python通过正则去除所有html标签

2022-04-13 00:00:00 标签 正则 去除

这段python代码可以用于去除html代码里的html标签,不包括标签里面的内容

"""
皮蛋编程(https://www.pidancode.com)
创建日期:2022/4/2
功能描述:python去除所有html标签
"""
import re
html='<a href="https://www.pidancode.com">皮蛋编程</a>,欢迎大家光临!'
dr = re.compile(r'<[^>]+>',re.S)
dd = dr.sub('',html)
print(dd)

输出:
皮蛋编程,欢迎大家光临!

相关文章