python通过正则去除所有html标签
这段python代码可以用于去除html代码里的html标签,不包括标签里面的内容
""" 皮蛋编程(https://www.pidancode.com) 创建日期:2022/4/2 功能描述:python去除所有html标签 """ import re html='<a href="https://www.pidancode.com">皮蛋编程</a>,欢迎大家光临!' dr = re.compile(r'<[^>]+>',re.S) dd = dr.sub('',html) print(dd)
输出:
皮蛋编程,欢迎大家光临!
相关文章