python通过正则表达式分析网页中的图片并进行替换

2022-04-29 00:00:00 分析 网页 替换

这段代码分析网页中的所有图片表单,分析后为其前后添加相应的修饰标签,并添加到图片的超级链接。

"""
皮蛋编程(https://www.pidancode.com)
创建日期:2022/3/31
功能描述:python通过正则表达式分析网页中的图片并进行替换
"""
import re

value = '<img src="http://www.pidancode.com/logo.png" />你好'
result = value.replace("[page]", "").replace('  ', u' ')
p = re.compile(r'''(<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*["']?[\s\t\r\n]*([^\s\t\r\n"'<>]*)[^<>]*?/?[\s\t\r\n]*>)''', re.IGNORECASE)
result = p.sub(r'''<span class="openIcon"><em></em><a href="\2">\1</a></span>''', result)
print(result)

输出结果如下:
你好

相关文章