python通过正则表达式分析网页中的图片并进行替换
这段代码分析网页中的所有图片表单,分析后为其前后添加相应的修饰标签,并添加到图片的超级链接。
""" 皮蛋编程(https://www.pidancode.com) 创建日期:2022/3/31 功能描述:python通过正则表达式分析网页中的图片并进行替换 """ import re value = '<img src="http://www.pidancode.com/logo.png" />你好' result = value.replace("[page]", "").replace(' ', u' ') p = re.compile(r'''(<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*["']?[\s\t\r\n]*([^\s\t\r\n"'<>]*)[^<>]*?/?[\s\t\r\n]*>)''', re.IGNORECASE) result = p.sub(r'''<span class="openIcon"><em></em><a href="\2">\1</a></span>''', result) print(result)
输出结果如下:
你好
相关文章