python通过正则替换屏蔽html代码里的全部javascript

2022-03-11 00:00:00 替换 正则 屏蔽

如果你不希望html代码里的javascript运行,可以通过正则替换掉所有的script为noscript,浏览器会忽略所有的noscript内的脚本

"""
作者:皮蛋编程(https://www.pidancode.com)
创建日期:2022/3/17
修改日期:2022/3/17
功能描述:python正则替换屏蔽html代码里的全部javascript
"""
import re
html = """
<script>console.write("https://www.pidancode.com")</script>
"""
re_noscript = re.compile('<(/?)script', re.IGNORECASE)
html = re_noscript.sub(r'<\1noscript', html)
print(html)

输出结果:

以上代码在python3.9环境下测试通过。

相关文章