Python BeautifulSoup的prettify()方法详解
Python的BeautifulSoup库中提供了prettify()方法,其作用是将HTML、XML等文本格式美化(使代码有良好的缩进、空格等格式),使文本易于阅读和理解。具体来说,prettify()方法可以自动缩进、格式化HTML标签、删除无用标签等,使得HTML或XML文本具有良好的结构和可读性。
下面是prettify()方法的使用示例:
from bs4 import BeautifulSoup html_doc = """ <html> <head> <title>pidancode.com</title> </head> <body> <h1>皮蛋编程</h1> <p>欢迎来到pidancode.com</p> <ul> <li>Python教程</li> <li>Web开发教程</li> <li>数据挖掘教程</li> </ul> </body> </html> """ soup = BeautifulSoup(html_doc, 'html.parser') print(soup.prettify())
输出结果如下:
<html> <head> <title> pidancode.com </title> </head> <body> <h1> 皮蛋编程 </h1> <p> 欢迎来到pidancode.com </p> <ul> <li> Python教程 </li> <li> Web开发教程 </li> <li> 数据挖掘教程 </li> </ul> </body> </html>
可以看到,prettify()方法将原始的HTML文本转换成了具有清晰缩进和良好结构的文本,方便阅读和理解。如果采用BeautifulSoup库解析HTML文本,建议使用prettify()方法对文本进行格式化,提高代码的可读性和可维护性。
相关文章