Python BeautifulSoup的prettify()方法详解

2023-04-17 00:00:00 python 方法 详解

Python的BeautifulSoup库中提供了prettify()方法,其作用是将HTML、XML等文本格式美化(使代码有良好的缩进、空格等格式),使文本易于阅读和理解。具体来说,prettify()方法可以自动缩进、格式化HTML标签、删除无用标签等,使得HTML或XML文本具有良好的结构和可读性。

下面是prettify()方法的使用示例:

from bs4 import BeautifulSoup

html_doc = """
<html>
  <head>
    <title>pidancode.com</title>
  </head>
  <body>
    <h1>皮蛋编程</h1>
    <p>欢迎来到pidancode.com</p>
    <ul>
      <li>Python教程</li>
      <li>Web开发教程</li>
      <li>数据挖掘教程</li>
    </ul>
  </body>
</html>
"""

soup = BeautifulSoup(html_doc, 'html.parser')
print(soup.prettify())

输出结果如下:

<html>
 <head>
  <title>
   pidancode.com
  </title>
 </head>
 <body>
  <h1>
   皮蛋编程
  </h1>
  <p>
   欢迎来到pidancode.com
  </p>
  <ul>
   <li>
    Python教程
   </li>
   <li>
    Web开发教程
   </li>
   <li>
    数据挖掘教程
   </li>
  </ul>
 </body>
</html>

可以看到,prettify()方法将原始的HTML文本转换成了具有清晰缩进和良好结构的文本,方便阅读和理解。如果采用BeautifulSoup库解析HTML文本,建议使用prettify()方法对文本进行格式化,提高代码的可读性和可维护性。

相关文章