如何使用Python BeautifulSoup解析XML文档？

2023-04-17 00:00:00 文档解析如何使用

使用Python中的BeautifulSoup库可以方便地解析XML文档，以下是具体步骤：

安装BeautifulSoup库

pip install beautifulsoup4

导入库和解析XML字符串

from bs4 import BeautifulSoup

xml_str = """
<root>
    <website>pidancode.com</website>
    <name>皮蛋编程</name>
</root>
"""

soup = BeautifulSoup(xml_str, 'xml')

获取节点值

website = soup.find('website').text
name = soup.find('name').text

print(website)  # pidancode.com
print(name)  # 皮蛋编程

注意，使用xml作为参数，可以将标签名称大小写忽略，例如：

soup.find('WEBSITE').text  # pidancode.com

此外，还可以使用正则表达式寻找节点：

soup.find_all(re.compile('^w.*'))  # [<website>pidancode.com</website>]

相关文章