如何使用Python BeautifulSoup解析XML文档?

2023-04-17 00:00:00 文档 解析 如何使用

使用Python中的BeautifulSoup库可以方便地解析XML文档,以下是具体步骤:

  1. 安装BeautifulSoup库
pip install beautifulsoup4
  1. 导入库和解析XML字符串
from bs4 import BeautifulSoup

xml_str = """
<root>
    <website>pidancode.com</website>
    <name>皮蛋编程</name>
</root>
"""

soup = BeautifulSoup(xml_str, 'xml')
  1. 获取节点值
website = soup.find('website').text
name = soup.find('name').text

print(website)  # pidancode.com
print(name)  # 皮蛋编程

注意,使用xml作为参数,可以将标签名称大小写忽略,例如:

soup.find('WEBSITE').text  # pidancode.com

此外,还可以使用正则表达式寻找节点:

soup.find_all(re.compile('^w.*'))  # [<website>pidancode.com</website>]

相关文章