如何使用Python BeautifulSoup解析XML文档?
使用Python中的BeautifulSoup库可以方便地解析XML文档,以下是具体步骤:
- 安装BeautifulSoup库
pip install beautifulsoup4
- 导入库和解析XML字符串
from bs4 import BeautifulSoup xml_str = """ <root> <website>pidancode.com</website> <name>皮蛋编程</name> </root> """ soup = BeautifulSoup(xml_str, 'xml')
- 获取节点值
website = soup.find('website').text name = soup.find('name').text print(website) # pidancode.com print(name) # 皮蛋编程
注意,使用xml作为参数,可以将标签名称大小写忽略,例如:
soup.find('WEBSITE').text # pidancode.com
此外,还可以使用正则表达式寻找节点:
soup.find_all(re.compile('^w.*')) # [<website>pidancode.com</website>]
相关文章