Python BeautifulSoup 修改 XML

2023-04-17 00:00:00 python beautifulsoup 修改

在Python中,可以使用BeautifulSoup库对XML进行解析和处理,包括修改和生成。以下是一个详细的演示代码:

from bs4 import BeautifulSoup

# 读取XML文件
with open('example.xml', 'r') as f:
    xml = f.read()

# 解析XML
soup = BeautifulSoup(xml, 'xml')

# 找到要修改的标签
tag = soup.find('name', text='pidancode.com')

# 修改标签内容
tag.string = '皮蛋编程'

# 保存修改后的XML
with open('example_modified.xml', 'w') as f:
    f.write(str(soup)) # 将BeautifulSoup对象转换成字符串

首先,使用open()函数读取XML文件内容,并把文件内容存储在变量xml中。然后,使用BeautifulSoup函数并将xml作为参数来创建一个BeautifulSoup对象。'xml'参数是指解析器类型。在这里,我们使用xml解析器来解析XML文件。

接着,使用find()方法找到需要修改的标签,即文本内容为'pidancode.com'<name>标签。然后,使用.string属性修改标签内容为'皮蛋编程'

最后,使用open()函数将修改后的XML保存到一个新的文件中。在这里,我们使用'w'模式写入文件。由于write()函数只能写入字符串,所以str(soup)将BeautifulSoup对象转换为字符串。

可以注意到,虽然这个例子使用的是XML,但是对HTML也同样适用。使用BeautifulSoup处理HTML和XML都是非常方便的。

相关文章