在 lxml 中解析 XML 时如何不加载注释
问题描述
我尝试像这样使用 lxml 在 Python 中解析 XML 文件:
I try to parse XML file in Python using lxml like this:
objectify.parse(xmlPath, parserWithSchema)
但 XML 文件可能在奇怪的地方包含注释:
but XML file may contains comments in strange places:
<root>
<text>Sam<!--comment-->ple text</text>
<!--comment-->
<float>1.2<!--comment-->3456</float>
</root>
是一种在解析前不加载或删除评论的方法吗?
It is a way to not load or delete comments before parsing?
解决方案
在解析器上设置 remove_comments=True
(文档):
Set remove_comments=True
on the parser (documentation):
from lxml import etree, objectify
parser = etree.XMLParser(remove_comments=True)
tree = objectify.parse(xmlPath, parser=parser)
或者,使用 makeparser()
方法:
parser = objectify.makeparser(remove_comments=True)
tree = objectify.parse(xmlPath, parser=parser)
希望对您有所帮助.
相关文章