Python XPath 谓语介绍
XPath 谓语是用于过滤节点的条件表达式,它可以使用比较、逻辑运算符以及函数等操作符。以下是一些常见的谓语:
- 比较运算符:=、!=、<、>、<=、>=。
- 逻辑运算符:and、or、not。
- 函数:contains()、starts-with()、ends-with()、substring()、count() 等。
下面是一些使用 XPath 谓语的示例代码:
- 选择所有文本节点中包含“pidancode”的节点:
//text()[contains(., 'pidancode')]
- 选择所有 div 标签中包含“皮蛋编程”且 class 属性包含“article”的节点:
//div[contains(@class, 'article') and contains(text(), '皮蛋编程')]
- 选择所有包含至少两个 a 标签的 span 节点:
//span[count(a) >= 2]
- 选择第一个 class 属性包含“pidancode”的 div 节点:
//div[contains(@class, 'pidancode')][1]
注意:XPath 谓语的效率比较低,应尽量避免在大型文档中使用过多的谓语表达式。
相关文章