爬虫进阶开发——xpath选择器常见用法

    选取节点

    XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。

    下面列出了最有用的路径表达式

    实例

    2、模糊查询

    contains 匹配一个属性值中包含的字符串

    3、获取节点属性

    XPATH的几个常用函数

    2.text():由于一个节点的文本值不属于属性,比如,所以,用text()函数来匹配节点://a[text()='baidu']

    3.last()://div[contains(@id, 'in')][las()],表示选择id中包含有'in'的div节点的最后一个节点

    4.starts-with(): //div[starts-with(@id, 'in')] ,表示选择以’in’开头的id属性的div节点

    5.not()函数,表示否定,//input[@name=‘identity’ and not(contains(@class,‘a’))] ,表示匹配出name为identity并且class的值中不包含a的input节点。 not()函数通常与返回值为true or false的函数组合起来用,比如contains(),starts-with()等,但有一种特别情况请注意一下:我们要匹配出input节点含有id属性的,写法如下://input[@id],如果我们要匹配出input节点不含用id属性的,则为://input[not(@id)]