org.spiderflow.io.SpiderResponse
返回值类型:Element
- 将对象转为Element
xpath
TIP
返回值类型:Element/String
- 根据xpath获取内容或Element对象
xpaths
参数名 | 描述 | 可否为空 |
---|---|---|
xpath | xpath表达式 | 否 |
TIP
返回值类型:List<Element/String>
- 根据xpath获取内容或Element对象
${resp.xpaths('//a/@href')}
返回值类型:String/List<String>
- 根据正则表达式提取字符串
regxs
参数名 | 描述 | 可否为空 |
---|---|---|
pattern | 正则表达式 | 否 |
groups | 捕获组序号int或List<Integer>(多个) | 是 |
TIP
返回值类型:List<String>/List<List<String>>
- 根据正则表达式提取字符串
selector
TIP
返回值类型:Element
- 根据css选择器查找dom
${resp.selector('div a.selected')}
参数名 | 描述 | 可否为空 |
---|---|---|
cssQuery | css选择器 | 否 |
返回值类型:List<Element>
- 根据css选择器查找dom
jsonpath
TIP
返回值类型:Object
- 根据JSONPath提取数据
links
参数名 | 描述 | 可否为空 |
---|---|---|
regx | 正则表达式(有此参数时代表提取满足条件的链接) | 是 |
TIP
返回值类型:List<String>
- 提取页面上的所有a标签的链接
${resp.links()}
返回值类型:List<String>
- 提取页面上的所有img的链接