org.spiderflow.io.SpiderResponse

    返回值类型:Element

    • 将对象转为Element

    xpath

    TIP

    返回值类型:Element/String

    • 根据xpath获取内容或Element对象

    xpaths

    参数名描述可否为空
    xpathxpath表达式

    TIP

    返回值类型:List<Element/String>

    • 根据xpath获取内容或Element对象
    1. ${resp.xpaths('//a/@href')}

    返回值类型:String/List<String>

    • 根据正则表达式提取字符串

    regxs

    参数名描述可否为空
    pattern正则表达式
    groups捕获组序号int或List<Integer>(多个)

    TIP

    返回值类型:List<String>/List<List<String>>

    • 根据正则表达式提取字符串

      selector

      TIP

      返回值类型:Element

      • 根据css选择器查找dom
      1. ${resp.selector('div a.selected')}
      参数名描述可否为空
      cssQuerycss选择器

      返回值类型:List<Element>

      • 根据css选择器查找dom

      jsonpath

      TIP

      返回值类型:Object

      • 根据JSONPath提取数据

      links

      参数名描述可否为空
      regx正则表达式(有此参数时代表提取满足条件的链接)

      TIP

      返回值类型:List<String>

      • 提取页面上的所有a标签的链接
      1. ${resp.links()}

      返回值类型:List<String>

      • 提取页面上的所有img的链接