curl

    curl命令 是一个利用URL规则在命令行下工作的文件传输工具。它支持文件的上传和下载,所以是综合传输工具,但按传统,习惯称curl为下载工具。作为一款强力工具,curl支持包括HTTP、HTTPS、ftp等众多协议,还支持POST、cookies、认证、从指定偏移处下载部分文件、用户代理字符串、限速、文件大小、进度条等特征。做网页处理流程和数据检索自动化,curl可以祝一臂之力。

    1. -A/--user-agent # 设置用户代理发送给服务器
    2. -anyauth # 可以使用“任何”身份验证方法
    3. -b/--cookie # cookie字符串或文件读取位置
    4. --basic # 使用HTTP基本验证
    5. -B/--use-ascii # 使用ASCII /文本传输
    6. -c/--cookie-jar # 操作结束后把cookie写入到这个文件中
    7. -C/--continue-at # 断点续传
    8. -d/--data # HTTP POST方式传送数据
    9. --data-ascii # 以ascii的方式post数据
    10. --data-binary # 以二进制的方式post数据
    11. --negotiate # 使用HTTP身份验证
    12. --digest # 使用数字身份验证
    13. --disable-eprt # 禁止使用EPRT或LPRT
    14. --disable-epsv # 禁止使用EPSV
    15. -D/--dump-header # 把header信息写入到该文件中
    16. --egd-file # 为随机数据(SSL)设置EGD socket路径
    17. --tcp-nodelay # 使用TCP\_NODELAY选项
    18. -e/--referer # 来源网址
    19. -E/--cert # 客户端证书文件和密码 (SSL)
    20. --cert-type # 证书文件类型 (DER/PEM/ENG) (SSL)
    21. --key # 私钥文件名 (SSL)
    22. --key-type # 私钥文件类型 (DER/PEM/ENG) (SSL)
    23. --pass # 私钥密码 (SSL)
    24. --engine # 加密引擎使用 (SSL). "--engine list" for list
    25. --cacert # CA证书 (SSL)
    26. --capath # CA目录 (made using c\_rehash) to verify peer against (SSL)
    27. --ciphers # SSL密码
    28. --compressed # 要求返回是压缩的形势 (using deflate or gzip)
    29. --connect-timeout # 设置最大请求时间
    30. --create-dirs # 建立本地目录的目录层次结构
    31. --crlf # 上传是把LF转变成CRLF
    32. -f/--fail # 连接失败时不显示http错误
    33. --ftp-create-dirs # 如果远程目录不存在,创建远程目录
    34. --ftp-method \[multicwd/nocwd/singlecwd] # 控制CWD的使用
    35. --ftp-pasv # 使用 PASV/EPSV 代替端口
    36. --ftp-skip-pasv-ip # 使用PASV的时候,忽略该IP地址
    37. --ftp-ssl # 尝试用 SSL/TLS 来进行ftp数据传输
    38. --ftp-ssl-reqd # 要求用 SSL/TLS 来进行ftp数据传输
    39. -F/--form # 模拟http表单提交数据
    40. --form-string # 模拟http表单提交数据
    41. -g/--globoff # 禁用网址序列和范围使用{}和\[]
    42. -G/--get # 以get的方式来发送数据
    43. -H/--header # 自定义头信息传递给服务器
    44. --ignore-content-length # 忽略的HTTP头信息的长度
    45. -i/--include # 输出时包括protocol头信息
    46. -I/--head # 只显示请求头信息
    47. -j/--junk-session-cookies # 读取文件进忽略session cookie
    48. --interface # 使用指定网络接口/地址
    49. --krb4 # 使用指定安全级别的krb4
    50. -k/--insecure # 允许不使用证书到SSL站点
    51. -K/--config # 指定的配置文件读取
    52. -l/--list-only # 列出ftp目录下的文件名称
    53. --limit-rate # 设置传输速度
    54. --local-port # 强制使用本地端口号
    55. -m/--max-time # 设置最大传输时间
    56. --max-redirs # 设置最大读取的目录数
    57. --max-filesize # 设置最大下载的文件总量
    58. -M/--manual # 显示全手动
    59. -n/--netrc # 从netrc文件中读取用户名和密码
    60. --netrc-optional # 使用 .netrc 或者 URL来覆盖-n
    61. --ntlm # 使用 HTTP NTLM 身份验证
    62. -o/--output # 把输出写到该文件中
    63. -O/--remote-name # 把输出写到该文件中,保留远程文件的文件名
    64. -p/--proxytunnel # 使用HTTP代理
    65. --proxy-anyauth # 选择任一代理身份验证方法
    66. --proxy-basic # 在代理上使用基本身份验证
    67. --proxy-digest # 在代理上使用数字身份验证
    68. --proxy-ntlm # 在代理上使用ntlm身份验证
    69. -P/--ftp-port # 使用端口地址,而不是使用PASV
    70. -q # 作为第一个参数,关闭 .curlrc
    71. -Q/--quote # 文件传输前,发送命令到服务器
    72. -r/--range # 检索来自HTTP/1.1或FTP服务器字节范围
    73. --range-file # 读取(SSL)的随机文件
    74. -R/--remote-time # 在本地生成文件时,保留远程文件时间
    75. --retry # 传输出现问题时,重试的次数
    76. --retry-delay # 传输出现问题时,设置重试间隔时间
    77. --retry-max-time # 传输出现问题时,设置最大重试时间
    78. -S/--show-error # 显示错误
    79. --socks4 # 用socks4代理给定主机和端口
    80. --socks5 # 用socks5代理给定主机和端口
    81. --stderr #
    82. -t/--telnet-option # Telnet选项设置
    83. --trace # 对指定文件进行debug
    84. --trace-ascii # Like --跟踪但没有hex输出
    85. --trace-time # 跟踪/详细输出时,添加时间戳
    86. -T/--upload-file # 上传文件
    87. --url # Spet URL to work with
    88. -u/--user # 设置服务器的用户和密码
    89. -U/--proxy-user # 设置代理用户名和密码
    90. -w/--write-out \[format] # 什么输出完成后
    91. -x/--proxy # 在给定的端口上使用HTTP代理
    92. -X/--request # 指定什么命令
    93. -y/--speed-time # 放弃限速所要的时间,默认为30
    94. -Y/--speed-limit # 停止传输速度的限制,速度时间

    文件下载

    curl命令可以用来执行下载、发送各种HTTP请求,指定HTTP头部等操作。如果系统没有curl可以使用yum install curl安装,也可以下载安装。curl是将下载文件输出到stdout,将进度信息输出到stderr,不显示进度信息使用--silent选项。

    1. curl URL --silent

    这条命令是将下载文件输出到终端,所有下载的数据都被写入到stdout。

    使用选项-O将下载的数据写入到文件,必须使用文件的绝对地址:

    1. curl http://example.com/text.iso --silent -O

    选项-o将下载数据写入到指定名称的文件中,并使用--progress显示进度条:

    1. curl http://example.com/test.iso -o filename.iso --progress
    2. ######################################### 100.0%

    不输出错误和进度信息

    -s 参数将不输出错误和进度信息。

    1. curl -s https://www.example.com
    2. # 上面命令一旦发生错误,不会显示错误信息。不发生错误的话,会正常显示运行结果。

    如果想让 curl 不产生任何输出,可以使用下面的命令。

    1. curl -s -o /dev/null https://google.com

    断点续传

    curl能够从特定的文件偏移处继续下载,它可以通过指定一个便宜量来下载部分文件:

    1. curl URL/File -C 偏移量
    2. #偏移量是以字节为单位的整数,如果让curl自动推断出正确的续传位置使用-C -:
    3. curl -C -URL

    使用curl设置参照页字符串

    参照页是位于HTTP头部中的一个字符串,用来表示用户是从哪个页面到达当前页面的,如果用户点击网页A中的某个连接,那么用户就会跳转到B网页,网页B头部的参照页字符串就包含网页A的URL。

    使用--referer选项指定参照页字符串:

    1. curl --referer http://www.google.com http://wangchujiang.com

    用curl设置用户代理字符串

    有些网站访问会提示只能使用IE浏览器来访问,这是因为这些网站设置了检查用户代理,可以使用curl把用户代理设置为IE,这样就可以访问了。使用--user-agent或者-A选项:

    1. curl URL --user-agent "Mozilla/5.0"
    2. curl URL -A "Mozilla/5.0"

    其他HTTP头部信息也可以使用curl来发送,使用-H“头部信息” 传递多个头部信息,例如:

    1. curl -H "Host:wangchujiang.com" -H "accept-language:zh-cn" URL

    curl的带宽控制和下载配额

    1. curl URL --limit-rate 50k

    命令中用k(千字节)和m(兆字节)指定下载速度限制。

    使用--max-filesize指定可下载的最大文件大小:

    1. curl URL --max-filesize bytes

    如果文件大小超出限制,命令则返回一个非0退出码,如果命令正常则返回0。

    1. curl --limit-rate 200k https://example.com
    2. # 上面命令将带宽限制在每秒 200K 字节。

    用curl进行认证

    使用curl选项 -u 可以完成HTTP或者FTP的认证,可以指定密码,也可以不指定密码在后续操作中输入密码:

    只打印响应头部信息

    通过-I或者-head可以只打印出HTTP头部信息:

    1. [root@localhost text]# curl -I http://wangchujiang.com
    2. HTTP/1.1 200 OK
    3. Server: nginx/1.2.5
    4. date: Mon, 10 Dec 2012 09:24:34 GMT
    5. Content-Type: text/html; charset=UTF-8
    6. Connection: keep-alive
    7. Vary: Accept-Encoding
    8. X-Pingback: http://wangchujiang.com/xmlrpc.php

    get请求

    1. curl "http://www.wangchujiang.com" # 如果这里的URL指向的是一个文件或者一幅图都可以直接下载到本地
    2. curl -i "http://www.wangchujiang.com" # 显示全部信息
    3. curl -l "http://www.wangchujiang.com" # 显示页面内容
    4. curl -v "http://www.wangchujiang.com" # 显示get请求全过程解析

    post请求

    1. $ curl -d "param1=value1&param2=value2" "http://www.wangchujiang.com/login"
    2. # 或者
    3. $ curl -d 'login=emma' -d 'password=123' -X POST https://wangchujiang.com/login

    --data-urlencode 参数等同于 -d,发送 POST 请求的数据体,区别在于会自动将发送的数据进行 URL 编码。

    1. curl --data-urlencode 'comment=hello world' https://wangchujiang.com/login
    2. # 上面代码中,发送的数据hello world之间有一个空格,需要进行 URL 编码。

    读取本地文本文件的数据,向服务器发送

    1. curl -d '@data.txt' https://wangchujiang.com/upload
    2. # 读取data.txt文件的内容,作为数据体向服务器发送。

    json格式的post请求

    1. curl -l -H "Content-type: application/json" -X POST -d '{"phone":"13521389587","password":"test"}' http://wangchujiang.com/apis/users.json

    向服务器发送 Cookie

    使用--cookie "COKKIES"选项来指定cookie,多个cookie使用分号分隔:

    1. curl http://wangchujiang.com --cookie "user=root;pass=123456"

    将cookie另存为一个文件,使用选项:

    1. curl URL --cookie-jar cookie_file

    -b 参数用来向服务器发送 Cookie。

    1. curl -b 'foo=bar' https://taobao.com
    2. # 上面命令会生成一个标头Cookie: foo=bar,向服务器发送一个名为foo、值为bar的 Cookie。
    1. curl -b 'foo1=bar' -b 'foo2=baz' https://taobao.com
    2. # 上面命令发送两个 Cookie。
    3. ```shell
    4. curl -b cookies.txt https://www.taobao.com
    5. # 上面命令读取本地文件 cookies.txt,里面是服务器设置的 Cookie(参见-c参数),将其发送到服务器。

    Cookie 写入一个文件

    1. curl -c cookies.txt https://www.taobao.com
    2. # 上面命令将服务器的 HTTP 回应所设置 Cookie 写入文本文件cookies.txt。

    请求的来源

    1. curl -e 'https://taobao.com?q=example' https://www.example.com
    2. # 上面命令将Referer标头设为 https://taobao.com?q=example。

    -H 参数可以通过直接添加标头 Referer,达到同样效果。

    1. curl -H 'Referer: https://taobao.com?q=example' https://www.example.com

    上传二进制文件

    -F 参数用来向服务器上传二进制文件。

    -F 参数可以指定 MIME 类型。

    1. curl -F 'file=@photo.png;type=image/png' https://taobao.com/profile
    2. # 上面命令指定 MIME 类型为image/png,否则 curl 会把 MIME 类型设为 application/octet-stream。

    -F 参数也可以指定文件名。

    1. curl -F 'file=@photo.png;filename=me.png' https://taobao.com/profile
    2. # 上面命令中,原始文件名为photo.png,但是服务器接收到的文件名为me.png。

    设置请求头

    -H 参数添加 HTTP 请求的标头。

    1. curl -H 'Accept-Language: en-US' https://google.com
    2. # 上面命令添加 HTTP 标头 Accept-Language: en-US。
    1. curl -H 'Accept-Language: en-US' -H 'Secret-Message: xyzzy' https://google.com
    2. # 上面命令添加两个 HTTP 标头。
    1. curl -d '{"login": "emma", "pass": "123"}' -H 'Content-Type: application/json' https://google.com/login
    2. # 上面命令添加 HTTP 请求的标头是 Content-Type: application/json,然后用 -d 参数发送 JSON 数据。

    跳过 SSL 检测

    1. curl -k https://www.example.com
    2. # 上面命令不会检查服务器的 SSL 证书是否正确。

    请求跟随服务器的重定向

    -L 参数会让 HTTP 请求跟随服务器的重定向。curl 默认不跟随重定向。

    1. curl -L -d 'tweet=hi' https://api.example.com/tweet

    调试参数

    -v 参数输出通信的整个过程,用于调试。

    1. curl -v https://www.example.com
    2. # --trace参数也可以用于调试,还会输出原始的二进制数据。
    1. $ curl --trace - https://www.example.com

    获取本机外网ip

    1. curl ipecho.net/plain

    使用 curl 测试网站加载速度

    命令有一个鲜为人知的选项,-w,该选项在请求结束之后打印本次请求的统计数据到标准输出。

    首先,我们定义控制打印行为的格式化字符串。新建文本文件 fmt.txt,并填入下面的内容:

    1. \n
    2. Response Time for: %{url_effective}\n\n
    3. DNS Lookup Time:\t\t%{time_namelookup}s\n
    4. Redirection Time:\t\t%{time_redirect}s\n
    5. Connection Time:\t\t%{time_connect}s\n
    6. App Connection Time:\t\t%{time_appconnect}s\n
    7. Pre-transfer Time:\t\t%{time_pretransfer}s\n
    8. Start-transfer Time:\t\t%{time_starttransfer}s\n\n
    9. Total Time:\t\t\t%{time_total}s\n

    curl 提供了很多置换变量,可以在格式化字符串中通过 %{var} 的形式使用。完整的变量列表可以在 curlmanpage 中查看。简单介绍一下我们使用的这几个变量:

    • url_effective: 执行完地址重定向之后的最终 URL;
    • time_namelookup: 从请求开始至完成名称解析所花的时间,单位为秒,下同;
    • time_redirect: 执行所有重定向所花的时间;
    • time_connect: 从请求开始至建立 TCP 连接所花的时间;
    • time_appconnect: 从请求开始至完成 SSL/SSH 握手所花的时间;
    • time_pretransfer: 从请求开始至服务器准备传送文件所花的时间,包含了传送协商时间;
    • time_starttransfer: 从请求开始至服务器准备传送第一个字节所花的时间;
    • time_total: 完整耗时。

    然后执行请求,通过 @filename 指定保存了格式化字符串的文件:

    1. $ curl -L -s -w @fmt.txt -o /dev/null http://www.google.com
    1. Response Time for: http://www.google.co.jp/?gfe_rd=cr&dcr=0&ei=cjIaWpTkHeiQ8QfnxYzoBA
    2. DNS Lookup Time: 0.000038s
    3. Redirection Time: 0.207271s
    4. Connection Time: 0.000039s
    5. App Connection Time: 0.000039s
    6. Pre-transfer Time: 0.000067s
    7. Start-transfer Time: 0.260115s
    8. Total Time: 0.467691s