安装指南

    请先阅读 平台安装指南.

    下列的安装步骤假定您已经安装好下列程序:

    • 2.7
    • Python Package: pip and . 现在 pip 依赖 ,如果未安装,则会自动安装 setuptools 。Python 2.7.9 and later include by default, so you may have it already.
    • lxml. 大多数Linux发行版自带了lxml。如果缺失,请查看

    使用pip安装:

    平台安装指南

    注解

    对于Windows或者使用 pip 安装有问题的用户, 推荐使用本方案来安装Scrapy.

    如果您已经安装了 或者 Miniconda , 维护了Linux, Windows, OS X系统的官方版本的conda包.

    使用 安装Scrapy, 请执行:

    1. conda install -c scrapinghub scrapy

    您需要修改 PATH 环境变量,将Python的可执行程序及额外的脚本添加到系统路径中。将以下路径添加到 PATH 中:

    1. C:\Python2.7\;C:\Python2.7\Scripts\;
    1. c:\python27\python.exe c:\python27\tools\scripts\win_add2path.py

    关闭并重新打开命令行窗口,使之生效。运行接下来的命令来确认其输出所期望的Python版本:

    1. python --version
    • 从 安装 pywin32

    请确认下载符合您系统的版本(win32或者amd64)

    打开命令行窗口,确认 被正确安装:

    • 到目前为止Python 2.7 及 pip 已经可以正确运行了。接下来安装Scrapy:
    1. pip install Scrapy

    不要 使用Ubuntu提供的 python-scrapy ,相较于最新版的Scrapy,该包版本太旧,并且运行速度也较为缓慢。

    您可以使用官方提供的 Ubuntu Packages 。该包解决了全部依赖问题,并且与最新的bug修复保持持续更新。

    如果您更倾向于本地构建python的依赖,而不是使用系统库(system package), 您需要先安装非python的依赖:

    1. sudo apt-get install python-dev python-pip libxml2-dev libxslt1-dev zlib1g-dev libffi-dev libssl-dev

    您可以使用 pip 安装Scrapy:

      注解

      您可以依照通用的方式或者从 AUR Scrapy package 来安装Scrapy:

      1. yaourt -S scrapy

      构建Scrapy的依赖需要C编译器及开发的头文件(development headers). 在OS X中,这通常由Apple的Xcode development tools提供. 安装Xcode command line tools,您需要打开一个终端,并且执行:

      这里有一个 阻止 更新system package. 这发生在成功地安装了Scrapy极其依赖之后,以下提供了一些可供参考的解决办法:

      • (Recommended)不要 使用系统提供的python, 而且安装一个最新的,并且不会与系统冲突的版本. 下面展现了如何使用 homebrew 包管理工具来实现:

        • 依照 的指示,安装 homebrew

        • 更新您的 PATH 变量, 使得 homebrew的包在system packages之前加载(修改 .bashrc.zshrc 如果您使用 作为默认的shell):

      1. echo "export PATH=/usr/local/bin:/usr/local/sbin:$PATH" >> ~/.bashrc
      • 重新加载 来保证修改已经生效:
      1. source ~/.bashrc
      • 安装python:
      1. brew install python
      • 最新版本的python已经捆绑了 pip ,所以您不需要单独安装.如果不是,则需要更新python:
        • (可选) 在单独的python环境中安装Scrpay.

        该方法能解决OS X的问题, 不过第一种方式更为优雅.

        virtualenv 是一个在python中创建虚拟环境的工具,我们推荐您阅读 来了解.