第4天-爬虫进阶篇

    • 另一条路便是学习一些优秀的框架,先把这些框架用熟,可以确保能够应付一些基本的爬虫任务,也就是所谓的解决温饱问题(企业用人要求),然后再深入学习它的源码等知识,进一步强化。

    爬虫框架,其中比较好用的是 Scrapy 和 PySpider。

    • Scrapy

      优点:自定义程度高,比 PySpider更底层一些,适合学习研究,需要学习的相关知识多,拿来研究分布式和多线程等等是最合适不过的。

    Scrapy

    官方文档:

    http://doc.scrapy.org/en/latest/intro/tutorial.html

    豆瓣Python小组:

    企业招聘要求: