ylw23 发表于 2020-5-14 12:54

看一下。谢谢

369 发表于 2020-5-15 15:29

感谢分享            

pancho 发表于 2020-5-18 15:28

Python 实战:用 Scrapyd 打造个人化的爬虫部署管理控制台

1564595661 发表于 2020-5-18 21:09


Scrapyd 是业内最优秀的爬虫框架之一 Scrapy 官方出品的部署管理平台。有了它,你就可以通过 API 向指定的爬虫发起指令,并且可以通过 Web 页面来查看爬虫的运行记录与状态等信息。

xiangyu1 发表于 2020-5-20 23:55

韦世东,资深爬虫工程师、开源项目 ScrapydArt 作者

zkj 发表于 2020-5-23 09:38

2000000000000000000000

lyd 发表于 2020-5-23 12:34

6666666666666666666

zxc125864 发表于 2020-6-12 23:28

谢谢风向

hangye168 发表于 2020-6-15 17:19

用 Scrapyd 打造个人化的爬虫部署管理控制台 [修改]

yj775132158 发表于 2020-6-15 17:21


Scrapyd 是业内最优秀的爬虫框架之一 Scrapy 官方出品的部署管理平台。有了它,你就可以通过 API 向指定的爬虫发起指令,并且可以通过 Web 页面来查看爬虫的运行记录与状态等信息。

将爬虫部署到服务器是大部分爬虫工程师必备的技能,这个技能可以为你的职业价值锦上添花。
然而网上关于 Scrapyd 的资料比较少,除了官方文档之外,只有一些零散的教程文章。这远远无法满足很多爬虫工程师的学习需求。所以你需要这本小册。
而且 Scrapyd 并不提供访问控制功能,意味着只要你部署到服务器上,任何人都可以访问它并且控制你的爬虫。它也不提供数据统计的功能,你不可能知道你部署的爬虫有多少,也不知道它们运行了多少次,谁的运行时间最长,也无法对爬虫日志进行排序或者筛选过滤。
别慌,笔者写这本小册就是为了解决那些问题。


最终的实战成果如下所示:
Web 界面及功能演示


新增 API 及数据结果演示
比如根据指定的project名称筛选出对应的爬虫记录。

不仅如此,文章中所涉及的演示和操作,笔者特意制作了 GIF 动图来帮助你更好的理解:



还有很多的流程图或者结构图以及 UML 图,助你轻松理解代码及其含义:

作者介绍

韦世东,资深爬虫工程师、开源项目 ScrapydArt 作者、开源项目 Gerapy 开发小组核心成员、公众号【进击的 Coder】运营者之一,5 年 IT 从业经验,具有丰富的爬虫项目设计及分布式海量数据爬取经验,擅长反爬虫的绕过技巧, 独立完成爬虫调度管理平台的技术研发,在数据分析及可视化方面具备一定的实战经验
页: 1 2 3 4 5 6 [7] 8 9 10 11 12 13
查看完整版本: Python 实战:用 Scrapyd 打造个人化的爬虫部署管理控制台