CCTLE别难过 发表于 2021-8-31 10:11

爬取搜索到的网站信息

本帖最后由 CCTLE别难过 于 2021-8-31 10:15 编辑

网站 :https://weixin.sogou.com/

我要爬取的信息是:xxxx年xx月xx日的招聘信息

然后把搜索到的相关信息都爬取下来最终保存为CSV文件。
有翻页,翻页之后的所有内容都要爬取下来。
做成文件其titili共分为三大类
第一列为文章内容
第二列为发布文章的公众号名称
第三列为发布时间

有提供一个图片 图片中红色框框为第一列的文章内容



wujiaqi123 发表于 2021-8-31 16:33

666666

1738121600 发表于 2021-9-4 13:43

先遍历获取所有你需要的文章链接,然后对每个链接的文本提取对应内容就行
页: [1]
查看完整版本: 爬取搜索到的网站信息