爬取搜索到的网站信息
本帖最后由 CCTLE别难过 于 2021-8-31 10:15 编辑网站 :https://weixin.sogou.com/
我要爬取的信息是:xxxx年xx月xx日的招聘信息
然后把搜索到的相关信息都爬取下来最终保存为CSV文件。
有翻页,翻页之后的所有内容都要爬取下来。
做成文件其titili共分为三大类
第一列为文章内容
第二列为发布文章的公众号名称
第三列为发布时间
有提供一个图片 图片中红色框框为第一列的文章内容
666666 先遍历获取所有你需要的文章链接,然后对每个链接的文本提取对应内容就行
页:
[1]