瑞客论坛

 找回密码
 立即注册
查看: 1374|回复: 2

[经验求助] 爬取搜索到的网站信息

[复制链接]

金币15  第17575名

0

主题

2

回帖

38

积分

新手上路

Rank: 1

威望
11
贡献
12
热心值
0
金币
15
注册时间
2021-8-31
发表于 2021-8-31 10:11 | 显示全部楼层 |阅读模式
10金币
本帖最后由 CCTLE别难过 于 2021-8-31 10:15 编辑

网站 :https://weixin.sogou.com/

我要爬取的信息是:xxxx年xx月xx日的招聘信息

然后把搜索到的相关信息都爬取下来最终保存为CSV文件。
有翻页,翻页之后的所有内容都要爬取下来。
做成文件其titili共分为三大类
第一列为文章内容
第二列为发布文章的公众号名称
第三列为发布时间

有提供一个图片 图片中红色框框为第一列的文章内容



图片.png
回复

使用道具 举报

金币69  第12293名

0

主题

60

回帖

344

积分

中级会员

Rank: 3Rank: 3

威望
165
贡献
110
热心值
0
金币
69
注册时间
2021-8-24
发表于 2021-8-31 16:33 | 显示全部楼层
666666
回复

使用道具 举报

金币5828  第201名

0

主题

3085

回帖

1万

积分

论坛元老

Rank: 8Rank: 8

威望
5709
贡献
5470
热心值
0
金币
5828
注册时间
2019-7-25
发表于 2021-9-4 13:43 | 显示全部楼层
先遍历获取所有你需要的文章链接,然后对每个链接的文本提取对应内容就行
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|瑞客论坛 |网站地图

GMT+8, 2024-11-23 09:27

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表