fnjerry 发表于 2020-12-2 19:13

黑马程序员 - 大数据反爬虫项目【完整资料】

bcxiaobai 发表于 2020-12-2 19:14

马程序员 - 大数据反爬虫项目

有种你重名 发表于 2020-12-2 19:20

kkkkkkkkkkk

乘风破浪 发表于 2020-12-2 19:22

课程亮点:
1、数据采集使用Lua,实现并发量的最大化,尽可能的降低高并发时的数据丢失.
2、消息队列采用Kafka,实现各模块的解耦,利用Kafka的高吞吐和可持久化的特性为平台提升稳定性.
3、利用SparkStreaming实现数据的实时计算,完成从数据预处理到爬虫黑名单的计算.
4、Spark的状态监控功能,实时掌握Spark的运行状态.
5、使用SparkSQL实现数据可视化相关指标的离线计算

课程内容:
1、项目整体介绍和数据采集模块详细介绍
2、openresty安装和lua语法学习
3、数据采集模块开发和反爬虫工程创建及链路统计功能开发
4、数据预处理模块:数据清洗和脱敏和打标签及数据解析
5、"数据结构化和数据推送 spark系统监控功能开发 实现反爬平台系统监控6、爬虫识别指标计算7、爬虫数据备份恢复和离线计算

适用人群:
1、对大数据Spark感兴趣的在校生及应届毕业生。
2、对目前职业有进一步提升要求,希望从事大数据行业高薪工作的在职人员。
3、对大数据行业感兴趣的相关人员。

hlwzjc 发表于 2020-12-2 19:23

4654654654654

隔壁吴大哥 发表于 2020-12-2 19:46

666666666666666666

decm32 发表于 2020-12-2 20:20

黑马程序员 - 大数据反爬虫项目【完整资料】   [复制链接]

黑马王子 发表于 2020-12-2 20:22

程序员 - 大数据反爬虫

mjk888 发表于 2020-12-2 20:40


黑马程序员 - 大数据反爬虫项目【完整资料】

feierte 发表于 2020-12-2 20:41

黑马程序员 - 大数据反爬虫项目【完整资料】
页: 1 2 3 4 5 [6] 7 8 9 10 11 12 13
查看完整版本: 黑马程序员 - 大数据反爬虫项目【完整资料】