瑞客论坛

 找回密码
 立即注册
查看: 1703|回复: 2

2018年最新大数据24期实战项目 9天 附课件源码

[复制链接]

金币83449  第4名

272

主题

5

回帖

8万

积分

论坛元老

Rank: 8Rank: 8

威望
194
贡献
282
热心值
21
金币
83449
注册时间
2020-8-31
发表于 2019-3-22 14:33 | 显示全部楼层 |阅读模式
课程目录:

第一天:

01.传统广告回顾
02.几个问题思考
03.广告的表现形式
04.名词解释
05.DSP原理图
06.DSP业务流程
07.DMP项目背景
08.DMP业务流程----重要
09.日志格式介绍
10.需求一日志转parquet文件

第二天:

01.工程包的创建
02.日志转parquet文件实现方式一----StructType
03.日志转换成parquet文件格式实现方式二---自定义类
04.统计各省市的数据量分布情况----结果输出成json
05.统计各省市的数据量分布情况----结果输出到mysql中
06.统计各省市的数据量分布情况----使用Spark算子的方式实现
07.地域分布需求

第三天:

00.Ambari介绍及项目打包上传
00.集群运行Job观察01
00.集群运行Job观察02
01.地域报表实现---Spark SQL
02.地域报表实现---Spark Core实现01
03.地域报表实现---Spark Core实现02
03.地域报表实现---读取原始日志文件
04.媒体报表需求
05.媒体报表实现---broadcast
06.媒体报表实现---改造---字典存入到redis
07.媒体报表实现---改造---将redis作为字典库
08.代码托管到git

第四天:

01.git创建分支--合并分支--切换分支--删除分支
02.上下文标签需求

第五天:

01.标签实现过程--step1
02.标签实现过程--step2
03.标签实现过程--step3
04.标签实现过程--step4
05.商圈标签实现思路

第六天:

01.经纬度知识库的建立-StepOne
02.经纬度知识库的建立-StepTwo
03.添加商圈标签
04.商圈标签bug解决
05.graph共同好友案例
06.graph解决用户当天标签合并

第七天:

01.案例聚合用户标签
02.案例聚合用户标签--代码实现
03.案例聚合用户标签--代码实现--测试
04.上下文标签数据合并
05.项目总结

第八天:

01.中国移动实时项目背景
02.项目整体业务架构图
03.flume节点及数据量分布
04.需求
05.日志字段说明
06.ScalikeJDBC介绍

第九天:

01.创建kafka -- topic
02.将数据对接到kafka
03.工程搭建--思路分析
04.代码实现-01---kafka偏移量有效性问题
05.代码实现-02---校验更新偏移量
06.代码实现--03--测试接收数据
07.代码实现--04---业务概况指标实现
08.代码实现--05---分区数据处理
09.代码实现--06---省市数据分布---每小时数据分布---每分钟数据分布
10.代码实现--07---偏移量有效性检验观察
11.Echarts展示
12.面试时的项目表述
13.面试问题补充




游客,如果您要查看本帖隐藏内容请回复

回复

使用道具 举报

金币1493  第1151名

1

主题

1091

回帖

2746

积分

禁止发言

威望
0
贡献
1
热心值
0
金币
1493
注册时间
2019-8-3
发表于 2019-8-25 15:24 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

金币23  第15508名

1

主题

363

回帖

641

积分

高级会员

Rank: 4

威望
324
贡献
294
热心值
0
金币
23
注册时间
2020-6-13
发表于 2021-10-24 14:54 | 显示全部楼层
6+66666666
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|瑞客论坛 |网站地图

GMT+8, 2024-11-30 01:23

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表