尚硅谷大数据技术之Spark3.x性能优化
〖课程简介〗:
本套课程从多个方面展开讲解Spark的调优策略,包括资源配置调优、SparkSQL语法调优、执行计划解读、数据倾斜问题解决、Job优化、Spark3.0新特性详解。
〖课程目录〗:
01-课程简介.mp416.70M
02_执行计划_准备测试数据和表.mp419.46M
03_执行计划_执行流程&案例实操解读.mp4150.13M
04-资源规划-资源设定上限估算.mp421.24M
05-资源规划-精确内存估算.mp428.01M
06-资源规划-精确调整内存各比例.mp415.72M
07-缓存调优-RDD-进行cache.mp439.32M
08-缓存调优-RDD-cache结合kryo序列化.mp421.24M
09-缓存调优-DS-cache和序列化.mp445.65M
10-CPU调优-合理利用CPU资源.mp486.32M
11-语法优化-RBO-inner join的谓词下推.mp470.46M
12-语法优化-RBO-外关联的谓词下推.mp467.87M
13-语法优化-RBO-列裁剪&常量替换.mp421.49M
14-语法优化-CBO-Statics统计&CBO使用效果.mp4124.05M
15-语法优化-广播Join.mp489.08M
16-语法优化-Join-SMB Join原理.mp421.10M
17-语法优化-Join-SMB Join效果演示.mp447.41M
18-数据倾斜-现象&原因&抽样定位大key.mp433.99M
19-数据倾斜-单表数据倾斜处理.mp458.08M
20-数据倾斜-Join-使用广播Join.mp442.45M
21-数据倾斜-Join-拆分key 打散大表 扩容小表.mp487.33M
22-Map端优化-使用Map端预聚合.mp46.00M
23-Map端优化-读取小文件优化.mp4142.67M
24-Map端优化-调大ShuffleWrite溢写时的输出流缓冲&源码分析.mp4107.28M
25-Reduce端优化-输出产生小文件优化-调整并行度&缩小分区.mp432.14M
26-Reduce端优化-动态分区插入小文件优化.mp438.08M
27-Reduce端优化-提高Reduce端缓冲区&重试次数&重试等待间隔.mp474.27M
28-Reduce端优化-合理使用bypass.mp442.01M
29-Job优化-调节数据本地化等待时间.mp499.06M
30-Job优化-堆外内存的版本区别.mp443.81M
31-Job优化-使用堆外缓存.mp440.56M
32-Job优化-调整连接等待时长.mp445.39M
33-Spark3.0-AQE-动态合并分区&动态申请资源.mp4102.12M
34-Spark3.0-AQE-动态切换Join策略.mp443.37M
35-Spark3.0-AQE-自动优化join倾斜.mp487.61M
36-Spark3.0-DPP-动态分区裁剪.mp469.25M
37-Spark3.0-Hint增强.mp425.36M
38-常见故障思路简析.mp447.06M
├──笔记.zip2.70M
├──代码.zip45.67kb
└──资料.zip262.00M
**** Hidden Message ***** 果您要查看本帖隐藏内 强烈支持楼主ing…… 激动人心,无法言表! 和词汇 支持啊 谢谢分享。。。。。。 强烈支持楼主ing…… 强烈支持楼主ing…… 强烈支持楼主ing…… 看到这帖子真是高兴!