课程介绍: 本课程主要讲解Spark MLlib,Spark MLlib是一种高效、快速、可扩展的分布式计算框架;实现了常用的机器学习,如:聚类、分类、回归等算法。本课拒绝枯燥的讲述,将循序渐进从Spark的基础知识、矩阵向量的基础知识开始,然后再透彻讲解各个算法的理论、详细展示Spark源码实现,最后均会通过实例进行解析实战,帮助大家真正从理论到实践全面掌握Spark MLlib分布式机器学习。
适用人群:对spark有兴趣,有志从事数据分析,数据挖掘工作方向的朋友。 课程目录:第一课 Spark MLlib基础入门 1、Spark介绍 2、Spark MLlib介绍 3、课程的基础环境 4、Spark RDD操作 5、RDD操作的代码实操 第二课 Spark MLlib矩阵向量 1、Spark MLlib矩阵向量 2、矩阵向量的代码实操 第三课 Spark MLlib线性回归算法 1、线性回归算法 2、源码分析 3、实例 4、实例的代码实操 第四课 Spark MLlib逻辑回归算法 1、逻辑回归算法 2、源码分析 3、实例 4、实例的代码实操 第五课 Spark MLlib贝叶斯分类算法 1、贝叶斯分类算法 2、源码分析 3、实例 4、实例的代码实操 第六课 Spark MLlib决策树算法 1、决策树算法 2、源码分析 3、实例 4、实例的代码实操 第七课 Spark MLlib KMeans聚类算法 1、KMeans聚类算法 2、源码分析 3、实例 4、实例的代码实操 第八课 Spark MLlib FPGrowth关联规则算法 1、FPGrowth关联规则算法 2、源码分析 3、实例 4、实例的代码实操 第九课 Spark MLlib协同过滤推荐算法 1、协同过滤推荐算法 2、源码分析 3、实例 4、实例的代码实操 第十课 Spark MLlib神经网络算法 1、神经网络算法 2、源码分析 3、实例 4、实例的代码实操
|