论坛元老
- 威望
- 58
- 贡献
- 83
- 热心值
- 0
- 金币
- 14148
- 注册时间
- 2020-8-31
|
课程介绍:
Mahout是Hadoop家族中与众不同的一个成员,是基于一个Hadoop的机器学习和数据挖掘的分布式计算框架。Mahout是一个跨学科产品,同时也是我认为Hadoop家族中,最有竞争力,最难掌握,最值得学习的一个项目之一。
Mahout为数据分析人员,解决了大数据的门槛;为算法工程师,提供基础的算法库;为Hadoop开发人员,提供了数据建模的标准;为运维人员,打通了和Hadoop连接。
Mahout就是训象人,在Hadoop上创造新的智慧!
Mahout 是基于Hadoop的机器学习和数据挖掘的一个分布式框架。Mahout用MapReduce实现了部分数据挖掘算法,解决了并行挖掘的问题。
根据”Mahout In Action”书中的介绍,Mahout实现3大类算法, 推荐(Recommendation),聚类(Clustering),分类(Classification)。
课程目录:
01、机器学习、Mahout与Hadoop的过去,现在与未来
02、推荐系统算法与架构剖析
03、推荐系统应用案例
04、购物篮分析:频繁模式与频繁子项挖掘
05、聚类算法模型
06、企业大数据环境实现聚类的案例
07、常用分类器及应用场景:贝叶斯,随机森林,SGD,SVM
|
|