论坛元老
- 威望
- 254
- 贡献
- 303
- 热心值
- 1
- 金币
- 18103
- 注册时间
- 2020-8-31
|
课程目录:
第一课. “一天理解数据、数据分析和数据挖掘“。
基本概念:数据是什么;通过一个数据实例了解数据分析和数据挖掘的任务和过程;
理论知识点1:统计初步。(课时1-3)
第二课. “必先利其器”。
使用Python搭建初步的数据分析环境;数据结构;数据生成,载入和存储,数据库知识;
理论知识点2:概率和矩阵运算。(课时4-6)
第三课. “了解你的数据”。
数学建模:从实际业务到抽象模型的转换,变量的提取;对数据质量进行初步检验;数据预处理:数据清洗,数据变换,异常值处理,粒度变换,维度变换,离散化等。(课时7-9)
第四课. “理解你的数据”。
数据分析初步:描述性分析;数据分析初步:研究变量之间的关系;数据分析初步:图形和数据可视化,使用可视化进行探索式分析;再说数据质量:抽样;完善Python环境。(课时10-12)
第五课. “深入理解你的数据”。
数据分析进阶:基于假设检验的数据分析,相关、卡方、方差分析;对数据进行降维处理,PCA和SVD;
理论知识点3:假设检验,经典数据分析的框架。(课时13-15)
第六课. “解释与预测”。
回归分析--线性回归,用线性回归模型进行预测,实例-销售量预测;数据分析进阶:广义线性回归,当应变量的分布非正态分布时,实例-用户访问量的预测;
理论知识点4:模型选择。(课时16-18)
第七课. “发现数据蕴含的新模式1”。
数据挖掘初步:定义数据点之间的距离;实例,如何根据兴趣判断两个用户的契合度;构造新变量;KNN;
理论知识点5:模式识别初步。(课时19-21)
第八课. “新模式:数据之间蕴含的关联关系”。
事务型数据挖掘:挖掘频繁项集-电影、购物、图书数据,关联分析-Apriori算法,相关分析。(课时22-24)
第九课. “使用数据辅助决策”。
分类分析:决策树,案例-信用评级;朴素贝叶斯进行分类分析:案例-信用评级;贝叶斯信念网络、支持向量机等其他分类方法;
理论知识点6:再说模型选择(课时25-27)
第十课. “发现新模式2”。
聚类分析:基本概念、方法、和评价;基于划分的方法,案例-寻找客户类型;基于相关的方法,基于密度的方法;
理论知识点7:信息学初步(课时28-30)
第十一课. “不可二次踏入的河流”。
时间序列:金融、天气等数据的分析和挖掘;
理论知识点8:时间序列分析(课时31-33)
第十二课. “一个大招放倒自己”。
数据分析和挖掘综合案例(课时34-36)
|
|