论坛元老
- 威望
- 152
- 贡献
- 152
- 热心值
- 0
- 金币
- 2988
- 注册时间
- 2020-8-31
|
课程目录
1 - 简介
2 - 行动时间
3 - 评估数据质量 I
4 - 评估数据质量 II
5 - 表格格式
6 - CSV 格式
7 - 解析 CSV 文件
8 - 解析 CSV 文件 Solution
9 - 问题行
10 - 问题行 Solution
11 - 使用 CSV 模块
12 - XLRD 简介
13 - 读取 Excel 文件
14 - 读取 Excel 文件 Solution
15 - JSON 简介
16 - JSON 中的数据建模
17 - JSON Playground
18 - 探索 JSON
19 - 探索 JSON Solution
20 - 通过考核
21 - 欢迎学习第 2 课
22 - XML 简介
23 - XML 设计原则
24 - 实践中的 XML
25 - XML 基础知识
26 - 解析 XML
27 - 提取数据
28 - 处理属性
29 - 屏幕抓取简介
30 - 工作示例简介
31 - 示例详情
32 - 数据在哪里?
33 - 步骤
34 - 提取实体
35 - 开始构建 http 请求
36 - 要做的比预期更多
37 - 有多少表单元素
38 - 有多少表单元素 Solution
39 - 使用 Beautiful Soup
40 - 请求中断
41 - 抓取的最佳做法
42 - 抓取解法
43 - 小结
44 - 简介
45 - 什么是数据清理?
46 - 脏数据来源
47 - 测量数据质量
48 - 质量度量的难点
49 - 针对清理的蓝图
50 - 使用蓝图的示例
51 - 审查有效性
52 - Wikipedia 信息框数据集
53 - 审查交叉字段的约束条件
54 - 审查准确率
55 - 审查准确率 2
56 - 审查完整性
57 - 审查一致性
58 - 一致性
59 - 审查均匀性
60 - 更多关于数据修正的信息
61 - 结论
62 - MongoDB 简介
63 - MongoDB 中的数据建模
64 - 为何使用 MongoDB?
65 - 灵活的模式
66 - PyMongo 简介
67 - 使用字段选择进行查询
68 - 多项字段查询
69 - 投影查询
70 - 将数据导入 MongoDB
71 - 使用 mongoimport
72 - 运算符
73 - 范围查询
74 - 存在
75 - 正则运算符
76 - 使用标量查询数组
77 - in 运算符
78 - all 运算符
79 - 点表示法
80 - 更新
81 - 设置与复位
82 - 多项更新
83 - 删除文档
84 - 结论
85 - 第 5 课简介
86 - Twitter 数据集
87 - 聚合框架示例
88 - 聚合管道
89 - 聚合运算符 1
90 - 聚合运算符 2
91 - Match 运算符
92 - Project 运算符
93 - Unwind 运算符
94 - 组累加运算符
95 - 使用给定运算符的多个阶段
96 - 索引
97 - 使用索引
98 - 地理空间索引
99 - 恭喜
100 - 简介
101 - 熟悉数据集
102 - 迭代解析
103 - Open Street Map XML 中的道路
104 - 循环访问道路标签
105 - 审查街道名
106 - 查看街道名审查
107 - 下一步用图形做什么
|
|