金牌会员
- 威望
- 26
- 贡献
- 68
- 热心值
- 0
- 金币
- 2162
- 注册时间
- 2020-8-31
|
课程介绍:
做这个实践的主要目的就是让我们活学活用, 从0开始搭建一个强化学习框架. 之前我们在强化学习系列教程中学习到了很多强化学习的知识, 了解了各种算法应该怎样运用, 从最简单的 Q-Learning 到结合神经网络的 DQN, 再到做连续动作的 DDPG 以及分布式训练的 A3C 和 DPPO. 但是我们却没有真正意义上的实践过一次, 因为在那个系列中大多数时候我们只关注了算法本身. 但是搭建模拟环境, 调整参数也同样重要. 所以我们在这个系列中将会做到这些, 让你真正意义上入门了强化学习.
课程目录:
项目一、强化学习机器人手臂
1.1 从头开始做一个机器手臂1 搭建结构
1.2 从头开始做一个机器手臂2 写静态环境
1.3 从头开始做一个机器手臂3 写动态环境
1.4 从头开始做一个机器手臂4 加入强化学习算法
1.5 从头开始做一个机器手臂5 完善测试
项目二、汽车状态分类器
2.1 从头开始做一个汽车状态分类器1: 分析数据
2.2 从头开始做一个汽车状态分类器2: 搭建模型
|
|