论坛元老
- 威望
- 152
- 贡献
- 172
- 热心值
- 5
- 金币
- 11038
- 注册时间
- 2020-8-31
|
课程介绍:
强化学习是当下爆火的机器学习经典模型,由于深度学习发展的迅速,使得强化学习和深度学习可以紧密的联系在一起。从AlphaGo到无人驾驶汽车,强化学习的应用越来越广泛也使得更多的学者关注这个领域。
系列课程从实例出发,形象解读强化学习究竟做了一件什么事以及如何完成这一系列任务。由强化学习的基本概念过度到马尔科夫决策过程,通过实例演示如何通过值迭代求解来得出来最好的决策。举例讲解Q-Learning算法的原理以及如何讲强化学习和深度学习进行结合。最后通过让AI自动玩游戏的项目实战实例演示如何实现用强化学习和卷积神经网络打造DQN网络模型。
课程目标:
带领同学们快速掌握机器学习界爆火的强化学习系列并将强化学习与深度学习进行结合,实例演示如何使用DQN网络让AI自己玩游戏!
适用人群:
机器学习,深度学习,人工智能爱好者
课程目录:
1 强化学习简介
课程介绍
2 强化学习基本概念
课程大纲
3 马尔科夫决策过程
学习资料
4 Bellman方程
学员评价
5 值迭代求解
强化学习原理形象解读
6 代码实战求解过程
强化学习所涉及基本概念讲解
7 QLearning基本原理
马尔科夫决策过程原理
8 QLearning迭代计算实例
Bellman方程的作用
9 QLearning迭代效果
如何使用值迭代来求解决策过程
10 求解流程详解
实战如何使用值迭代来求解决策过程
11 DeepQnetwork原理
强化学习中QLearning算法基本原理解释
12 DQN网络细节
实例解释QLearning迭代计算流程
13 DQN网络参数配置
实例演示QLearning算法迭代计算结果
14 搭建DQN网络模型
对求解过程进行分析
15 DQN卷积操作定义
经典强化学习模型DQN原理
16 数据预处理
对DQN网络细节进行分析
17 实验阶段数据存储
DQN网络模型所涉及的参数配置
18 实现训练模块
DQN网络模型构造
19 Debug解读训练代码
DQN卷积网络中所涉及到的计算
20 完整代码流程分析
对图像数据进行处理,构造网络的输入
21 DQN效果演示
通过实验阶段来构造训练时的输入数据
|
|