瑞客论坛

 找回密码
 立即注册
查看: 7377|回复: 41

python3 Reinforcement Learning 强化学习高清视频教程 31课

[复制链接]

金币3418  第477名

125

主题

14

回帖

3480

积分

论坛元老

Rank: 8Rank: 8

威望
0
贡献
61
热心值
1
金币
3418
注册时间
2020-8-31
发表于 2019-3-21 15:19 | 显示全部楼层 |阅读模式
课程介绍:

强化学习是机器学习大家族中的一大类, 使用强化学习能够让机器学着如何在环境中拿到高分, 表现出优秀的成绩. 而这些成绩背后却是他所付出的辛苦劳动, 不断的试错, 不断地尝试, 累积经验, 学习经验.

课程目录:

一、简介

1.1 什么是 强化学习 (Reinforcement Learning)
1.2 强化学习方法汇总 (Reinforcement Learning)
1.3 为什么用强化学习 Why?
1.4 课程要求

二、Q-learning

2.1 小例子
2.2 什么是 Q Leaning
2.3 Q-learning 算法更新
2.4 Q-learning 思维决策

三、Sarsa

3.1 什么是 Sarsa
3.2 Sarsa 算法更新
3.3 Sarsa 思维决策
3.4 什么是 Sarsa(lambda)
3.5 Sarsa-lambda

四、Deep Q Network

4.1 什么是 DQN
4.2 DQN 算法更新 (Tensorflow)
4.3 DQN 神经网络 (Tensorflow)
4.4 DQN 思维决策 (Tensorflow)
4.5 OpenAI gym 环境库
4.6 Double DQN (Tensorflow)
4.7 Prioritized Experience Replay (DQN) (Tensorflow)
4.8 Dueling DQN (Tensorflow)

五、Policy Gradient

5.1 什么是 Policy Gradients
5.2 Policy Gradients 算法更新 (Tensorflow)
5.3 Policy Gradients 思维决策 (Tensorflow)

六、Actor Critic

6.1 什么是 Actor Critic
6.2 Actor Critic (Tensorflow)
6.3 什么是 Deep Deterministic Policy Gradient (DDPG)
6.4 Deep Deterministic Policy Gradient (DDPG) (Tensorflow)
6.5 什么是 Asynchronous Advantage Actor-Critic (A3C)
6.6 Asynchronous Advantage Actor-Critic (A3C) (Tensorflow)
6.7 Distributed Proximal Policy Optimization (DPPO) (Tensorflow)


游客,如果您要查看本帖隐藏内容请回复

回复

使用道具 举报

金币62  第12704名

0

主题

53

回帖

311

积分

中级会员

Rank: 3Rank: 3

威望
129
贡献
120
热心值
0
金币
62
注册时间
2019-5-15
发表于 2019-5-15 10:04 | 显示全部楼层
看看,,,,,,,,,,,,,,,,,,,,
回复

使用道具 举报

金币4045  第377名

1

主题

1149

回帖

1万

积分

论坛元老

Rank: 8Rank: 8

威望
3706
贡献
4544
热心值
0
金币
4045
注册时间
2019-5-9
发表于 2019-5-19 08:48 来自手机 | 显示全部楼层
6666666666
回复

使用道具 举报

金币2290  第777名

0

主题

6279

回帖

1万

积分

论坛元老

Rank: 8Rank: 8

威望
7857
贡献
6127
热心值
0
金币
2290
注册时间
2019-4-11
发表于 2019-5-19 17:07 | 显示全部楼层
python3 Reinforcement Learning 强化学习高清视频教程
回复

使用道具 举报

金币524  第3088名

0

主题

260

回帖

754

积分

高级会员

Rank: 4

威望
97
贡献
133
热心值
0
金币
524
注册时间
2019-7-28
发表于 2019-9-16 17:04 | 显示全部楼层
python3 Reinforcement Learning 强化学习高清视频教程
回复

使用道具 举报

金币271  第4841名

1

主题

52

回帖

389

积分

中级会员

Rank: 3Rank: 3

威望
51
贡献
67
热心值
0
金币
271
注册时间
2019-9-21
发表于 2019-9-21 11:23 | 显示全部楼层
谢谢楼主 , 一定努力学习
回复

使用道具 举报

金币611  第2736名

0

主题

1077

回帖

5979

积分

论坛元老

Rank: 8Rank: 8

威望
2918
贡献
2450
热心值
0
金币
611
注册时间
2020-1-27
发表于 2020-2-13 17:42 | 显示全部楼层
看看 先 感谢分享
回复

使用道具 举报

金币375  第3894名

0

主题

107

回帖

404

积分

中级会员

Rank: 3Rank: 3

威望
11
贡献
18
热心值
0
金币
375
注册时间
2019-10-23
发表于 2020-2-28 02:22 | 显示全部楼层
: python3 Reinforcement Learning 强化学习高清视频教程 3
回复

使用道具 举报

金币6  第26787名

0

主题

93

回帖

122

积分

注册会员

Rank: 2

威望
56
贡献
60
热心值
0
金币
6
注册时间
2020-2-29
发表于 2020-3-1 19:55 | 显示全部楼层
python3 Reinforcement Learning
回复

使用道具 举报

金币89  第11402名

0

主题

2829

回帖

1万

积分

论坛元老

Rank: 8Rank: 8

威望
6031
贡献
4042
热心值
0
金币
89
注册时间
2019-7-2
发表于 2020-3-2 07:14 | 显示全部楼层
xiexie sharing.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|瑞客论坛 |网站地图

GMT+8, 2025-1-15 12:56

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表