Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

CodeRayZhang/Reinforcement-Learning

Folders and files

NameName
Last commit message
Last commit date

Latest commit

History

32 Commits

Repository files navigation

强化学习的博客及配套代码

记录自己强化学习由浅入深的学习过程,目前主要参考的资料是David Silver的公开课,下面提到的代码有部分源于网络。

强化学习博客与代码:

博客 代码
强化学习-术语和数学符号
强化学习(一)简介
强化学习(二)马尔科夫决策过程
强化学习(三)动态规划寻找最优策略
强化学习(四)不基于模型的预测
强化学习(五)不基于模型的控制
强化学习实践(一)Tic-Tac-Toe游戏 代码
强化学习实践(二)迭代法评估4*4方格世界下的随机策略 代码
强化学习实践(三)理解gym的建模思想
强化学习实践(四)编写通用的格子世界环境类 代码
强化学习实践(五)Agent类和SARSA算法实现 代码
强化学习实践(六)SARSA(λ)算法实现 代码
强化学习(六)价值函数的近似表示
强化学习实践(七)给Agent添加记忆功能 代码
强化学习(七)策略梯度
强化学习(八)整合学习与规划
强化学习(九)探索与利用
强化学习实践(八)DQN的实现 代码

About

Reinforcement Learning学习之路

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

AltStyle によって変換されたページ (->オリジナル) /