Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

QLUT-AMD-Lab/RL_Learning

Folders and files

NameName
Last commit message
Last commit date

Latest commit

History

8 Commits

Repository files navigation

RL_Learning 🎉️

简介 📖

本项目为西湖大学赵世钰老师的强化学习课程代码实践,目前完成了1-9章的大部分代码,包括仿真环境的搭建 值迭代,策略迭代 蒙特卡洛 时序差分 状态值近似 DQN Reinforce 等算法的实现。尽可能的追求复现,但是作者代码水平有限,不免存在许多bug以及效率低下之处,请大家仅作参考。

非常幸运能够发现这一门课,因为这门课我知道了RL。

比较过市面上很多其他的资料,不管是课程还是教材的质量都是顶尖的。

像赵老师一样愿意耗费如此心血,制作如此高质量的视频的老师已经很少了。

谨以此开源仓库向赵老师致敬✋,当然,这个仓库目前还不够。

本人代码以及RL水平有限,仅作参考。

代码演示视频地址

项目持续更新中 🚶

赵世钰老师课程地址 💌

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%

AltStyle によって変換されたページ (->オリジナル) /