jcwleo/Reinforcement_Learning

Name

Last commit message

Last commit date

Latest commit

History

Reinforcement Learning

Here is my new Repo for Policy Gradient!!

1. Q-Learning / SARSA

2. Q-Network (Action-Value Function Approximation)

3. DQN

DQN(NIPS2013)은 (Experience Replay Memory / CNN) 을 사용.

DQN(Nature2015)은 (Experience Replay Memory / Target Network / CNN) 을 사용

5. Vanilla Policy Gradient(REINFORCE)

6. Advantage Actor Critic

7. Deep Deterministic Policy Gradient

8. Parallel Advantage Actor Critic(is called 'A2C' in OpenAI)

9. C51(Distributional RL)

10. PPO(Proximal Policy Optimization)

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

jcwleo/Reinforcement_Learning

Folders and files

Latest commit

History

Repository files navigation

Reinforcement Learning

Here is my new Repo for Policy Gradient!!

1. Q-Learning / SARSA

2. Q-Network (Action-Value Function Approximation)

3. DQN

5. Vanilla Policy Gradient(REINFORCE)

6. Advantage Actor Critic

7. Deep Deterministic Policy Gradient

8. Parallel Advantage Actor Critic(is called 'A2C' in OpenAI)

9. C51(Distributional RL)

10. PPO(Proximal Policy Optimization)

About

Releases

Packages

Languages

jcwleo/Reinforcement_Learning

Folders and files

Latest commit

History

Repository files navigation

Reinforcement Learning

Here is my new Repo for Policy Gradient!!

1. Q-Learning / SARSA

2. Q-Network (Action-Value Function Approximation)

3. DQN

5. Vanilla Policy Gradient(REINFORCE)

6. Advantage Actor Critic

7. Deep Deterministic Policy Gradient

8. Parallel Advantage Actor Critic(is called 'A2C' in OpenAI)

9. C51(Distributional RL)

10. PPO(Proximal Policy Optimization)

About

Releases

Packages 0

Languages

Packages