エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
Keras-rlとOpenAIgym Keras-rl 深層学習用ライブラリであるkerasを用いて、深層強化学習のアルゴリズム... Keras-rlとOpenAIgym Keras-rl 深層学習用ライブラリであるkerasを用いて、深層強化学習のアルゴリズムを実装したライブラリ。 OpenAIgym 強化学習アルゴリズムの開発と評価のためのプラットフォーム。 強化学習では「エージェント」の行動を「環境」が評価して報酬を渡します。「エージェント」はもらった報酬から新たに行動を決め、実行します。 「深層学習が強化学習において果たす役割とは?『現場で使える!Python深層強化学習入門』から紹介」より参照 今回は「エージェント」をKeras-rl、「環境」をOpenAIgymで作っていきます。 ボール反射ゲーム 画面端で反射するボールをプレーヤーが皿を動かして打ち返すだけのゲームです。 import pygame from pygame.locals import * import sys import math impo