書誌事項

強化学習編

斎藤康毅著

(ゼロから作るdeep learning, 4)

オライリー・ジャパン , オーム社 (発売), 2022.4

タイトル別名

強化学習編

タイトル読み

キョウカ ガクシュウ ヘン

大学図書館所蔵 件 / 275

この図書・雑誌をさがす

注記

参考文献: p343-347

索引: p349-355

内容説明・目次

内容説明

人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。

目次

  • 1章 バンディット問題
  • 2章 マルコフ決定過程
  • 3章 ベルマン方程式
  • 4章 動的計画法
  • 5章 モンテカルロ法
  • 6章 TD法
  • 7章 ニューラルネットワークとQ学習
  • 8章 DQN
  • 9章 方策勾配法
  • 10章 さらに先へ
  • 付録

「BOOKデータベース」 より

関連文献: 1件中  1-1を表示

詳細情報

  • NII書誌ID(NCID)
    BC13737932
  • ISBN
    • 9784873119755
  • 出版国コード
    ja
  • タイトル言語コード
    jpn
  • 本文言語コード
    jpn
  • 出版地
    東京,東京
  • ページ数/冊数
    xviii, 355p
  • 大きさ
    21cm
  • 分類
  • 件名
  • 親書誌ID
ページトップへ

AltStyle によって変換されたページ (->オリジナル) /