ITエンジニアのための強化学習理論入門(技術評論社) [電子書籍]
    • ITエンジニアのための強化学習理論入門(技術評論社) [電子書籍]

    • ¥3,278656ポイント(20%還元)
    • すぐ読めます
100000086601115558

ITエンジニアのための強化学習理論入門(技術評論社) [電子書籍]

価格:¥3,278(税込)
ポイント:656ポイント(20%還元)(¥656相当)
フォーマット:
専用電子書籍リーダアプリ「Doly」が必要です。無料ダウンロード
出版社:技術評論社
公開日: 2020年07月17日
すぐ読めます。
お取り扱い: のお取り扱い商品です。
ご確認事項:電子書籍リーダーアプリ「Doly」専用コンテンツ
こちらの商品は電子書籍版です

ITエンジニアのための強化学習理論入門(技術評論社) の 商品概要

  • 前作の『ITエンジニアのための機械学習理論入門』から,5年経過しましたが,AI(人工知能)や機械学習に対しての期待と関心はまったく衰えません。むしろ機械学習の利用はIT業界で当然のものとなり,さらなる活用がさまざまな場所で行われています。前作では一般的な機械学習について解説しましたが,試行錯誤しながら1つの解をもとめていく「強化学習理論」についてくわしく・やさしく解説します。理論を表現するいろいろな数式とそれらをプログラミングするためのPythonコードを並列しながらその理論の神髄にせまり,強化学習の基礎となるさまざまなアルゴリズムを体系的に学びます。
  • 目次

    第1章 強化学習のゴールと課題
    1.1 強化学習の考え方
    1.2 実行環境のセットアップ
    1.3 バンディットアルゴリズム(基本編)
    1.4 バンディットアルゴリズム(応用編)
    第2章 環境モデルを用いた強化学習の枠組み
    2.1 マルコフ決定過程による環境のモデル化
    2.2 エージェントの行動ポリシーと状態価値関数
    2.3 動的計画法による状態価値関数の決定
    第3章 行動ポリシーの改善アルゴリズム
    3.1 ポリシー反復法
    3.2 価値反復法
    3.3 より実践的な実装例
    第4章 サンプリングデータを用いた学習法
    4.1 モンテカルロ法
    4.2 TD(Temporal-Difference)法
    第5章 ニューラルネットワークによる関数近似
    5.1 ニューラルネットワークによる状態価値関数の計算
    5.2 ニューラルネットワークを用いたQ-Learning

ITエンジニアのための強化学習理論入門(技術評論社) の商品スペック

Cコード 3055
出版社名 技術評論社
紙の本のISBN-13 9784297115159
他の技術評論社の電子書籍を探す
ファイルサイズ 26.7MB
著者名 中井悦司
著述名

    技術評論社 ITエンジニアのための強化学習理論入門(技術評論社) [電子書籍] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!