ITエンジニアのための強化学習理論入門―Pythonで学ぶアルゴリズムの動作原理 [単行本]

販売を終了しました

    • ITエンジニアのための強化学習理論入門―Pythonで学ぶアルゴリズムの動作原理 [単行本]

100000009003299169

ITエンジニアのための強化学習理論入門―Pythonで学ぶアルゴリズムの動作原理 [単行本]

販売終了時の価格: ¥3,278(税込)
フォーマット:
出版社:技術評論社
販売開始日: 2020/07/17(販売終了商品)
お取り扱い: のお取り扱い商品です。

販売を終了しました

ITエンジニアのための強化学習理論入門―Pythonで学ぶアルゴリズムの動作原理 の 商品概要

  • 要旨(「BOOK」データベースより)

    強化学習の基礎となるアルゴリズムを体系的に学ぶ。
  • 目次

    第1章 強化学習のゴールと課題
    1.1 強化学習の考え方
    1.2 実行環境のセットアップ
    1.3 バンディットアルゴリズム(基本編)
    1.4 バンディットアルゴリズム(応用編)

    第2章 環境モデルを用いた強化学習の枠組み
    2.1 マルコフ決定過程による環境のモデル化
    2.2 エージェントの行動ポリシーと状態価値関数
    2.3 動的計画法による状態価値関数の決定

    第3章 行動ポリシーの改善アルゴリズム
    3.1 ポリシー反復法
    3.2 価値反復法
    3.3 より実践的な実装例

    第4章 サンプリングデータを用いた学習法
    4.1 モンテカルロ法
    4.2 TD(Temporal-Difference)法

    第5章 ニューラルネットワークによる関数近似
    5.1 ニューラルネットワークによる状態価値関数の計算
    5.2 ニューラルネットワークを用いたQ-Learning
  • 内容紹介

    前作の『ITエンジニアのための機械学習理論入門』から、5年経過しましたが、AI(人工知能)や機械学習に対しての期待と関心はまったく衰えません。むしろ機械学習の利用はIT業界で当然のものとなり、さらなる活用がさまざまな場所で行われています。前作では一般的な機械学習について解説しましたが、試行錯誤しながら1つの解をもとめていく「強化学習理論」についてくわしく・やさしく解説します。理論を表現するいろいろな数式とそれらをプログラミングするためのPythonコードを並列しながらその理論の神髄にせまり、強化学習の基礎となるさまざまなアルゴリズムを体系的に学びます。
  • 著者について

    中井悦司 (ナカイエツジ)
    1971 年4 月大阪生まれ。ノーベル物理学賞を本気で夢見て、理論物理学の研究に没頭する学生時代、大学受験教育に情熱を傾ける予備校講師の頃、そして、華麗なる(?)転身を果たして、外資系ベンダーでLinux エンジニアを生業にするに至るまで、妙な縁が続いて、常にUnix/Linux サーバーと人生を共にする。その後、Linux ディストリビューターのエバンジェリストを経て、現在は、米系IT 企業のSolutions Architectとして活動。
    最近は、機械学習をはじめとするデータ活用技術の基礎を世に広めるために、講演活動のほか、雑誌記事や書籍の執筆にも注力。主な著書は、『[改訂新版]プロのためのLinux システム構築・運用技術』『IT エンジニアのための機械学習理論入門』(いずれも技術評論社)、『TensorFlow とKeras で動かしながら学ぶディープラーニングの仕組み』(マイナビ出版)など。

ITエンジニアのための強化学習理論入門―Pythonで学ぶアルゴリズムの動作原理 の商品スペック

商品仕様
出版社名:技術評論社
著者名:中井 悦司(著)
発行年月日:2020/07/30
ISBN-10:4297115158
ISBN-13:9784297115159
判型:A5
対象:専門
発行形態:単行本
内容:電子通信
言語:日本語
ページ数:283ページ
縦:21cm
他の技術評論社の書籍を探す

    技術評論社 ITエンジニアのための強化学習理論入門―Pythonで学ぶアルゴリズムの動作原理 [単行本] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!