現場で使える!Python深層強化学習入門―強化学習と深層学習による探索と制御(現場で使える!シリーズ) [単行本]
    • 現場で使える!Python深層強化学習入門―強化学習と深層学習による探索と制御(現場で使える!シリーズ) [単行本]

    • ¥3,740113 ゴールドポイント(3%還元)
    • 在庫あり2025年2月13日木曜日までヨドバシエクストリームサービス便(無料)がお届け
100000009003153914

現場で使える!Python深層強化学習入門―強化学習と深層学習による探索と制御(現場で使える!シリーズ) [単行本]

伊藤 多一(ほか著)今津 義充(ほか著)須藤 広大(ほか著)仁ノ平 将人(ほか著)川崎 悠介(ほか著)
価格:¥3,740(税込)
ゴールドポイント:113 ゴールドポイント(3%還元)(¥113相当)
フォーマット:
お届け日:在庫あり今すぐのご注文で、2025年2月13日木曜日までヨドバシエクストリームサービス便(無料)がお届けします。届け先変更]詳しくはこちら
出版社:翔泳社
販売開始日: 2019/08/07
お取り扱い: のお取り扱い商品です。
ご確認事項:返品不可
店舗受け取りが可能です
マルチメディアAkibaマルチメディア梅田マルチメディア博多にて24時間営業時間外でもお受け取りいただけるようになりました

現場で使える!Python深層強化学習入門―強化学習と深層学習による探索と制御(現場で使える!シリーズ) の 商品概要

  • 要旨(「BOOK」データベースより)

    AlphaGo(アルファ碁)でも利用されている深層強化学習。AIサービスのみならずロボティクス分野でもその応用が期待されています。本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。
  • 目次

    ■Part 1 基礎編



    CHAPTER 1 強化学習の有用性

     1.1 機械学習の分類

     1.2 強化学習でできること

     1.3 深層強化学習とは



    CHAPTER 2 強化学習のアルゴリズム

     2.1 強化学習の基本概念

     2.2 マルコフ決定過程とベルマン方程式

     2.3 ベルマン方程式の解法

     2.4 モデルフリーな制御



    CHAPTER 3 深層学習による特徴抽出

     3.1 深層学習

     3.2 畳み込みニューラルネットワーク(CNN)

     3.3 再帰型ニューラルネットワーク(RNN)



    CHAPTER 4 深層強化学習の実装

     4.1 深層強化学習の発展

     4.2 行動価値関数のネットワーク表現

     4.3 方策関数のネットワーク表現



    ■Part 2 応用編



    CHAPTER 5 連続制御問題への応用

     5.1 方策勾配法による連続制御

     5.2 学習アルゴリズムと方策モデル

     5.3 連続動作シミュレータ

     5.4 アルゴリズムの実装

     5.5 学習結果と予測制御



    CHAPTER 6 組合せ最適化への応用

     6.1 組合せ最適化への応用について

     6.2 巡回セールスマン問題

     6.3 ルービックキューブ問題

     6.4 まとめ



    CHAPTER 7 系列データ生成への応用

     7.1 SeqGANによる文章生成

     7.2 ネットワークアーキテクチャの探索



    APPENDIX 開発環境の構築

     AP1 ColaboratoryによるGPUの環境構築

     AP2 DockerによるWindowsでの環境構築

  • 出版社からのコメント

    注目の深層強化学習の理論と実践手法を徹底解説!
  • 内容紹介

    注目の最新AI技術!深層強化学習の開発手法がわかる!

    第一線で活躍する著者陣の書下ろしによる待望の1冊!



    【本書の目的】

    AlphaGo(アルファ碁)でも利用されている深層強化学習。

    AIサービスのみならずロボティクス分野でもその応用が期待されています。

    本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。



    【本書の特徴】

    第1部では、まず、深層強化学習の概要について説明します。

    次いで、強化学習の基礎(Q学習、方策勾配法、Actor-Critic法)と深層学習の基礎(CNN、RNN、LSTM)を解説します。

    さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。

    第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。

    1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。

    2つ目は、パズル問題の解法です。巡回セールスマン問題(TSP)やルービックキューブの解探索について説明します。

    3つ目は、系列データ生成です。文書生成(SeqGAN)やニューラルネットワークのアーキテクチャ探索(ENAS)を解説します。


    全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。



    【読者が得られること】

    深層強化学習による開発手法を学ぶことができます。


    【対象読者】

    深層強化学習を学びたい理工学生・エンジニア

  • 著者紹介(「BOOK著者紹介情報」より)(本データはこの書籍が刊行された当時に掲載されていたものです)

    伊藤 多一(イトウ タイチ)
    1995年名古屋大学大学院理学研究科博士課程修了。博士(理学)。2004年3月まで素粒子物理学の研究に従事。同年、受託データ分析を専業とするベンチャー企業に入社、数々のデータ分析案件に携わる。2013年よりブレインパッド社にて機械学習による広告効果分析などに携わる。2016年以降は深層学習による画像解析案件にも携わる

    今津 義充(イマズ ヨシミツ)
    素粒子・原子核物理学の研究を通して統計分析・モデル構築、数値シミュレーションに精通。2013年よりブレインパッド社にて需要予測や数理最適化などの定量分析案件を主導。近年は深層学習技術を活用した分析案件や応用研究に従事。博士(理学)

    須藤 広大(スドウ コウダイ)
    1年間の世界放浪の後、奈良先端科学技術大学院大学で自然言語処理学を専攻。修士(情報工学)。新卒でブレインパッド社に入社し、機械学習エンジニアとして、深層学習に関連した分析・開発案件に携わる

    仁ノ平 将人(ニノヒラ マサト)
    大学院では経営システム工学を専攻し、2018年にデータサイエンティストとしてブレインパッド社に新卒入社。入社後は強化学習や自然言語処理を用いた案件に従事。修士(工学)

    川崎 悠介(カワサキ ユウスケ)
    大学では情報工学を専攻し、2018年にブレインパッド社に入社。画像認識・時系列予測を用いた案件に携わる。修士(工学)

    酒井 裕企(サカイ ユウキ)
    2018年、大学院では素粒子論を専攻し、学位取得後はデータサイエンティストとしてブレインパッド社に新卒入社、自社プロダクトにまつわるデータ分析案件に携わる。博士(理学)

    魏 崇哲(ウェイ チョンチェア)
    2011年、オークランド大学大学院機械工学科修士課程修了。修士(機械工学)。卒業後、Foxconnに入社、ロボットの研究開発に携わる。2018年にブレインパッド社に入社、深層学習と強化学習による画像分析とゲームAI開発案件に携わる

現場で使える!Python深層強化学習入門―強化学習と深層学習による探索と制御(現場で使える!シリーズ) の商品スペック

商品仕様
出版社名:翔泳社
著者名:伊藤 多一(ほか著)/今津 義充(ほか著)/須藤 広大(ほか著)/仁ノ平 将人(ほか著)/川崎 悠介(ほか著)
発行年月日:2019/08/07
ISBN-10:4798159921
ISBN-13:9784798159928
判型:A5
発売社名:翔泳社
対象:専門
発行形態:単行本
内容:電子通信
付録:有
言語:日本語
ページ数:313ページ
縦:21cm
その他:ダウンロードファイル
他の翔泳社の書籍を探す

    翔泳社 現場で使える!Python深層強化学習入門―強化学習と深層学習による探索と制御(現場で使える!シリーズ) [単行本] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!