大規模言語モデル入門(技術評論社) [電子書籍]
    • 大規模言語モデル入門(技術評論社) [電子書籍]

    • ¥3,520704ポイント(20%還元)
    • すぐ読めます
100000086602035188

大規模言語モデル入門(技術評論社) [電子書籍]

山田育矢(著者)鈴木正敏(著者)山田康輔(著者)李凌寒(著者)山田育矢 監修
価格:¥3,520(税込)
ポイント:704ポイント(20%還元)(¥704相当)
フォーマット:
専用電子書籍リーダアプリ「Doly」が必要です。無料ダウンロード
出版社:技術評論社
公開日: 2023年07月29日
すぐ読めます。
お取り扱い: のお取り扱い商品です。
ご確認事項:電子書籍リーダーアプリ「Doly」専用コンテンツ
こちらの商品は電子書籍版です

大規模言語モデル入門(技術評論社) [電子書籍] の 商品概要

  • ChatGPTに代表される大規模言語モデルが自然言語処理の幅広いタスクで高い性能を獲得し,大きな話題となっています。大規模言語モデルは,大規模なテキストデータで訓練された大規模なパラメータで構成されるニューラルネットワークです。2020年以降,自然言語処理や機械学習の知見をもとに,パラメータ数とテキストデータの拡大により,性能が飛躍的に向上しました。
    Hugging Face社の"transformers"というPythonライブラリを利用することで,プログラミングの経験があれば,モデルの操作やデータからの学習がかんたんにできます。モデルを訓練するための日本語もしくは日本語を含む多言語のデータセットも充実してきており,すぐに業務に使える実用的なモデルを作ることが可能な時代がやってきました。本書は,大規模言語モデルの理論と実装の両方を解説した入門書です。大規模言語モデルの技術や自然言語処理の課題について理解し,実際の問題に対処できるようになることを目指しています。以下のような構成によって,理論とプログラミングの双方の側面から,大規模言語モデルに関する情報を提供します。
  • 目次

    第1章 はじめに
    1.1 transformersを使って自然言語処理を解いてみよう
    1.2 transformersの基本的な使い方
    1.3 単語埋め込みとニューラルネットワークの基礎
    1.4 大規模言語モデルとは

    第2章 Transformer
    2.1 概要
    2.2 エンコーダ
    2.3 エンコーダ・デコーダ
    2.4 デコーダ

    第3章 大規模言語モデルの基礎
    3.1 単語の予測から学習できること
    3.2 GPT(デコーダ)
    3.3 BERT・RoBERTa(エンコーダ)
    3.4 T5(エンコーダ・デコーダ)
    3.5 多言語モデル
    3.6 トークナイゼーション

    第4章 大規模言語モデルの進展
    4.1 モデルの大規模化とその効果
    4.2 プロンプトによる言語モデルの制御
    4.3 アライメントの必要性
    4.4 指示チューニング
    4.5 人間のフィードバックからの強化学習
    4.6 ChatGPT

    第5章 大規模言語モデルのファインチューニング
    5.1 日本語ベンチマーク:JGLUE
    5.2 感情分析モデルの実装
    5.3 感情分析モデルのエラー分析
    5.4 自然言語推論・意味的類似度計算・多肢選択式質問応答モデルの実装
    5.5 メモリ効率の良いファインチューニング
    5.6 日本語大規模言語モデルの比較

    第6章 固有表現認識
    6.1 固有表現認識とは
    6.2 データセット・前処理・評価指標
    6.3 固有表現認識モデルの実装
    6.4 アノテーションツールを用いたデータセット構築

    第7章 要約生成
    7.1 要約生成とは
    7.2 データセット
    7.3 評価指標
    7.4 見出し生成モデルの実装

    第8章 文埋め込み
    8.1 文埋め込みとは.
    8.2 文埋め込みモデルSimCSE
    8.3 文埋め込みモデルの実装
    8.4 最近傍探索ライブラリFaissを使った検索

    第9章 質問応答
    9.1 質問応答システムのしくみ
    9.2 データセットと評価指標
    9.3 ChatGPTにクイズを答えさせる
    9.4 文書検索モデルの実装
    9.5 文書検索モデルとChatGPTを組み合わせる

大規模言語モデル入門(技術評論社) [電子書籍] の商品スペック

Cコード 3055
出版社名 技術評論社
本文検索
紙の本のISBN-13 9784297136338
他の技術評論社の電子書籍を探す
ファイルサイズ 23.9MB
著者名 山田育矢
鈴木正敏
山田康輔
李凌寒
山田育矢 監修
著述名 著者

    技術評論社 大規模言語モデル入門(技術評論社) [電子書籍] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!