現場で使える!pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法 [単行本]
    • 現場で使える!pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法 [単行本]

    • ¥4,180126ポイント(3%還元)
    • 在庫あり2021年9月23日木曜日までヨドバシエクストリームサービス便(無料)がお届け
100000009003251734

現場で使える!pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法 [単行本]

価格:¥4,180(税込)
ポイント:126ポイント(3%還元)(¥126相当)
フォーマット:
専用電子書籍リーダアプリ「Doly」が必要です。無料ダウンロード
お届け日:在庫あり今すぐのご注文で、2021年9月23日木曜日までヨドバシエクストリームサービス便(無料)がお届けします。届け先変更]詳しくはこちら
出版社:翔泳社
販売開始日: 2020/04/18
お取り扱い: のお取り扱い商品です。
ご確認事項:返品不可
店舗受け取りが可能です
マルチメディアAkibaマルチメディア梅田マルチメディア博多にて24時間営業時間外でもお受け取りいただけるようになりました

現場で使える!pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法 の 商品概要

  • 要旨(「BOOK」データベースより)

    本書は、機械学習やデータサイエンスの現場では、データ処理に必要な定番のライブラリ「pandas」を用いて、前処理の基本と様々な前処理手法について、あますところなく解説した書籍です。初学者向けにシンプルでわかりやすいサンプルを用いていますので、pandasの基本操作方法やデータ構造、さらに前処理の基本の理解についてもしっかり学ぶことができます。pandasを理解することで、様々な機械学習・データ分析タスクがスムーズに行えるようになります。
  • 目次

    Chapter 1 pandasの概要とPythonの基本操作
    1.1 機械学習の分野でなくてはならないライブラリ「pandas」
    1.2 pandasを利用する環境の構築
    1.3 Pythonのデータ構造
    1.4 Pythonの基本操作
    1.5 Jupyter Notebookの基本操作

    Chapter 2 pandasのデータ構造
    2.1 シリーズ
    2.2 データフレーム
    2.3 インデックス
    2.4 pandasを触ってみよう

    Chapter 3 データ参照と読み込み
    3.1 データ参照
    3.2 ファイルの読み込み・書き出し

    Chapter 4 データ集計と並べ替え
    4.1 データ集計
    4.2 データ並べ替え

    Chapter 5 データ変形
    5.1 追加と削除
    5.2 データ連結とマージ
    5.3 その他のデータ変形

    Chapter 6 欠損値・外れ値・重複データ
    6.1 欠損値
    6.2 外れ値
    6.3 重複データ

    Chapter 7 関数適用とグループ化
    7.1 関数処理
    7.2 for文によるループ処理
    7.3 データのグループ化

    Chapter 8 その他の操作
    8.1 文字列操作
    8.2 データの可視化
    8.3 階層型インデックス
    8.4 時系列データ

    Chapter 9 データ分析の基本
    9.1 探索的データ解析(EDA)
    9.2 整然データ(Tidy Data)
    9.3 データ分析の実例(Bank Marketing)
    9.4 データ分析の実例(Online Retail Data Set)

  • 出版社からのコメント

    データの前処理をpandasで効率よく行おう!
  • 内容紹介

    機械学習エンジニア&データサイエンティスト必携!
    初学者でもpandasによる前処理手法がわかる

    【本書の背景】
    機械学習やデータサイエンスでは、いかに「きれいなデータ」を用意できるかが非常に重要です。データクレンジングともいわれますが、実際の現場のデータは、機械学習やデータ分析にすぐ利用できるデータは皆無に等しく、エンジニアによりデータの前処理が必須となってきています。

    【本書の概要】
    本書は、機械学習やデータサイエンスの現場では、データ処理に必要な定番のライブラリ「pandas」を用いて、前処理の基本と様々な前処理手法について、あますところなく解説した書籍です。
    初学者向けにシンプルでわかりやすいサンプルを用いていますので、pandasの基本操作方法やデータ構造、さらに前処理の基本の理解についてもしっかり学ぶことができます。
    pandasを理解することで、様々な機械学習・データ分析タスクがスムーズに行えるようになります。

    【本書の対象読者】
    ・機械学習エンジニア(初学者)
    ・データサイエンティスト(初学者)

    【著書からひとこと】
    機械学習では「Garbage In, Garbage Out(略、GIGO)」と言う概念があります。これは「無意味な(ゴミのような)データを入力すると無意味な結果が戻される」の意味です。
    GIGOの概念でも解る通り、機械学習エンジニアは様々な手法で収集された膨大なデータの分析を行い、意味のある結果を得るために、多種多様な手法の前処理/分析を行います。
    機械学習において約7割の時間はデータの前処理に費やされると言われていますが、その多くは「pandas」を使ったものです。
    CSVファイルの読み込みから始まり、要約統計量や欠損値・外れ値・重複データの確認、さらにデータのマージやグループ化などの様々なタスクをpandasで行います。
    本書では機械学習「初学者向け」にpandasの基本的な操作を解説しています。初歩的な要約統計量の算出やグループ化やダミー変数、さらに文字列や時系列データの基本操作など、幅広い範囲をカバーしています。
    日々、データを業務で取り扱う機械学習エンジニアやKaggle等のデータ分析競技をやられている方に向けて、pandasを使ったデータ前処理のお役に立てばと思い執筆いたしました。

  • 著者紹介(「BOOK著者紹介情報」より)(本データはこの書籍が刊行された当時に掲載されていたものです)

    増田 秀人(マスダ ヒデト)
    株式会社ロンバードAI戦略室室長。サンフランシスコ、東南アジアで起業を経て、2017年に機械学習スクール「codexa(コデクサ)」の事業立ち上げ。法人向け研修の講師やxPython Meet Up&Conference 2019などに登壇

現場で使える!pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法 の商品スペック

商品仕様
出版社名:翔泳社
著者名:増田 秀人(著)
発行年月日:2020/04/20
ISBN-10:4798160679
ISBN-13:9784798160672
判型:A5
対象:専門
発行形態:単行本
内容:電子通信
付録:有
言語:日本語
ページ数:675ページ
縦:21cm
その他:ダウンロードファイル
他の翔泳社の書籍を探す

    翔泳社 現場で使える!pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法 [単行本] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!