Python ではじめる機械学習 - scikit-learn で学ぶ特徴量エンジニアリングと機械学習の基礎

出版日
ページ数
392
Python ではじめる機械学習 - scikit-learn で学ぶ特徴量エンジニアリングと機械学習の基礎
ISBN10
4873117984
ISBN13
978-4873117980
目次
目次 まえがき 1章 はじめに 1.1 なぜ機械学習なのか? 1.2 なぜ Python なのか? 1.3 scikit-learn 1.4 必要なライブラリとツール 1.5 Python 2 vs. Python 3 1.6 本書で用いているバージョン 1.7 最初のアプリケーション:アイリスのクラス分類 1.8 まとめと今後の展望 2章 教師あり学習 2.1 クラス分類と回帰 2.2 汎化、過剰適合、適合不足 2.3 教師あり機械学習アルゴリズム 2.4 クラス分類器の不確実性推定 2.5 まとめと展望 3章 教師なし学習と前処理 3.1 教師なし学習の種類 3.2 教師なし学習の難しさ 3.3 前処理とスケール変換 3.4 次元削減、特徴量抽出、多様体学習 3.5 クラスタリング 3.6 まとめと展望 4章 データの表現と特徴量エンジニアリング 4.1 カテゴリ変数 4.2 ビニング、離散化、線形モデル、決定木 4.3 交互作用と多項式 4.4 単変量非線形変換 4.5 自動特徴量選択 4.6 専門家知識の利用 4.7 まとめと展望 5章 モデルの評価と改良 5.1 交差検証 5.2 グリッドサーチ 5.3 評価基準とスコア 5.4 まとめと展望 6章 アルゴリズムチェーンとパイプライン 6.1 前処理を行う際のパラメータ選択 6.2 パイプラインの構築 6.3 パイプラインを用いたグリッドサーチ 6.4 汎用パイプラインインターフェイス 6.5 前処理ステップとモデルパラメータに対するグリッドサーチ 6.6 グリッドサーチによるモデルの選択 6.7 まとめと展望 7章 テキストデータの処理 7.1 文字列として表現されているデータのタイプ 7.2 例題アプリケーション:映画レビューのセンチメント分析 7.3 Bag of Words によるテキスト表現 7.4 ストップワード 7.5 tf.idf を用いたデータのスケール変換 7.6 モデル係数の調査 7.7 1 単語よりも大きい単位の Bag-of-Words ( n-グラム ) 7.8 より進んだトークン分割、語幹処理、見出し語化 7.9 トピックモデリングと文書クラスタリング 7.10 まとめと展望 8章 おわりに 8.1 機械学習問題へのアプローチ 8.2 プロトタイプから運用システムへ 8.3 運用システムのテスト 8.4 独自 Estimator の構築 8.5 ここからどこへ行くのか 8.6 結論 索引
紹介( powered by openBD

数学の知識がなくても読み進められる、理論だけでなく実践面も重視した機械学習の入門書!
バックグラウンドに数学的な知識がなくても理解できるように書かれた、Pythonを使った機械学習の入門書。Pythonの機械学習用ライブラリの大定番、scikit-learnの開発に関わる著者が、scikit-learnを使った機械学習の方法を、ステップバイステップで解説します。最初に実践について述べて後から理論を補強するスタイルで、理解しやすいように工夫されています。理論面と実践面のバランスが良く、モデルの評価と改善について多くの紙面を割くなど、類書にはない特徴を備えています。