Python によるデータ分析入門 - NumPy、pandas を使ったデータ処理

出版日
ページ数
474
説明

データ分析用途で Python に興味のある方におすすめな書籍です。 NumPy などの強力な数学・数値計算ライブラリの利用方法が紹介されています。

目次
訳者まえがき まえがき 1章 はじめに 1.1 この本で説明する内容 1.2 なぜ Python はデータ分析者におすすめなのか 1.3 本書で扱う重要な Python ライブラリ 1.4 インストールとセットアップ 1.5 コミュニティとカンファレンス(会議) 1.6 この本の読み方の案内 1.7 謝辞 2章 Python によるデータ分析事例 2.1 データ分析の例: 短縮 URL 1.usa.gov への変換データ 2.2 データ分析の例: MovieLens 1M (映画評価データ) 2.3 データ分析の例: アメリカの赤ちゃんに名付けられた名前リスト( 1880-2010 ) 2.4 この章のまとめと次のステップ 3章 IPython: 対話的な開発環境 3.1 IPython の基本 3.2 コマンド履歴の利用 3.3 オペレーティングシステムとの連携 3.4 ソフトウェア開発ツール 3.5 IPython HTML ノートブック 3.6 IPython での生産的コード開発に向けたヒント 3.7 高度な IPython 機能 3.8 謝辞 4章 NumPy の基本: 配列とベクトル演算 4.1 NumPy ndarray: 多次元配列オブジェクト 4.2 ユニバーサル関数: すべての配列要素への関数適用 4.3 ndarray を用いたデータ処理 4.4 ndarray のファイル入出力 4.5 行列計算 4.6 乱数生成 4.7 例: ランダムウォーク 5章 pandas 入門 5.1 pandas のデータ構造 5.2 pandas の重要な機能 5.3 要約統計量の集計と計算 5.4 欠損値の取り扱い 5.5 階層型インデックス 5.6 pandas のその他のトピック 6章 データの読み込み、書き出しとファイル形式 6.1 テキスト形式のデータの読み書き 6.2 バイナリデータ形式 6.3 HTML や Web API を用いた読み書き 6.4 データベースの読み書き 7章 データの管理: データのクリーニング、変換、マージ、再形成 7.1 データセットのマージ 7.2 再形成とピボット 7.3 データの変換 7.4 文字列操作 7.5 例: USDA の食品データベース 8章 プロットと可視化 8.1 matplotlib API の概要 8.2 pandas のプロット関数 8.3 地図のプロット: ハイチ地震災害のデータ 8.4 Python 可視化ツールのエコシステム 9章 データの集約とグループ演算 9.1 GroupBy の仕組み 9.2 データの集約 9.3 グループ指向の演算と変形 9.4 ピボットテーブルとクロス集計 9.5 例: 2012年の連邦選挙委員会のデータベース 10章 時系列データ 10.1 日付、時間のデータ型とツール 10.2 時系列の基本 10.3 日付範囲、頻度、シフト 10.4 タイムゾーンを扱う 10.5 期間を使った算術演算 10.6 再サンプリングと頻度変換 10.7 時系列のプロット 10.8 移動する窓関数 10.9 パフォーマンスとメモリ利用の注意点 11章 金融と経済データへの応用 11.1 データ変更に関するトピック 11.2 グループの変換と分析 11.3 その他の応用例 12章 NumPy: 応用編 12.1 ndarray オブジェクトの内部構造 12.2 配列操作: 応用編 12.3 ブロードキャスト 12.4 ufunc の使い方: 応用編 12.5 構造化配列とレコード配列 12.6 ソートについてさらに詳しく 12.7 NumPy の行列クラス 12.8 配列の入出力: 応用編 12.9 パフォーマンスに関する小技 索引
紹介( powered by openBD

Pythonの代表的なデータ解析用ツール、pandasのメイン開発者による、Pythonでデータサイエンスを始めるための情報をまとめた、優れたガイドブック。豊富な事例とサンプルコードを示した実践的、実際的な一冊。