Python による Web スクレイピング

目次
まえがき
第Ⅰ部スクレイパーを作る
1章 最初の Web スクレイパー
2章 高度なHTMLパーシング
3章 クローリングを開始する
4章 API を使う
5章 データを格納する
6章 文書を読む
第Ⅱ部 高度なスクレイピング
7章 汚れたデータをクリーニング
8章 自然言語の読み書き
9章 フォームとログインでクロール
10章 JavaScript のスクレイピング
11章 画像処理とテキスト認識
12章 スクレイピングの落とし穴を避ける
13章 Web サイトをスクレイパーでテストする
14章 リモートでスクレイピング
付録A Python 入門
付録B インターネット入門
付録C Web スクレイピングの適法性と倫理
訳者あとがき
索引
紹介( powered by openBD )
検索エンジンだけでは入手できない、本当に欲しい情報をWebスクレイピングで手に入れる!
インターネットからデータを機械的に集め、必要な情報を抽出するプロセスが「Webスクレイピング」です。検索エンジンだけでは限られた情報しか集めることができませんが、Webスクレイピングの技術を使えば、インターネット上の膨大な情報の中から本当に必要な情報を入手することができます。コンピュータサイエンスに限らず(理系にも限らない)研究者たちが、最新動向を把握するために、また、小売業界、金融業界でも情報収集にWebスクレイピングを活用するなど、広い分野で求められ、また注目されている技術です。本書はPythonを使ってWebスクレイピングを行うための解説書です。