入門 自然言語処理

出版日
ページ数
592
入門 自然言語処理
ISBN10
4873114705
ISBN13
978-4873114705
目次
訳者まえがき はじめに 1章 言語処理と Python 1.1 言語の計算処理: テキストと単語 1.2 Python をより詳しく: テキストと単語のリスト 1.3 言語の計算処理: 簡単な統計処理 1.4 再び Python: 決定を下し処理を制御する 1.5 自動自然言語理解 2章 テキストコーパスと語彙資源へのアクセス 2.1 テキストコーパスへのアクセス 2.2 条件付き頻度分布 2.3 Python をもっと活用する: コードの再利用 2.4 語彙資源 2.5 WordNet 2.6 まとめ 2.7 参考文献 2.8 演習問題 3章 生テキストの処理 3.1 ウェブおよびディスク上のテキストへのアクセス 3.2 文字列: もっとも低いレベルのテキスト処理 3.3 Unicode を利用したテキストの処理 3.4 単語のパターンを検出するための正規表現 3.5 正規表現の有用な応用方法 3.6 テキストの正規化 3.7 テキストのトークン化のための正規表現 3.8 セグメンテーション 3.9 データの整形: リストから文字列へ 3.10 まとめ 3.11 参考文献 3.12 演習問題 4章 構造化されたプログラムを書く 4.1 基礎へ立ち戻ろう 4.2 シーケンス 4.3 スタイルの問題 4.4 関数: 構造化プログラミングの基礎 4.5 関数をもっと活用する 4.6 プログラムの開発 4.7 アルゴリズムデザイン 4.8 Python ライブラリの例 4.9 まとめ 4.10 参考文献 4.11 演習問題 5章 単語の分類とタグ付け 5.1 タガーの利用 5.2 タグ付きコーパス 5.3 Python のディクショナリを利用して単語を属性にマップする 5.4 自動タグ付け 5.5 N グラムタグ付け 5.6 変換を利用したタグ付け 5.7 品詞を決定する方法 5.8 まとめ 5.9 参考文献 5.10 演習問題 6章 テキスト分類の学習 6.1 教師あり分類 6.2 教師あり分類のそのほかの例 6.3 評価 6.4 決定木 6.5 単純ベイズ分類器 6.6 最大エントロピー分類器 6.7 言語的パターンのモデル化 6.8 まとめ 6.9 参考文献 6.10 演習問題 7章 テキストからの情報抽出 7.1 情報抽出 7.2 チャンキング 7.3 チャンカの開発と評価 7.4 言語構造における再帰 7.5 固有表現認識 7.6 関係抽出 7.7 まとめ 7.8 参考文献 7.9 演習問題 8章 文構造の分析 8.1 文法的なジレンマ 8.2 構文の用途 8.3 文脈自由文法 8.4 文脈自由文法を用いた構文解析 8.5 依存関係と依存文法 8.6 文法の開発 8.7 まとめ 8.8 参考文献 8.9 演習問題 9章 素性ベースの文法の構築 9.1 文法素性 9.2 素性構造の処理 9.3 素性ベース文法の拡張 9.4 まとめ 9.5 参考文献 9.6 演習問題 10章 文の意味の解析 10.1 自然言語理解 10.2 命題論理学 10.3 一階述語論理 10.4 英語文の意味論 10.5 談話意味論 10.6 まとめ 10.7 参考文献 10.8 演習問題 11章 言語データの管理 11.1 コーパスの構造: ケーススタディ 11.2 コーパスのライフサイクル 11.3 データの取得 11.4 XML を利用した処理 11.5 Toolbox データを利用する 11.6 OLAC メタデータを利用した言語資源の表現 11.7 まとめ 11.8 参考文献 11.9 演習問題 12章 Python による日本語自然言語処理 Python における日本語の取り扱い 12.1 日本語コーパスの取り扱い 12.2 日本語形態素解析 12.3 日本語構文解析 12.4 日本語意味解析 12.5 さらに学ぶために 12.6 演習問題 あとがき: 言語への挑戦 参考文献一覧 NLTK索引 索引
紹介( powered by openBD

豊富な実装例や演習問題を通して、理論と実践をバランスよく学べる「自然言語処理」の実践的な入門書。日本語NLPのための書き下ろしも収録。