拙著『Rによるテキストマイニング入門』(森北出版 2017)で扱ったデータを、Pythonでも分析できるように構成し直し、さらに単語分散表現の使い方、最近の自然言語処理で主流の Transformers についても解説した入門書です。
- 出版社 : シーアンドアール研究所
- 発売日 : 2022/8/13
- ISBN-13 : 978-4863543935 https://www.amazon.co.jp/dp/486354393X/
なお、Windows で MeCab を利用する場合は 64bit UTF-8 辞書版が必要です。公式の 32 bit 版 MeCab をすでにインストールしている場合は必ずアンインストールしてから、64bit版をインストールし直してください。 https://github.com/ikegami-yukino/mecab/releases
解説動画を公開します。
- 第2章 Python 速習: Miniforgeのインストール(M1チップmacOS編): https://youtu.be/pDubtRcuth8
- 第2章 Python 速習:Jupyterの起動と終了 (M1チップmacOS Miniforge編): https://youtu.be/0-AETjou8zA
- 第2章 Python 速習:Jupyterの使い方 : https://youtu.be/Y9qMibaa3uo
- 第2章 Python 速習: Python 速習 : テキスト分析:https://youtu.be/ifq-gmQvbhg
- 第3章 MeCab: MeCabのインストール(macOS): https://youtu.be/0ePI8a9kNUI
- 第9章 第10章 歴代首相所信表明演説の読み込みと分析(安倍元総理の演説分析): https://youtu.be/5DfMDSucfRk
『Rによるテキストマイニング入門』 出版社:森北出版 ISBN: 978-4627848429 https://www.amazon.co.jp/dp/4627848420
『実践 R によるテキストマイニング:センチメント分析・単語分散表現・機械学習・Pythonラッパー』 出版社:森北出版 ISBN: 978-4627885110 https://www.amazon.co.jp/dp/4627885113/
- Chapter02 emoji-2.0.0では UNICODE_EMOJI が削除され EMOJI_DATA を利用する
- Chapter07 CountVectorizer とファイルジェネレーターの項で引数指定を修正
- Chapter09 transformers で日本語モデルを読み込む処理を行うセルがノートブックから削除されていたので修正