はじめに 本記事では、Pythonによるテキストマイニングの簡単なチュートリアルとして、ここ8年ほどの間に刊行された「本格ミステリ」に分類される小説のキーワードを解析し、可視化することを目指します。 使用するデータ 出版書誌情報データベース(Books)において、検索キーワードを「本格ミステリ」に設定し、ヒットした書誌の内容紹介からあらすじに相当する部分をExcelに手作業で(!)切り貼りすることで、本格推理小説505作のあらすじをまとめました。 実装 あらすじから内容を象徴するようなキーワードを抽出し、その出現の頻度や関係を可視化することで分析を行います。なお、添付したコードはGoogle Colaboratoryでの実行を想定しています。 必要なライブラリのインストール 形態素解析(文から単語を切り出し、品詞等の判別を行うこと)にはPythonの言語処理ツールであるGiNZAを、解析結