はじめに 夏目漱石、芥川龍之介、川端康成、太宰治、三島由紀夫・・・ これら日本を代表する作家たちが、小説に最も使用した単語は一体何なのでしょうか? 今回は名詞・動詞・形容詞それぞれについて、Pythonを使って分析してみました。 この記事で学べること テキストマイニングの進め方、考え方 Pythonによるスクレイピング MeCabによる形態素解析 Seabornによるグラフの描画 etc... 環境 Python 3.7.4 Anaconda 4.8.3 Jupyter notebook 分析 それでは、早速分析していきましょう。 データ集め 今回使用する文章データは「青空文庫」様より拝借します。 まずは一例として夏目漱石のデータを取得してみます。 夏目漱石の作品一覧は以下のURLに収められています。 このURLの「148」が夏目漱石の作家IDとなります。 つまり、このIDの部分を変えれば