エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
自然言語処理の分野で、分析を行ったり、モデルを試すのに、どうしても必要になるのが、テキストのデー... 自然言語処理の分野で、分析を行ったり、モデルを試すのに、どうしても必要になるのが、テキストのデータセットです。 しかし、手頃なデータセットを用意するのって難しいんですよね。 そんなお悩みにこたえてくれるのがlivedoorニュースコーパスです。 9つのカテゴリー別に複数の記事があることから、分類タスクや感情分析など、自然言語処理のさまざまなタスクに活用できます。 ここでは、Livedoorニュースのデータセットをダウンロードして、CSVファイルにする方法を解説していきます。 Livedoorニュースのデータセットの概要 株式会社ロンウイットが、収集しているデータです。 登録不要で、すぐにダウンロードできるので非常に便利です。 以下の9つのカテゴリ別に、複数のニュース記事が用意されています。(ただし、時期は結構古いです。) トピックニュース Sports Watch ITライフハック 家電チ