エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
import re import nltk # 自然言語処理のライブラリ import spacy from nltk.stem import WordNetLemmat... import re import nltk # 自然言語処理のライブラリ import spacy from nltk.stem import WordNetLemmatizer from bs4 import BeautifulSoup """ テキストの前処理 。テキストのクリーニング(HTMLタグの除去、特殊文字の除去etc) ・トークン化 ・ストップワードの除去 ・ステミングやレンマ化 """ # リソースのダウンロード nltk.download('wordnet') # ストップワードの設定 nlp: spacy.language = spacy.load('ja_ginza') # テキスト分析で重要ではない日本語のリスト stop_words = nlp.Defaults.stop_words # レンマタイザの初期化 lematizer = WordNetLemmatiz