エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
word2vec は単語を意味空間のベクトルに変換するGoogleの古典的なアルゴリズムである。この空間では kin... word2vec は単語を意味空間のベクトルに変換するGoogleの古典的なアルゴリズムである。この空間では king - man + woman ≒ queen が成り立つなどと言われている。これを検証してみよう。 まずは上記のページから学習済みのモデル GoogleNews-vectors-negative300.bin.gz をいただいてくる(約1.6GB)。これは約1000億語からなるGoogle Newsデータセットを学習したもので、300万の単語・熟語を300次元の空間に埋め込む。単語・熟語は大文字・小文字を区別し、熟語の場合はスペースを _ で置き換えてある(例: New_York)。 Pythonで扱うには gensim というパッケージを使う。これは今のところPython 3.12までしか対応していないようだ。pip install --upgrade gensim でイ