コンテンツにスキップ
Wikipedia

Gensim

出典: フリー百科事典『ウィキペディア(Wikipedia)』

これはこのページの過去の版です。UBinKitte (会話 | 投稿記録) による 2023年8月10日 (木) 07:44 (個人設定で未設定ならUTC)時点の版 (Infobox softwareの一部の内容が英語版にリンクされているため修正。)であり、現在の版 とは大きく異なる場合があります。

UBinKitte (会話 | 投稿記録)による2023年8月10日 (木) 07:44時点の版 (Infobox softwareの一部の内容が英語版にリンクされているため修正。)
この記事の出典や参考文献は、一次資料や記事主題の関係者による情報源に頼っています。 信頼できる第三者情報源とされる出典の追加が求められています。
出典検索?"Gensim" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL (2022年1月)
Gensim
作者 Radim Řehůřek
開発元 RARE Technologies Ltd.
初版 2009
最新版
4.3.2[1] / 2022年12月21日 (21か月前) (2022年12月21日)
リポジトリ github.com/RaRe-Technologies/gensim
プログラミング
言語
Python
対応OS Linux, Windows, macOS
種別 情報検索
ライセンス LGPL
公式サイト radimrehurek.com/gensim/
テンプレートを表示

Gensim(ジェンシム)は、最新の統計的機械学習を使用した、教師なしトピックモデリング (英語版)自然言語処理のためのオープンソースライブラリである。

Gensimは、Python言語と性能向上を図るためにCython言語で記述されている。Gensimは、データストリーミングとインクリメンタルオンラインアルゴリズムを使用して大規模なテキストコレクションを処理するように設計されており、インメモリ処理のみを対象とした他の多くの機械学習ソフトウェアパッケージとの差別化を図っている[要出典 ]

主な機能

Gensimには、fastText (英語版)[2] word2vecdoc2vecアルゴリズムのストリーミング並列化実装に加えて[3] 潜在意味解析(LSA、LSI、SVD)、非負行列分解 (英語版)(NMF)、潜在ディリクレ配分 (英語版)(LDA)、tf-idf、およびランダム射影 (英語版)が含まれている[4]

Gensimの新しいオンラインアルゴリズムのいくつかは、Gensimの制作者であるRadim Řehůřekの2011年の博士論文『Scalability of Semantic Analysis in Natural Language Processing(自然言語処理における意味解析のスケーラビリティ)』にも掲載されている[5]

Gensimの使用例

Gensimは、2018年の時点で[6] 、医学から保険金請求分析、特許検索まで、さまざまな分野で1,400件を超える商用および学術用途で使用および引用されている[7] 。このソフトウェアは、いくつかの新しい記事、ポッドキャスト、インタビューでも取り上げられている[8] [9] [10]

無償および有償サポート

Gensimのソースコードは、GitHub [11] で開発および公開されており、Google Groups [12] Gitter (英語版)[13] 上でサポートフォーラムが公開・維持されている。

Gensimは、rare-technologies.com社によって商業的にサポートされている。学生インキュベータープログラムを通じて Gensimの学生メンターシップと学術論文プロジェクトも提供している[14]

脚注

  1. ^ "Release 4.3.2" (24 8月 2023). 18 9月 2023閲覧。
  2. ^ Scalable *2vec training
  3. ^ Deep learning with word2vec and Gensim
  4. ^ Radim Řehůřek and Petr Sojka (2010). Software framework for topic modelling with large corpora. Proc. LREC Workshop on New Challenges for NLP Frameworks
  5. ^ "Scalability of Semantic Analysis in Natural Language Processing" (2011年). 27 January 2015閲覧。 "my open-source gensim software package that accompanies this thesis"
  6. ^ Gensim academic citations
  7. ^ Commercial adopters of Gensim
  8. ^ Podcast.__init__ episode #71 on Gensim
  9. ^ Interview with Radim Řehůřek, creator of Gensim
  10. ^ "DecisionStats Interview Radim Řehůřek Gensim #python" (8 December 2015). 2022年1月22日閲覧。
  11. ^ Gensim source code on Github
  12. ^ Gensim mailing list on Google Groups
  13. ^ Gensim chat room on Gitter
  14. ^ Gensim open source Incubator

外部リンク

AltStyle によって変換されたページ (->オリジナル) /