エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
流行りに便乗するタイプです。 DeepSeek-R1とは? DeepSeek-R1は、DeepSeek社が開発した生成AIモデルで... 流行りに便乗するタイプです。 DeepSeek-R1とは? DeepSeek-R1は、DeepSeek社が開発した生成AIモデルです。以下の記事によると「DeepSeek-R1は数学、コード、推論タスク全体でOpenAI o1に匹敵するパフォーマンスを発揮する」とのことです。 DeepSeek-R1の「派生モデル」とは? DeepSeek-R1が公開されているHugging Faceのページでは、DeepSeek-R1を蒸留した「DeepSeek-R1-Distill」も公開されています。 蒸留の解説部分を翻訳すると以下のとおりです。 私たちは、より大きなモデルの推論パターンをより小さなモデルに蒸留することができ、その結果、小さなモデルで RL を通じて発見された推論パターンと比較して、より優れたパフォーマンスが得られることを実証しました。オープンソースの DeepSeek-R1 とその