[フレーム]

サクサク読めて、
アプリ限定の機能も多数!

はてなブックマーク
テクノロジー
速報:話題の 1ビットLLMとは何か?|寺田英雄

気に入った記事をブックマーク

気に入った記事を保存できます
保存した記事の一覧は、はてなブックマークで確認・編集ができます
記事を読んだ感想やメモを書き残せます
非公開でブックマークすることもできます

速報:話題の 1ビットLLMとは何か?|寺田英雄

テクノロジーカテゴリーの変更を依頼記事元:note.com/3d_vizionist

適切な情報に変更

エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます

コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

次回からTwitterへ自動リダイレクト

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

226users がブックマークコメント 19

ゲスト

コメントするにはログインが必要ですブックマークを追加

ブックマークを追加

よく使うタグ

速報:話題の 1ビットLLMとは何か?|寺田英雄

226 users note.com/3d_vizionist

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページへ

記事へのコメント19件

注目コメント
新着コメント

MIZ

MIZ "巨大なクラウド基盤などに頼らなくても学習済みの生成AIが動かせることになるので、スマホや各種組み込み機器でChatGPTレベルのAIを単独で動作できる可能性が出てくる"

2024年03月02日リンク

その他

shunkeen

shunkeen "BNNの説明が理解できていれば、1.58ビットトランスフォーマーモデルを理解するのは簡単"/やっぱり前提知識がある人は理解の深さが違うんだなぁ。

AI
文章

2024年03月02日リンク

その他

RySa

RySa 機械学習は一般的に学習に計算コストが掛かって推論は低コストなのでこれはこれで進歩ではあるがゲームチェンジャーでは無い。とは言え機械学習ブームで金回りが良い内に研究をどんどん進めて欲しい。

2024年03月03日リンク

その他

sugawara1991

sugawara1991 エンコードのコストは重いままでもデコードが軽くなることが有用なのは既存の技術で何度も見てきた。ハードウェアの利点は依然としてあるのでGPUや組込デバイスに1.58bit処理が統合されたりしていくと思う

2024年03月03日リンク

その他

ntstn

ntstn 学習はGPUで推論は専用加算機とかそんな感じに棲み分けるのかしら?

2024年03月03日リンク

その他

craftone

craftone やっぱり学習中は高精度なのか。そうするとより大きなモデルを学習するためにはGPUがもっと必要になる・・?

2024年03月02日リンク

その他

stealthinu

stealthinu BNN->BitNet->1-bit LLMの流れなのでBNNを理解すると話が早いと。まじこれだけの違いで実現されてるの!?すげえ。

2024年03月03日リンク

その他

misshiki

misshiki "そもももこれは何なのか?LLMのモデルで中心的役割を果しているトランスフォーマー(Transformer)の、入力および出力の埋め込み変換行列 W の数値の精度を大幅に削減(1ビット!化)して小型化したもの。"

2024年03月04日リンク

その他

honma200

honma200 モデルはクラウドで作って推測はローカルで出来ちゃうとかかしら

2024年03月03日リンク

その他

yarumato

yarumato "何が嬉しいのか? 推論用途ではメモリ容量で十数分の1に小型化できると同時に、複雑で消費電力の多い浮動小数点演算回路=GPUを大幅に削減できる。スマホや組み込み機器でChatGPTレベルのAIを単独動作の可能性"

2024年03月03日リンク

その他

onesplat

onesplat "ある意味単純な仕組みで画期的な効果が生み出せることに驚かされる" お前らいつもこんなこと言ってるな

2024年03月03日リンク

その他

mr_mayama

mr_mayama 今Intelが進めてる次期Core uUtra、推論に特化ささて設計を見直した方がいいんじゃないか?

2024年03月03日リンク

その他

stealthinu

stealthinu BNN->BitNet->1-bit LLMの流れなのでBNNを理解すると話が早いと。まじこれだけの違いで実現されてるの!?すげえ。

2024年03月03日リンク

その他

sugawara1991

2024年03月03日リンク

その他

RySa

2024年03月03日リンク

その他

ntstn

ntstn 学習はGPUで推論は専用加算機とかそんな感じに棲み分けるのかしら?

2024年03月03日リンク

その他

samu_i

samu_i "「あらゆる機械がしゃべりだす」時代が、ぐっと近づいたのである。" そのドラえもん、物まねマシンでしかないの、なんかなぁ

2024年03月03日リンク

その他

colonoe

colonoe 実際に動いてるものが出てきてないのでなんとも言えない

2024年03月03日リンク

その他

OkadaHiroshi

OkadaHiroshi さらに大きなモデルが出てきて、次の世代のGPUにこの3値演算命令が実績されれ、ローエンドや内蔵GPUの価値が高まると思う。インテルやAMDの売上も上がるかも。

2024年03月03日リンク

その他

natu3kan

natu3kan ローカルでAIできるサービスは老人の話し相手とか見守りロボット作りやすいのでかいよな。高齢者になると急な心筋梗塞とか脳溢血で倒れても、家族いなくて発見が遅れて孤独死とかあるからなあ。

2024年03月03日リンク

その他

mohno

mohno 全然知らないけど、乗除算が要らないだけでGPUを使ってないわけじゃないんだよね?BitNet専用プロセッサ開発競争が始まるのかな。

2024年03月03日リンク

その他

kei_1010

kei_1010 「一方、推論用のGPUへのニーズが相対的には減るので、NVIDIA社のようなGPUメーカーのビジネスにとっては逆風となりかねない」だよね?そうだよね?空売りした俺大勝利だよね?ね?(株をやったらあかん人)

2024年03月02日リンク

その他

craftone

craftone やっぱり学習中は高精度なのか。そうするとより大きなモデルを学習するためにはGPUがもっと必要になる・・?

2024年03月02日リンク

その他

shunkeen

AI
文章

2024年03月02日リンク

その他

MIZ

2024年03月02日リンク

その他

urtz

urtz やはりMSがタダでこれを公開したとは思えない

2024年03月02日リンク

その他

ゲスト

コメントするにはログインが必要ですログインしてコメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

[<a href="https://b.hatena.ne.jp/entry.parts?url=https%3A%2F%2Fnote.com%2F3d_vizionist%2Fn%2Fn0e7130ef92a2">フレーム</a>]

プレビュー

[フレーム]

はてなブックマークボタンを作成して埋め込むこともできます

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック!

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

usersに達しました!

さんが1番目にブックマークした記事「速報:話題の 1ビ...」が注目されています。

気持ちをシェアしよう

ツイートする

速報:話題の 1ビットLLMとは何か?|寺田英雄

2024年02月27日にarXiv公開され,昨日(2024年02月28日)あたりから日本のAI・LLM界隈でも大きな話題になってい... 2024年02月27日にarXiv公開され,昨日(2024年02月28日)あたりから日本のAI・LLM界隈でも大きな話題になっている、マイクロソフトの研究チームが発表した 1ビットLLMであるが、これは、かつてB-DCGAN(https://link.springer.com/chapter/10.1007/978-3-030-36708-4_5; arXiv:https://arxiv.org/abs/1803.10930 )という「1ビットGANのFPGA実装」を研究していた私としては非常に興味をそそられる内容なので、論文を読んでみた。今回は速報として、その内容のポイントを概説したい。論文情報 Ma, S. et al. (2024) ‘The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits’, arXiv [c