気に入った記事をブックマーク

気に入った記事を保存できます
保存した記事の一覧は、はてなブックマークで確認・編集ができます
記事を読んだ感想やメモを書き残せます
非公開でブックマークすることもできます

RTX3060でMoE付きTransformerの事前学習をしてみる

テクノロジーカテゴリーの変更を依頼記事元:zenn.dev/asap

適切な情報に変更

エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます

コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

次回からTwitterへ自動リダイレクト

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

1user がブックマークコメント 0

ゲスト

コメントするにはログインが必要ですブックマークを追加

ブックマークを追加

よく使うタグ

RTX3060でMoE付きTransformerの事前学習をしてみる

1 user zenn.dev/asap

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページへ

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

ゲスト

コメントするにはログインが必要ですログインしてコメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

[<a href="https://b.hatena.ne.jp/entry.parts?url=https%3A%2F%2Fzenn.dev%2Fasap%2Farticles%2Fd3bada2f005330">フレーム</a>]

プレビュー

[フレーム]

はてなブックマークボタンを作成して埋め込むこともできます

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック!

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

usersに達しました!

さんが1番目にブックマークした記事「RTX3060でMoE付きT...」が注目されています。

気持ちをシェアしよう

ツイートする

RTX3060でMoE付きTransformerの事前学習をしてみる

環境 OS:ubuntu 20.04 GPU:RTX3060 12GB Memory:64GB(12GB程度しか利用していない) SSD:最低でも200GB... 環境 OS:ubuntu 20.04 GPU:RTX3060 12GB Memory:64GB(12GB程度しか利用していない) SSD:最低でも200GB-300GB程度の空きを推奨 Python:3.11 事前学習モデルやデータセットなどつらつらと事実だけ書いていきます。やり方だけ知りたいという方は飛ばしてください。モデルの特徴 400M程度の小さなTransf ormerを利用位置埋め込みにRoPEを利用 Mixture of Experts(MoE)を利用 DeepSeekMoEと同様にshared expertsも利用 Grouped Query Attention(GQA)を利用してメモリ削減活性化関数にSwiGLUを利用推論時KVキャッシュが可能モデルパラメータ実際のパラメータ数 418.5M 学習可能パラメータ 418.5M Activeパラメータ 191.9

ブックマークしたユーザー

flying-cat2025年09月20日 flying-cat

すべてのユーザーの
詳細を表示します

同時期にブックマークされた記事

天ぷら饅頭 - ニコニコ

1 user www.nicovideo.jp

いま人気の記事 - 企業メディア

企業メディアをもっと読む

気に入った記事をブックマーク

エントリーの編集

タイトルガイドライン

ブックマークしました

おすすめタグタグについて

よく使うタグすべて表示

RTX3060でMoE付きTransformerの事前学習をしてみる

おすすめタグタグについて

よく使うタグすべて表示

はてなブックマークで関心をシェアしよう

記事へのコメント0件

リンクを埋め込む

プレビュー

関連記事

usersに達しました!

RTX3060でMoE付きTransformerの事前学習をしてみる

ブックマークしたユーザー

ブックマークしたすべてのユーザー

同時期にブックマークされた記事

公式Twitter

はてなのサービス

よく使うタグ

よく使うタグ

はてなブックマークで
関心をシェアしよう