[フレーム]
はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできます コメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

155users がブックマーク コメント 9

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

実践!大規模言語モデル / 1000億パラメータ越えモデルを動かすには?

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページ

記事へのコメント9

  • 注目コメント
  • 新着コメント
sys-bio
大規模言語モデルの実践的な内容!手元でもかなりレベルの高い大規模言語モデル動かせるようになってきたし、今後ますます実用が広がっていきそう!

その他
shodai
"軽量化されたモデルであっても329GBの容量が必要です。2023年2月現在、コンシューマー向けの最上位のGPUであるGeForce RTX3090やRTX4090であってもメモリサイズ24GBなので、最低でも14枚以上必要になります。"

その他
gengohouse
"実践!大規模言語モデル / 1000億パラメータ越えモデルを動かすには?"

その他
misshiki
"1. 言語モデルとは?、2. 大規模言語モデルのGPT-3とは、3. Turingが目指す基盤モデル、4. 1000億越えのパラメータの言語モデルを動かす?、4.a BLOOMとは?、5. GPU 1枚で推論を可能にするFlexGen"分かりやすいのでお勧め。

その他
macro1597
たしかBLOOMは多言語対応であるにも関わらず日本語対応していなかったはずだけど、他の言語の性能が上がったから日本語の性能も連動して上がったのかな?

その他
aox
稽古、稽古、稽古です

その他
Nyoho
FlexGenすごいな。4ビット量子化すごいな。

その他
qpci32siekqd
巨大パラメータ勝負になっているが、本当に全部のパラメータ使えてるのだろうか...。

その他
shodai
shodai "軽量化されたモデルであっても329GBの容量が必要です。2023年2月現在、コンシューマー向けの最上位のGPUであるGeForce RTX3090やRTX4090であってもメモリサイズ24GBなので、最低でも14枚以上必要になります。"

2023年03月03日 リンク

その他
aoshun7
言語モデルと自動運転基盤モデルの話

その他
sys-bio
sys-bio 大規模言語モデルの実践的な内容!手元でもかなりレベルの高い大規模言語モデル動かせるようになってきたし、今後ますます実用が広がっていきそう!

2023年03月03日 リンク

その他

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

プレビュー
アプリのスクリーンショット
いまの話題をアプリでチェック!
  • バナー広告なし
  • ミュート機能あり
  • ダークモード搭載
アプリをダウンロード

関連記事

usersに達しました!

さんが1番目にブックマークした記事「実践!大規模言語...」が注目されています。

気持ちをシェアしよう

ツイートする

実践!大規模言語モデル / 1000億パラメータ越えモデルを動かすには?

こんにちは。Turing株式会社の機械学習チームでインターンをしている九州大学修士1年の岩政(@colum2131)... こんにちは。Turing株式会社の機械学習チームでインターンをしている九州大学修士1年の岩政(@colum2131)です。 Turingは完全自動運転EVの開発をするスタートアップです。 自動運転技術において、カメラやセンサ情報は正確な制御をする上で不可欠な要素である一方、自然言語やマルチモーダルな処理が必要となる状況もしばしば存在します。特に完全自動運転車においては、音声認識によってドライバーの音声命令を認識し、リアルタイムで適切な制御を行うことや、複雑な交通状況の背景にあるコンテクストを理解させるといった要求が出てきます。そのために、「基盤モデル」と呼ばれるような、自然言語処理を含む大規模モデルの学習が必要になってくると、私たちは考えています。 そこで記事では、言語モデルの発展の流れとTuringが目指す基盤モデルの開発について紹介します! 1. 言語モデルとは? 近年の言語処理モデ

ブックマークしたユーザー

  • takcontan2025年08月28日 takcontan
  • techtech05212024年06月04日 techtech0521
  • sasasin_net2023年11月21日 sasasin_net
  • roogh5eeSha62023年09月11日 roogh5eeSha6
  • syque2023年08月24日 syque
  • sharaku3eyes2023年08月10日 sharaku3eyes
  • nukosan5552023年07月24日 nukosan555
  • bayaread2023年07月05日 bayaread
  • isrc2023年05月17日 isrc
  • katz19552023年04月30日 katz1955
  • kivatorial232023年04月25日 kivatorial23
  • moo_san2023年04月02日 moo_san
  • CLSmooth2023年03月27日 CLSmooth
  • dltlt2023年03月19日 dltlt
  • nyaocat2023年03月18日 nyaocat
  • tanop2023年03月18日 tanop
  • imyutaro2023年03月16日 imyutaro
  • m0t0m0t02023年03月10日 m0t0m0t0
すべてのユーザーの
詳細を表示します

ブックマークしたすべてのユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

同時期にブックマークされた記事

いま人気の記事 - 企業メディア

企業メディアをもっと読む

はてなブックマーク

公式Twitter

はてなのサービス

Copyright © 2005-2025 Hatena. All Rights Reserved.
設定を変更しましたx

AltStyle によって変換されたページ (->オリジナル) /