[フレーム]
1 - 40 件 / 1006件
最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。 ローカルLLMって何じゃ?というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。 オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。 だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題 & OpenAIがAIベンチャー皆殺しにしてしまう問題 まず「結局GPTのAPIを叩いてサービス運営して成功し
みなさまお元気ですか 暑さも少し落ち着いてきて、ようやく外に出てもいいかなという気になってきました。季節の変わり目体調には気をつけていきたいですね。 実は、一ヶ月くらい前に Linux PC を自作して Mac から移行しました。そのときの考え、その後の感想を残しておきます。 また、学んだことや作業のログを細かく残しておきたいと思います。(どこかの誰かが不安に思ったときに同じ失敗や疑問を経験した人がいて安心してもらえたら嬉しい) Ubuntu のインストール画面 (ベストオープンソースと開発しよう!) 目次 Mac をやめるきっかけ、経緯 Ubuntu に移行して一ヶ月の感想 おまけ1: どのような PC になったか おまけ2: 事前に学んだこと おまけ3: PC の組み立て おまけ4: Ubuntu のセットアップ 加筆/修正 指摘のあった誤字を修正 NVEnc について誤った内容があっ
Apple の iPhone や Mac で試用される AX チップ、M1 チップ、Android スマートフォンの多くが試用している Snapdragon、その他さまざまなシーンで採用されている Arm アーキテクチャを持つ ARM ホールディングス。そのライセンス権利を独占的に与えられた中国合弁企業が乗っ取られ、権利を奪ったまま独立を宣言してしまったことをSemiAnalysisが伝えている。 簡単に説明すると、Arm の中国における権利をもった会社の CEO が背任行為を行っており、Arm は解任しようとしたが中国の制度上の問題で失敗し、CEO は中国における顧客、売上を奪って独自製品を開発するまでの力を持つに至り、独立したという状態になるようだ。 詳細に経緯を説明していくと、下記のようになる。 Arm はもともとイギリスの企業だったが、2016年に日本のソフトバンクに買収された。
"Locality is efficiency, Efficiency is power, Power is performance, Performance is King", Bill Dally マルチスレッディングとは? CPUとGPUのマルチスレッディングの違いをブログにまとめていたけど例によって誰も興味なさそう— arutema47 (@arutema47) 2021年8月16日 つぶやいたら読みたい方が多そうだったので完成させました。 マルチスレッディングとはメモリ遅延を隠蔽しスループットを上げるハードウェアのテクニックです。 ただCPUとGPUで使われ方がかなり異なるため、その違いについて考えてみる記事です。 (SIMDについて並列プログラミングの観点から触れるべきでしたが、時間無いマルチスレッディングに注目するため初版では省きました。) 本記事について 本記事はCPUとG
OpenAIの対話型AI「ChatGPT」は史上最も急速な成長で「月間1億ユーザー」をわずか2カ月で達成するなど、大いに注目を集めています。それに伴い、GoogleがChatGPTのライバルとなる会話型AI「Bard」を発表したり、中国企業が続々とChatGPT風AIを開発していると報道されている一方で、OpenAIはChatGPTのコードを公開していないためChatGPTを効果的に複製することは難しくなっています。AIのディープラーニングトレーニングを最適化するオープンソースプラットフォームのColossal-AIが、ChatGPTトレーニングプロセスをわずか1.6ギガバイトのGPUメモリで7.73倍高速なトレーニングに再現したと告知し、オープンソースで公開しています。 Open-source replication of ChatGPT implementation process!
NVIDIAと滋賀大学は9月8日、データサイエンス教育用の講義資料「DLI データサイエンス教育キット」の日本語版の無償提供を始めた。同資料はNVIDIAのデジタルスキル育成プログラム「Deep Learning Institute」(DLI)の講義資料で、滋賀大学が日本語に翻訳したもの。教育機関の教員向けに提供する。利用にはNVIDIAの開発者アカウントが必要。 講義資料では「データサイエンスとRAPIDSの入門」「データ収集と前処理(ETL)」「データセットにおけるデータ倫理とバイアス」「データ統合と分析」「データビジュアライゼーション」「Hadoop、Hive、SparkとHBaseによるスケールと分散コンピューティング」「機械学習(分類)」「機械学習(クラスタリング、次元削減)」「ニューラルネットワーク」などの分野を取り上げる。 資料の元になった「DLI データサイエンス教育キット
Warning: Undefined array key 0 in /home/wwnstyle/wirelesswire.jp/public_html/wp-content/themes/wirelesswire_v3/functions.php on line 17 Tweet 3月14日の早朝、GPT-4が公開され、筆者は早速試した。 その後、開けて3月15日の早朝、APIも部分的に解放され、筆者はそれも試した。 その上で、先週書いた記事の内容についての確信が深まった。 やはり、GPT-4は期待を超えてはこなかった。 GPT-4は、ChatGPT Plusに入会すると誰でもすぐに使うことができる。APIだけは招待制だが、それも筆者と同じくらいのタイミングでアンロックされた方も少なくないのではないか。 100倍規模のパラメータがあっても、アプローチには限界があるのである。 また、Cha
Intelの業績が冴えない。2024年8月1日に発表された2024年第2四半期(Q2)の決算は、売上高が128.2億米ドルで、営業損失が19.8億米ドル、最終損益が16.1億米ドルといずれも赤字を計上した。加えて、従業員15000人を削減し、配当を停止することも発表された。 Intelの不調は今に始まったことではない。2019年以降の四半期の売上高と営業利益を見てみると、コロナ特需によって2021年に営業利益が増大したが、2022年に入って特需が終焉すると、売上高も営業利益も急降下した。特に営業利益は、2022年Q2以降、ほとんど赤字で推移するようになった(図1)。 その後、2022年11月30日に、Open AIがChatGPTを公開すると、米NVIDIA、米AMD、SK hynixなどが売上高を大きく伸ばす一方、Intelの売上高は横ばいで、営業利益はまたしても赤字に陥った。要するに、
加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実 2024年06月21日 Updated by Ryo Shimizu on June 21, 2024, 18:19 pm JST 世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。 いくつかの興味深い事象が起きているからだ。 昨日発表されたKarakuri社のLLM、「KARAKURI LM 8x7B Instruct v0.1」は、非常に高性能な日本語LLMだ。Karakuri社は今年の一月にも非常に高性能な70Bモデルを引っ提げて業界に旋風を巻き起こした。この最新のLLNは、日本語向けオープンLLMとしては初の「命令実行」チューニングを施されている。それだけでなく、RAGと呼ばれる、複数の知識を組み合わせてより正解に近い答えを導く技術や、Function
半導体企業・Armが開発したArmアーキテクチャは、携帯電話や自動車、マイクロコントローラー、Amazon Web Services(AWS)のサーバーなどで使われる何十億ものチップで採用されています。Armはイギリスの企業でしたが、2016年にソフトバンクに買収されました。その後、NVIDIAへ売却されることが発表されたものの、中国国内でのライセンス権を持っていた中国合弁企業が一方的に独立を宣言し、知的財産権(IP)のライセンス権を横取りしたまま暴走を続けていると、半導体関連ブロガーのディラン・パテル氏が解説しています。 The Semiconductor Heist Of The Century | Arm China Has Gone Completely Rogue, Operating As An Independent Company With Inhouse IP/R&D -
月額料金なし、検閲なし、枚数制限もなし。 無制限かつ自由にAIイラストを生成させるなら、Stable Diffusion XLやQwen Imageをパソコンで動かせる「ローカル版AIイラスト」が必要です。 しかし、ローカル版AIイラストはグラフィックボードも必須です。 VRAM容量が大量に欲しい GeForceシリーズが絶対に良い Radeonは玄人向けだから避けるべき などなど、いろいろな情報が飛び交っていますが実際のところはどうなのか? やかもちグラフィックボードをなぜか40枚ほど所有している筆者が、実際にStable Diffusionを動かして徹底的に検証します。 (公開:2023年3月8日 | 更新:2025年8月24日) この記事の目次 Toggle AIイラスト(Stable Diffusion)におすすめなグラボを検証 検証方法:AIイラストの生成速度をテストする AIイラス
深層学習をまじめにやるなら、どう考えても専用のPCが必要になる。 僕は現在、Memeplexというサービスを運営していて、これはさくらインターネットさんから大量のGPUを借りている。借りたGPUは、さくらインターネットの石狩データセンターで動いている。 さらに、ABCIは企画の段階から立ち会って、実際に仕事ではよく使っている。ABCIは5000以上のGPUを擁するGPUクラウド基盤で、その実態はスーパーコンピュータである。 ABCIを使えば、ほとんどの難しいタスクを恐ろしく安い料金で行うことができる。GoogleやAmazon AWSのようなサービスを展開することができない本邦においては、国家が設立し、民間利用可能なABCIは国民にとっての天叢雲剣あめのむらくものつるぎである。 それでもなお、手元には深層学習用のPCが必要だ。しかも一台では足りない。 ABCIがいかに安くても、PCほどの利
自宅で動くChatGPTと噂のFlexGenを試す shi3zさんが興奮して動かしていたFlexGen 関係する記事は以下 ツヨツヨGPUが無いと動かないと思っていたのですが、タイムラインでミクミンPさんが、RTX3060でFlexGenを動かしているツイートを発見。 「RTX3060なら自分も持っている!」ということで、試してみることにしました。 追記: 私がこの記事で動かしているのは小さいモデルです。とりあえずお試しで動かしただけで、shi3zさんが動かしているモデルとは異なります。 性能の参考にする記事ではないので、ご承知ください。より大きいサイズのモデルの使用に関しては、FlexGenの公式リポジトリを参照ください。私も今後試したら追記していきます(現状、私の環境では動かせてないです)。 FlexGenをDockerで動かす 結果的には、Dockerを使うことで簡単に動かせました。
Warning: Undefined array key 0 in /home/wwnstyle/wirelesswire.jp/public_html/wp-content/themes/wirelesswire_v3/functions.php on line 16 Tweet そろそろ業界の最深部でしか知られてなかった事実がニュースになって来始めているのでここで本当の問題を明らかにしておきたい。 AI開発に必須なのは、計算資源である。そしてこれは現在のところ、事実上NVIDIAが一社独占している。 NVIDIA以外の半導体がいくら「AIに特化しています」と能書きを垂れていてもごくわずかな例外を除いてはほとんど全部が誇大広告である。 たとえばApple Silliconは、「ニューラルエンジン」と称するモジュールを内蔵しているが、これを使ってAIの学習をすると、なんとCPUよりも遅い。
NVIDIAとIntelがまさかの協業! Intelに約7368億円を投資して,RTX GPUを統合したx86 SoCをPC市場向けに提供するとのこと 編集部:小西利明 米国時間2025年9月18日,IntelとNVIDIAは,NVIDIAがIntelに対して,普通株式50億ドル分(約7368億円)を投資すると発表した。 両社は,データセンターおよびPCクライアント分野の製品開発で協業し,NVIDIAのプロセッサ間接続技術「NV Link」を用いて,Intel製CPUとNVIDIA製GPUをシームレスに接続することも明らかにしている。 これによりIntelは,NVIDIAのRTX GPUを統合したSoC(System-on-a-Chip)を開発してPC市場に提供することと,x86 CPUのNVIDIA向けカスタム版を,AIデータセンター向けのNVIDIAプラットフォームに統合して提供すると
マーケットの怪物「MATANA」の誕生 過去20年の株式市場を引っ張ってきた米メガテック企業の代名詞「GAFA」の時代が終わりを告げ、いま注目されているのは「MATANA」である。「MATANAっていったいなんだ?」と思われるかもしれないが、これからの投資を考えるうえで欠くことのできない注目分野だ。 そんな「MATANA」にとある半導体企業が組み込まれた。このことは、日本株投資を考える上で重要な示唆がある。 直近のマーケットの動向を見ても、日本の半導体銘柄は意外な動きを見せてきた。「MATANA」とは何かを紹介する前に、まずは半導体が、いまマーケットでどのように位置づけられているのかという解説から始めよう。 「アメリカ景気後退」と「半導体」の意外な関係 米国を中心に本格的な景気の後退が懸念され始めている。 ISM製造業指数、非製造業指数ともに予想を下回り、3月の消費者物価指数も想定以上に鈍
最近よく聞く「レイトレーシング」 一体ナニモノ?:レイトレーシングが変えるゲームグラフィックス(第1回)(1/3 ページ) 2018年、NVIDIAがリアルタイムレイトレーシング(RT)に対応するGPU「GeForce RTX 20シリーズ」を発表した。このことは、2000年に誕生した「プログラマブルシェーダー」以来となるグラフィックスパイプラインにおける大きな"変革"をもたらした。 →NVIDIAが新アーキテクチャの「GeForce RTX」シリーズを発表 価格は499ドルから そして2020年、ついに家庭用ゲーム機にもRT機能が搭載された。そう、「PlayStation 5(PS5)」と「Xbox Series X」「Xbox Series S」のことである。これらのゲーム機にAPU(GPU統合型CPU)を提供しているAMDも同年、RTに対応するGPU「Radeon RX 6000シリ
AITuber「しずく」開発者としても知られる、あき先生ことakio kodaira氏を筆頭にした研究グループは12月21日、リアルタイム画像生成を実現するために最適化されたパイプライン「StreamDiffusion」を発表。従来の画像生成パイプラインと比べて飛躍的な速度向上を実現している。 ノイズ除去をバッチ処理で高速化 「Stable Diffusion」をはじめとする画像生成AIモデルの高性能化は著しいが、メタバース、オンラインストリーミングなど高スループットと低レイテンシーが必要な環境ではまだ力不足だ。 StreamDiffusionは新しいアプローチを採用し、従来の連続的なノイズ除去をバッチ処理のプロセスに変換することで、高スループットストリームを実現。さらに、GPUの利用効率を向上させるため、従来の分類器フリーガイダンス(CFG)に代わり、残差分類器フリーガイダンス(RCFG
2025年1月20日、DeepSeekが推論モデルの「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスの下でオープンソースとして公開しました。「R1」のトレーニングコストはOpenAIの推論モデル「o1」の約3%程度だとも伝えられたために、AIの開発に対する業界の見方を大きく変えたこのモデルについて、Apple、Microsoft、Automatticでの勤務経験があるアナリストのベン・トンプソン氏が解説しました。 DeepSeek FAQ – Stratechery by Ben Thompson https://stratechery.com/2025/deepseek-faq/ 17 Thoughts About the Big DeepSeek Selloff - Bloomberg https://www.bloomberg.com/news/ne
2013年に初参加し、コロナ禍で2年ほど欠席を挟んで今回で10回目の参加となる任天堂株主総会に今年も行ってきた。 先日、株主総会に関する記事執筆の依頼があり、株主総会に参加する意義と楽しみ方について書いたので、合わせて読んでいただけるとありがたい。 任天堂が好き過ぎて株を購入。「任天堂株主総会レポート」中の人が語る、"推し"企業に投資する魅力 | イーデス さて、今年2024年の株主総会だが、Nintendo Live 2024 TOKYOが脅迫により中止に追い込まれたことが影響したのか、今年から手荷物検査が行われると告知があった。博多駅からの始発で開会時間には間に合うのだけど、手荷物検査や天候不良で余計な時間が取られそうだと判断し、余裕を持てるようにホテルを予約して前日入りすることにした。 かつて任天堂の株価はWii全盛期に7万円台をつけ、その後の業績不振によりもっとも低いときは1万円を
大手半導体メーカーでありAI研究にも力を入れているNVIDIAが、新たな画像生成AIである「eDiffi」を発表しました。NVIDIAはeDiffiについて、世界中で話題となっている「Stable Diffusion」やOpenAIの「DALL・E2」といった従来の画像生成AIより入力テキストに忠実な画像を生成できると主張しています。 [2211.01324] eDiffi: Text-to-Image Diffusion Models with an Ensemble of Expert Denoisers https://arxiv.org/abs/2211.01324 eDiff-I: Text-to-Image Diffusion Models with Ensemble of Expert Denoisers https://deepimagination.cc/eDiffi/
自分の認識をだらだら書くとこうなる。 結局のところ2003年から2011年頃までいちばん延べ計算量が必要だったのはリアルタイムの3Dグラフィックスのレンダリングだったんだ。そこではNVIDIAって会社がPCゲームのプラットフォームを握ってしまっていてそこで技術開発をめっちゃ進めてしまったんだ。 結果的にPlayStation2までは純日本設計だったグラフィックチップが、PlayStation3ではNVIDIAのGPUになってしまったんだ。そこで負けが確定してしまった感じだ。PlayStation3のCPU、CELLに内蔵されているSPUは、世代をどんどん進めていったら最終的にレンダリングもできるグラフィックチップに進化する可能性があったのかもしれないけど次世代が出せなかったのでそこで終わりになってしまった。 NVIDIAは先端を走っているユーザーが何を求めているかをめちゃくちゃちゃんと調査
世界的なリスク資産離れの波に米株価が急落してから約4週間後、半導体メーカー株売却の動きが新たな株安をもたらした。業界アナリスト2人が人工知能(AI)を取り巻く熱狂は行き過ぎだと懸念を再び提起した。 レーバーデー連休明け3日の米株式市場で、AI向け半導体メーカー大手エヌビディア株は9.5%下落し、2789億ドル(約40兆5460億円)が吹き飛んだ。米1銘柄として過去最大となる。 エヌビディアが先月28日に発表した売上高見通しが投資家の高い期待に届かず、同社株のその後の3営業日の下落幅は計14%に達している。フィラデルフィア半導体株指数(SOX)を構成する30銘柄は3日にいずれも少なくとも5.4%の下落となり、SOXは2020年3月以来の大幅下落を記録した。 オン・セミコンダクターとKLA、モノリシック・パワー・システムズは9%強下げて、ナスダック100指数の下げ幅は3.2%近くに達した。 エ
NVIDIAが開発している対話型AIシステムが「Jarvis」(ジャービス)だ。以前から開発についてはアナウンスされていたが、ついに正式にリリースされた。しかも日本語対応で。 「GTC 2021」のオンライン基調講演でNVIDIAのCEO、ジェンスン フアン氏(Jensen Huang)がこのニュースを紹介するとともに、聞き取り、発話、翻訳などのデモを行った。「Jarvis」はHuang氏が話した言葉を瞬時にテキスト化し、更にはHuang氏が話した英語を日本語にリアルタイム翻訳して見せた。 対話型AIフレームワーク「NVIDIA Jarvis」 NVIDIAは現地時間の4月12日、「NVIDIA Jarvis フレームワーク」の提供を開始したことを発表した。これは最先端のAIトレーニング済みディープラーニング モデルとソフトウェア ツールを活用して、さまざまな業界と分野向けに、対話型AIサ
量子コンピューティング関連株が8日の取引で急落した。写真はエヌビディアのジェンスン・ファンCEO。6日撮影(2025年 ロイター/Steve Marcus) [8日 ロイター] - 量子コンピューティング関連株が8日の取引で急落した。米半導体大手エヌビディア(NVDA.O), opens new tabのジェンスン・ファン最高経営責任者(CEO)がアナリストの会合で、量子コンピューターの実用化は約20年先となる公算が大きいという見通しを示したことが嫌気された。
【Creator's Voice】 https://www.nintendo.com/jp/switch2/creators-voice/index.html 【Nintendo Switch 2】 https://www.nintendo.com/successor/ja-jp/index.html 【再生リスト:Nintendo Switch 2】 https://www.youtube.com/playlist?list=PLPh3p_yYrx0BGQwcfbn9fiJkUoX3d-dAv 【任天堂ホームページ】 https://www.nintendo.co.jp/ 動画に含まれる情報は公開日時点のものです。
西川善司の3DGE:「ストリートファイターV」にまつわる遅延の謎を,遅延計測システムを使って検証してみた ライター:西川善司 コアゲーマーなら,誰もが一度は意識したことがあるに違いない"遅延"の問題。ただ,この遅延というキーワード,人によって「イメージしている現象」が違っていて,テーマとして語り合うにはなかなか難しい話題だったりする。 例えば,ゲーマー同士の会話でしばしば耳にする「液晶って遅延が大きいよね」というフレーズ。これは「(入力/表示)遅延」と「応答速度」を曖昧に解釈した発言と思われる。まあそこは大目にみて"一緒くた"にするのを許容したとしても,昨今の事情を鑑みればやはり正しいとは言い難い。 少なくともゲーム用途を謳うディスプレイに搭載されている液晶パネルなら応答速度はひと桁msだし,遅延も同じく数msだ。むしろ低遅延なイメージがある有機ELパネルのほうが,焼き付き防止や倍速駆動と
半導体産業を日本が独占していた時代 エズラ・ヴォーゲルの「ジャパン・アズ・ナンバーワン」は今では「日本の過大評価」であったと多くの人々が見ているが、日本産業の詳細を見れば見るほどその評価が正しかったのではなかろうかと思えてくる。 たとえば、今や「産業のコメ」として、最も重視されていると言っても過言ではない半導体産業については、図表1に見るようにものすごいものがあった。1986年の世界ランキングのトップ3がすべて日本企業であったばかりでなく、トップ10まで見てもその6社までが日本企業となっている。
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く