[フレーム]
1 - 40 件 / 116件
クッキーとオレンジが並ぶと、「どちらも丸い食べ物ですが、オレンジの方が健康的ですね」と答え、2色の毛糸玉から作れるマスコットも提案する。 絵から太陽系の惑星の並びの間違いを指摘し、動画の「次のシーン」の予測までこなす。 これらのように、文章から回答を作るのではなく、声や画像、立体物に動画と、さまざまな情報を並列に扱って、それぞれをちゃんと理解し、論理的な回答をする。 別の例も示してみよう。 物理のテストの回答があったとする。従来なら、まず手書き認識をして、その内容が正しいかをさらに判定するだろう。 だが、Geminiでは処理を分けることもなく、Geminiが持つ能力自体で「文字認識」「回答の妥当性検証」を行い、正誤判定を出す。さらに、正しい回答を示すことも可能だ。 Geminiは「記述式テスト」の正誤判定を行い、間違いまで説明できる。出典:グーグル出典:グーグル出典:グーグルこれが、Gem
米Alphabet傘下の英DeepMindが、遺伝子配列情報からタンパク質の立体構造を解析するAI「AlphaFold v2.0」(以下、AlphaFold2)をGitHub上で無償公開し、ネット上で注目を集めている。Twitterを利用する生物系の研究者からは「革命的な成果だ」「これからの研究の前提が変わっていく」など、AlphaFold2の予測精度に対して驚きの声が相次いだ。 なぜAlphaFold2はこれほどの驚きや賞賛をもって迎えられているのか。タンパク質構造解析の難しさをひも解く。 未知の部分が多いタンパク質の構造 タンパク質は数十種類のアミノ酸からできており、配列によってさまざまな性質に変化する。例えば筋肉、消化酵素、髪の毛はそれぞれ役割が異なるが、いずれもタンパク質で作られている。タンパク質の構造が分かれば、生体内の化学反応の理解が進む。アルツハイマー型認知症やパーキンソン病
米Google傘下のAI企業Google DeepMindは6月7日(現地時間)、アルゴリズムを開発するAI「AlphaDev」が、人間が考えたものより高速なソートアルゴリズムを発見したと発表した。 ソートアルゴリズムは、入力されたデータを一定のルールに基づいて並べ替えるもの。ネット検索結果の並べ替えやランキング制作などIT技術の根幹を担う技術の一つ。今回AlphaDevが考案したアルゴリズムは既存のものに比べて、少量のデータなら最大70%、数十万規模の大量のデータなら約1.7%速く処理できた。 DeepMindはAlphaDevに新しいアルゴリズムを発見させるため、ソートの作業を「組み立てゲーム」としてプレイさせた。「正確にソートできる」「既存のアルゴリズムより高速である」という2点を満たせばクリアとした。 関連記事 OpenAIやDeepMindのCEOやトップ研究者ら、「AIによる人
[29日 ロイター] - 米実業家イーロン・マスク氏や人工知能(AI)専門家、業界幹部らは公開書簡で、AIシステムの開発を6カ月間停止するよう呼びかけた。社会にリスクをもたらす可能性があるとして、まずは安全性に関する共通規範を確立する必要があると訴えた。 オープンAIが開発したAI対話ソフト「チャットGPT」の最新版言語モデル「GPT─4」に言及し、これを上回るシステムを開発停止の対象にすべきとした。 公開書簡は非営利団体「フューチャー・オブ・ライフ・インスティチュート(FLI)」が発表。マスク氏や米アルファベット傘下ディープマインドの研究者、英スタビリティーAIのエマド・モスタク最高経営責任者(CEO)、AIの大家であるヨシュア・ベンジオ氏やスチュワート・ラッセル氏など1000人以上が署名している。
囲碁世界チャンピオンを打ち負かしたDeepMind製のAI「AlphaGo」は度重なる機能強化によってチェスや将棋などあらゆるボードゲームへの対応を果たしました。新たに、AlphaGoの系譜を受け継ぐAI「AlphaTensor」が「行列の積を計算する最適な方法を求めるゲーム」に挑み、行列の積を計算する未発見のアルゴリズムを導き出すことに成功しました。 Discovering faster matrix multiplication algorithms with reinforcement learning | Nature https://doi.org/10.1038/s41586-022-05172-4 Discovering novel algorithms with AlphaTensor https://www.deepmind.com/blog/discovering-no
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Google DeepMindなどに所属する研究者らが発表した論文「Stealing Part of a Production Language Model」は、米OpenAIのGPT-4や米GoogleのPaLM-2などのクローズドな大規模言語モデル(LLM)から、モデルの一部を盗み出す攻撃を提案した研究報告である。言語モデルのAPIへのクエリを通じて、低コストでモデルの内部構造に関する情報を抽出することに成功した。 GPT-4やPaLM-2などの最先端AIモデルは、APIを通じて一般ユーザーに提供されているが、内部構造や学習に使用され
新たな数学の定理の発見や、未証明の予想の解決にAIが役立つ──そんな研究結果を、囲碁AI「AlphaGo」などで知られる英DeepMindが発表した。順列に関する新しい定理を発見した他、ひもの結び目を数学的に研究する「結び目理論」についても、異なる数学の分野をつなぐ、予想していなかった関係性を見つけたという。 DeepMindは、豪シドニー大学と英オックスフォード大学の数学者とともに数学研究を支援するための機械学習フレームワークを構築。これまでも数学者は、研究対象を調べるためにコンピュータを使い、さまざまなパターンを生成することで発見に役立ててきたが、そのパターンの意義は数学者自身が考察してきた。しかし、研究対象によっては何千もの次元があることから、人間による考察も限界があった。 今回開発したアルゴリズムは、こうしたパターンを検索する他、教師あり学習を基にその意味を理解しようと試みるという
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、国際数学オリンピックで金メダル相当のパフォーマンスを達成したモデルを提示する論文「Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2」に注目します。 Google DeepMindが開発したAIシステム「AlphaGeometry2」(AG2)は、国際数学オリンピック(IMO)の幾何学問題において画期的な成果を上げました。2000年から2024年までのIMO幾何学問題の
IT系海外速報を書いたり、翻訳を請け負ったりしています。初めてのスマートフォンはHTC Desire。その後はNexus 5からずっとGoogleさんオリジナルモデルを使っています。 Google(というかその親会社のAlphabet)が1万2000人のレイオフを発表しました。これでいわゆるGAFA(FacebookはMetaになっちゃったので古い)でリストラを発表していないのはAppleだけに。Apple以外はコロナ禍の2019年〜2022年の間、かなり雇用を拡大していた(Alphabetは57%増)ので、予想されていたものではあります。 スンダー・ピチャイCEOは大規模リストラの理由を「AIへの初期投資で生まれた大きなチャンスを完全につかむため」と公式ブログで説明しました。 ▲さんかくGoogle I/O 2022でAIについて語るスンダー・ピチャイCEO "初期投資"というように、Googl
米Google DeepMindは10月7日(現地時間)、「Gemini 2.5 Pro」の視覚理解力と推論能力を基盤として特別に構築されたAIエージェントモデル「Gemini 2.5 Computer Use」を、APIを通じてパブリックプレビュー公開したと発表した。 このモデルは、ユーザーからの自然言語による指示と、画面のスクリーンショットをインプットとして受け取る。モデルは、画面上の要素を視覚的に認識し、ユーザーのリクエストを分析し、次に何をすべきかを判断し、マウスクリック、スクロール、タイピング、フォームへの入力といった具体的なUIアクションを、`function_call`という関数呼び出しの形で生成する。この一連のプロセスは、アクション実行後に新しいスクリーンショットをモデルに送り返すエージェントループの中で繰り返され、タスクが完了するまで自律的に操作を続行する。これにより、人
DeepMindが競技プログラミングレベルのプログラミングが可能な人工知能(AI)の「AlphaCode」を発表しました。AlphaCodeのほかにも自動でプログラミングが可能なAIは存在しますが、AlphaCodeは414億ものパラメーターを保持した特に精度の高いAIに仕上がっているとのことです。 Competitive programming with AlphaCode | DeepMind https://deepmind.com/blog/article/Competitive-programming-with-AlphaCode Competition-Level Code Generation with AlphaCode (PDF)https://storage.googleapis.com/deepmind-media/AlphaCode/competition_leve
米Google傘下のGoogle DeepMindは5月14日(現地時間)、AIが自らコンピュータの計算手順やアルゴリズムを発見し、さらに進化させる新しいAIエージェント「AlphaEvolve」を発表した。 AlphaEvolveの目的は、コンピュータサイエンスの基礎となるアルゴリズムや複雑な数学的課題に対する解法を、人間がゼロから開発するのではなく、AI自身が見つけ出し、最適化することにあるという。 このシステムの大まかな流れは、高速な「Gemini Flash」でアイデア候補を生成し、それを「Gemini Pro」が深く洞察して提案することで、アルゴリズムを実装するプログラムを生み出す。このプログラムを、AlphaEvolveに組み込まれた自動評価ツールが検証、実行、スコアリングすることで、アイデアを「進化」させていく。 AlphaEvolveは、既にGoogle内部で多岐にわたる成
米Google DeepMindは5月20日(現地時間)、開発者向け年次イベント「Google I/O 2025」の中で、超高速に文章やコードを生成できるAIモデル「Gemini Diffusion」を発表した。ウェイティングリストへの登録フォームを公開している。
Googleがスマートフォン向けの最適化技術を取り込んだオープンソースAIモデル「Gemma 3n」の早期プレビュー版を公開しました。すでにAndroidスマートフォンで簡単に試す方法が用意されていたので、実際に使ってみました。 Gemma 3n - Google DeepMind https://deepmind.google/models/gemma/gemma-3n/ Announcing Gemma 3n preview: powerful, efficient, mobile-first AI - Google Developers Blog https://developers.googleblog.com/en/introducing-gemma-3n/ Gemma 3nはスマートフォンやタブレットなどでローカル動作させることを念頭に開発されたAIモデルで、メモリ使用量を大幅
Google DeepMindが気象予測AI「GraphCast」を発表しました。10日間の天気を予測する場合、従来の気象予測システムではスーパーコンピューターを数時間稼働させる必要がありましたが、GraphCastでは1台のマシンを1分稼働させるだけで従来の予測システムを超える精度での予測が可能とアピールされています。 Learning skillful medium-range global weather forecasting | Science https://www.science.org/doi/10.1126/science.adi2336 GraphCast: AI model for faster and more accurate global weather forecasting - Google DeepMind https://deepmind.google/
AIに取り組む著名研究者、エンジニア、CEOなどのグループが5月30日(米国時間)、AIによる人類絶滅の危機について、新たな警告を発した。 「Statement on AI Risk」(AIリスクに関する声明)に署名したのだ。広く受け入れられるよう簡潔にまとめられたこの声明は、「Mitigating the risk of extinction from AI should be a global priority alongside other societal-scale risks such as pandemics and nuclear war.」(AIによる絶滅のリスクを軽減することは、パンデミックや核戦争などの他の社会的規模のリスクと並んで世界的な優先事項とすべきだ)というものだ。 この声明は、サンフランシスコに拠点を置く非営利団体Center for AI Safety(C
DeepMind Technologiesは、コード生成人工知能(AI)の「AlphaCode」を開発。 AlphaCodeはプログラミングコンテストでほぼ中央値となる成績を収め、人間と同レベルのコーディングスキルを持つことを示した。2022年2月2日の公式ブログで発表されていたが、このたび12月8日に、AlphaCodeについての論文が『Science』に掲載され、表紙を飾った。 DeepMindはAIを開発している企業だ。2015年には、同社の囲碁プログラム「AlphaGo」がAIとして初めて人間のプロ囲碁棋士を破り話題となった。 AlphaCodeは競技プログラミング向けに作られたシステムだ。競技プログラミングでは、批判的思考、論理、アルゴリズム、コーディング、自然言語理解を組み合わせて、予期せぬ問題に対する解決策を創出することが必要となる。予期せぬ問題に解決策を見出すのは、従来の機
A note from Google and Alphabet CEO Sundar Pichai: Every technology shift is an opportunity to advance scientific discovery, accelerate human progress, and improve lives. I believe the transition we are seeing right now with AI will be the most profound in our lifetimes, far bigger than the shift to mobile or to the web before it. AI has the potential to create opportunities — from the everyday to
Google DeepMindのAI気象予測モデル「GraphCast」、従来予報を大きく上回る性能との研究結果 米Google DeepMindは11月14日(現地時間)、「前例のない精度で中期天気予報を行うことができる」と謳う気象AIモデル「GraphCast」を発表した。 同日に科学雑誌「Science」に掲載された論文によると、世界の気象状況を最大10日前まで予測する場合、GraphCastは気象シミュレーションシステム「欧州中期天気予報センター」(ECMWF)の「高解像度予報」(HRES)より正確かつ迅速だったという。 異常気象の早期警告の提供も可能で、サイクロンの進路を高精度で予測したり、洪水を引き起こす危険のある"大気中の河川"を特定したり、急激な気温の変化を予想したりできるとしている。 GraphCastは、「Graph Neural Network」(GNN)と呼ばれるニ
囲碁世界チャンピオンを負かし引退に追い込んだ囲碁AI「AlphaGo」などで知られるDeepMindが、テキスト出力の領域を超えた単一の汎化エージェントだという「Gato」を構築しました。Gatoは文脈に基づき、テキストを出力するか、関節を動かすか、あるいはボタンを押下するかといった動作を決定できるとのことです。 A Generalist Agent https://www.deepmind.com/publications/a-generalist-agent DeepMind’s new AI can perform over 600 tasks, from playing games to controlling robots | TechCrunch https://techcrunch.com/2022/05/13/deepminds-new-ai-can-perform-ove
米Google傘下のGoogle DeepMindは12月4日(現地時間)、生成AIベースの高精度天気予測モデル「GenCast」を発表した。最大15日先までの日々の天気と台風などの気象現象の両方を、「従来の最先端システムよりも正確に予測できる」としている。 GenGastは気象軌跡を表す50以上の予測で構成される「アンサンブルモデル」で、従来の単一の推定値を提供する決定論的モデルとは対照的だとDeepMindは説明する。また、複雑なデータの確率分布をモデル化し、新しいサンプルを生成できる生成的な機械学習手法である「拡散モデル」でもある。 例えば、台風の進路予測でも優れた性能を示すという。例として、2019年に日本に上陸した台風19号の予測性能を紹介した。下の画像では、上陸7日前はまだ不確実性が高い状態だが、上陸が近づくにつれて正確な進路予測が可能になることを示している。 DeepMind
Our natively multimodal AI model Gemini is capable of reasoning across text, images, audio, video and code. Here are favorite moments with Gemini Learn more and try the model: https://deepmind.google/gemini Explore Gemini: https://goo.gle/how-its-made-gemini For the purposes of this demo, latency has been reduced and Gemini outputs have been shortened for brevity. Subscribe to our Channel: h
画像や文章を生成するAIに続いて、動画生成AIも急速に進歩しつつありますが、これまでのAIが生成した動画は無音か人間が音を後付けしたものばかりでした。Google DeepMindが2024年6月17日に、映像の雰囲気や動きに合わせて音楽や音を生成する「video-to-audio(V2A)」を発表しました。 Generating audio for video - Google DeepMind https://deepmind.google/discover/blog/generating-audio-for-video/ Google DeepMindが今回発表したV2Aシステムは、動画生成AI「Veo」と組み合わせてドラマチックなBGMやリアルなSE、キャラクターのセリフなどを生成できる技術です。 例えば、以下のムービーは「Cinematic, thriller, horror f
Google DeepMindが、国際数学オリンピックレベルの複雑な幾何学問題を解決できるAI「AlphaGeometry」を発表しました。AlphaGeometryは、実際に国際数学オリンピックで出題された幾何学問題30問を制限時間以内に25問解いたとのことです。 Solving olympiad geometry without human demonstrations | Nature https://www.nature.com/articles/s41586-023-06747-5 AlphaGeometry: An Olympiad-level AI system for geometry - Google DeepMind https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-syst
Googleの人工知能関連企業「Google DeepMind」が2023年11月16日、音楽生成に特化したAIモデル「Lyria」と、Lyriaを用いて音楽制作が可能な2つのツールセット「Dream Track」「Music AI Tools」を発表しました。 Transforming the future of music creation - Google DeepMind https://deepmind.google/discover/blog/transforming-the-future-of-music-creation/ An early look our AI Music experiment - YouTube Blog https://blog.youtube/inside-youtube/ai-and-music-experiment/ DeepMind and
米Google傘下のGoogle DeepMindは7月21日(現地時間)、同社のAIモデル「Gemini」の「Deep Think」が、2025年の国際数学オリンピック(IMO)に公式に参加し、出題6問中5問を解いて金メダルレベルのパフォーマンスを達成したと発表した。7月20日の公式による結果発表を待っての開示だ。 米OpenAIも19日、IMOに非公式に参加し、6問中5問を解いたとXにポストした。 IMOのグレゴール・ドリナー会長は発表文で「AIモデルの数学的能力の進歩を見るのは非常に喜ばしいことだ。しかし、IMOは使用された計算量や人間の関与の有無、結果の再現性など、手法を検証することはできないことを明確にしておく。われわれに言えることは、最も優秀な学生によって生み出されたものであれ、AIモデルによって生み出されたものであれ、正しい数学的証明は有効であるということだ。今年のIMOには
New AI agent evolves algorithms for math and practical applications in computing by combining the creativity of large language models with automated evaluators
プレプリントの論文を発表するサーバー「Arxiv」に投稿された「A Generalist Agent」と題する論文で、著者のScott Reed氏らは、「Gatoは、1セットの重みで、対話を行ったり、画像にキャプションを付けたり、本物のロボットアームでブロックを積み上げたり、Atariのテレビゲームを人間よりも上手にプレイしたり、シミュレーションされた3D環境でナビゲーションを行ったり、命令に従ったりすることができる」と述べている。 DeepMindの共同設立者であるDemis Hassabis氏は、ツイートで「私たちが作った中で最も汎用的なエージェントだ!素晴らしい成果だ!」とチームの成果を絶賛した。 残念な点があるとすれば、いくつかのタスクはそれほど得意ではないことだろう。 Gatoは、協働ロボット「Sawyer」のアームを制御してブロックを積み上げることにかけては、専用の機械学習プロ
AlphaGoやAlphaZeroを開発したDeepMind、GPT-4やChatGPTなどを開発したOpenAI、チャットボットAIのClaudeを開発するAnthropicという3つのAI組織がどういう経緯で設立したのかについて、The New York Timesがまとめています。 How Elon Musk and Larry Page’s AI Debate Led to OpenAI and an Industry Boom - The New York Times https://www.nytimes.com/2023/12/03/technology/ai-openai-musk-page-altman.html ・目次 ◆だいやまーくイーロン・マスクとラリー・ペイジの議論 ◆だいやまーくDeepMindの誕生 ◆だいやまーくDeepMindがGoogleに買収されるまで ◆だいやまーくOpenAIの設立とマスク氏の離
Alphabet傘下のAI研究所DeepMindが開発するチャットボット「Sparrow」は、市場投入時には、ChatGPTより優れた製品になる可能性がある。Sparrowは、証拠となる出典を示し、嘘やなりすましのようなリスクを抑制する工夫をしている。 DeepMindのデミス・ハサビスCEOが、米TIME誌のインタビューの中でChatGPTの対抗馬となるチャットボット「Sparrow」を開発中であることを明かした。DeepMindはSparrowのプライベートベータ版を2023年中にリリースする予定だ。 チャットボットは通常、インターネットからかき集めたテキストで訓練した大規模言語モデル(LLM)によって動いている。これらのモデルは、少なくとも表面上は一貫性があり文法的に正しい文章の段落を生成することができ、ユーザーからの質問やプロンプトに応答することができる。 Sparrowの特徴的な
AlphaGoの開発元として有名なGoogle DeepMind社が深層強化学習を応用してさまざまなコンピューティングアルゴリズムを改善するAI「AlphaDev」を発表しました。同時に、AlphaDevを利用してソートアルゴリズムを高速化できたという論文がNatureに掲載されています。 AlphaDev discovers faster sorting algorithms https://www.deepmind.com/blog/alphadev-discovers-faster-sorting-algorithms Faster sorting algorithms discovered using deep reinforcement learning | Nature https://doi.org/10.1038/s41586-023-06004-9 ソートアルゴリズムとは
Google DeepMindが、単一の入力画像からプレイ可能な3D環境を生成できる基盤的世界モデル「Genie 2」を2024年12月4日に発表しました。Genie 2で生成した世界は、人間やAIエージェントがキーボードとマウスを使った操作で移動することが可能です。 Genie 2: A large-scale foundation world model - Google DeepMind https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/ Genie 2は大規模な動画データセットで訓練された自己回帰潜在拡散モデルで、物理演算、キャラクターアニメーション、オブジェクトの相互作用など、様々な創発的能力を示します。画像生成AI「Imagen 3」で生成した画像を入力としてプレ
米Google傘下のGoogle DeepMindは12月14日(現地時間)、LLM(大規模言語モデル)とLLMによる幻覚(ハルシネーション)を防止する"評価器"を組み合わせた新たなシステム「FunSearch」を発表した。長年解決不可能な数学問題とされてきた「Cap set問題」を解き、実社会でも役立つ「ビンパッキング問題」のための効果的なアルゴリズムを発見したという。 FunSearch(funは「楽しい」ではなく、「関数」に由来する)は、GoogleのLLM「PaLM 2」をコンピュータコードで微調整したバージョンの「Codey」を使っている。LLMは不正確な情報を幻覚させることが分かっているため、LLMの出力から不正確だったり無意味だったりする部分を拒否する"評価器"アルゴリズムを組み合わせているという。 FunSearchはLLMと評価器による出力と評価を反復させていくことで、自
米Alphabet傘下のGoogleは4月20日(現地時間)、2014年に買収し、現在はAlphabet傘下の英DeepMindとGoogle Brain Teamを統合し、Google傘下のGoogle DeepMindという企業にすると発表した。 CEOは、現在DeepMindのCEOを務めるデミス・ハサビス氏。Google Brainの責任者、ジェフ・ディーン氏はGoogleのチーフサイエンティストに昇格し、Google ResearchとGoogle DeepMindのチーフサイエンティストを兼任する。ディーン氏はAlphabetおよびGoogleのCEO、スンダー・ピチャイ氏の直属になる。 Google Researchは今後もアルゴリズムやプライバシー、量子コンピューティング、ヘルスケア、責任あるAIなどの分野への取り組みを続ける。 ピチャイ氏は、新ユニットが「AIの進歩を大幅
GoogleのAI研究部門であるGoogle DeepMindが、「GNoME」と呼ばれるAIツールを使って理論的には安定しているものの実験的には実現されていない新しい結晶構造を220万種類も発見しました。220万種類という数字は、これまで発見された結晶構造の45倍以上にもおよびます。 Scaling deep learning for materials discovery | Nature https://www.nature.com/articles/s41586-023-06735-9 Millions of new materials discovered with deep learning - Google DeepMind https://deepmind.google/discover/blog/millions-of-new-materials-discovered-w
米Googleは12月19日(現地時間)、新たな推論AIモデル「Gemini 2.0 Flash Thinking」を発表し、Experimental(実験)モデルをGoogle AI Studioで公開した。 Gemini 2.0 Flash Thinkingは、回答の一部としてモデルが行う「思考プロセス」、つまり、問題を解決するためにどのような手順で考え、どのような情報を参照したのかを、人間が理解できる形で示すようにトレーニングされた推論モデル。ベースとした「Gemini 2.0 Flash」よりも、より強力な推論機能を備えており、マルチモーダル理解、推論、コーディングに最適という。 Google DeepMindとGoogle Researchのチーフサイエンティスト、ジェフ・ディーン氏はXのポストで、「思考を明示的に示すモデル」と説明した。同氏がシェアしたデモでは、「電子は、x=-
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く