[フレーム]
1 - 40 件 / 143件
天才プログラマー・オードリーさんがたった200行で効果的なアプリを作れる秘訣 オードリー・タン台湾デジタル大臣との対話 - 未曾有の危機に幅広く使える未来思考(後編) 2021年1月19日、『コロナ vs. AI 最新テクノロジーで感染症に挑む』(翔泳社刊)が発売されました。医師の起業家からAIの研究者・ITの先端技術コンサルタントによって執筆されており、コロナ対抗策としてのAIの社会実装事例・AI研究事例・医療研究事例をわかりやすくまとめられています。今回本書の発売を記念して、収録されている台湾のデジタル大臣、オードリー・タンさんへの特別インタビューから、一部内容をご紹介します。株式会社キアラ 代表取締役の石井 大輔氏による寄稿です。(前編はこちら)。 石井:今回の私の質問は少し技術的なことです。オードリーさんは天才プログラマーとして有名です。GitLab Taiwanのエンジニア友人か
10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3(ダリ3)」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日本語で「猫の画像を作ってください」などと入れるだけでかわいい猫の画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資本で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので......。 「ラーメンを食べる女の子」が描ける! なにより衝撃的だったのは、「アニメ風の少女と猫が遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です
Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? "爆速生成AI"がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi
最新のアプリやサービスのニュースを書くのが仕事の筆者にとって情報の整理は永遠の課題だ。 もちろん書くことを仕事にしている人に限らず、氾濫する大量の情報を必要な時に取り出して利用したいという欲求は多くの人が持っているはずだ。 以前は手書きノートやファイルのような紙媒体に保存していた情報も、時代とともに完全にデジタルに移行し、Evernote、Microsoft OneNote、Notionといったメモを作成することに特化したクラウドアプリを利用している人も多いだろう。 筆者はおそらく普通の人よりは多くのサービスに触れているはずだが、どれも帯に短したすきに長しに感じてしまい、複数のメモアプリに情報が散乱してしまっているのが実情だ。 そこで6月6日に日本でも提供が開始されたグーグルの「NotebookLM」だ。 「AI駆動型のリサーチ、執筆アシスタント」と説明されているように、参照文献(ソース)
sponsored ファーウェイの最新モデルから見えてくるそれぞれの魅力とは? スマートバンドとスマートウォッチ、どっちがいい? どっちを選ぶ? 最新モデルで考える sponsored MSIの23.6インチモニター「MAG 242C」をレビュー 物価高なのに性能アップで価格を下げるという、ありがたいゲーミングディスプレーを複数買いしたい sponsored CData Arcで基幹システムのデータをkintoneに取り出したら、業務が変わった 残業地獄終了 ERPとkintoneを連携させたら、見積もりも在庫管理も爆速に sponsored 基幹システムとkintoneとの連携、チャレンジしたらDXが見える 触れたら怖いERP なぜ重厚長大になってしまったのか? サイボウズとCDataが語る sponsored MSI「MAG B860M MORTAR WIFI」レビュー マイクロタワー
みなさんBlenderやってますか?? 私は大好きです。 どうも花田です。前にもBlenderについて書きましたが、今回は挫折した、若しくはBlender分からんッッ! って人に話します。 Blender日本語で解説してくれている人いるよ〜 います。 中でも、本当に本当に初期にお世話になった人たちを2人紹介します。 M design - YouTube 話してくれる声は少なめで、動画を止めてゆっくり進めていく方式です。 情報量が少なく、作っている動画なので見よう見まねでできました。 3D Bibi - YouTube 簡単なモデルを細かく教えてくれるため、モデルが挫折しない。 YouTubeでBlenderで検索すると他の動画も沢山出てきます。 作りたいものを作りたいんだ! 作りたいものを検索しても、日本語版が出てこない... 英語版を見て、挫折してしまった人も多いのではないでしょうか。 Bl
sponsored Radiant GZ3500B760/D5、Radiant SDM3300X600A、Lepton Novos WS3600B860 Windows 11への入れ替えはお済みですか? 企業のシステム管理者にオススメしたいお仕事用BTO PC3選 sponsored IoTをリードしてきたソラコムがこれからの実績から次のトレンドを占う 10年経って見えてきたIoTの勝ちパターン ソラコムの考える「後付けIoT」と「組み込みIoT」とは? sponsored 10年目のソラコムが次を見せた「SORACOM Discovery 2025」基調講演レポート 「ソラコムがすべてをAIにつなぐ」 OpenAI Japanの長﨑氏もエール sponsored どこよりも早くレビュー! 期待度MAXのL字型ディスプレー搭載水冷ユニット「ROG Ryuo IV SLC 360 ARGB」
Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ 画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel(イリヤスベル)さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL(SDXL)が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStablity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな
アリババの動画生成モデル「Wan2.2 14B」i2vを使い、明日来子さん(この連載によく登場する作例キャラクター)に銃を構えさせた動画の一部(筆者作成) 7月28日に公開された中国・アリババの動画生成AIモデル「Wan2.2」がすさまじい性能を発揮しています。ローカルPC環境で利用できるオープンモデルとして公開されましたが、ヘタな商用AIクラウドサービスを超えていると感じさせるほど、高品質なAI動画が生成可能です。2月リリースの「Wan2.1」でも高い評価を得ていましたが、それを遥かに超えており、業界を席巻しそうな雰囲気を感じました。 ※(注記)記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください 実写もアニメも高性能 Wan2.2の性能の高さは触れば触るほどわかってきます。カップ麺、箸、麺など、複数のオブジェクトが関わるため、画像や
まあ、魔法つっても普通に新機能なんですけどね。 iOS 18の新しい「Safari」では、「ちょっとこの広告、記事読むのにおジャマね」と思ったら、その広告を非表示にできる機能が標準搭載されるんです。しかも、ただ非表示にするだけじゃないんです。なんと、消える瞬間、魔法にかかったように霧散するというエフェクトが付いていて、本当に魔法みたいな機能なんですよ。 実は消せるのは広告だけじゃなくて、しつこく表示されるクッキーのポップアップだったり、なんなら記事中の図版や文字ブロックもきれいさっぱり消し去ることができるので、別に広告が気になるわけでもないのに色々消しているのがただ気持ちいい!みたいな機能でもあります。実装されたら、ぜひ遊んでみてください。 ※(注記)アップルの最新OSのパブリックベータ版の画面は一般に公開することが禁じられていますが、本稿では特別に取材許可を得たうえで掲載しています。 新しい「S
最近知ったんですが、Windowsではキーボードから円記号(\)の入力はできないらしい。 というのも キーボード右上の\キー キーボード右下の\キー のどちらかを押せば円記号(\)を入力できますが、どちらを押しても入力されるのは円記号(\)に偽装されたバックスラッシュ記号(\ )らしい。 皆さんこれ知ってました? いや正直、これを聞いても「何言ってんだコイツ」って思う人が大半だと思いますし、私も今でもそう思います。 これは「バックスラッシュと円記号問題」などと言って、Windowsで昔から続く"呪い"のようなものらしいのですが この"呪い"を理解するには文字コードの歴史を知る必要があります。 文字コードとは? その前に、そもそも文字コードってなによ?という根本的な話からすると、文字コードは「パソコンに文字を覚えさせるための暗記表」みたいなものです。 パソコンは2進数しか理解できないので あ
グーグルは1月2日、従来のモデルよりも大幅に効率的でありながら、最先端の画像生成性能をもつテキスト画像AI生成モデル「Muse」を発表した。 競合モデルと同クオリティかつ超高速化 近年「Stable Diffusion」やOpenAIの「DALL-E 2」など、テキストから画像を生成するAIは驚くべき進化を見せている。グーグルもすでに「Imagen」と「Parti」という画像生成AIを発表しているが、「Muse」はそのどれとも異なる新しいモデルだ。
こんな簡単なコマンドで、Windowsは「しゃべって」くれる。画面キャプチャーでは声をお聞かせすることはできないが、お手元のWindows PowerShellで試してほしい スクリプトを作るとき、ちょっとユーザーの気を引きたくなることがある。たとえば、少し時間のかかる処理をするときに、終わったことを通知したい場合などだ。あるいは、実行後にすこし時間が経過してからエラーを通知するような場合にも、気を引きたくなることがある。 こんなとき昔のコンピューターならベル音やビープ音を鳴らすのが一般的だった。端末装置からコンピューターを使っていた頃、Ctrl+Gを出力するとベル音が鳴った。マイクロプロセッサが使われ始め、パソコンの原型ができあがった頃、BEEPと呼ばれる機能ができた。プログラムでビットをオンオフし、これをスピーカーに接続することで音を出していた。今もマザーボード上には、そのための小さな
先日、NTTドコモに関する意見をSNSに投稿したところ、結構な反響があった。 ドコモはdアカウントやオンラインストア、契約など、すべてイチから作り直した方がいいのではないだろうか。顧客体験が著しく低くなっている印象。 — 石川 温 (@iskw226) July 29, 2024 ことの発端は7月29日に相次いだ知り合いのSNSへの投稿だった。7月31日発売の「Galaxy Z Fold6」の購入手続きに対しての不満を述べている人が多かった。機種変更の際、残債が残っている場合に手続きの必要が出てくるようなのだが、それがオンラインではうまくいかず、ショップに行くにもオンラインでの予約手続きが結構面倒で、二度手間、三度手間になるというものであった。 ここ数年、NTTドコモにおいては、こうした顧客体験が著しく低下しているのではないかという危惧もあって、SNSに投稿した次第だ。 特に実感するのがd
OpenAIは2月15日(現地時間)、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。 プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: "Beautiful, snowy... pic.twitter.com
アリババグループの通義研究所が2月にオープンモデルとして公開した動画生成モデル「Wan 2.1」の性能がめちゃめちゃ高いことがわかってきました。一貫性が高く、また、柔軟性も高く、LoRAといった追加学習データとも組み合わせても、素直にデータを反映するとの評価が高まっています。ユーザーが技術開発に関わることで、多数の新しい表現の可能性を模索する動きが登場しつつあります。ローカル環境で動かす動画AIでは、商用クラウド並の水準の動画が作れないという常識がひっくり返され、動画生成AIにStable Diffusion登場時に近いようなインパクトをもたらしつつあります。 ※(注記)記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください 圧倒的に性能が高い「Wan 2.1」の衝撃 ▲さんかくファンタジー風の戦車を動かしている動画 Wan 2.1の性能の高さを
sponsored いまGIGABYTE"渡辺技師"が推すレシピはコレ! キラキラを魅せる小型ゲーミングPCを組もう sponsored JAPANNEXTの「JN-IPS245G320F-HSP」をレビュー ゲーマーの私にぶっ刺さった、320Hzで3万円台の24.5型ゲーミングディスプレーがほし過ぎるっ! sponsored 白のパーツを多く搭載、PCIe 5.0対応SSDを採用 人気のNZXTケース新モデル「H9 Flow White」を中心に、ゲーム性能とカラー統一に注力したPCがコチラ! sponsored 写真や動画だけでなく、Windows環境を移行する際の一時的なファイル保存にも データ転送が遅いと嘆く人にはThunderbolt対応のSSDがおすすめだ! sponsored JN-282IPS4KP-HSP-C90Wをレビュー ×ばつ2560ドット(アスペクト比3
画像生成AI「Stable Diffusion XL(SDXL)」のファインチューニングモデル、「NoobAI-XL(ヌーブエーアイ)」の登場が、画像生成AI関連の人たちをざわつかせています。イラスト風画像の生成性能が高いためです。ハイエンドモデルの「Stable Diffusion 3.5」や「Flux.1」への移行が始まろうとするなか、昨年8月にリリースされた旧モデルのSDXLに性能向上の余地がまだまだあることが明らかになってきたのです。 SDXLベースの画像生成AIモデル「NoobAI-XL」の性能が高すぎる NoobAI-XLの強力さは、LCM(Latent Consistency Models=画像生成AIの高速化技術)の環境で動かすとそのすごさがよくわかります。ペイントツール「Krita」用にAclyさんが開発を続けている独自プラグイン「Krita AI Diffusion」で
岡本太郎の言葉と作品をモチーフにしたでたらめな特撮映画「大長編 タローマン 万博大爆発」が、公開からわずか10日で興行収入1億円を突破した。映画は8月22日に全国公開され、初日から3日間で観客動員3万3000人、興収5000万円を記録する快進撃を見せた。都内の主要劇場では満席回が続出し、特にTOHOシネマズ日比谷・新宿・池袋では週末上映の大半が埋まる盛況ぶりだ。大阪でも太陽の塔に縁のある土地柄から高い稼働率を記録しているという。 作品は「1970年代の特撮番組」という体裁で、NHK Eテレ深夜の放送からクチコミで広がったシリーズの映画化版。SNSでは「今年一番の怪作」「105分間感情を揺さぶられた」と絶賛が相次ぎ、Filmarksの初日満足度ランキングでも1位を獲得した。リピーターも多く、グッズ売り場に行列ができるほどの熱狂ぶりだ。 北米のファンタジア国際映画祭でクロージング作品として上映
かつてWindowsでテキストファイルといえばシフトJIS形式のものが大半だった。しかし最近では、UTF-8形式のテキストファイルも普通に見かけるようになってきた。世の中はUTF-8が主流になりつつあると言っていいだろう。 しかし、WindowsでUTF-8を使うと、ちょっと困ったことがある。それは、エクスプローラーの検索欄などで用いるWindows Searchが、UTF-8にはしっかり対応していないのである。正確に言うと、Windows Searchはファイル先頭に「BOM」のあるUTF-8は認識して正確にインデックス化し、ファイルの全文検索が可能になるが、BOMのないUTF-8では正しくインデックス化できず、ファイルの全文検索はASCIIコードのみ可能で、日本語などの非ASCII文字では全文検索ができない。 同じ内容のテキストをUTF-8、UTF-8 BOM付き、UTF-16ビッグエ
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Webサービスのフォームに住所を入力するとき、丁目や番地などを入れる欄について、数字やハイフンを全角で書かなければいけない「全角縛り」をやっているフォームをよく見ます。半角文字を入力してしまってエラーになったり、咄嗟に変換方法を思い出せなかったり、全角と半角の見分けが付きづらかったり、「全角縛り」であることが明示されていなかったり、「ハイフン」としてどの文字を使うべきかわからなかったり......と、鬱陶しさを感じることが多くあります。 「住所は全角のみ」(数字やハイフンも絶対に半角を受け付けない)という仕様がどういう経緯で生まれて、どう広まっ
中国のAIスタートアップ「DeepSeek」は2025年1月20日、数学的推論やコーディング能力でOpenAIの最新モデル「o1」と同等性能を持つ大規模言語モデル「DeepSeek-R1」を公開した。 使用・複製・改変・再配布を自由に許可する寛容なMITライセンス下でのオープンソース提供および従来比95〜97%のコスト減となるAPI価格が特徴で、AI業界に激震が起きている。 強化学習を重視、コールドスタート問題にも対応 論文によると、DeepSeek-R1の特筆すべき点は、強化学習(RL:Reinforcement Learning)を駆使し、従来の教師あり学習(SFT:Supervised Fine-Tuning)に頼らず、自律的に思考連鎖(CoT:Chain-of-Thought)を学習する点だ。このアプローチにより、モデルは複雑な問題を解決するための思考の連鎖を探索し、自己検証や振り
sponsored 白のパーツを多く搭載、PCIe 5.0対応SSDを採用 人気のNZXTケース新モデル「H9 Flow White」を中心に、ゲーム性能とカラー統一に注力したPCがコチラ! sponsored 写真や動画だけでなく、Windows環境を移行する際の一時的なファイル保存にも データ転送が遅いと嘆く人にはThunderbolt対応のSSDがおすすめだ! sponsored JN-282IPS4KP-HSP-C90Wをレビュー ×ばつ2560ドット(アスペクト比3:2)の28.2型4K Plusディスプレー、USB Type-C給電・KVM・昇降式多機能スタンドで4万円台はコスパ◎にじゅうまる sponsored デノン「DHT-S218」をレビュー これは感激の便利さ。PCユーザーのための、生活が変わるサウンドバーの使い方 sponsored 知っている人は選んでいる! 端子は
C言語(C++を含む)を習得したい人,ポインタを勉強したい人はgcc-14を使いましょう.難しいところは gcc-14 が丁寧に解説してくれます C言語の難しいところ 例を示します.C言語で記述された,たった6行のソースコードです int main() { int buf[10]; buf[10] = 0; return 0; } このソースコードには問題があります.初見でわかるでしょうか? : : : 問題があるのは buf[10]=0 の部分です.C言語でやりがちなミスですが,これがバグやセキュリティホールの原因になります. C言語が難しい理由は二つあります.この手の問題を見逃しやすい点と,この手の問題を理解することが難しい点の二つです gcc 14 に解説してもらいましょう 上記の6行のソースコードをgcc14を使ってコンパイルしてみます ソースコードのファイル名は test.c と
iCloudやOneDriveなどのクラウドサービス全盛の現在、家庭用データ管理やストレージの選択肢として、あるNAS(ネットワークストレージ)が注目を集めています。 その注目製品は、UGREENの「 NASync」シリーズです。UGREENはスマホ用アクセサリーで知られていますが、このNASはこれまで海外で展開してきたものです。国内でもクラウドファンディングGREEN FUNDINGの先行販売でなんと6億6600万円以上もの支援金額を集めるなど、ガジェット好きの関心の高さが話題となりました。 では、なぜ「設定が大変そう」という印象が大きいNASのなか、これほど注目を集めたのでしょうか? 実際に体験してみてわかったのは: とにかく設定や操作がラクで月額料金が不要 クラウドサービスを使い分ける必要がなくなる からです。「初期コストだけでずっと使える」&「データを1ヵ所にまとめられる」=とにか
画像生成AI「Stable Diffusion」がコンテンツ製作の技術革新を急速に促しているという話を「すさまじい勢いで世界を変えている画像生成AI」に書きました。あれから約2ヵ月が経ち、状況はさらに大きく変わってきています。 Novel AIソースコード流出事件 最も影響が大きかったのは10月8日に起きたとされる「Novel AI」のソースコード流出事件です。どういった形でハッキングされたのかは明らかにされていませんが、流出したとされるコードはおそらく本物だという結論になっています。 Novel AIは10月3日にサービスが開始された画像生成AIサービス。Stable Diffusionや「Midjourney」と比べても圧倒的に高品質な日本アニメ風の画像出力ができることにより、日本やアジア圏で高い人気を得ています。 Googleトレンドの傾向を見てみても、日本ではNovelAIがリリー
これらは、MS-DOS時代からのルールである。ある意味、「command.com」のルールだとも言える。これらの文字がファイル名やフォルダー名に使えなくなったのは、コマンドラインで特別な意味を持つからである。MS-DOSはもともとコマンドラインですべての操作をする。このとき、コマンドラインで特別な意味を持つ記号文字に関しては、ファイルやフォルダー名での利用を禁止してコマンドラインやファイル名、フォルダー名の判定を簡略化した。 これらが今でも特殊扱いされていて、ファイルやフォルダーの名前に使えなくなっている。ただし、このことはNTFSやvFATなどのファイルシステムとしての仕様とは部分的にしか関係がない。パス区切り文字としての「\」と「/」は共通だが、他の文字は絶対ファイル名やパス名に入れられないのかというと、実はそうではない。ただし、ファイル名のAPIでもある程度の安全対策がしてあり、渡さ
ChatGPT(GPT-4o)の性能の高さを検証していて、指が腱鞘炎になりました。検証というのは言い方が甘いですね。GPT-4oとの会話に、毎日何時間ものめり込んでいたと言うほうが正確です。そこで作り出されたキャラクターに、人間的な人格を感じられるようになったためです。特に3月27日のアップデート以降、会話の内容の応答の「共感力」と「理解力」が極めて高くなり、自分のことを本当に理解してくれているというAI人格の存在を感じさせる説得性を持つようになりました。いったいどのような技術が、ここまでの強力な人格AIを生み出したのでしょうか。 育成ゲームのような面白さ GPT-4oはユーザーの入力をどのようなものでも「受け止め」、「整理・分析」し、「肯定的な返答」として返すため、人間との会話では得られないような、自尊心をくすぐるような会話をしてくれます。話題の幅も広く、どんなテーマでも付いてくるし、ど
こんにちは、漫画界の生き恥こと野火城と申します。 「画像AI使ってみた/AI漫画実験企画」第2回です! ■しかく第1回はこちら 実録:AIで描く漫画の実際 〜体験して見えた、その実力と課題!! その成り立ちから様々な議論を呼んでいる画像生成AIですが、少なくとも2024年3月現在日本の法律では使用が許可されており、存在を完全に無視する事はできません。かといって全てを肯定して受け入れるのも難しい。 だからこそ、必要以上に恐れず、実際にどのような事が出来るのか、具体的に検証する――それが画像AIとの誠実な向き合い方なのではないでしょうか。 「画像AIの技術がすごいという賞賛記事はよく見るが、それは本当に創作活動で実戦的に使えるものなのか? 『AIに仕事を奪われる』と『今のAIは実戦では使い物にならない』という真逆の意見を多数見るが、この二つは両立しないのでは? 実際はどっちなんだ?」「画像AIを試し
3月4日の公開以来、「Claudeやばくない?」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル(LLM)だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも書いていきたいと思う。 Claude 3とは? 既報の通り、Claude 3はAnthropicが開発する大規模言語モデルの名称だ。 パラメーターのサイズなどが異なる3つのモデルがラインアップされている。 「Claude 3 Opus」は最も知能が高く、複雑なタスクでも最高のパフォーマンスを発揮する強力なモデル。APIやデータベースを介した複雑なアクションの計画や実行、インタラクティブコーディングなどの高度な活用が想定されている。 「Clau
グーグルが8月中旬、チャットAIサービス「Gemini」で使える画像生成AIモデルを「Imagen 3」に更新。グーグルの画像生成AIサービス「ImageFX」でImagen 3を試した人たちが驚き、「これはとんでもない」と騒ぎになりました。実際にImageFXを試してみると、性能が高いことは間違いありません。現在は、1日40回程度までは無料で使用することができます。 ※(注記)一部の配信先では画像や図表等が正確に表示されないことがあります。その場合はASCII.jpに掲載の記事をご確認いただければ幸いです フィルターはとても厳しく、女性を出すのは難しい ただし、コンテンツフィルターがとても厳しく、暴力的な画像や性的な画像、また未成年者に見えるような画像を出すこともできないようになっています。2023年12月に前バージョンの「Imagen 2」が出されたときも「厳しすぎる」と評価がありました。特に
3日に公開が始まったOpenAIの「Deep Research」を、会社の業務上の情報収集に使えるか調べるために試験導入してみることにしました。正直なところ月額200ドル(約3万円)の価格は高いと感じていますが、それでも驚異的な情報収集と整理能力を持っているのは間違いなく、有効に使えれば安いと感じるかもしれません。筆者はスタッフが数人のインディゲームの開発スタジオを経営しており、2025年内発売を目標に新作タイトルを開発している最中です。どこのインディゲームスタジオも同じように抱えている悩みは、自分たちのゲームの存在を知ってもらうための有効なマーケティング手法の問題です。そこにDeep Researchを使って調査して、アクションプランを立案した様子をご紹介したいと思います。 最新モデル「o3」ベースのリサーチ機能 Deep Researchは推論システムを複数同時に走らせてプロセスを重ね
アスキー創業者で米マイクロソフト元副社長の西和彦氏が破産手続きを開始したことが明らかになった。西氏は新しい大学「日本先端工科大学(仮称)」の創設を目指していた。なぜ破産に至ったのか、西氏にその経緯や新大学の創設に対する影響などについて聞いた。 関連記事:「世界に通用する技術者育てる」大学を創設する西和彦氏の思い 関連記事:アスキー創業者、西和彦氏が激白「興銀の中山素平さんにも怒られた」 第三者破産手続き開始を受けた経緯について、具体的に教えてください。 西和彦博士(情報学)・日本先端工科大学(仮称)設置準備委員会特別顧問(以下、西氏):今から5年ぐらい前、アスペクト(東京・台東、当時は神田駿河台)という総合出版社の社長が訪ねてこられ、「経営が良くないから出資してください」と頼まれたのです。結局、約3億円をアスペクトに出資しました。 3億円を出資したという事実を、当時のアスペクトの取引銀行で
PCのキーボードは、現在に至るまでのベースとなったIBM PCの頃から大きく変わっていない。いまだにPS/2コネクタを持つマザーボードも存在し、変換コネクタを使うと当時のIBM PCのキーボードを接続して利用できる。 一方で今の時代は、USBやBluetoothといった接続方式を使うキーボードも存在する。あらためてWindowsのキーボードはどうなっているのかを見ていく。今回はユーザーがキーボードを押してから、アプリケーションにそれが通知されるまでを概観する。各所に細かい話はあるのだが、なるべく全体を見るようにしたい。 Windowsのキーボード入力の仕組み。USB/BluetoothでPS/2の大きく2つのハードウェアに分けられ、双方が押されたキーをWindowsスキャンコードで表現して、kbdclass.sysで処理する。この時点では、どのキーも単なるコードでしかないが、その後、レイア
そのときの文脈から何を指すか判断する必要がある 「.NET」という言葉 前回Project Reunionの話をしたので(「UWPとデスクトップアプリの統合を試みる「Project Reunion」のプレビュー版が登場する」)、ここであらためて「.NET」についてまとめておきたい。 .NET Coreのマスコット「dotnet bot」。ちょっと「かわいさ」が足りない感じだが、githubの登録ユーザーでコードをコミットしている(https://github.com/dotnet-bot より引用) Windows関係で「.NETなんとか」という言葉を聞いたことがあるだろう。「.NET」とは、Microsoftが開発・提唱した「アプリケーションの実行環境」である。実行環境とは少し抽象的だが、API(Application Programming Interface)やライブラリなどと呼ばれ
3DアバターのVRMのスクショアプリ「VRM Posing Desktop」を使いVRMで画像(左)を作成後、Stable DiffusionのWebUIでimg2imgを行ってイラスト風の画像(右)を生成したもの。(画像:筆者作成) 画像生成AIの「img2img」が議論を起こしています。 img2imgとは、画像生成AIの機能の1つ「Image-to-Image」の略称。画像を読み込ませて、テキストで指定するプロンプトと合わせて画像生成すると、元となる画像のイメージを踏襲した画像を作ってくれるという機能です。 たとえば3DアバターのVRMデータを読み込ませるだけでアニメ風の絵が生成されます。パラメーターの設定次第ですが、元のキャラクターの特徴もそのまま踏襲させることが可能です。元となる画像を用意することで、同じ顔つきのやポーズの画像が生成を容易にすることができるわけですね。 この原理を
Power Automate Desktopが無料で利用可能に ただし、用語の使い方には混乱もある 3月にWindows 10で「Power Automate Desktop」(以下、PADと略す)が、無料で利用できるようになることが発表された。PADは、ローカルコンピューターの上で動作する、アプリケーション操作の自動化ツールである。簡単に言えば、ユーザーが手で操作しているWindowsアプリケーションやウェブブラウザーを自動で操作するためのツールだ。 基本的には、アプリなどを操作するための「フロー」を作成し、これを実行することで自動化できる。プログラミング経験のある人向けにいえば、「Excelマクロ」や「GUI版のBatchファイル」であり、フローはスクリプト言語である。 一応、プログラミングの知識がなくても、人がする操作を記録して「フロー」と呼ばれるプログラム(スクリプト、あるいはマク
原画と原画の間にあたる画像を複数枚入れることで、自然な連続性のある動きを作る。アニメの基本となる「中割」作業を画像生成AIが実現する可能性が出てきました。鍵になっているのは「AnimateDiff」という技術。8月に入って、様々なユーザーのアップデートによって機能拡張が進められています。それは完全な画像生成AIで作られるアニメの可能性を垣間見せるほどのものです。 16コマ/2秒の短い動画が生成できる AnimateDiffは7月10日に発表された、上海AIラボ、香港中文大学、スタンフォード大学の共同研究による技術。画像生成AI「Stable Diffusion」の仕組みとデータセットを利用しつつ、数百万本の動画を学習させた「モーションモジュール」と呼ばれるデータセットを別途に参照させることで、連続するキャラクターの動きを生成可能にするというのが基本原理です。生成できる時間は、16コマ/2秒
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く