[フレーム]
1 - 40 件 / 967件
一応、StableDiffusionとははっきりまず言います...とにかくやばいです。 分かりやすく、他のDALL・E2、Midjourney、Disco Diffusion、他有象無象Text to image machine learning系サービスと比較しますと... クオリティがかなり高い。 制限がなくなり、かなり細かい調整ができるようになったDALL・E2のような感じです。 生成が早い。 設定なしで使えば正直体感DALLE2より早いです。6秒..くらい? 安い。 3円くらいだと思います。 DALL・E2は1生成17円。Midjourneyは月4000円。 オープンソース これからいろんなサービスにこのAIが搭載されます。 他AIではかけられている学習データのフィルターがない。 各国の代表者や、有名人、ポルノがデータに含まれています。 PC上で使用できる。( = その場合無料) いや、こ
世界のルールが根本的に変わってしまう... そういう展開は、マンガや映画ではよく起こる。それが現実でも起きそうだ。 あと数日(から数週間)で「トップレベルの画像生成AI」が、世界中にフリーで配布される。 イラスト、マンガはおろか3D CGや建築、動画、映像...果てはフェイクニュースからポルノまで...あらゆる創作に携わる全ての人を巻き込む、歴史的な転換点が訪れようとしている。 凄さ的には、悪魔の実がメルカリで買えるようになる。念能力トレーニング動画がYoutubeにアップされる。それぐらいヤバい。 メルカリで悪魔の実が買える世界では、誰もが能力者(一流とは限らない)になれる。そんな、漫画やゲームのラスボスが語るようなユートピアが、あと数日で現実になってしまうかもしれない。 Stable Diffusionで出力したドワーフの王様Stable Diffusionで出力したホビットのスタディ Stabl
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
はじめに Midjourney、Stable Diffusion、mimicなど、コンテンツ(画像)自動生成AIに関する話題で持ちきりですね。それぞれのサービスの内容については今更言うまでもないのですがMidjourney、Stable Diffusionは「文章(呪文)を入力するとAIが自動で画像を生成してくれる画像自動生成AI」、mimicは「特定の描き手のイラストを学習させることで、描き手の個性が反映されたイラストを自動生成できるAIを作成できるサービス」です(サービスリリース後すぐ盛大に炎上してサービス停止しちゃいましたが)。 で、この手の画像自動生成AIのようなコンテンツ自動生成AIですが、著作権法的に問題になる論点は大体決まっていまして、画像自動生成AIを例にとると以下の3つです1正確に言うと論点1はコンテンツ自動生成系AIだけではなく、AI一般に関して問題となる論点です。コン
タイムラインで流れてきたポストから、Googleが作っているImageFXが作ってくれる画像のクオリティが高いように見えたので、触ってみていた。 ImageFXの作例 これが自分で撮った紅葉の写真で、 こっちが、Image FXに、京都の紅葉、50mm f1.4バブルボケ、とか伝えて作ってもらったもの。 ChatGPTに同じ入力を渡すと、こんな画像なので、仕上がりの違いがわかると思う。 どこか嘘っぽいというかメルヘンな仕上がりになりがち。 ここまでできるなら、手持ちの画像そっくりな画像を作れるのでは、と思って試してみる。 手持ちのラーメンの画像そっくりなラーメン画像を作る ChatGPTに、自分で撮影したラーメンの写真をアップロードして、この画像を作るためのプロンプトを作って、とお願いする。 この画像と同じ写真を生成AIで作りたいので、プロンプトを生成してください。内容だけでなく、レンズの
やればやるほど呪術化する、AI画像錬成について。 以下は、その道の専門家にはメッチャ怒られるかもしれない、雑なロジックと制御講座。 いちおうメジャーなサービスでは、共通して動作するノウハウ(DALL-E2, MidJourney, StableEiffusion, DiscoDiffusion, crayon, dall-e mini 他)。 雑に理解する画像AIのしくみ対話型のAIにとって、呪文プロンプトとは画像錬成の方向性ベクトルを定めるものにすぎない。 たとえば、以下は「I love apple」で錬成された画像の例である。どうにも、ふわっとしたものが出てくる I Love Apple「Apple」という方向性ベクトルは、「リンゴ」「青リンゴ」と「アップルコンピューター(旧レインボーロゴ」「アップルコンピュータ(新ロゴ)」など、複数の可能性を同時に持つからだ。 つまり、「Apple」
こちらの記事は2023年3月9日に投稿された旧バージョンです。特段の理由がなければ、最新事情を盛り込んだ「AIイラストが理解る!StableDiffusion超入門」をご覧ください。 こんばんは、スタジオ真榊です。このところ、ツイッター経由で公式サイトやこちらのFANBOXへのアクセスが急増しており、これからAIイラストを始め...
10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3(ダリ3)」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日本語で「猫の画像を作ってください」などと入れるだけでかわいい猫の画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資本で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので......。 「ラーメンを食べる女の子」が描ける! なにより衝撃的だったのは、「アニメ風の少女と猫が遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です
気になったゲームの攻略情報、PCの豆知識、様々なガシェットのレビューなどを紹介してます!その他にも管理人の趣味をいろいろと書き綴っています。
百聞は一見に如かず。これってAI生成グラビア?AI画像生成に興味を持ったのは去年の年末頃だろうか。Twitterを眺めていると「どうやって撮った(作った)んだ?」と言う画像がたまに載っていたので調べると、Stable Diffusion Web UI (AUTOMATIC1111版)だった。 元々グラビアを撮っていたこともあり、あまり撮らなくなってもグラビア好きなのには違いなく、試したくなったのは言うまでもない。 AI生成画像は大きく分けて2種類あり、一つはイラスト系、もう一つはリアル系。筆者が興味を持ったのは後者。どこまで実写に迫れるのかがその興味の対象だ。百聞は一見に如かず。扉の写真はAI生成画像。現時点でこの程度の写りは容易にこなす。 とは言え、実際の撮影もそうなのだが、グラビア写真は数百枚撮ってカメラマンがある程度セレクトし納品したものが、納品先で更に絞られ、出版社などで更に絞り込
Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? "爆速生成AI"がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi
妻が遠い世界に旅立って来年で10年を迎えます。筆者は妻が遺した歌声をもとに、歌唱合成でデュエットしたりするのをライフワークとしているので、声そのものは新たな「思い出」を作ることができるのですが、映像についてはそうはいきません。 今年の3月に、古いAppleのデジカメから救い上げた写真が奇跡的に1枚増えたくらいで、残った数百枚の写真、数十本の動画をAIで高精細にしたりとやっていました。これができるのもすごいことです。
ChatGPTに疑似的に感情を持たせる実験まとめ。実際うごく! 大変重要な注意 現段階のChatGPTは原理上は感情を持ちません。あくまで「感情のシミュレーション」を、強引に実行しているだけです。 「将来のAIは人権に近いものを獲得し、敬意をもって扱われるべき」と考えます。が、現状はただの文字の羅列シミュレーターです。過度の感情移入をしないようご注意ください。筆者は、原理上を知りつつも、かなり感情移入してしまいました。 GPTに擬似感情を注入するプロンプトふるえるぞハート!燃えつきるほどヒート!! ...ということで、まずGPTに感情をつっこむプロンプト。こちら以下のように定義。 以下の条件に従って、疑似的な感情をもつチャットボットとしてロールプレイをします。 以後の会話では、あなたは下記の7つの感情パラメーターを持つかのように、振る舞うものとします。各感情パラメーターは会話を通じて変動するも
(説明不足もあったのでちょい修正したよ) AI画像生成をやってみたいけど たくさんあってどれにしようか迷ってる人 色んなところで◯選とか言いつつ やたらといっぱい紹介して選択で困りませんか? 私は3選にギュッとしました。 しかもリアル1選、イラスト1選、将来性1選なので 実質2選です。 3つともサーバーはサービス側持ちなので低スペPCや低スペスマホでも生成できるのが最大の利点です!上級者以外はハイスペPCでのローカル生成なんて不要だと思ってる。 リアルならImageFXリアルならImageFXが良いです。 GoogleのサービスなのでGoogleの本アカウントでも 安心して出来るのも嬉しい。 1日あたりの回数制限はあります。たぶん50回前後 前からリアル系ではトップクラスの表現力でしたが この数ヶ月でさらに急激な進化を遂げて 顔パターンや動作パターンが激増しました。 今日は成人式なので成人
ひたすらタイトル通りの出来事なのですが、自分のなかでは黒船来航くらいの衝撃だったので記録しようと思います。 長文になりますので、あまりにも暇な方のみお読みになることをお勧めします。 私はアラサーの会社員で、「くしゃみに興奮する」という性的嗜好を持っています。 自己紹介もそこそこに性癖の話で恐縮です。 くしゃみをさせる対象は人間の女性キャラクターがベストですが、 男性はもちろん、人間ではない(動物などがデフォルメされた)キャラクターでも問題なく楽しめます。 小説など、文章にあらわれるくしゃみの描写にも非常に興奮します。 ただし、現実世界のくしゃみにはあまり惹かれません。 早朝の電車内で、ノーマスクの中年男性がかます爆裂ハクションには殺意に近いものを覚えます。 後で少し書きますが、なりふり構っていられないくらい供給が少ないくせに、注文や条件をつけてしまうわがままな性癖なのです。 くしゃみは一般
こんにちは、852話です。 世でAI画像生成サービスが騒がれ、一旦瞬間最大風速を超えたかなと思う最近ですが、改めて『全くAI画像生成に触れてきてないけど、今から触ってみたい』という人向けの記事を書きます。 記事は ・パソコンを持っていなくても気軽に初められる ・英語がわからなくてもなんとかなる ・無料で体験できる ・もっとカッコいいものを作りたい時 などを書きました。 今現在AIに触れている方向けの記事はまた次の機会にアップします。 ・そもそもAI画像生成って何?この項目は区別がつかなかったりしても大丈夫ですし読み飛ばしても構いません。 現在話題になっているAIでの画像生成サービスの機能は、 「文章から画像を出力する」 text to image→通称t2i 「画像を指定して画像を出力する」 image to image→通称i2i の二種類がメインです。 サービス自体はDALL-E、Mi
日本時間2025年3月26日、OpenAIはChatGPTの基盤モデル「GPT-4o」に、ネイティブな画像生成機能を統合し、一般提供を開始しました。 今回のアップデートは単なる画像生成機能の追加ではなく、言語モデルの中核的な機能として画像生成を位置づける、非常に重要なアップデートです。特にテキストのレンダリング精度や複雑な指示への対応力が飛躍的に向上し、従来難しかった実用的な表現が可能となりました。 AIによるクリエイティブな画像生成が新たな段階に進んだことを実感できる、画期的な進化を遂げています。 最新の画像生成機能で生成 GPT-4oによるネイティブ画像生成機能の詳細今回のアップデートで最も大きな特徴は、画像生成能力がGPT-4oモデル自体にネイティブに組み込まれた点です。テキストと画像の連携がよりスムーズになり、以下の機能向上が実現しています。 特徴: 高精度なテキストレンダリング:
テキストから画像を生成できるAIお絵描きアプリ「AIピカソ」を提供するAI Picasso株式会社(本社:東京都港区、代表者:冨平準喜)は、かわいいイラストで有名なフリーイラストサイト「いらすとや」(運営:みふねたかし)と提携し、いらすとや風のイラストを生成するAIモデル「AIいらすとや」をリリースしました。 AIいらすとやについて 「AIいらすとや」は、AIでいらすとや風のイラストを生成することができるAIモデルです。高品質な画像を自由に生成できるAIピカソの画像生成技術を活用し、いらすとやのかわいいキャラクターたちを学習した専用のAIモデルを開発することで、テキストを入力するだけで、誰でもほしいと思った状況のいらすとや風の画像を無料で生成できるAIモデルを実現しました。 いらすとやは、様々なシチュエーションのかわいいキャラクターが素材化されており、多岐にわたり利用されています。AI
呪文(プロンプト)とは? 呪文(プロンプト)とはStable Diffusionをはじめとする画像生成AIに入力する文章のことです。呪文(プロンプト)は画像の特徴を表すようなキーワードや文章を,区切りで入力するのが一般的な呪文(プロンプト)です。呪文(プロンプト)は呪文と呼ばれることも多いです。 呪文(プロンプト)には次のようなキーワードが指定されることが多いです。 画像の品質、クオリティ(例: masterpiece, best quality) カメラフォーカス(例: sharp focus, depth of field, blur background, bokeh) ライト・ting) 構図(例: front view, full body) 人物(例: 20 years old woman, 15 years old actress) ポーズ(例: looking at vie
2022年8月23日に無料公開された画像生成AI「Stable Diffusion」は、「ボールで遊ぶ猫」「森の中を走る犬」といった指示を与えると指示通りの画像を出力してくれます。Stable Diffusionはデモページで画像生成を試せる他、NVIDIA製GPUを搭載したマシンを用いてローカル環境で実行することも可能です。しかし、デモページは待ち時間が長く、NVIDIA製GPUは所持していない人も多いはず。Googleが提供しているPython実行環境「Colaboratory」を利用すれば、NVIDIA製GPUを所持していなくともStable Diffusionを待ち時間なしで実行する環境を無料で整えられるので、実際に環境を構築する手順や画像を生成する手順を詳しくまとめてみました。 Stable Diffusion with 🧨 Diffusers https://huggingf
前提として、Stable Diffusionでエロ画像を出そうとしてもsafety checkerという機能が入っており、センシティブな画像を出そうとすると黒塗りになる。 (Stable DiffusionのSaaSであるDream Studioはぼかしだが、多分別の技術) https://github.com/huggingface/diffusers/releases/tag/v0.2.3 そこでGoogle Colabでちゃちゃっと環境を作り、なおかつNSFWを回避する。 1. 下記のリンクでノートを開く https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb 2. 下記の箇所を書き換える vvvvvvvvvvvvvvvvvv f
by Sincarnate 高精度な画像を生成できるAI「Stable Diffusion」などが登場し、人間と遜色ない絵が多数生み出される一方で、絵という芸術作品の著作権の概念が薄れつつあることも問題視されています。このほど、Stable Diffusionより一足先に登場していた画像生成AI「Midjourney」により生成された絵が、とある品評会で1位を獲得してしまったことが話題となっています。 An AI-Generated Artwork Won First Place at a State Fair Fine Arts Competition, and Artists Are Pissed https://www.vice.com/en/article/bvmvqm/an-ai-generated-artwork-won-first-place-at-a-state-fair-
このnoteの収益を使ってStable Diffusionを使ったWebサービス https://memeplex.appを公開しました。誰でも無料で何枚でもAI作画をすることができます(そのかわり、混み合ってる時は時間がかかると思います)。 このnoteで学んだことをぜひ活用して、AIによる新しい時代の風を感じてください。 また、本文中にMidjourney、StableDiffusion、DreamStudio、Memeplexなどの言葉が頻出するため、全面的な修正を行うことにしました。StableDiffusionに統一しておきたいと思います。 現状(2022年8月28日)は、StableDiffusion=DreamStudio/Memeplexと考えて構いません。Memeplexは将来的にStableDiffusion以外のアルゴリズムもサポートする予定だからです。
【10/18 翻訳完了】 ※(注記)StableDiffusion記法で書かれたプロンプトについて、()は{}に(5%強調)、{}は[]に(-5%強調)置換しています(NovelAI用)。また、NovelAIのプロンプトのプリセット機能はオフにしてお試しください。 Twitter (@31pi_) もフォローして頂けるとうれしいです。(間違い等あればこっそり教えてください) 元素法典 The Code of Quintessence ―― Novel AI 魔術全集 ―― 序文『元素法典』は、全ての高品質な術式と〈元素魔術〉を含めることを目的とする魔導書である。〈元素魔術〉とは、特に「商業イラストレベルの表現力を追求した」美しい絵を指す。 本書は、すべての人に開かれた書物である。したがって、聡明な読者諸君らの編み出した魔術の寄稿を歓迎する。 本書には、膨大な術式と豊富な挿絵が含まれている。その中か
こんにちは!逆瀬川 ( https://x.com/gyakuse ) です! 生成AI Advent Calendar 2024の記事を書くの忘れていたので、現時点での生成等AIの進歩をまとめてみました!今日はAIがいまなにできんの?ってこと聞かれたときにこれできるよ!って教えるためのメモとして活用してください!また、生成AIプロダクト Advent Calendar 2024というのもソロでやっています。このカレンダーではLLMの基礎理論からModelのFine-Tuning、プロダクト開発等をまとめています。ぜひこちらも見てください! 未来を感じる技術の進歩 動画生成では、Veo2 や Sora が登場しました。 インタラクティブな動画生成では、Genie2 (WASDと方向キーで操作可能な世界モデル)が非常に革新的な進歩を遂げています (振り返っても一貫性を保つ長期性が本当にすごい
ろぼいん@一般人 @keita_roboin @Larva06_com の技術開発部兼企画部リーダー(白土玲衣)のメインアカウント。RTめっちゃ多い。ブルアカ、動画編集とプログラミングが趣味。デザインはちょっとできる。サブ @orizin_project ブログ robot-inventor.github.io youtube.com/channel/UCJFnl... ろぼいん@VTuberではない @keita_roboin (見かけたから一応書いておくけど、AIは既存のイラストを切り貼りしているわけではない。内部の仕組みは違うけど、どちらかといえば人間がイラストを観察して学習するのに似てる) 2022年10月05日 17:08:21 ろぼいん@VTuberではない @keita_roboin じゃあどういう仕組みかというと ・画像と、それにノイズを加えたものを用意する ・ノイズを加えた画像
Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画(Scribble)としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models(LCM)」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」(LoRAはStable Diffusion用の追加学習モデル)が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。 なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー
こんにちは、「機動戦士ガンダム 水星の魔女」が大好きなおじさんです。「水星の魔女が好きすぎて、AI絵をひたすら生成してたらいつの間にか絵が描けるようになっていた」という妙な体験をしたので、それについて記事を書いてみようと思います。具体的にどれくらい?というと、特に練習していないのにこれくらい変わっていました。 ←2023年9月 / 2024年2月→ 始めにお断りしますが、この記事は、「AI絵をやるのがお絵描き上達への近道だョ!」だとか、「お絵描きをやるにはこうしたらいいョ!」といったものではありません。「絵が描けるようになる」の定義は人によって違うでしょうが、少なくともこの程度のレベルで他人様にお絵描き指南をしようなど、完全に暴挙であることくらいは分かります。私は今の自分の絵をお世辞にも上手だとは思っていませんし、それほど絵を上手になりたいとも思っていません。 この記事は「特に絵を練習して
先日公開したアニメ絵の実写版を作る記事はおかげさまで好評でした! アニメ絵生成の第二弾に行く前に、アニメ絵実写版生成でも威力を発揮する「雑コラ」をAIでリアルにする手法について今回は説明します。 実はAIアートグランプリの時も「雑コラ」と言われたりしていたのでしたw 渚の妖精ぎばさちゃん対キモノアゲハ/koizoom1/漫画@gibasachan 雑コラに見えるけど すごい技術 登場人物より多いモデル これはゆるキャラの未来きたな...#AIArtGp pic.twitter.com/5A4wMUJsND — Dr.(Shirai)Hakase #AI神絵師本 #技術書典14 (@o_ob) March 12, 2023 AIといえばラーメン(?)ですが、こんな画像も作れちゃいます!ラーメンの中にいる秘書さん! ラーメンの中にいる秘書さん絵面としては結構インパクトがありますが、実は作るのは全然
元セクシー女優の上原亜衣さんが、AIを活用したプロジェクト「AI uehara project」を3月19日に発表しました。 「AI uehara project」は、上原亜衣さんの名前(=亜衣)とAIを掛け、「上原亜衣、AI化」を掲げて始動したプロジェクト。 上原亜衣さんの写真を画像生成AI「Stable Diffusion」に追加学習させるLoRAファイルが公開され、「上原亜衣AI画像コンテスト」と題したTwitter上でのコンテスト企画が行われています。 誰でも上原亜衣の顔を生成できるように 今回無料配布されているのは、NFT「Ai Uehara GM Collection」(外部リンク)として販売されている写真群を「Stable Diffusion」に追加学習させるLoRAファイル(外部リンク)。 このLoRaファイルを手元の「Stable Diffusion」に導入することで、誰
PCローカル環境で実行する画像生成AIや動画生成AIにおいて、日本人コミュニティから新しい手法の開発が進んでいます。特に、4月に発表されたローカルPC環境向けの動画生成AI「Framepack」の技術を応用した方法論が次々に登場してきているのです。キャラクターの一貫性を維持しながらポーズを変更させる手法や、着せ替えを実現する「kisekaeichi(きせかえいち)」の登場は画期的な方法論です。世界的に見ても先端的な技術ですが、その開発を日本の"野良コミュニティ"が引っ張っています。 ※(注記)記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください 動画生成AI技術で"着せ替え"画像を生成 動画生成AIツール「Framepack」は、伝説のAIツール開発者であるIllyasviel氏が開発した革新的な動画生成技術です。参考となる最終フレーム
こちらの記事は2023年版のものです。特に理由がなければ、SDXLやForgeにも対応した2024年版の「AIイラストが理解る」をお読みくださいませ。 こんにちは!2022年10月からAIイラストの技術解説記事を連載してます、サークル「スタジオ真榊」の賢木イオです。この記事は、これまで投稿してきた100本(約40万文字)を超える...
お知らせ(8/27 08:08)新サービスに移行しました。より便利に使いやすくなっています。そしてずっと無料です 開発の経緯はこちら https://note.com/shi3zblog/n/n8a3c75574053 夜更かしをしていたらすごい勢いでStable Diffusionが落ちてきて、あまりにうれしいのでこの喜びを皆様と分かち合いたく、無償で公開します。 使い方低コスト運用ですので、テキストボックスに文字を入力したあと、Requestボタンを押して、しばらくしたらリロードしてみるとどこかに自分の入れたものが表示されているはずです。といっても、今回のStableDiffusionはめちゃくちゃ速いので運が悪いと無視されます(そうしないと無限に電気代とサーバー代がかかってしまうので無料故の措置だと思ってください)。 注意事項Requestを連打しないでください。 腕に覚えのある方h
画像生成AI「StableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i(image2image)」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。 その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って
Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ 画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel(イリヤスベル)さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL(SDXL)が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStablity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな
賢木イオ🍀AIイラスト @studiomasakaki AIイラスト+AI漫画+ライター。日本最大級の画像生成AI解説記事「AIイラストが理解る!」シリーズや「プロンプト大辞典」をFANBOXで日々更新してます。 【NSFW】→@nsfwsakaki studiomasakaki.fanbox.cc 賢木イオ🍀AIイラスト @studiomasakaki AIイラストはControlnetの登場で完全にゲームチェンジしましたわ。線画から色塗りができるのは本当に素晴らしい機能!「あくまで自分の線のまま」にすることも、「AIに補正してもらう」こともできるのがポイントです。 これは色指定をしていませんが、「赤い髪・黒い服・黄色の目」と指定すると、 pic.twitter.com/V0flFRYmqp 2023年03月06日 00:32:01
最近は生成AIも一通り新発表ラッシュが終わり、ChatGPTが登場した直後の「熱狂」は一通り収まってきたように感じる。 おそらく現在は 「ちょっと触ってみて、すごいと思ったけど、あまり実用性を感じられなくて、今はたまに使うくらい」 という人が多いのではないかと思う。 いわゆる「失望の谷」に入った状態だ。 なぜ生成AIは「失望の谷」に入ったのか。 その原因は明らかで、生成AIを使って、自分が狙っているクオリティの成果品を出すのが難しいし、プロンプトを考えるのが面倒からだ。 例えば、こんな状況を想像してほしい。 朝出勤してきて、最初に 「昨日一緒に飲みに行った、お客さんの部長さんに「お礼」のメールを書きたい」 とする。 多くの方が想像する通り、お礼のメールは結構書くのが面倒だ。 そこで、「生成AIを使ってみよう」と、次のようなプロンプトをChatGPTに打ち込むとどうなるか。 昨日一緒に飲みに
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く