Stable Diffusionとは⁉驚異のAI美少女を生んで話題のAI画像生成ツールを解説します

画像生成
スポンサーリンク

AI画像生成ツールの台頭

会話型AI「ChatGPT」の誕生以降、AI技術の台頭は目覚ましく、さまざまな分野で画期的なツールが生み出されています。
その中でももっともホットな分野の一つが画像生成AIの分野です。
CharGPTを生んだOpenAI社が手掛けた「DALL E2」を始め「ミッドジャーニー(Midjourney)」「レオナルド(Leonardo)」など多くの画像生成AIツールが公開されていますが、高品質の画像生成で高い支持を得ているツールが「ステーブル・ディフュージョン(Stable Diffusion)」です。
今回は画像生成AIツールのステーブル・ディフュージョンを紹介します。

Stable Diffusion/ステーブル・ディフュージョン

ステーブル・ディフュージョン(Stable Diffusion)は入力された文字(テキスト)をもとに画像を生成するAIツールです。
誰でも手軽に高品質な画像を生成する事ができます。
文字で「サッカーをする子犬」などと入力するとAIが入力情報から画像を生成してくれます。
絵を描く技術は必要では無く、文字情報だけで画像を生成できます。
本物の写真としか思えないリアルな画像にする事も可能です。
また画像を読み込ませてその内容を反映させた別の画像を生成する事もできます。

Stable Diffusion Online
Stable Diffusion is a deep learning model that generates images from text descriptions. Use Stable Diffusion online for free.

開発者

ステーブル・ディフュージョンはミュンヘン大学のCompVisグループが開発し、2022年8月にCompVisとStability AIRunwayの共同で最初のモデルが公開されました。
2022年11月にはステーブル・ディフュージョン2.0が公開されています。
最新では2023年4月にステーブル・ディフュージョンXLがベータ版として公開されており、機能を更に充実させています。

大人気のアプリケーションに

2.0の公開以降、ステーブル・ディフュージョンは関連アプリケーションがApp Storeの上位を占めるほどの人気となりました。
大きなインパクトとなったのがステーブル・ディフュージョンを使って創られたAI美少女の画像です。
過去のAI生成画像とは一線を画す、極めてリアルな(あるいはそれ以上の)美しい女性の画像がユーザーによって次々に作成され、SNSを駆け巡りました。

無料で使える

ステーブル・ディフュージョンは誰でも無料で利用し画像生成を始めることができます。
パソコンにインストールして利用することもできますが、パソコンの能力に大きく依存してしまうので多くのユーザーにとって賢明な方法ではありません。
ネット上にあるステーブル・ディフュージョンを使ったWebサービスを利用するのが一般的です。
ステーブル・ディフュージョンは以下の様なWebサービスで利用できます。

●ステーブル・ディフュージョン・オンライン
●ドリームスタジオ(DreamStudio)
●ハギング・フェイス(Hugging Face)
●マージ(Mage)

ステーブル・ディフュージョン・オンライン

ステーブル・ディフュージョン・オンラインはもっとも簡単に画像生成を行えるWebサービスです。
ステーブル・ディフュージョン・オンラインのサイトに行きます。

Stable Diffusion Online
Stable Diffusion is a deep learning model that generates images from text descriptions. Use Stable Diffusion online for free.

【無料で始めましょう】のボタンをクリックすると画像生成の画面に移ります(実際には画面の下に飛んでいるだけです)。
『Enter your prompt』と表示されている欄に生成したい画像の内容を記入します。
例えば「眠る猫(Sleeping cat)」などと入力します。
英語の方がAIの認識する精度が高いですが、日本語で入力しても大丈夫です。
入力したら入力欄の右側にある【Generate Image】のボタンをクリックすると画像の生成が始まります。

内容にもよりますが数十秒程度で画像が基本設定では4枚生成されます。
簡単ですね。

ドリームスタジオ(DreamStudio)

ドリームスタジオ(DreamStudio)では多彩な機能を使ってより本格的な精度の高い画像を生成する事ができます。
ドリームスタジオは実際には有料のサービスなのですが、アカウント登録をすると最初に一定数のクレジット(Cresdits)と呼ばれるポイントが貰えるので100枚程度の画像生成を無料で行うことができます。
やってみてもっと使いたいということであればクレジットを購入します。
クレジットは10ドルから購入でき、10$で1,000クレジットを獲得できます。
これで約5,000枚の画像を生成できるので他の有力画像生成サービスと比べるとかなり割安な設定と言えます。

ドリームスタジオにログインし、画面左側の『Prompt』欄に生成したい画像の内容を記入します。
記入したら画面左上部の【Generate】ボタンをクリックすると画像が生成されます。
この辺りは他のサービスと同様と言えます。
ドリームスタジオには『Prompt』欄の下に『Negative Prompt』という欄もあります。
これは「こういうものは排除して欲しい」という内容を指示できる欄です。
また『Upload image』という欄もあって、こちらに既存の画像(写真)をアップロードさせて内容を画像生成に反映させる事もできます。

DreamStudio

ハギング・フェイス(Hugging Face)

ハギング・フェイス(Hugging Face)は自然言語処理のさまざまなツールを利用できるコミュニティです。
多様なツールが提供されており、その中にStable Diffusion 2 Demoというモデルも収容されています。
Hugging Faceの画面右上にある【Spaces】をクリックします。
検索欄に「Stability AI」と入れて検索すると「Stability AI-Stable Diffusion 2」がリストに出てきますので選択します。
後はStable Diffusionオンラインと同様です。
テキストの入力エリアに生成したい画像を表すテキストを入力します。
実行ボタンをクリックすると画像生成が行われます。

Hugging Face – The AI community building the future.
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

マージ(Mage)

MageはHugging Face同様、さまざまなAIアプリケーションを集めたプラットフォームです。
開発者向けのSNSツールであるGitHubを使える人がメインユーザーとなっており、一般の人にはちょっととっつきにくいかも知れません。
ただGitHubを利用している人にとっては非常に使いやすいサービスです。
メイン画面で”Stable Diffusion”を検索して、後は他のサービスと同じ様に使う事ができます。

Stable Diffusion XL

2023年4月、ステーブル・ディフュージョンは新しいバージョンとなるStable Diffusion XLのβ版を発表しました。
XLでは画像生成機能を大幅に向上させ、より短い文章からでも精度の高い画像を生成することができます。
XLは現在は DreamStudio などのアプリケーションでベータ版を利用する事ができます。
近い将来にはオープンソースとして公開される予定になっています。

XLでは以下の様な機能が追加されています。

インペインティング

生成された画像を編集する事ができます。

アウトペインティング

生成した画像の外部側に画像を拡張する事ができます。

Image-to-image

ソースとなる画像を使用して新しい画像をプロンプトします

まとめ

ステーブル・ディフュージョンは能力の高い画像生成AIツールとして多くのユーザーに支持されています。
ごく短い期間に機能も精度も格段に向上しており、最新のStable Diffusion XLでは多様な機能を扱う事ができます。
当然今後も更なる進化をしていくと見られます。
日本のユーザーの人気も高く、広く浸透していく可能性を持つAIツールと言えます。
是非一度触って見て下さい。
最後までお読み頂き、ありがとうございました。

コメント

タイトルとURLをコピーしました