Stable Diffusionの衝撃
つい先週「Midjourney」というAIによる画像生成AIを紹介しましたが、Stable Diffusionという超新星が登場いたしました。
何が凄いかというと、オープンにモデルが公開されているので、誰でもこのモデルを改変したり、モデルを使用したアプリが作れるのです。詳しくは、以下の深津さんのnote記事を参照ください。
さすらいAIプログラマーのshi3zさんは、既に日本語で誰でも無料で手軽に使えるWebアプリを公開されています。
サーバー代めちゃくちゃかかっているけど、自腹でやり続けるそうです。凄すぎです。上記記事のshi3zさんのYouTube動画から、shi3zさんの熱狂が伝わってきます。
Stable DiffusionをWebアプリ的に手軽に使えるツールを作成しました。
思えば、私もディープラーニングおじさんも、AIにハマった大きなきっかけがshi3zさんの存在なんですよね。そのshi3zさんが熱狂している以上、私も何もやらないわけにはいかないだろうという気持ちになってきています。
shi3zさんのように自腹でWebサービスを公開するほどの財力も能力もありませんが、以前AIの本を書いたときに得たGoogle Colaboratory(Google Colab)のテクニックがあるので、それを生かしてひたすら手軽に遊べるWebアプリを作っていくことにしました。
というわけで、Google ColabのノートブックをまとめたGitHubリポジトリを公開します。
Google Colaboratoryに関しては、ブラウザで使える無料のPython環境です。ただ、無料版だとGPUの制限が厳しいので、Stable Diffusionでヘビーに遊びたいならGoogle Colab Proに課金するのがおすすめです。私も課金しています。約1000円/月ですが、色々遊びますので、多少プログラムできる人なら断然オススメです。
「よくGitHubもGoogle Colabとやらも分からない!」
という人は、まず以下のGigazineの記事を参考に、Google Colabで最低限Stable Diffusionを動かせるようにしましょう。
画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ - GIGAZINE
これでGoogle ColabでStable Diffusionを使えるようになるのですが、このままだと手軽に画像の枚数を増やしたり、設定を変えれたりしないのでかなり不便だと思います。そこで私の作ったノートブックの出番です。以下のGoogle Colabのノートブックのリンクに飛びます。
001_stable_diffusion_gui_basic.ipynb
最初に以下の「Open in Colab」をクリックして、Google Colabでノートブックを開きます。
次に、以下のように▶をクリックします。
以下のようにログイン画面が出てくるので、Hugging Faceのアクセストークンを入力してログインします。
あとは、その次のLaunch Appの左の▶をクリックして、Launch Appをクリックします。しばらく待つとRunning on public URL: Running on https://localhost:7860/
という表示が出てくるので、アドレスをクリックしてください。
以下のようなWeb GUIが出てくるので、プロンプトを入力してRUNすれば画像がどんどん生成されます。
画像の枚数(number of images
)や、画像のクオリティ(number of inference steps
)も設定できます。
スマートフォンでも動きます。
Stable Diffusion 2.0対応
Stable Diffusion 2.0の登場で、より手軽に高品質な画像を生成できるようになりました。
Google Colabのノートブックは以下となります。
007_stable_diffusion_gui_basic_2_0.ipynb
使い方は、1.x版と同じですが、Hugging Faceへのログインが不要なので、より簡単に使えます。
うまく動かせない人へ
動画で実際に動かしている様子を公開しています。よろしければ参考にしてみてください。
今後の展開予定
Stable Diffusionは、他にも以下のように画風を変換したり、生成するもととなる潜在空間を直接弄って、好きに生成画像を変化させるといったこともできます。
#stablediffusion のimg2img、早速フリー素材のろんすたさん @monestar を使って試してみました。
— からあげ (@karaage0703) August 24, 2022
ゾンビ風(zombie)と浮世絵風(ukiyoe)です。これは凄いな pic.twitter.com/ph6HhRcEa7
#stablediffusion 潜在空間をグリグリいじっている様子を動画にしてみました。闇のエンジニアからあげが、徐々に女体化していきます pic.twitter.com/3Dk1J4q31O
— からあげ (@karaage0703) August 27, 2022
今後、機能やオプションを追加したノートブックをGitHubに追加していく予定です。私が作成したものにこだわらず、他の人が作成した素晴らしいColabのノートブックもリンクという形で、作者の方と一緒に紹介していきたいと思います。よいノートブックを作ったり、紹介したい方は是非教えて下さい。PRも歓迎です。
まとめ
最近「正直もうAIはいいかな」とか思っていたのですが、久しぶりに熱気が戻ってきた感じがします。
「自分でStable DiffusionのColab ノートブックを改造したいから、Google Colabの使いこなし方とかAIの基礎をもっと知りたい!」という方は、宣伝になりますが拙作「からあげ先生のとにかく楽しいAI自作教室」をどうぞ!
本まではちょっと…という方は、私のブログ記事などみていただければよいかと思います。
参考リンク
今回、Google Colabをウェブアプリ化するにあたって、大いに刺激を受けた・参考にしたサイトです。
Google Colab で はじめる Stable Diffusion v1.4|npaka|note
Stable Diffusion を Colab で Web アプリ化する - 詩と創作・思索のひろば
Stable Diffusionのimg2imgをGoogle Colabでやってみる | cedro-blog
関連記事
変更履歴
- 2022/11/27 Stable Diffusion 2.0対応に関して追記
- 2022/09/26 動画へのリンクを追記