画像生成AIの使い方

画像生成AIの使い方を考える時に重要なことは、サービスごとで使用方法が大きく異なるということです。
もちろん、文章からイメージを生成すること（通称：Text to Image）や、イメージからイメージを生成すること（通称：Image to Image）など、基本的なプロセスは同じかもしれません。

しかしながら、各サービスごとで出来ることは大きく変わります。

そのため、この記事では、画像生成AIの基本を押さえた後、「フローチャート」と通じて、自分にとって最適な画像生成AIを見つけることを目指します。
数多あるサービスの違いに振り回されることなく、最適なサービスを使い始めましょう。

画像生成AIとは

画像生成AIとは、人工知能の技術を用いて画像を生成する仕組みや、それに基づいたサービス一般のことを指しています。
一般的には、作成したい画像の内容を、"文章"や"箇条書き"で伝えることで、それに応じた画像が生成されます。

また、文章以外でも画像を生成することも可能です。
例えば、猫の全身が写っている画像データをアップロードし、そこで、「猫の色を白から黒にしてほしい」という指示を与えることで、元あった画像をベースに、新しい画像を作成することもできます。

画像生成AIの技術は日進月歩で進んでおり、一概に言うことはできませんが、このように画像生成AIは高画質でクリエイティブなビジュアルを誰でも簡単に生成することができます。

プロンプトとは

先ほどの説明で、「作成したい画像の内容を"文章"や"箇条書き"で伝えること」について軽く触れました。画像生成AIのコミュニティにおいて、この文章はプロンプトと呼ばれます。例えば、以下の画像。

カモの画像

この画像のプロンプトは以下のような内容になります。

5羽の鴨の家族が、川辺で居眠りをしている。

ここでは、"一連の文章"として入力していますが、"単語だけで区切られた文章"にすることも可能であり、入力方法に関して具体的なルールがあるわけではありません。また、生成したい画像に対して、プロンプトをできるだけ具体的にすることで、思い描いた画像と近づけることが可能になります。重要なことなので、このことについて詳細に説明致します。

まず、以下の2つの画像を比べてみてください。それぞれのプロンプトを画像の下に記載しています。

プロンプト：海の上を飛ぶカモメ

カモメ.2
プロンプト：Unrealengine,海の上空を飛ぶカモメ、レンズフレア、空撮

下の画像と上の画像のプロンプトの違いは、「Unrealengine」「レンズフレア」「空撮」というキーワードの有無です。簡単に言えば、上のプロンプトは要素が1つ。下のプロンプトは、要素が4つです。なぜプロンプトによってこのような画像が生成されているのでしょうか？ここでは、「Unrealengine」というキーワードに絞って解説致します。

「Unrealengine」とはゲームを制作するためのソフトウェアの名称になります。まるで実写映画のようにリアルな映像を作成できることで有名です。試しにインターネット上で、「Unrealengine」を検索してみると、高精細な画像がたくさん出てきます。

ところで、AIは、インターネット上にアップロードされた大量の画像データを学習しています。学習は、言葉と画像がセットとなり、学習されます。画像データにラベルが貼り付けられるような形をイメージしてください。例えば、男性が散歩している画像があったとして、その画像は、「男性」「散歩」といった言葉とセットになるということです。画像生成AIは、こういう学習を大量に行うことで、あらゆる質問や要求を解析し、その言葉に対して紐付く、適切な画像を生成しているわけです。つまり、学習データ全体から得ることのできる「一定の傾向」を元にして回答していると言えます。

以上のことを踏まえると、Unrealengineという言葉は、高精細のゲーム画像と対応させられているはずだということを考えることができます。Unrealengineで作られた画像は、おしなべて高画質です。そこで作成された数々の高画質の画像がAIによって学習させられる時、Unrealengineという言葉と対応して学習している可能性が高いです。

だからこそ、2枚目のカモメの画像では、1枚目と比較して高画質でダイナミックに画像になっているのです。この画質はUnrealengineで制作されたゲーム画像が持つ高画質性を引き継いでいると言えます。

画像生成AIフローチャート

画像生成AIの概要がわかったところで、さっそく画像生成AIの具体的な操作方法を確認していきましょう。

と言いたいところなのですが、冒頭に述べたように、画像生成AIには様々な種類があります。そして、それぞれごとに使いやすさ、出来ること、特徴などが異なります。そのため、まずは自分にとってどの画像生成AIを使うのがいいのかを明確にしましょう。

以下のフローチャートは、その検討に役立つものです。画面左上にある「画像生成AIをどのように使いたいですか？」という問いから始まり、「Yes」と「No」を判断していく中で、ご自身の関心に近しい画像生成AIを特定することが目的です。

画像生成AI使い方記事フローチャート
画像生成AIの始め方フローチャート

構成上、文字が小さくなっております。必要に応じてズームしながらフローチャートを進めてみてください。

また、このフローチャートは、あくまでも、多々ある種類の中から、あたりをつけるための補助道具です。そのため、もしかしたら適切ではない可能性や、もっと色々な画像生成AIに触れて試行錯誤していくべき人もいるかもしれません。そちらについては、ご自身の具体的な状況に合わせて、適宜フローチャートの活用方法を判断していただけると幸いです。

各画像生成AIサービスの使い方

フローチャートを通じて、現時点のご自身に合う画像生成AIサービスがわかったら、実際に触ってみましょう。

以降の文章で、それぞれの画像生成AIの概要と、その使い方を一つずつ解説した記事をご紹介しています。

Hugging.face

Hugging.faceには、たくさんのオープンソースのAIモデルが公開されています。その中で、StableDiffusionが、最低限の機能で公開されています。
そのため、1〜2クリックで操作を済ませることができます。初心者でも簡単に画像生成AIを使える点が特徴です。また、Hugging.faceは、突飛な画像がたまに出力されるため、触っていて面白いです。こちらは無料で使うことができます。

以下の記事で詳しく紹介しています。ぜひご覧ください。

記事が見つかりません | AI総合研究所 | AI総合研究所

お探しの記事は見つかりませんでした。

https://www.ai-souken.com/article/how-to-use-stable-diffusion

Stable Diffusion Online

Stable Diffusion Onlineも、Hugging.faceと同様に、画像生成に必要な最低限の機能を限定的に公開しているサービスです。簡単な操作で高クオリティな画像を生成することができます。

以下の記事で詳しく紹介しています。ぜひご覧ください。

Stable Diffusionを無料で使えるサイト・利用方法を徹底解説！ | AI総合研究所

Stable Diffusionを無料で使う方法とその注意点をわかりやすく紹介しています。初心者向けに気軽に試せる情報満載です。

https://www.ai-souken.com/article/free-use-stable-diffusion

Dreamstudio

DreamStudioは、画像生成に加えて、編集についての機能が揃っています。例えば、アスペクト比やテイストの変更などの簡単な編集から、生成モデルの変更を通して絵柄をガラッと変えることまでできます。上述したHugging.faceやStableDiffusionOnlineと比較して、とても高画質です。どちらも無料で利用することができます。

以下の記事で詳しく紹介しています。ぜひご覧ください。

記事が見つかりません | AI総合研究所 | AI総合研究所

お探しの記事は見つかりませんでした。

https://www.ai-souken.com/article/how-to-use-stable-diffusion

Mage.space

Mage.spaceも、Dreamstusioと同様に、編集についての機能が揃っています。

以下の記事で詳しく紹介しています。ぜひご覧ください。

記事が見つかりません | AI総合研究所 | AI総合研究所

お探しの記事は見つかりませんでした。

https://www.ai-souken.com/article/how-to-use-stable-diffusion

Midjourney

Midjourneyの特徴は出力される画像の独創性にあります。クリエイター向けに開発されていることもあり、芸術的に洗練された画像を簡単に生成することができます。特にクリエイティブなプロジェクトやデザインの初期段階で役立ち、視覚的なインスピレーションを与えます。また、使いやすいインターフェースと豊富なカスタマイズオプションにより、幅広いユーザー層に対応しています。

以下の記事で詳しく紹介しています。ぜひご覧ください。

Midjourney(ミッドジャーニー)とは？使い方・料金プラン・商用利用まで徹底解説！ | AI総合研究所

Midjourney(ミッドジャーニー)の概要から使い方、料金体系、各プランの特徴、登録方法、商用利用のポイントまで分かりやすく解説。あなたに最適なプラン選びと画像生成をサポートします。

https://www.ai-souken.com/article/pricing-midjourney

DALLE3

DA-LLE3は高解像度で自然な画像生成が可能なOpenAIの最新画像生成AIです。他方で、Midjourneyは独特な芸術スタイルの画像生成に特化したAIです。リアルよりか、ファンタジーよりかという違いはありますが、プロンプト次第では、どちらも広告やパッケージ、世界観を表示する画像を生成することが可能です。DA-LLE3は、ChatGPTやMicrosoftCopilot、 Bing image Creatorなどで使えますが、無料で使えるのはMicrosoftCopilotのみです。
また、Midjourneyは現時点では有料ユーザーのみの対応となっています。

以下の記事で詳しく紹介しています。ぜひご覧ください。

DALL-E3とは？使い方や料金、無料で使う方法を紹介！商用利用も解説 | AI総合研究所

DALL E3の使い方や料金、プロンプトのコツや無料で使える方法をわかりやすく解説しています。著作権や商用利用についても紹介します。クリエイティビティを広げたい方必見です。

https://www.ai-souken.com/article/exploring-dall-e-3

Leonaldo AI

リアルタイム画像生成や画像に動きをつける機能など、他の画像生成サービスにはない斬新な機能が多数搭載されています。
テキストによって画像を生成する経験（一般的な画像生成AIの経験）に一通り慣れてきた後に、ぜひ体感してみてください。

以下の記事で詳しく紹介しています。ぜひご覧ください。

Stable Diffusionを無料で使えるサイト・利用方法を徹底解説！ | AI総合研究所

Stable Diffusionを無料で使う方法とその注意点をわかりやすく紹介しています。初心者向けに気軽に試せる情報満載です。

https://www.ai-souken.com/article/free-use-stable-diffusion

Adobe Firely

Adobe製品との統合が強みで、高品質の画像生成と編集が可能です。テキストからの画像生成はもちろん、それ以外のクリエイティブを支援してくれる機能が多数搭載されています。また、他のAdobeサービスとも連携することができます。サブスクリプションモデルで費用がかかる点にご注意ください。

以下の記事で詳しく紹介しています。ぜひご覧ください。

Adobe Fireflyとは？使い方や料金体系、プロンプトのコツを徹底解説！ | AI総合研究所

Adobe Fireflyの使い方や料金体系、商用利用と著作権について解説します。また、プロンプト例や無料での使い方も紹介。クリエイターやデザイナーにとって革新的なAI駆動クリエイティブツールの魅力に迫ります。

https://www.ai-souken.com/article/what-is-adobe

Canva AI

Canvaは、デザイン全般をサポートする多機能な統合型プラットフォームです。AI画像生成だけでなく、AI文章作成、AIナレーション、AI音楽生成など、AI機能を豊富に搭載しています。

Canvaとは？できることや料金、実際の活用例を徹底解説！ | AI総合研究所

Canvaの特徴や使い方、そして料金体系や商用利用についても徹底解説します。無料プランとProプランの違いや、比較結果もご紹介します。

https://www.ai-souken.com/article/what-is-canva

まとめ

この記事では、画像生成AIの概要から、フローチャートを通じた適切画像生成AI診断、そして、各サービスの使い方の入り口に立つところまでを解説してきました。

画像生成AIサービスは、どれも基本的にテキストからイメージを生成するという点で似ています。
しかし、各サービスごとで生成されるイメージのクオリティは異なるため、まずはたくさん触ってみることで、より自分に適切な画像生成AIが見つけることが可能になるでしょう。

AI総合研究所では、StableDiffusionやMidjourneyといった代表的な画像生成AIを中心に、網羅的な解説を行なっております。画像生成AIの活用でお困りのことがあった場合は、ぜひご活用ください。