
Midjourneyという画像生成AIを使うとなると、先ず、英語のプロンプト(prompt)というハードルが待ち構えている。
大して難しいものではないが、AIが必要とする情報を順序立てて、補足説明を加えれば、思ったような画像を生成できるようになる。
以下は、画像生成AI Midjourneyの基本のプロンプトであるが、[ ]の中をみると、サブジェクト、背景、時間帯、光のタイプ、レンズのタイプ、レンズ名、そしてアスペクト比など、ごく僅かな情報が書かれているに過ぎない。
それでも、サブジェクト=ウサギ、背景=森林、時間帯=正午ころ、光のタイプ=太陽光や逆光、レンズのタイプ=35mm f1.4、レンズ名=Sigma、アスペクト比=16:9と、英単語にしたものを入れて、Midjourneyの「/imagine」の後に、このプロンプト全体をコピペしてクリックすると、1分程度でそれなりの画像が生成されるのである。
また、ここで秘策を伝授することに。それは、英語が苦手な人への面白活用術だが、ChatGPT3.5(無料版)に(2)を入れて、「英訳せよ」と書けば、(3)のように英訳してくれる。
ここで、Midjourneyのプロンプトが準備ができたので、Midjourneyのアプリを立ち上げ、使用可能な箇所で「/imagine」と記述して、その後に、(3)のプロンプトを流し込んで生成の指示を与えるだけで、後は待つことに。
(1)基本のシンプルなプロンプト
Midjourney prompt formula:
A photo of a [subject] with [background], during [time of day] with [type of lighting] and shot with a [type of lens] using [name of lens] --ar 16:9
(2)日本語を入れたプロンプト
Midjourney prompt formula:
A photo of a [ウサギ] with [森林], during [正午ごろ] with [逆光] and shot with a [35mm f1.4] using [Sigma] --ar 16:9
(3)ChatGPTで(2)を英訳させたもの
Midjourney prompt formula:
A photo of a [rabbit] with [forest], during [around noon] with [backlight], and shot with a [35mm f1.4] using [Sigma] --ar 16:9
▼ Midjourneyの画像生成用画面

上の画面中央下の(+)で「/imagine」を書き、その後に、「A photo of a [rabbit] with [forest], during [around noon] with [backlight], and shot with a [35mm f1.4] using [Sigma] --ar 16:9」をコピペで準備完了。

生成中の画面が二つ。一つは、中央の公開されているもの、右上は自分のみプレビューできるもの)

だんだんと画像が鮮明になって行き、100%まで待つ。

上は、出来上がった画面。時間的には1〜2分程度であり、アスペクト比16:9の画像を4パターン生成されている。

上をクリックすると、「ブラウザで開く」と画面左下にあるので、それをクリックして、自分のパソコンにダウンロードすれば完了となる。

上は、4パターンの画像をブラウザで見ているところ。拡大も可能。

ブラウザで閲覧している画像を、自分のパソコンにダウンロードする直前の映像。
4パターンが全て気に入れば良いが、一つだけであれば、このようにワンカットだけを選べば問題ない。既にお分かりかと思うが、光のタイプに「逆光」と入れたのは、ウサギの耳を透かして表現するために設定したのである。
▼MidjourneyとChatGPT4の相性の良さ
上述は、MidjourneyのプロンプトをChatGPTに翻訳させて、それをコピペして、再び、Midjourneyで画像生成をした訳だが、ここで、二つの生成AIの相性の良さを利用して、Midjourney向けに作ったプロンプトをChatGPT4に直接提供したら、画像生成するか否かの実験を行うことに。
結果は画像下の通りとなった。それなりにウサギが森の中に佇み、逆光を浴びて、静かに耳を立てている画像が生成されてきたのである。

以上のように、画像生成AIを活用するのは、全く難しくないことがご理解いただけたと確信する次第。
何事も経験を積むことで、いくらでもスキルアップができるので、プロンプトに関しては、例えば、「少女が主人公。小高い丘の上に立つ少女の髪が長く風に吹かれている様子。少女の服装は白い細いベルト付きの水色のワンピースとスニーカー。可愛い小さな雲が浮かび、小鳥が囀り飛び回っている。丘の上には一本の木があり、少女と話をしたいと思っている。アスペクト比を16:9で、画風はパステルトーンの水彩画風で生成してください。」と適当な日本語で書いてみる。
さて、ChatGPTがどのような画像を生成するのか、出来上がりは???なんとなくイメージに近い構図ではあるが、木が遠すぎて、遠近法でおかしくなっているが、ここで贅沢は言えない。

次に、先ほど何気に書き綴った日本語を、ChatGPTで英訳することに。
The protagonist is a young girl standing on a slightly elevated hill, her long hair being blown by the wind. She is dressed in a light blue dress with a thin white belt and sneakers. Cute little clouds float in the sky, and small birds chirp and flutter around. There is a single tree on the hill that seems to want to talk to the girl. Please generate the image in a 16:9 aspect ratio, in a pastel-tone watercolor style.
これをコピーして、今度は逆に、Midjourney側へ持ち込み、画像生成できるかの実験をしてみたい。出来上がった画像は以下の通り。
アスペクト比は16:9にはなっていないが、丘にいる少女の長い髪が風になびき、真っ白な雲と小鳥がたくさん飛んでいる画像となっている。スニーカーは履いているものと履いていないものがあり、白い細いベルトはないようだ。

このように、生成AI同士が相性が良ければ、プロンプトをガッチリ固めて挑まぬとも、素人さんでも自由な発想で活用できることがご理解いただけたかと・・・。これに、プロンプトに詳細を付加して行くだけで、どんどんと画像の構図や質感が向上し、リアルな写真も生成可能となる訳だ。
何はともあれ、少しでもご興味ある方は、生成AIにチャレンジされては如何だろうかと・・・。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
https://www.dandl.co.jp/

AIプロンプト・文責:西田親生
Comments