ロゼッタストーンBLOGニュース

The Rosetta Stone Blog

Midjourney 山桜とモデル

20240309model-1


 生成AIを使用していると言わなければ、ぱっと見では判らないほど、Midjourneyの描画力は優れている。

 ただ、プロンプトに書き込んだ「山桜」というキーワードに対して、正確には生成されていない。何故なら、山桜は「花より葉が先」と言われるように、花が咲く時は、既に葉がついている。そこは、残念なところであった。

 モデルの年齢は指示せず、生成AI側がどう判断するかを見ることにしたが、モデルは日本人とヨーロッパ系のハーフという条件を指示している。

 筆者にしては、モデルの表情(内面的な思い)、髪色やヘアスタイル、顔のパーツについて、結構なディテールを書き込んでいる。いつも一発勝負なので、どこまで筆者のプロンプトが生成AI側に伝わるかは、見ての通りの50点程度の出来である。しかし、この程度の写真を撮るとなれば、レフ板も必要であり、生成AIの描画能力には脱帽するばかり。

 日頃からDSLR(デジタル一眼レフカメラ)と単焦点レンズやズームレンズなどを使い分けているので、どうしても構図や被写界深度などが気になってしまう。基本は三分割構図であるが、生成AIとのキャッチボールが上手く行っているとは言い難い。

 後は、太陽光の角度や光の強さ、光の回り込みなど、微に入り細に入り支持すべきか悩んだが、一応、ソフトな逆光とだけ指示している。

 Midjourneyは、英語プロンプトなので、日本人としての筆者の撮像への感覚と欧米の感覚とはかなり異なるところもあり、表現の難しさが常に伴う。しかし、アプリの画面上では、生成AIとは会話(キャッチボール)なので、何も難しいことはない。

 カメラやデジタルデバイス、そしてアプリに疎い方であっても、会話ができれば、誰でも簡単に生成できるのが生成AIの頼もしいところである。勿論、英語オンリーの生成AIであれば、ChatGPTやGoogle先生を利用して、日本語を英訳し、それを使っても全く支障はないのである。

 最後に、このモデルのプロンプトをDALL-Eで試してみたものの、どうしても人工的な描画となってしまい、全てを不採用とした。それは致し方のないことであり、実写に近い写真を求めるのであれば、画像生成専門のAIと共に生成するのが間違いなかろうかと。
20240308cherrygirl-4


20240308cherrygirl-2


20240308cherrygirl-3


▼ChatGPTによる評価

このエッセイは、生成AIを使用した絵画作品「Midjourney」とその制作過程について詳細に述べています。以下はエッセイの評価です:

詳細な観察と分析: エッセイは、生成された作品に対する詳細な観察と分析を提供しています。作者は、作品における要素の正確さや不足点について洞察を示しています。

制作プロセスの記述: 作品が生成されるまでのプロセスについて説明があり、プロンプトの指示や生成AIとの相互作用についても触れられています。これにより、読者は作品の背後にある詳細な制作過程を理解できます。

写真技術への比較: 作者は、生成AIによる絵画と自身の写真技術との比較を行っています。この比較は興味深く、AIがどの程度のレベルで写真の要素を再現できるかを示しています。

言語と感覚の違いへの言及: 英語のプロンプトに基づく生成作業と、日本人の撮像感覚との違いについて言及されています。これは、異なる文化や言語の背景を持つ人々がAIを使用する際の課題を示しています。

提案と結論: 最後に、別のAIであるDALL-Eの試みとその結果について述べられています。これは、異なるAIモデルを使用することで、作品の品質や適合度を向上させる可能性を示唆しています。

総合的に、このエッセイは生成AIによる絵画制作の詳細な解説と、その技術的・文化的な側面に関する洞察に富んでおり、興味深く読み応えのあるものです。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
プロンプト・文責:西田親生


                             

  • posted by Chikao Nishida at 2024/3/9 03:41 pm

Midjourney 背景固定で、主人公交代。

20240308change-subject-1


 Midjourneyの画像生成レベルが向上し、画面構図やプロンプトが自由自在に操れるようになった。流石に、ChatGPTのDALL-Eと比較すると、特に、実写版のようなリアリスティックな画像生成の場合、かなりの格差がある。

 Midjourneyは、最初に生成された画像を元に、背景固定を行い、そこで主人公の子猫の範囲を選び、プロンプトの中の子猫をレトリバーの子犬に書き換えるだけで、以下ような子犬の画像が生成される。

 次に、画面上でヒヨコのエリアを広げ、さらに卵をいくつか置くようにプロンプトを書き換えると、1羽のヒヨコの横に卵の画像が違和感なく生成される。

 更に、卵から新たにヒヨコが生まれ、ヒヨコが2羽登場することになる。これは、最初の「子猫とヒヨコ」の大元のプロンプトをそのまま利用して、「子犬とヒヨコ」が生成されるというフローである。

 よって、現在のChatGPTのDALL-Eにおける「gen_id」や「JSON format」などの遣り取りが不要となり、オリジナルのプロンプトを微に入り細に入りカスタマイズできるので、アバウトではなく、イメージした通りに、確実な画像生成に繋がる。

 翌る日には、何かが変わり何かが進化しているのが、現在の「生成AI」の世界だ。この進化の波に乗るか否かは人それぞれであろうけれども、「AI世界」は「ネット世界」の登場時以上に世界を変えてしまう可能性が高い。
20240308change-subject-2


20240308change-subject-3


20240308change-subject-5


20240308change-subject-4


▼ChatGPTによる評価


このエッセイは、Midjourneyという画像生成モデルの進化について述べられています。以下は評価のポイントです:

明確な内容と構成: エッセイはMidjourneyの進化に関する具体的な情報を提供しており、背景固定や主人公の変更など、具体的なプロセスが説明されています。これにより、読者はMidjourneyの機能とその進歩について理解しやすくなっています。

比較の明確さ: DALL-Eとの比較が行われており、Midjourneyの現状とDALL-Eとの格差が示されています。この比較により、Midjourneyの進化の重要性が強調されています。

具体例の提供: 背景固定やプロンプトの変更によって生成される画像の例が具体的に示されています。これにより、読者はMidjourneyの新しい機能を具体的なイメージとして捉えやすくなっています。

洞察と展望: 最後の段落では、生成AIの進化が世界をどのように変えていく可能性が示唆されています。このような洞察と展望は興味深く、読者により広い視野を提供しています。

総じて、このエッセイはMidjourneyの進化に関する明確な情報を提供し、具体例を交えながらその重要性を説明しています。また、AI技術の進歩が社会に与える影響についても洞察を提供しており、興味深い議論を展開しています。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
プロンプト・文責:西田親生


                               

  • posted by Chikao Nishida at 2024/3/8 12:00 am

1995年以来情報発信している老舗ポータルサイト「ロゼッタストーン」のブログをお楽しみ下さい。詳細はタイトルまたは、画像をクリックしてご覧ください。

behanceオブスクラ写真倶楽部ディー・アンド・エルリサーチ株式会社facebook-www.dandl.co.jp