ロゼッタストーンBLOGニュース

The Rosetta Stone Blog

カテゴリー » 企業IT&AI戦略

日本人女性の左眼をAI Soraで生成

20241222eye-2


 ChatGPTの目玉の一つである生成AI(text to video)のSoraを本格的には活用していないが、現在、不定期ながらも実験しているところだ。

 本日は、日本人女性の左眉、左眼、付けまつ毛のプロンプトを書き込み、瞬きの動画を生成させてみた。

 僅か10秒であるが、日本人的なイメージは出ており、目の色もブラウンで違和感はない。ただ、思いの外、つけまつ毛が太く長すぎるところが不自然に感じるが、初の試みなので、及第点にしようかと。

 眼球の動きはとてもスムーズに動いており、クローズアップのプロンプトもSora側はしっかりとジェネレートしており、文句の言いようがない。

 しかし、このtext to videoの生成AIが進化すれば、実物なのかAIによる動画なのかの判別なかなか難しくなってくる。

 このような動画がフェイクとして拡散することは避けなければならず、法整備も喫緊の課題である。

▼Soraで生成した動画
https://youtube.com/shorts/CriVxEC54y4?si=0EmDOSwRQET3JboxLink

20241222eyes-1


20241222eyes-2


20241222eyes-3


20241222eyes-4


20241222eyes-5


▼ChatGPT-4oによる感想

エッセイについての感想を述べます。

このエッセイでは、「Sora」という生成AIを使用して、日本人女性の左眼の動画を生成した実験について説明しています。特に、瞬きや眼球の動きのリアリズムに焦点を当て、技術の進化に対する期待と懸念が述べられています。

生成されたビデオの詳細な記述は、AIが現実の人間の特徴をどの程度正確に再現できるか、そしてそれが持つ意味についての理解を深めます。特に、つけまつ毛の太さや長さに関する観察は、AIの生成する細部への注意がまだ改善の余地があることを示唆しています。

また、AIによる動画生成技術が現実との区別を難しくする可能性について触れられており、この技術の社会的な影響や法的な枠組みに関する重要な問題を提起しています。これは、テクノロジーが進化するにつれて社会が直面するであろう倫理的なジレンマを浮き彫りにするものです。

全体として、エッセイは生成AIの現状と将来の展望について興味深い洞察を提供しており、技術の進歩が人間社会に与える影響を考える良いきっかけを与えています。特に、フェイクニュースの問題や個人のプライバシー保護の観点から、これらの技術がどのように管理されるべきかについての議論は、ますます重要になってくるでしょう。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
プロンプト・文責:西田親生


                       

  • posted by Chikao Nishida at 2024/12/22 12:00 am

生成AI画像の質と価値は、観察力と表現力により差異が生じる。

20241217frog-1


 この1年余りの生成AIついての考察および実践において、表題の通り「生成AI画像の質は、観察力と表現力により差異が出る。」との結論となった。

 緻密かつ繊細な観察力があり、そのイメージを如何に表現(言葉にする)するかで、プロンプトが決まってくる。よって、そのプロンプトの良し悪しが生成AI画像の質と価値を決めると言っても過言ではない。

 登場する主人公が誰なのか、年齢、性別、ヘアスタイル、目や眉、そして鼻や口の形、顔の輪郭、表情、服装などのディテールに加え、背景や環境光、構図など総合的に緻密な観察力を持って、確実な表現力(生成AIとの会話)によって全てが決まることになる。

 text to image、text to video、text to soundなどなど、テキストから画像が生成されたり、静止画から動画が生成されたりするので、ほんの数行のプロンプトでも画像生成は可能ではあるものの、その質と価値を決めるのは、上述の通り。

 よって、感性の低い人が書き込むプロンプトは単純であり、主人公のディテールがないために、薄っぺらい、軽々な、それもありきたりな画像として生成されてしまう。

 生成AIのアプリによっても癖が異なるので、特に人物の画像生成をする場合は、適当に書き込むと、同じような人物像が生成され、食傷ものとなる。

 特に、最近はtext to videoが話題となっているので、目の動きやカメラワーク、撮影機材やレンズまでをもプロンプトに書き込み、アスペクト比なども考慮しておかないと、単なる、インスタグラムに投稿するようなスクウェア画像となるので、しっかりと把握しておかねばならない。

 中には、AIのプロンプトに精通しており、短時間に相当レベルの高い画像生成ができる強者も見かけるが、その人たちと肩を並べるクリエイターとなるには、高い歓声もさることながら、観察力と表現力が大きな鍵を握っていると言っても過言ではなさそうだ。
20241214aiimage-1


20241214aiimage-2


20241214aiimage-3









▼ChatGPT-4oによる感想

このエッセイは、生成AIによる画像生成の質を決定づける重要な要素として「観察力」と「表現力」を挙げ、その意義や影響を具体的に論じています。以下に感想を述べます。

1. 明確な結論と一貫性
エッセイの冒頭で「生成AI画像の質と価値は観察力と表現力により差異が生じる」という結論を提示し、全体を通じてそのテーマが一貫して論じられています。これにより、読者は何を主張しているのかを明確に把握できます。このような明快な構成は説得力を高めています。

2. 観察力と表現力の重要性の説明
具体的な例を挙げながら、観察力が画像のディテールをどのように影響するか、またそれを生成AIのプロンプトで表現するスキルがいかに重要かを説明しています。たとえば、「年齢、性別、ヘアスタイル、顔の特徴、表情、服装、背景などの詳細」がプロンプトに反映されることで質の高い画像が生まれるという論点は非常に具体的です。この部分は、特にクリエイティブな仕事に携わる人々にとって有用な洞察となっています。

3. 生成AIツールの特性の指摘
「生成AIアプリによって癖が異なる」「適当なプロンプトでは似通った画像が生成される」など、実践から得た知見が共有されています。これにより、生成AIの特性を理解し、活用する上での具体的なヒントが得られる点が優れています。

4. 批評と課題提示
感性が低い人や観察力・表現力が不足している場合の問題点として、「薄っぺらい、軽々な画像」となるリスクを指摘しており、生成AIを単なる便利ツールとしてではなく、クリエイティブな表現の拡張として捉えるべきという示唆があります。この批評は鋭いものの、受け手に努力の方向性を示唆しているため、建設的な印象を与えます。

5. 未来への展望と課題
最後に、text to videoの可能性に触れ、「カメラワークやアスペクト比」など、さらに高度な要素をプロンプトに含める必要性を示唆しています。生成AI技術の進化に伴う新たなチャレンジを指摘しつつも、それを乗り越えるための具体的なアプローチを提示しており、読者に未来志向の視点を提供しています。

総評
このエッセイは、生成AIを効果的に活用するための核心的なポイントを捉えており、特にクリエイティブ分野の専門家や興味を持つ読者にとって有益です。観察力と表現力がプロンプトの質を決定し、それが画像生成の結果に直結するという洞察は、生成AIの可能性を深く掘り下げたものと言えます。また、課題と展望のバランスが良く、生成AIの未来についてポジティブな視点を提供しています。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
文責:西田親生


                             

  • posted by Chikao Nishida at 2024/12/17 12:00 am

1995年以来情報発信している老舗ポータルサイト「ロゼッタストーン」のブログをお楽しみ下さい。詳細はタイトルまたは、画像をクリックしてご覧ください。

behanceオブスクラ写真倶楽部ディー・アンド・エルリサーチ株式会社facebook-www.dandl.co.jp