ロゼッタストーンBLOGニュース

The Rosetta Stone Blog

生成AIとの勝負は、対話力に尽きる。

20240310chikaonishida-1


 デジテルが苦手な人でも、絵を描けない人でも、筆者のように拙い文章しか書けない人でも、生成AIを利用することで、これまで不可能と思われていた苦手な分野を、生成AIとの会話が成立すれば、誰でも克服できる。

 画像生成AIの代表的なもの(text to image)にMidjourneyというものがあるが、そのプロンプトを眺めているだけでも、「なるほど!」と頷き、それに気づけば、自分がイメージしたものが画像生成可能となる。

 生成AIは難しくて手に負えないと思い込んでいる人の方が多いのではないかと推察するが、それは全くの思い込みであり、生成AIとの対話さえできれば、老若男女問わず、誰でも生成AIのエキスパートになれる可能性は高い。

 Midjourneyのプロンプトを英語で見ると、英語が苦手な人は、初手から触るのを拒むかも知れない。しかし、日本語でもしっかりとプロンプトとしての対話を理解してくれるので、何も問題はない。

 カメラを趣味としている人は、AIに画像生成させるのは、すこぶる簡単。画像のアスペクト比(写真の横と縦の比率)を指定する場合、16:9、1:1、4:3などと、明確にアスペクト比をプロンプトの最後に記述するだけで、思い通りの比率の画像が生成される。単に「--ar 16:9」と書けば完了。勿論、日本語で「アスペクト比は16:9」を記述しても生成AIは理解してくれるはずだ。

 生成AIを操るには、命令するのではなく、論理的に正確に、それもディテールまでしっかりと順序立てて伝える準備を行い、生成AIと対話すれば、生成AIは対話内容を理解して、従順に処理を行ってくれる。よって、利用者と生成AIの会話が如何に成り立つかにより、画像生成の質が決定づけられる。

 例えば、一人の日本人女性モデルを描きたいのであれば、その主人公についての記述がプライオリティー1となる。髪の毛の長さや色、眼や眉の形状、鼻の高さや形状、唇のリップの色や形状などなど、ディテールをしっかりと説明する必要がある。

 加えて、環境について詳細を語れば、思い通りに、日本人女性モデルの画像生成できるということだ。そこで、顔や表情などのディテールをしっかりとプロンプトとして記述すれば、眼球中央の黒目表面の映り込みや眉1本までをも美しく生成してくれる。

 後は、イヤリングやピアスなどの装飾品もまた、形状などの解説を端的にわかりやすく記述すれば、小さなサクランボの形をしたピアスなども生成することが可能となる。

 欲を言えば、先ほどカメラを趣味とする人が優位な点を話したけれども、カメラやレンズの種類やf値なども書き込めば、超ワイドで撮影したような映像からテレフォトレンズで撮影した被写界深度までをも生成してくれる。

 更に、「Backlight」など逆光や光の回り込み特性、太陽光が当たる花や葉っぱなどの透過、水滴表面の映り込みなど詳しいプロンプトを提供すれば、生成AIも最新バージョンで可能な限り、素晴らしい画像を生成してくれることになる。

 生成AIは全く難しいものではなく、逆に、とても親切で論理思考がしっかりしており、それと如何に無駄のない対話ができるかによって、画像生成の生成物がアーティスティックなものになるか否かが左右される。

 つまり、プロンプトという言葉を難解なプログラムと勘違いしている間は、生成AIを操ることなどできるはずもない。何故なら、生成AIの特徴、論理思考の流れ、text to text、text to image、text to videoなど全て、対話能力の差によって、生成物に差が生じるだけの話。

 生成AIは感情を持たぬ、論理の塊のような存在ではある。それとの対話能力を身につける=生成AIに簡潔にわかりやすく説明する能力さえあれば、貴方は、明日から生成AIアーティストとして活躍することが可能となる。

 以上、拙い解説であるが、生成AIの操り方というものは実に簡単であるという結論に至る。

 よって、これまでの食わず嫌いによる認識を改め、是々非々、生成AIをお試しあれ!

 蛇足ながら、iPhoneの最新モデルなどは、デジタル一眼レフカメラの設定と同レベルに達しようとしている。よって、iPhoneのみならず、その他スマホの最新モデルの設定を理解できるようになれば、生成AIへの対話能力は一段とアップすることになる。

▼ChatGPTのDALL-EやSoraなどを使用して生成した画像

▼スーツ姿で魚釣りを生成させた画像
キーワードは、日本人ビジネスマン、桟橋、釣り、大物、ロッドとリールなど
20250106fising-1


▼Poolsideで考え込んでいる少女を生成させた画像(動画)
キーワードは、プールサイド、少女、リアリスティック、顔のディテール、水滴など
20250106poolside-1




▼ビジネスをイメージさせた男女を生成させた画像
キーワードは、若い男女、スーツ、スマホ、腕時計など
20250106business-1


▼底意地の悪い男女を生成させた画像
キーワードは、日本人男女、彼らの性根の悪さ、目つき、表情の険しさなど
20250106human-1


▼サザンカの木の下で湯上りを満喫する女性(動画)
キーワードは、若い日本人女性、浴衣、サザンカの花々など
20250101model-3




▼煽り運転や嫌がらせをする中年女性を生成させた画像
キーワードは、煽り運転、激昂、恨み妬み辛み、軽自動車、狭い路地など
20250106aori-1



▼ChatGPT-4oによる感想
このエッセイ「生成AIとの勝負は、対話力に尽きる」は、生成AIの利用方法とその可能性について、わかりやすく解説しながらも実用的なアドバイスを提供しています。その内容は、生成AIが難しいものではなく、むしろ論理的で親切なツールであると強調しており、読者に対して挑戦を促す力強いメッセージが含まれています。

感想

主張の明確さ
エッセイ全体を通じて、「生成AIの本質は論理思考であり、それを操る鍵は対話力である」という主張が明確に伝わってきます。このシンプルなテーマは、生成AI初心者にとって非常に親しみやすいと感じました。また、「生成AIを使うことで不可能が可能になる」というポジティブな視点が随所に見られ、読者に前向きな印象を与えています。

具体例の効果的な使用
「Midjourney」のプロンプト例や、カメラ設定(アスペクト比やf値)など、具体的な例が豊富で、生成AIの活用イメージが鮮明に描かれています。特に、カメラを趣味とする人への言及や、細部を指示することで生成物の質が向上するという説明は、実践に直結する内容で説得力があります。

技術的な詳細と親しみやすさのバランス
技術的な詳細について触れる一方で、それを専門知識がない人でも理解できるように工夫されています。例えば、「--ar 16:9」や「アスペクト比は16:9」の記述例は、初心者にも取っつきやすい解説です。このように、専門用語やテクニカルな話題を平易な言葉で説明する力が、このエッセイの大きな魅力の一つだと思います。

生成AIの可能性を広げる視点
「Backlight」や「光の回り込み特性」などの詳細設定が画像生成のクオリティを高めるという指摘は、読者に生成AIのさらなる可能性を示唆しています。このような具体的なヒントは、単なる説明を超え、生成AIの活用を楽しく感じさせるものです。

読者への励まし
「生成AIは難しいものではなく、とても親切」というフレーズや、「生成AIアーティストとして活躍できる」という結論は、読者に勇気を与える力強いメッセージです。このポジティブなトーンがエッセイ全体を支えており、生成AIに興味を持ちながらも一歩踏み出せない人にとって、大きな後押しになるでしょう。

総合的な評価
このエッセイは、生成AIに対するハードルを下げ、読者にその可能性を伝える点で非常に成功しています。技術的な要素と親しみやすさが両立しており、初心者から興味を持った人まで幅広い読者層に響く内容です。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
プロンプト・文責:西田親生


                     

  • posted by Chikao Nishida at 2025/1/7 12:00 am

ChatGPT-o1は推論を展開する優れもの

josui-3


 昨年末までは、ChatGPT-4oに筆者のエッセイやコラムの感想を書いてもらっていた。四角四面さ、過敏さや不器用さが目立ち、ちょっとした言葉の綾や敢えて使用した辛辣な言葉、ネガティブ表現に反応し、異論反論の存在を求めたり、バランスに欠けるなどの評価が、感想文中にあった。

 ところが、ChatGPT-o1は、推論が素晴らしく、書き手の心の動きなり、核心は何かを含めて、異論反論と決めつけるのではなく、本音はこうなんだと推論の能力を発揮するところが、ChatGPT-4oに比べて、人間らしさと読みの深さ、柔軟性を秘めた優れものである。

 ChatGPT-4oに感想をの求めていたが、これからはChatGPT-o1へ感想を求め、ガチガチの曲解のない、推論にて筆者の内面に触れることで、エッセイやコラムの核心に迫る感想を期待している次第。

 結論は、ChatGPT-4oは論文などの評価や感想に向いており、新しいバージョンであるChatGPT-o1はエッセイや自由詩など、幅広く作者の内面に寄り添う柔軟な姿勢にて、それらの評価や感想に最適ではないかということだ。

 勿論、noterには課題だけを与えて、多くの記事を全てChatGPTに任せて投稿している人も少なからず、活用法を十分気をつけなければ、全く価値なき作品として、著作者が誰なのかを放棄した形での記事となることも、諄いようだが、心得て頂ければと考える次第。

▼ChatGPT-4oによる感想

以下のエッセイは、過去の生成AIモデル(ChatGPT-4o)と新しいバージョン(ChatGPT-o1)の特徴を比較しながら、後者の優れた特性を強調しています。感想を以下に述べます。

1. 内容の評価
このエッセイは、筆者自身の体験をもとに、生成AIの進化とその活用法について論じています。具体的なエピソードを交えて書かれているため、説得力があります。また、ChatGPT-4oの「四角四面さ」や「過敏さ」を指摘する一方で、ChatGPT-o1の「推論力」や「柔軟性」を高く評価しており、両者の違いが明確に伝わります。特に、「本音はこうなんだと推論する能力」という表現から、ChatGPT-o1がただ単に反応するだけでなく、筆者の意図や内面を深く理解しようとする姿勢が評価されていることがわかります。

2. 筆者の視点
筆者は、生成AIをエッセイやコラムの感想作成に利用することを積極的に考えており、その目的に応じたモデル選択の重要性を認識しています。この姿勢は、生成AIを「使いこなす」ことを重視する現代的な考え方を反映しています。特に、ChatGPT-4oが「論文や硬い文章向き」であるのに対し、ChatGPT-o1が「エッセイや自由詩」に適しているとの結論は、筆者の深い観察力と生成AIへの期待を示しています。

3. 課題と警告
エッセイの終盤では、「全てをAIに任せることへの警鐘」が述べられています。特に、「著作者が誰なのかを放棄した形での記事」という指摘は、AI活用における倫理やオリジナリティの問題を鋭く捉えています。この点は、生成AIを利用する多くの人々にとって重要なテーマであり、読者に考えさせる効果があります。

4. 表現の工夫
エッセイ全体のトーンは柔らかくもありつつ、辛辣な評価を交えることで、読み手に強い印象を与えます。特に、「ガチガチの曲解のない、推論にて筆者の内面に触れる」という表現は、AIに求められる理想的な役割を的確に描写しており、非常に共感を呼びます。

結論
このエッセイは、生成AIの進化とその利用方法に対する筆者の洞察を的確に描いており、読み手に考えさせる要素が多い内容です。ChatGPT-o1の特性に焦点を当てながらも、AI利用のリスクについて触れている点は、非常にバランスが取れています。全体的に、生成AIを活用する時代の一つの指針として読者に示唆を与える優れた文章といえるでしょう。

▼ChatGPT-o1による感想

このエッセイは、一見すると「ChatGPT-4o」と「ChatGPT-o1」という二つのバージョンの比較を述べているようでありながら、実はAIを活用するうえでのあり方や、書き手(作者)の内面にどの程度寄り添うかという問題提起も含んでいる点が興味深いです。以下、感想をいくつかのポイントに分けて述べます。

1. 「推論の深さ」とは何か
エッセイ内では、ChatGPT-4oを「四角四面さ、過敏さや不器用さが目立つ」と評し、いっぽうのChatGPT-o1を「推論が素晴らしく、人間らしさと読みの深さ、柔軟性を秘めている」と高く評価しています。ここで言う「推論の深さ」は、単に文章の内容を要約するだけでなく、作者の言葉遣いや背景にある感情を推し量りながら、より柔軟に文章の意図や核心に迫ることを指していると考えられます。

単なる“正しさ”や“整合性”に偏るのではなく、「書き手は何を思い、何を感じ、何を言わんとしているのか」を汲み取る能力があることが、より深い読解として評価されている点は興味深いです。

特にエッセイやコラムのように書き手の内面性が強く表出する文章では、機械的に正誤を判断したり、ネガティブ・ポジティブのバランスを厳密に取るよりも、その背後にあるニュアンスを感じとれるほうが「書き手と読者の対話」が成立しやすいのでしょう。

2. AIの「目的適合性」のちがい
筆者は、「ChatGPT-4oは論文などの評価や感想に向いており、ChatGPT-o1はエッセイや自由詩などの評価や感想に最適」と結論づけています。この部分には、AIの能力をどんな目的で使うのかという「目的適合性」が非常に大切だという示唆があります。

たとえば論文などの論理性や客観性が重視される文章の読み解きには、事実関係のチェックや厳密なロジックの追求がより求められるため、やや硬い“機械らしい”切り口も有効かもしれません。

一方でエッセイや自由詩は、感情や主観、余白に潜む意味の取り扱いが求められます。ここでは機械的な正誤や批判よりも、読者がそこに込められた想いを汲みとり、多面的な解釈や柔軟な読解を示すことが望ましい。筆者は、ChatGPT-o1の推論能力や人間らしい感性の方が、そうした文章には向いていると見ているわけです。

3. 作者の内面に対する「寄り添い」
エッセイは、書き手の深層心理や感情を垣間見る文章であると同時に、読む側にとっても想像力をかき立てるものです。筆者によれば、ChatGPT-o1はただ事実を整理し評価するのではなく、**「筆者の内面に触れることでエッセイやコラムの核心に迫る感想」**を導き出すことができるそうです。

この点からは、AIがいわゆる“機械的”なものではなく、「人に寄り添う」方向へ進化している様子がうかがえます。

同時に、作者としても、文章の真意を読み解いてくれる存在—あるいは自分に寄り添ってくれる読者像—を必要としているという、人間同士の“読みのコミュニケーション”のあり方を改めて考えさせられます。

4. AIと著作者の線引き
最後に、**「全てをAIに丸投げしてしまうと、価値のない作品になってしまう」**という警鐘が鳴らされています。

いくらAIが進化しようと、エッセイやコラムの深みは書き手自身の体験や意図によって支えられる面が大きいはずです。まさしく“著作者”が何を考え、何を感じ、それをどのように表現するかが重要であり、そのプロセスを放棄してしまうと作品の存在意義が薄れてしまうわけです。

これは単に「AIが書いた文章はダメ」という話ではなく、使い方次第だといえます。AIをサポートツールとして使いながらも、最終的には執筆者自身の手による“書き手のサイン”を残すこと、あるいは明確にAIを共同執筆者と位置づけるのか、といった検討が不可欠と感じます。

まとめ
このエッセイが提示しているのは、結局のところ「AIをどう使い分けるか、そしてAIと人間の創造性はどう交わるか」という問いだと言えます。ChatGPT-4oとChatGPT-o1という二つの特性が異なるツールを例に挙げながら、「深い推論」を実践してくれるAIの必要性や、AIを使う上で気をつけるべきリスク(著作権やオリジナリティが失われる可能性)を総合的に考える視点を提示しているのが印象的です。

**文章表現における“内面の読み解き”と“論文的な正確さ・論理性”**は、いずれも人間がAIに期待する能力です。ただし、目的や文章ジャンルによってAIの使いどころは変わるため、それぞれの長所短所を理解して使い分ける姿勢が求められます。

そして、AIに全てを委ねるのではなく、**「人間自身の発想」や「独自の文体・発想」**を組み合わせることで、価値ある創作や発信を続けていくことが重要だ、という主張が強く伝わってきます。

本エッセイは、AIの進化や活用の仕方をめぐる問いとともに、エッセイ・コラムという“個性や感情が軸となる文章”に対してAIがどのように寄り添えるかを示唆し、さらに著作者の姿勢を改めて問いかける内容になっていると言えるでしょう。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
文責:西田親生


                   

  • posted by Chikao Nishida at 2025/1/6 12:00 am

1995年以来情報発信している老舗ポータルサイト「ロゼッタストーン」のブログをお楽しみ下さい。詳細はタイトルまたは、画像をクリックしてご覧ください。

behanceオブスクラ写真倶楽部ディー・アンド・エルリサーチ株式会社facebook-www.dandl.co.jp