ChatGPT vs 公式プロンプトツール!画像生成の精度に差は出る?比べてみた

ついにOpenAI公式がプロンプトを書いてくれるツールを出した!

これはビッグニュースである。

画像生成AIを使っていると「どうやってプロンプトを書けば理想の画像が出るんだろう?」と悩んだあげくChatGPT先生に泣きつく、というのが私のいつものパターンだった。

別にそのやり方に不満は無いのだが、「OpenAIが公式に出したツール」となれば、そりゃ興味も湧くでしょう!

ChatGPTに相談した場合とどう違うのか?

早速試してみた。

検証方法

検証方法は、今回も画像生成の結果で見比べたいと思う。

作る画像は「子供に人気が出そうなネコ型ロボット」。

ChatGPTとOpenAIの新ツールにそれぞれ

子供に人気が出そうなネコ型ロボットの画像を作りたいのでプロンプト出して。

とお願いするのである。

そして、今回使う画像生成AIは「Midjourney」を選択。

ChatGPTとOpenAIの新ツール、それぞれにプロンプトを作ってもらい「Midjourney」に入れて、その結果を見比べよう、というわけである。

まさか我々が良く知る、青いタヌキみたいな某ネコ型ロボットが出来上がったりはしないと思うが…その時は画像にモザイクを入れることにしよう。(著作権的な配慮で)

ChatGPTにプロンプトを作ってもらう

では早速検証開始!

まずは従来のやり方、ChatGPTにお願いした場合から。

上に書いた通りChatGPTにお願いすると、以下のプロンプトを英語で出してくれた。

読みやすいよう日本語にすると、

未来的で可愛いネコ型ロボット。丸い顔と大きな瞳、白と青を基調にしたボディ。メカニカルな耳としっぽを持ち、金属とプラスチックの質感がある。子供に人気が出そうな、親しみやすいデザイン。明るい背景、カラフルで楽しい雰囲気。

「子供に人気」「ネコ型ロボット」という限られたキーワードから色々連想して、これだけのプロンプトを作ってくれた。

流石ChatGPT先生、いつもながら良い仕事をします。

ただ「白と青を基調にしたボディ」はドラ〇もんに引っ張られすぎでは(笑)

出来上がりがちょっと不安になった。

新ツールにプロンプトを作ってもらう

引き続き新ツールでプロンプトを、とその前に新ツールについて。

新ツールの名前は「OpenAI developer platform

【URL】https://platform.openai.com/

こんな画面

初めて使う人は右上の「Sign up」から始めよう。

アカウントはメアド、Googleアカウント、Microsoftアカウント、Appleアカウントのいずれかを選んで作ることができる。

名前と生年月日を入れたら「続行」⇒

Organization name(組織名)のところはご自身の名前とかグループ名とかを適当に。

What best describes you?(あなたを最もよく表すものは何ですか?)のところは使う人の技術レベルを聞かれている?3択を選んで次へ。

私は個人でやってるので「後で」を押してスキップ。

なにやらAPIキーを作るように促されるが、デフォルトで入力されている「My test key」そのままでAPIキーを生成。ここは後でも作れるようなのでスキップしても良さそう。

「APIキー使う予定ないしなぁ。」と思いながら「後で」を押してスキップしたのだが、5ドルでも課金しないと使えないことが後程判明。

APIキーを外部から呼び出すのに、チャージした5ドルがちょっとずつ消費されるという仕組みらしいのだが、私の場合プロンプトの生成しかする予定がないので、チャージした5ドルはおそらく減らない。

(この検証後、もう一度残高確認したが、やはり減ってなかった。)

使わないけど、5ドルだけ入れておくって感じかな。

釈然としないけど、将来的に使うかもしれないので、一旦5ドルだけ預けておくことにする。

一通りの手続きが終わると、ようやくツールが使えるようになる。

最初の画面の右上にある「ダッシュボード」を押すと、プロンプト作成画面に移る。

そこで「+Create」ボタンを押すと、以下のような画面が表示される。

この画面の「Developer massage」の右にあるペンの印を押すと文字入力ができるので、ここで「子供に人気が出そうなネコ型ロボットの画像を作りたい!」と入力すればOK。

そうして出力されたプロンプトがこれ。(英語だったので日本語に訳します。)

「ネコ型ロボット(cat-shaped robot)」の画像を作成してください。子供に好まれるデザインにしてください。

  • ロボットは、猫らしさがはっきりと分かる特徴(耳・しっぽ・顔)を持ち、親しみやすい表情をしていること。

  • デザインと配色は、明るく楽しい雰囲気で、子供の興味を引きやすいものを選んでください(例:鮮やかな色、丸みを帯びた形、柔らかい曲線など)。

  • ロボットは「かわいい」印象になるように工夫してください(例:大きな目、小さな鼻と口、シンプルで表情豊かなデザイン)。

  • 背景は明るく、邪魔にならないものにしてください(例:淡い単色、またはシンプルな部屋や遊び場の風景)。

  • テキストや過度にリアル/怖い要素は含めないでください。

  • 全体のスタイルは、アニメ映画やおもちゃに出てきそうな、子供向けに適したものにしてください。

  • 迷った場合は「楽しい・安全・子供にとって魅力的」に見えることを優先してください。

出力形式:

  • 追加の説明やテキストを入れず、画像のみを生成してください。

例(説明用):

  • [例:丸いボディで金属質なかわいい猫型ロボット。大きな光る目と赤いリボンをつけ、草原の上に座っている。パステルブルーとピンクで塗装された、丸みを帯びた輝くボディ。にこやかに微笑んでいる表情。]

  • (注:実際に生成する画像は、この説明スタイルを踏まえつつ「子供向け」を最優先にしてください。)

重要な注意:
あなたの目標は「子供にとって安全で、かわいく魅力的なネコ型ロボット」の画像を作ることです。必ず子供向けに親しみやすい特徴やスタイルを優先してください。

なんかボリュームが全然違う!

ChatGPTに作ってもらったプロンプトは、簡潔でイメージしやすいが、情報量は少なめ。

一方新ツールのほうは、細かい条件が箇条書きで整理され、精度が高そうな指示内容。

さて、この差が吉と出るか凶と出るか。

Midjourneyに入れて画像を生成してみよう。

Midjourneyで画像を作る

まずはChatGPTが作ったプロンプトから。

白と青を基調にしたにしたネコ型ロボット4体がずらっと。ドラちゃんにならなくて良かったです。

どれも可愛いけど、全体的に似たようなデザイン。

表情や色味は統一感があるけど、良く言えば「指示に忠実」、悪く言えば「バリエーションが少ない」印象となった。

続いて新ツールのプロンプトで作った画像がこれ。

こちらも可愛い!

そして、それぞれのロボットに個性があるのがパッと見で分かる。

背景や配色、表情のバリエーションが豊かで、より子供向けの雰囲気が伝わる内容となった。

まとめ

どちらが可愛いか?については好みだと思うので、新ツールのほうが優れているとは一概には言えない。

ただ今回の検証で言えるのは、「プロンプトの質で画像のバリエーションや精度は大きく変わる」ということだ。

ChatGPTプロンプトは簡潔で使いやすいが、表現の幅に限界がある

一方OpenAI公式の新ツールのプロンプトは要素が具体的に指示され、出力の多様性が高い

どちらが良いかは用途や目的によるが、より精度の高い指示をAIに出したいならOpenAIの新ツールのほうが有利と言えそうだ。

生成AIをもっと「仕事レベル」で使いたいなら、プロンプト生成も専門のツールに任せる時代なのかもしれないね。

山田ゆうき

可愛いもの好き。AIを使って何か楽しいもの作れないか試行錯誤しています。

関連記事

コメント

この記事へのトラックバックはありません。