Imagen 4でテキスト入り画像が実用化|Geminiでの使い方とプロンプトのコツ

AI活用術

この記事でわかること

  • Geminiに統合されたImagen 4の主な改善点
  • テキスト入り画像を成功させるプロンプトのコツ3つ
  • Gemini AdvancedとGoogle AI Studioでの使用方法
  • 実用レベルでの活用シーン(ポスター・SNS素材など)

GeminiでImagen 4が使えるようになった

ちょっと前まで「Geminiの画像生成、なんか微妙だよな」と思ってたんですが、最近アップデートされて様子が変わってきました。

GoogleがImagen 4を提供していて、Gemini APIGoogle AI Studioで使えるようになっています。公式の案内でも「(Googleの)最高のテキストから画像への変換モデル」といった位置づけで紹介されていて、特にテキストレンダリング(画像の中の文字)が改善されたとされています。

実際に触ってみたらわりと印象が変わったので、使い方と感じたことをメモしておきます。

Imagen 4で何が変わったのか

個人的に一番気になったのが画像内の文字がちゃんと読めるようになったこと。以前の画像生成AIって、看板とかポスターに文字を入れようとすると謎の文字列になりがちでしたよね。Imagen 4はそこが改善されたとされていて、「○○と書かれた看板」みたいなプロンプトでもわりと正確に出てきます。

公式情報でも用途例はいろいろ紹介されているようなので、以下みたいな使い方を想定してます。

  • ポスター・パーティーの招待状
  • コミック・イラスト
  • SNS用の画像素材

実際に試したプロンプトのコツ

①スタイルを最初に書く

「ミニマルなデザインで、白背景に黒のシンプルな線画、ポスター風」みたいに、スタイルの指定を先に書くと出力がブレにくい印象です。後ろに書くとあまり反映されないことがありました。

②テキスト入れたいなら引用符で囲む

画像内に特定の文字を入れたいときは、"OPEN" のようにダブルクォートで囲んで指定すると認識精度が上がった気がします。日本語もある程度入りますが、英語のほうがまだ安定してる気がします。

③比率や用途のヒントを添える

「SNS用の正方形フォーマット」「A4縦向き」みたいな一言を添えると、構図が自然に調整される感じがします。明示的にサイズ指定できるわけじゃないけど、構図への影響はあるっぽいです。

Gemini AdvancedとGoogle AI Studioでの使い方

Gemini Advanced(gemini.google.com)にアクセスして、チャット欄に普通にプロンプトを入力するだけです。「〇〇の画像を生成して」と書けば画像生成が動きます。

Google AI Studioからも試せるので、API連携で自動化したい場合はそちらが便利。自分はまだ試してないですが、Lambda + Imagen 4で画像自動生成とかやってみたいな、とは思ってます(いつになるかは謎)。

気になるところと使い時

良くなったとはいえ、複雑な日本語テキストや人物の手の描写はまだ怪しい場面も。商用利用を考える場合は、生成画像の利用規約を確認したほうが良さそうです。

とはいえ、ブログのアイキャッチやちょっとしたSNS素材くらいであれば十分使えるレベルになってきた印象。ChatGPTの画像生成と比較してどっちが良いかはまだ判断できてないですが、Geminiを普段使いしているなら試してみる価値はあると思います。

※この記事にはプロモーションが含まれます

ちなみに、Aiarty Image Enhancer(AI画像高画質化ツール。ノイズ除去・8倍拡大に対応)も気になっています。Aiarty Image Enhancer

まとめ

Imagen 4はテキストレンダリングの改善で、ポスターやSNS素材といった実用的な画像生成が現実的になってきました。プロンプトのコツさえ押さえれば、手軽に見栄えの良い画像が作れます。完璧さよりも「ちょうどいい素材が欲しい」という場面で活躍しそうです。

参考になったらクリックしてもらえると嬉しいです!

Blogmura AIAI Ranking
タイトルとURLをコピーしました