はじめに

DX開発事業部の北村です。

2025年5月20日に開催された Google I/O ’25で発表された「Imagen4」の始め方について解説します!

気になっていて触ってみたいけど、環境構築するの面倒だな・・・と思っている方!複雑な環境構築やセットアップ、コーディングも不要です!Googleアカウントさえあれば、5分後にはImagen4で最初のAI画像を生成することが可能です。

まずは手を動かして、Imagen4の実力を体感してみましょう!

Imagen4とは

Imagen4は、Googleが開発した最新のテキストtoイメージ生成AIモデルです。

Imagen4の魅力は、以下4つです。

極めて高度な写実性と、細部の忠実な再現性

まるでプロの写真家が撮影したかのような、実写と見分けがつかないほどの高画質な画像を生成します。肌の質感、髪の毛一本一本、布地の繊細な模様、動物の毛並みまで、驚くほど鮮明かつ自然に描写します。これまでのAIが苦手としてきた、細部の表現力が飛躍的に向上しました。

正確な「文字」の描画

これまで多くの画像生成AIが苦手としてきた、画像内への「文字」の挿入。Imagen 4はこの課題を克服し、ポスターやグリーティングカード、コミックのセリフのように、意味の通る正確なスペルと美しい書体を描き出すことができます。これにより、デザインの可能性は無限に広がります。

複雑な指示も的確に理解・実行

「笑顔で歩く日本の女性、背景には昭和レトロな商店街と提灯」といった長く複雑な指示(プロンプト)も、Imagen 4は的確に意図を汲み取り、構図や要素を正確に配置した画像を生成します。不自然な歪みや要素の抜け落ちが劇的に減り、思い描いた通りの世界観を忠実に再現します。

プロの現場で活躍する、多様性とスピード

最大2Kという高解像度での画像生成に対応し、印刷物やプレゼンテーションにも最適です。リアルな写真スタイルから抽象的なアート、イラストまで、あらゆる表現に柔軟に対応。さらに、リアルタイム生成に迫る高速化も実現しており、アイデアを瞬時に視覚化し、試行錯誤のサイクルを加速させます。

Imagen4は現在、Gemini アプリ、Whisk、Vertex AI、およびWorkspaceのスライド、ビデオ、ドキュメントなどで利用可能です。

Imagen4以外に、さらに高精度な「Imagen4 Ultra」も使用可能です。

では、さっそくImagen4を触っていきましょう!今回は、Vertex AIで触っていきます。

【ハンズオン】最初の1枚を生成するまでの3ステップ

1.プロジェクトの作成

必要に応じて、新しいプロジェクトを作成します。

2.API有効化

Vertex AI APIを有効にします。

「APIが有効です」と表示されていれば有効化完了です。

3.画像生成

Vertex AI/Vertex AI Studio/Media Studioに移動し、Imagenを選択します。

モデルが「Imagen4」になっていることを確認します。

好きなプロンプトを入力して画像を生成します!

「餌を食べるキンクマハムスター」という単純なプロンプトでも、これほど高精度に詳細に画像が生成されます!ハムスターの毛並みまで詳細に描かれています。

日本語プロンプトを使いこなす3つのコツ

日本語のプロンプトを使いこなすために以下の3つを意識すると、かなり高精度な画像が生成されます。

当たり前のことですが、意外と意識できていない場合もあるので、日本語プロンプトで画像を生成する際は以下の3つを意識すると、思い通りの画像が生成される可能性が高いです!

コツ1:具体的かつ詳細に書く(5W1Hを意識する)

AIを「何も知らないアシスタント」だと考え、具体的な情報を一つでも多く伝えます。「いつ(When)、どこで(Where)、誰が/何が(Who/What)、何をしていた(What doing)、どのように(How)」を意識すると、自然と詳細なプロンプトになります。

  • 悪い例: 女性
  • 良い例: (どこで)京都の石畳の道を、(誰が)20代の日本人女性が、(何を)楽しそうな笑顔で、(どのように)こちらに歩いてくる

コツ2:情景と雰囲気を文章で描写する

生成したい画像の「ムード」や「世界観」を言葉で伝えます。これにより、画像のテイストが大きく変わります。

  • 例1(パワフルな雰囲気): 雨に濡れたネオン街、パワフルな雰囲気、反射する光
  • 例2(ノスタルジックな雰囲気): 夏の終わりの夕暮れ時、ジブリ映画のような、少しだけ寂しくてノスタルジックな雰囲気
  • 例3(感情の表現): 満面の笑み 物憂げな表情 真剣な眼差し

コツ3:カメラや画材を指定して、クオリティを上げる

最も効果的なコツの1つです。AIは様々な写真やアート作品を学習しているため、具体的なカメラ名、レンズ、画材、アーティストの名前などを指定すると、そのスタイルを模倣し、画像のクオリティが劇的に向上します。

  • 写真の場合:
    • 高画質な写真
    • 映画のワンシーンのような
    • Canon EOS R5で撮影(特定のカメラ名を出す)
    • 絞りF1.8で背景がボケている(専門的な指示)
  • イラスト・絵画の場合:
    • 水彩画 油絵 アクリル画
    • アニメのセル画風 厚塗り
    • ゴッホのような力強い筆致 (アーティスト風)

上記を意識して、プロンプトを書いてみます。

太陽の光が降り注ぐ晴れた日の午後、東京・下北沢の活気ある通り。白いTシャツにジーンズというラフな格好の一人の若い男性が、片手にアイスコーヒーを持ち、楽しそうな笑顔でこちらに向かって歩いてくる。背景にはカラフルな看板の古着屋や雑貨店が並び、多くの若者たちが行き交っている。映画のワンシーンのような高画質な写真。

イメージと違う画像が生成されてしまいました。モデルを「Imagen4 Ultra」に変えて再度画像を生成してみます。

かなりプロンプトに忠実に再現されています!少し複雑な画像は、「Imagen4 Ultra」で生成した方が良さそうです。

ポスターも生成してみます。

クラフトビールのための広告ポスター。活気のあるモダンなビアパブの店内。様々な国籍の若い男女5人グループが、木製のテーブルを囲んで楽しそうに笑いながら、ビールが注がれたグラスで乾杯している瞬間を捉えている。テーブルの中央には、カラフルでグラフィカルなラベルデザインのビール缶が数本置かれている。温かみのある照明の下、人々の自然な笑顔とシズル感のあるビールに焦点が合っている。ポスター上部には「To Great Friends and Great Times.」という英語のキャッチコピーが、親しみやすい手書き風のフォントで書かれている。全体的に彩度が高く、ポジティブでエネルギッシュな雰囲気。

やはり、プロンプトに忠実に再現されています!ポスターの文字も問題なく生成されています。(しかし、日本語はまだまだで英語だと上手くいきました)今回もImagen4ではなく「Imagen4 Ultra」で生成した方が段違いで高精度でした!

料金

Vertex AIでImagenを使用する際は、モデルによって料金が異なります。

主要なモデルの料金は以下の通りです。

モデル 料金
Imagen4 Ultra 画像1枚あたり$0.06
Imagen4 画像1枚あたり$0.04
Imagen3 画像1枚あたり$0.04
Imagen3 Fast 画像1枚あたり$0.02

参考:Vertex AI Imagen料金

Imagen4を触ってみると、楽しくなり色々な画像を生成したくなります。気づいたら請求が大変なことにならないように、予算アラートは設定しておきましょう!(お支払い/予算とアラート で設定可能です)

まとめ

今回は、Vertex AIでImagen4を始める方法と日本語プロンプトのコツを紹介しました。

Imagen4の実力をご理解いただけたかと思います!プロンプトを詳細にすることで、イメージに忠実な画像が生成できますので、ぜひ試していただけると幸いです!個人的には、複雑なプロンプトで画像を生成する際は「Imagen4 Ultra」が段違いで高精度な画像が生成できると感じました!

今回は、Vertex AIでImagen4を触りましたが、ImagenはAPIも使用することができます。Imagen APIを使ってアプリケーションに組み込むのも面白いと思いますので、興味がある方はぜひ試してみてください!