DX開発事業部の西田です!
ついにGemini 2.5 ProとGemini 2.5 Flashが本日GAされ、さらにGemini 2.5 Flash-Liteのプレビュー版がGoogle AI StudioとVertex AIで利用可能になりました👏

We’re expanding our Gemini 2.5 family of models
Gemini 2.5 Flash and Pro are now generally available, and we’re introducing 2.5 Flash-Lite, our most cost-efficient and fastest 2.5 model yet.


Gemini 2.5 Updates: Flash/Pro GA, SFT, Flash-Lite on Vertex AI | Google Cloud Blog
Latest Gemini 2.5 updates on Vertex AI: Flash & Pro GA for enterprises, SFT GA for custom AI, Flash-Lite Preview, & enhanced Live API for voice apps.

本記事ではVertex AIのGemini 2.5 モデルファミリーのアップデート内容をまとめていきます。

比較表

Gemini 2.5 モデルファミリーの比較表がこちらです。

※画像引用元:https://blog.google/products/gemini/gemini-2-5-model-family-expands/

Gemini 2.5 モデルファミリーでは全てのモデルで思考モードが有効にできるようになり、思考モードとそうでないときの性能比較がなされています。

革新的なハイブリッド思考モデル Gemini 2.5 Flash Preview が Vertex AI に登場🚀
DX開発事業部の西田です。昨夜 Google Cloud Next '25でも登場が予告されていた Gemini 2.5 Flash のプレビューバージョンが Google AI Studio と Vertex AI にリリースされました!Gemini 2.5 FlashGemini 2.5 Flash は Gemini 2.5 Pro よりも低いコストで Pro に次ぐ優れたパフォーマンスを出すコスト効率の良いモデルとなっています。さらにユースケースによって品質、コスト、レイテンシのトレードオフを最適化する機能として「Thinking Budget(思考バジェット)」が取り入れられています。Gemini 2.5 Flash は与えられたプ...

以前は思考を有効にするかどうかで料金面にも違いが生じたのですが、そこは撤廃されています。
速度と性能だけを天秤にかけて思考バジェットを設定するだけでよくなりチューニングの考慮事項が減りました!

Gemini 2.0 Flash-LiteがVertex AIでGAされました🚀
DX開発事業部の西田です。試験版だったGemini 2.0 Flash-LiteがGoogle AI StudioとVertex AIでGAされました!Ready to upgrade from Gemini 1.5? 🚀Developers can start building with Gemini 2.0 Flash-Lite in @Google AI Studio and @GoogleCloud's #VertexAI. 🛠️It offers improved performance across reasoning, multimodal, math and factuality benchmarks, while also being a more… pic.twitter.com/8JwTKF7uRO— Google DeepMind (@GoogleDeepMind) February 25, 20252月頭にGemini 2.0 FlashのGAを取り上げた記...

またGemini 2.0 Flash-LiteではVertex AI SearchやGoogle検索でのグラウンディング機能が利用できませんでしたが。
Gemini 2.5 モデルファミリーでは全てのモデルでサポートされています。

最大入力トークンは「1,048,576」、最大出力トークンは「65,535」。扱えるマルチモーダルメディアも共通となり、カタログスペック上の違いがほとんど性能とコストだけとなりました。

価格

参考:https://cloud.google.com/vertex-ai/generative-ai/pricing?hl=en#gemini-models-2.5

モデル名 種別 価格(1Mトークンあたり)≤ 200K 入力トークン 価格(1Mトークンあたり)> 200K 入力トークン バッチ推論時 ≤ 200K 入力トークン バッチ推論時 > 200K 入力トークン
Gemini 2.5 Pro 入力(テキスト、画像、動画、音声) $1.25 $2.50 $0.625 $1.25
出力(テキスト・応答および推論) $10 $15 $5 $7.5
Gemini 2.5 Flash GA 入力(テキスト、画像、動画) $0.30 $0.30 $0.15 $0.15
音声入力 $1 $1 $0.5 $0.5
テキスト出力 $2.50 $2.50 $1.25 $1.25
学習用チューニング(1Mトークン) $5.00
Gemini 2.5 Flash Preview
(2025年7月15日で終了)
入力(テキスト、画像、動画) $0.15 $0.15 $0.075 $0.075
音声入力 $1 $1 $0.5 $0.5
テキスト出力(思考なし) $0.60 $0.60 $0.30 $0.30
テキスト出力(思考あり) $3.50 $3.50 $1.75 $1.75
Gemini 2.5 Flash Live API 入力:1M テキストトークン $0.5 $0.5
入力:1M 音声トークン $3 $3
入力:1M 動画トークン $3 $3
出力:1M テキストトークン $2 $2
出力:1M 音声トークン $12 $12
Gemini 2.5 Flash Lite 入力(テキスト、画像、動画) $0.10 $0.10
音声入力 $0.50 $0.50
テキスト出力(応答・推論あり) $0.40 $0.40
項目 説明 料金
Grounding with Google Search Gemini 2.0 Flash、2.5 Flash、2.5 Flash-Lite:合計1,500件/日まで無料
Gemini 2.5 Pro:10,000件/日まで無料
超過後は $35 / 1,000件
エンタープライズ向けWebグラウンディング Web検索結果を含むグラウンディングプロンプトのみに課金 $45 / 1,000件
独自データでのグラウンディング ユーザーデータに対するグラウンディングプロンプト(2025/6/16より) $2.5 / 1,000件
  • 200Kトークンを超えるクエリは、すべての入力・出力が長文コンテキスト料金として課金されます。
  • Webグラウンディングは、実際にWeb検索結果(少なくとも1件のURL)を返した場合のみ課金対象となります。
  • グラウンディングプロンプト:Geminiに1回以上の検索をさせるリクエストを指します。検索クエリが複数でも、プロンプト単位で1件とカウントされます。

前述の通りGemini 2.5 FlashのGAに伴って思考ありなしに対しての価格差がなくなりました。
その分入力トークンのコストが若干値上がりし、出力トークンのコストは間を取った価格となっています。

注意事項

GAに伴いプレビューモデルのエンドポイントが2025年7月15日に廃止予定となります。
以下のモデルをお使いの場合はGAされたモデルエンドポイントかGemini 2.5 Flash Liteのエンドポイントに切り替える必要があります。

  • gemini-2.5-flash-preview-04-17
  • gemini-2.5-flash-preview-05-20
  • gemini-2.5-pro-preview-03-25
  • gemini-2.5-pro-preview-05-06
  • gemini-2.5-pro-preview-06-05

今回のGAにより、高性能なGemini 2.5 モデルファミリーが揃い踏みし、より利用に踏み出しやすくなりました!

Google Cloud 生成 AI ソリューション支援パートナーであるアイレットではGoogle Cloud 生成 AI 導入支援サービスを提供しています。
是非お問い合わせください!