DX開発事業部の西田です!
ついにGemini 2.5 ProとGemini 2.5 Flashが本日GAされ、さらにGemini 2.5 Flash-Liteのプレビュー版がGoogle AI StudioとVertex AIで利用可能になりました👏
本記事ではVertex AIのGemini 2.5 モデルファミリーのアップデート内容をまとめていきます。
比較表
Gemini 2.5 モデルファミリーの比較表がこちらです。
※画像引用元:https://blog.google/products/gemini/gemini-2-5-model-family-expands/
Gemini 2.5 モデルファミリーでは全てのモデルで思考モードが有効にできるようになり、思考モードとそうでないときの性能比較がなされています。

以前は思考を有効にするかどうかで料金面にも違いが生じたのですが、そこは撤廃されています。
速度と性能だけを天秤にかけて思考バジェットを設定するだけでよくなりチューニングの考慮事項が減りました!

またGemini 2.0 Flash-LiteではVertex AI SearchやGoogle検索でのグラウンディング機能が利用できませんでしたが。
Gemini 2.5 モデルファミリーでは全てのモデルでサポートされています。
最大入力トークンは「1,048,576」、最大出力トークンは「65,535」。扱えるマルチモーダルメディアも共通となり、カタログスペック上の違いがほとんど性能とコストだけとなりました。
- https://cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/2-5-flash?hl=en
- https://cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/2-5-pro?hl=en
- https://cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/2-5-flash-lite?hl=en
価格
参考:https://cloud.google.com/vertex-ai/generative-ai/pricing?hl=en#gemini-models-2.5
モデル名 | 種別 | 価格(1Mトークンあたり)≤ 200K 入力トークン | 価格(1Mトークンあたり)> 200K 入力トークン | バッチ推論時 ≤ 200K 入力トークン | バッチ推論時 > 200K 入力トークン |
---|---|---|---|---|---|
Gemini 2.5 Pro | 入力(テキスト、画像、動画、音声) | $1.25 | $2.50 | $0.625 | $1.25 |
出力(テキスト・応答および推論) | $10 | $15 | $5 | $7.5 | |
Gemini 2.5 Flash GA | 入力(テキスト、画像、動画) | $0.30 | $0.30 | $0.15 | $0.15 |
音声入力 | $1 | $1 | $0.5 | $0.5 | |
テキスト出力 | $2.50 | $2.50 | $1.25 | $1.25 | |
学習用チューニング(1Mトークン) | $5.00 | – | – | – | |
Gemini 2.5 Flash Preview (2025年7月15日で終了) |
入力(テキスト、画像、動画) | $0.15 | $0.15 | $0.075 | $0.075 |
音声入力 | $1 | $1 | $0.5 | $0.5 | |
テキスト出力(思考なし) | $0.60 | $0.60 | $0.30 | $0.30 | |
テキスト出力(思考あり) | $3.50 | $3.50 | $1.75 | $1.75 | |
Gemini 2.5 Flash Live API | 入力:1M テキストトークン | $0.5 | $0.5 | – | – |
入力:1M 音声トークン | $3 | $3 | – | – | |
入力:1M 動画トークン | $3 | $3 | – | – | |
出力:1M テキストトークン | $2 | $2 | – | – | |
出力:1M 音声トークン | $12 | $12 | – | – | |
Gemini 2.5 Flash Lite | 入力(テキスト、画像、動画) | $0.10 | $0.10 | – | – |
音声入力 | $0.50 | $0.50 | – | – | |
テキスト出力(応答・推論あり) | $0.40 | $0.40 | – | – |
項目 | 説明 | 料金 |
---|---|---|
Grounding with Google Search | Gemini 2.0 Flash、2.5 Flash、2.5 Flash-Lite:合計1,500件/日まで無料 Gemini 2.5 Pro:10,000件/日まで無料 |
超過後は $35 / 1,000件 |
エンタープライズ向けWebグラウンディング | Web検索結果を含むグラウンディングプロンプトのみに課金 | $45 / 1,000件 |
独自データでのグラウンディング | ユーザーデータに対するグラウンディングプロンプト(2025/6/16より) | $2.5 / 1,000件 |
- 200Kトークンを超えるクエリは、すべての入力・出力が長文コンテキスト料金として課金されます。
- Webグラウンディングは、実際にWeb検索結果(少なくとも1件のURL)を返した場合のみ課金対象となります。
- グラウンディングプロンプト:Geminiに1回以上の検索をさせるリクエストを指します。検索クエリが複数でも、プロンプト単位で1件とカウントされます。
前述の通りGemini 2.5 FlashのGAに伴って思考ありなしに対しての価格差がなくなりました。
その分入力トークンのコストが若干値上がりし、出力トークンのコストは間を取った価格となっています。
注意事項
GAに伴いプレビューモデルのエンドポイントが2025年7月15日に廃止予定となります。
以下のモデルをお使いの場合はGAされたモデルエンドポイントかGemini 2.5 Flash Liteのエンドポイントに切り替える必要があります。
- gemini-2.5-flash-preview-04-17
- gemini-2.5-flash-preview-05-20
- gemini-2.5-pro-preview-03-25
- gemini-2.5-pro-preview-05-06
- gemini-2.5-pro-preview-06-05
今回のGAにより、高性能なGemini 2.5 モデルファミリーが揃い踏みし、より利用に踏み出しやすくなりました!
Google Cloud 生成 AI ソリューション支援パートナーであるアイレットではGoogle Cloud 生成 AI 導入支援サービスを提供しています。
是非お問い合わせください!