Gemini 2.5時代、開幕。Pro/FlashがGA、Flash-Liteもプレビューリリース！

DX開発事業部の西田です！
ついにGemini 2.5 ProとGemini 2.5 Flashが本日GAされ、さらにGemini 2.5 Flash-Liteのプレビュー版がGoogle AI StudioとVertex AIで利用可能になりました👏

We’re expanding our Gemini 2.5 family of models

Gemini 2.5 Flash and Pro are now generally available, and we’re introducing 2.5 Flash-Lite, our most cost-efficient and fastest 2.5 model yet.

Google

Gemini 2.5: Updates to our family of thinking models

developers.googleblog.com

Gemini 2.5 Updates: Flash/Pro GA, SFT, Flash-Lite on Vertex AI | Google Cloud Blog

Latest Gemini 2.5 updates on Vertex AI: Flash & Pro GA for enterprises, SFT GA for custom AI, Flash-Lite Preview, & enhanced Live API for voice apps.

Google Cloud Blog

本記事ではVertex AIのGemini 2.5 モデルファミリーのアップデート内容をまとめていきます。

比較表

Gemini 2.5 モデルファミリーの比較表がこちらです。

※画像引用元：https://blog.google/products/gemini/gemini-2-5-model-family-expands/

Gemini 2.5 モデルファミリーでは全てのモデルで思考モードが有効にできるようになり、思考モードとそうでないときの性能比較がなされています。

革新的なハイブリッド思考モデル Gemini 2.5 Flash Preview が Vertex AI に登場🚀

DX開発事業部の西田です。昨夜 Google Cloud Next '25でも登場が予告されていた Gemini 2.5 Flash のプレビューバージョンが Google AI Studio と Vertex AI にリリースされました！Gemini 2.5 FlashGemini 2.5 Flash は Gemini 2.5 Pro よりも低いコストで Pro に次ぐ優れたパフォーマンスを出すコスト効率の良いモデルとなっています。さらにユースケースによって品質、コスト、レイテンシのトレードオフを最適化する機能として「Thinking Budget（思考バジェット）」が取り入れられています。Gemini 2.5 Flash は与えられたプ...

iret.media

以前は思考を有効にするかどうかで料金面にも違いが生じたのですが、そこは撤廃されています。
速度と性能だけを天秤にかけて思考バジェットを設定するだけでよくなりチューニングの考慮事項が減りました！

Gemini 2.0 Flash-LiteがVertex AIでGAされました🚀

DX開発事業部の西田です。試験版だったGemini 2.0 Flash-LiteがGoogle AI StudioとVertex AIでGAされました！Ready to upgrade from Gemini 1.5? 🚀Developers can start building with Gemini 2.0 Flash-Lite in @Google AI Studio and @GoogleCloud's #VertexAI. 🛠️It offers improved performance across reasoning, multimodal, math and factuality benchmarks, while also being a more… pic.twitter.com/8JwTKF7uRO— Google DeepMind (@GoogleDeepMind) February 25, 20252月頭にGemini 2.0 FlashのGAを取り上げた記...

iret.media

またGemini 2.0 Flash-LiteではVertex AI SearchやGoogle検索でのグラウンディング機能が利用できませんでしたが。
Gemini 2.5 モデルファミリーでは全てのモデルでサポートされています。

最大入力トークンは「1,048,576」、最大出力トークンは「65,535」。扱えるマルチモーダルメディアも共通となり、カタログスペック上の違いがほとんど性能とコストだけとなりました。

価格

参考：https://cloud.google.com/vertex-ai/generative-ai/pricing?hl=en#gemini-models-2.5

モデル名	種別	価格（1Mトークンあたり）≤ 200K 入力トークン	価格（1Mトークンあたり）> 200K 入力トークン	バッチ推論時 ≤ 200K 入力トークン	バッチ推論時 > 200K 入力トークン
Gemini 2.5 Pro	入力（テキスト、画像、動画、音声）	$1.25	$2.50	$0.625	$1.25
	出力（テキスト・応答および推論）	$10	$15	$5	$7.5
Gemini 2.5 Flash GA	入力（テキスト、画像、動画）	$0.30	$0.30	$0.15	$0.15
	音声入力	$1	$1	$0.5	$0.5
	テキスト出力	$2.50	$2.50	$1.25	$1.25
	学習用チューニング（1Mトークン）	$5.00	–	–	–
Gemini 2.5 Flash Preview （2025年7月15日で終了）	入力（テキスト、画像、動画）	$0.15	$0.15	$0.075	$0.075
	音声入力	$1	$1	$0.5	$0.5
	テキスト出力（思考なし）	$0.60	$0.60	$0.30	$0.30
	テキスト出力（思考あり）	$3.50	$3.50	$1.75	$1.75
Gemini 2.5 Flash Live API	入力：1M テキストトークン	$0.5	$0.5	–	–
	入力：1M 音声トークン	$3	$3	–	–
	入力：1M 動画トークン	$3	$3	–	–
	出力：1M テキストトークン	$2	$2	–	–
	出力：1M 音声トークン	$12	$12	–	–
Gemini 2.5 Flash Lite	入力（テキスト、画像、動画）	$0.10	$0.10	–	–
	音声入力	$0.50	$0.50	–	–
	テキスト出力（応答・推論あり）	$0.40	$0.40	–	–

項目	説明	料金
Grounding with Google Search	Gemini 2.0 Flash、2.5 Flash、2.5 Flash-Lite：合計1,500件/日まで無料 Gemini 2.5 Pro：10,000件/日まで無料	超過後は $35 / 1,000件
エンタープライズ向けWebグラウンディング	Web検索結果を含むグラウンディングプロンプトのみに課金	$45 / 1,000件
独自データでのグラウンディング	ユーザーデータに対するグラウンディングプロンプト（2025/6/16より）	$2.5 / 1,000件

200Kトークンを超えるクエリは、すべての入力・出力が長文コンテキスト料金として課金されます。
Webグラウンディングは、実際にWeb検索結果（少なくとも1件のURL）を返した場合のみ課金対象となります。
グラウンディングプロンプト：Geminiに1回以上の検索をさせるリクエストを指します。検索クエリが複数でも、プロンプト単位で1件とカウントされます。

前述の通りGemini 2.5 FlashのGAに伴って思考ありなしに対しての価格差がなくなりました。
その分入力トークンのコストが若干値上がりし、出力トークンのコストは間を取った価格となっています。

注意事項

GAに伴いプレビューモデルのエンドポイントが2025年7月15日に廃止予定となります。
以下のモデルをお使いの場合はGAされたモデルエンドポイントかGemini 2.5 Flash Liteのエンドポイントに切り替える必要があります。

gemini-2.5-flash-preview-04-17
gemini-2.5-flash-preview-05-20
gemini-2.5-pro-preview-03-25
gemini-2.5-pro-preview-05-06
gemini-2.5-pro-preview-06-05

今回のGAにより、高性能なGemini 2.5 モデルファミリーが揃い踏みし、より利用に踏み出しやすくなりました！

Google Cloud 生成 AI ソリューション支援パートナーであるアイレットではGoogle Cloud 生成 AI 導入支援サービスを提供しています。
是非お問い合わせください！

Gemini 2.5時代、開幕。Pro/FlashがGA、Flash-Liteもプレビューリリース！

比較表

価格

注意事項

ウワサのClaude Design、使ってみた

【速報】Gemini 3.6 Flash / 3.5 Flash-Lite / 3.5 Flash Cyber 発表！

MCPを使ってRedmineに接続してみた

開発サイクルの効率UP！〜アイレットの社内ツール「次世代監視基盤 AMS」に「CircleCI」を導入

2025年度版！AWS資格取得の順番について！

Gemini 2.5時代、開幕。Pro/FlashがGA、Flash-Liteもプレビューリリース！

比較表

価格

注意事項

関連記事Related Articles

開発の背景と全体アーキテクチャの展望（統括編）【実践！Google Cloud × Geminiで作るナレッジ自動化】①

DX開発事業部 presents 週刊生成AIニュース 2026年1月26日週

Vertex AI プロビジョンドスループット：Gemini導入時の試算攻略

生産性向上に不可欠な課題整理

AIシステム設計の最適解：シングルエージェントとマルチエージェントの違いとGoogle Cloud実装ガイド