社内に蓄積されたマニュアルや規定、ナレッジなどの膨大なPDFデータの中から、AIが適切な情報を探し出して回答を生成する「RAG(検索拡張生成)」。「社内の専門知識を即座に引き出せるAIチャット」という利用イメージが最も近く、情報の正確性が求められる業務での活用が進んでいます。
導入を検討する際、多くの方が抱く懸念は「結局、月いくらかかるのか?」という運用コストではないでしょうか。
本記事では、Google Cloud をベースにした弊社のRAG導入支援サービス「かんたん AI パック」のRAGプランについて、50名規模の組織で本格運用した際の月額コストを徹底試算しました。
今回は初期構築費用ではなく、運用後の「月額費用(ランニングコスト)」に焦点を当てて解説します。
結論から申し上げますと、標準構成なら月額 3,000円〜5,000円という非常にリーズナブルな金額で運用が可能です。予算策定の具体的な根拠として、ぜひお役立てください。
1. シミュレーションの前提条件
本見積もりでは50名規模の組織において、全ユーザーがRAGを非常に活発に利用した「最大負荷に近い運用」を想定しています。
基本の想定
- 利用人数: 50名
- 保管データ量: 約3GB(PDF約3,000枚相当)
- 月間リクエスト数: 5,000回(1人1日5回 × 20日)
- 採用モデル: Gemini 2.5 Flash
※2026年2月時点の料金体系に基づき、1ドル=150円で算出
RAG特有の「トークン数」の考え方
RAGは、AIが回答を作る前に「社内資料を読み込む」プロセスが入るため、通常のチャットよりも入力トークン(AIが処理する文字数)が多くなる傾向があります。
今回は1回あたり2,000トークン(入力1,500:出力500)と、余裕を持った数値で計算しています。
「かんたんAIパック」は複数のクラウドサービスを組み合わせて構築しているため、月額費用は各サービスの利用量に応じた「従量課金制」の合算となります。
費用の中身を、土台となる「固定費(インフラ)」と、使った分だけ発生する「変動費(AI利用料)」に分けて整理しました。
まずは無料枠でコストを最小化できるインフラ・ストレージ費用から確認していきましょう。
2. 【固定費】インフラ・ストレージ費用
AIアプリを安定稼働させるためのインフラ費用です。Google Cloudの強力な無料枠により、この項目はほぼ無料に収まります。
| サービス名 | 主な役割 | 無料枠の有無 | 試算結果(50名規模) |
|---|---|---|---|
| Firebase Authentication | ユーザーログイン管理 | 5万人/月 | 無料 |
| Firebase App Hosting | チャット画面の配信 | ストレージ5GB等 | 無料 |
| Cloud Run | AIを動かすエンジン | 200万リクエスト/月等 | 無料 |
| Cloud Build | 開発 | 2,500 分/月 | 無料 |
| Cloud Logging | 監視ログ | 50 GiB/月 | 無料 |
| Secret Manager | APIキー管理 | 10,000 回/月等 | 無料 |
| Artifact Registry | ビルド済みデータの保存 | 0.5GB/月 | 約38円 |
| Cloud Storage | データの保管 | なし | 約55円 |
| Cloud Firestore | チャット履歴 | 1 GiB/月等 | 無料 |
基本は無料枠で収まりますが、一部の保管料のみ実費が発生します。PDF資料を保存する「Cloud Storage」は東京リージョンに無料枠がないため、以下の式で算出します。
- データ保存: 3GB × $0.023(単価)= $0.069(約 10円)
- データ転送(読込): 1回0.5MB読み取ると仮定(月2.5GB)× $0.12 = $0.3(約 45円)
【データが増えた場合は?】 仮にマニュアルが大量に増え、保管データ量が 10GB になったとしても、保存料は月額 約35円 程度です。RAG運用において、ストレージ容量そのものがコストを圧迫することはほとんどありません。
3. 【変動費】AI・検索エンジン利用料
ここが費用のメインとなるAIの利用料です。
検索エンジンの「探すコスト」と、Geminiの「考えるコスト」に分かれます。
① Vertex AI Search(資料を探す)
PDF群の中から回答に必要な箇所を特定する「検索エンジン」の費用です。
- 検索リクエスト: 月間10,000回まで無料。今回の5,000回は無料枠内。
- 高度な生成回答(AIモード): 1,000回ごとに$4.00かかります。
- 計算式: 5,000回 × ($4.00 / 1,000) = $20.00(約3,000円)
② Gemini 2.5 Flash(文章を作る)
検索された情報を読み取り、回答文を作成する費用です。「100万トークン(1M)」単位の従量課金です。
入力(資料の読み込み):
- 5,000回 × 1,500トークン = 7.5Mトークン
- 7.5M × $0.30(単価)= $2.25(約338円)
出力(回答の作成):
- 5,000回 × 500トークン = 2.5Mトークン
- 2.5M × $2.50(単価)= $6.25(約938円)
【もっと高性能なモデルの場合は?】
より複雑な資料の読み解きや専門性の高い回答が可能な「Gemini 2.5 Pro」モデルを利用した場合、Flashと比較すると「文章を作るコスト」は約4倍になります。
4. 【結論】月額コスト合計と運用のポイント
50名規模で「1人1日5回」という、かなりアクティブな利用を想定した最終的な予算目安です。
| 項目 | ドル換算 (USD) | 日本円換算 (JPY) |
|---|---|---|
| 固定費(インフラ・ストレージ) | $0.62 | 約 93円 |
| 変動費(AI・検索利用料) | $28.50 | 約 4,276円 |
| 合計 | $29.12 | 約 4,369円 |
運用のポイント
- コストの変動要因: 最も影響するのは「保管量」ではなく「AIを利用する回数」です。
- 追加機能の拡張: 大量の表データを解析する「BigQuery連携」や、複雑なレイアウトの資料を読み込む「Document AI」などのオプションを追加する場合、月額プラス数千円程度の予算を見込んでおく必要があります。
最後に
最後まで読んでいただきありがとうございました!
「AIは高い」というイメージがありますが、Google Cloudを賢く使えば、50人規模でも月々数千円で専用のAIアシスタントを持つことができます。
「自社の資料量だと具体的にいくらになるか知りたい」といった個別のご相談も承っております。
お気軽にお申し付けください!