社内に蓄積されたマニュアルや規定、ナレッジなどの膨大なPDFデータの中から、AIが適切な情報を探し出して回答を生成する「RAG(検索拡張生成)」。「社内の専門知識を即座に引き出せるAIチャット」という利用イメージが最も近く、情報の正確性が求められる業務での活用が進んでいます。

導入を検討する際、多くの方が抱く懸念は「結局、月いくらかかるのか?」という運用コストではないでしょうか。

本記事では、Google Cloud をベースにした弊社のRAG導入支援サービス「かんたん AI パック」のRAGプランについて、50名規模の組織で本格運用した際の月額コストを徹底試算しました。

今回は初期構築費用ではなく、運用後の「月額費用(ランニングコスト)」に焦点を当てて解説します。
結論から申し上げますと、標準構成なら月額 3,000円〜5,000円という非常にリーズナブルな金額で運用が可能です。予算策定の具体的な根拠として、ぜひお役立てください。

 

1. シミュレーションの前提条件

本見積もりでは50名規模の組織において、全ユーザーがRAGを非常に活発に利用した「最大負荷に近い運用」を想定しています。

基本の想定

  • 利用人数: 50名
  • 保管データ量: 約3GB(PDF約3,000枚相当)
  • 月間リクエスト数: 5,000回(1人1日5回 × 20日)
  • 採用モデル: Gemini 2.5 Flash
    ※2026年2月時点の料金体系に基づき、1ドル=150円で算出

RAG特有の「トークン数」の考え方

RAGは、AIが回答を作る前に「社内資料を読み込む」プロセスが入るため、通常のチャットよりも入力トークン(AIが処理する文字数)が多くなる傾向があります。
今回は1回あたり2,000トークン(入力1,500:出力500)と、余裕を持った数値で計算しています。

「かんたんAIパック」は複数のクラウドサービスを組み合わせて構築しているため、月額費用は各サービスの利用量に応じた「従量課金制」の合算となります。
費用の中身を、土台となる「固定費(インフラ)」と、使った分だけ発生する「変動費(AI利用料)」に分けて整理しました。
まずは無料枠でコストを最小化できるインフラ・ストレージ費用から確認していきましょう。

 

2. 【固定費】インフラ・ストレージ費用

AIアプリを安定稼働させるためのインフラ費用です。Google Cloudの強力な無料枠により、この項目はほぼ無料に収まります。

サービス名 主な役割 無料枠の有無 試算結果(50名規模)
Firebase Authentication ユーザーログイン管理 5万人/月 無料
Firebase App Hosting チャット画面の配信 ストレージ5GB等 無料
Cloud Run AIを動かすエンジン 200万リクエスト/月等 無料
Cloud Build 開発 2,500 分/月 無料
Cloud Logging 監視ログ 50 GiB/月 無料
Secret Manager APIキー管理 10,000 回/月等 無料
Artifact Registry ビルド済みデータの保存 0.5GB/月 約38円
Cloud Storage データの保管 なし 約55円
Cloud Firestore チャット履歴 1 GiB/月等 無料

基本は無料枠で収まりますが、一部の保管料のみ実費が発生します。PDF資料を保存する「Cloud Storage」は東京リージョンに無料枠がないため、以下の式で算出します。

  • データ保存: 3GB × $0.023(単価)= $0.069(約 10円)
  • データ転送(読込): 1回0.5MB読み取ると仮定(月2.5GB)× $0.12 = $0.3(約 45円)

【データが増えた場合は?】 仮にマニュアルが大量に増え、保管データ量が 10GB になったとしても、保存料は月額 約35円 程度です。RAG運用において、ストレージ容量そのものがコストを圧迫することはほとんどありません。

 

3. 【変動費】AI・検索エンジン利用料

ここが費用のメインとなるAIの利用料です。
検索エンジンの「探すコスト」と、Geminiの「考えるコスト」に分かれます。

① Vertex AI Search(資料を探す)

PDF群の中から回答に必要な箇所を特定する「検索エンジン」の費用です。

  • 検索リクエスト: 月間10,000回まで無料。今回の5,000回は無料枠内
  • 高度な生成回答(AIモード): 1,000回ごとに$4.00かかります。
  • 計算式: 5,000回 × ($4.00 / 1,000) = $20.00(約3,000円)

② Gemini 2.5 Flash(文章を作る)

検索された情報を読み取り、回答文を作成する費用です。「100万トークン(1M)」単位の従量課金です。

入力(資料の読み込み):
  • 5,000回 × 1,500トークン = 7.5Mトークン
  • 7.5M × $0.30(単価)= $2.25(約338円)
出力(回答の作成):
  • 5,000回 × 500トークン = 2.5Mトークン
  • 2.5M × $2.50(単価)= $6.25(約938円)

【もっと高性能なモデルの場合は?】
より複雑な資料の読み解きや専門性の高い回答が可能な「Gemini 2.5 Pro」モデルを利用した場合、Flashと比較すると「文章を作るコスト」は約4倍になります。

 

4. 【結論】月額コスト合計と運用のポイント

50名規模で「1人1日5回」という、かなりアクティブな利用を想定した最終的な予算目安です。

項目 ドル換算 (USD) 日本円換算 (JPY)
固定費(インフラ・ストレージ) $0.62 約 93円
変動費(AI・検索利用料) $28.50 約 4,276円
合計 $29.12 約 4,369円

運用のポイント

  • コストの変動要因: 最も影響するのは「保管量」ではなく「AIを利用する回数」です。
  • 追加機能の拡張: 大量の表データを解析する「BigQuery連携」や、複雑なレイアウトの資料を読み込む「Document AI」などのオプションを追加する場合、月額プラス数千円程度の予算を見込んでおく必要があります。

 

最後に

最後まで読んでいただきありがとうございました!
「AIは高い」というイメージがありますが、Google Cloudを賢く使えば、50人規模でも月々数千円で専用のAIアシスタントを持つことができます。

「自社の資料量だと具体的にいくらになるか知りたい」といった個別のご相談も承っております。
お気軽にお申し付けください!