DX開発事業部の山中です。本記事は、 Google Cloud Next Tokyo 2025 で行われたセッション「速習 Cloud Run:サービスの基礎から注目アップデートまで」の参加レポートです。
セッション概要
タイトル: 速習 Cloud Run:サービスの基礎から注目アップデートまで
スピーカー: 佐々木 駿太(株式会社G-gen / プラットフォームエンジニアリング本部 クラウドソリューション部)
セッション説明: Google Cloud の非常に強力なサーバーレスコンピューティングサービスである Cloud Run について、基礎的な機能や他のコンピューティングサービスとの使い分け、最近の注目すべきアップデートなどを解説します。
Cloud Run 基礎~概要~
Cloud Run は、Google Cloud が提供するコンピューティングサービスの一つであり、そのキーワードは「サーバーレス」と「コンテナ」です。Cloud Run はコンテナ化されたものであれば動かすことができるため、ユースケースは非常に幅広いです。具体的には、ウェブアプリケーション、 API やマイクロサービス、機械学習モデルによる推論ワークロード、ストリーミングデータ処理、バッチデータ処理などが挙げられます。最近では、 AI チャットボットや SMTP サーバーとして利用されるケースも出てきています。
Cloud Run 基礎~特徴~
Cloud Run には、運用管理負荷を大幅に軽減するいくつかの大きな特徴があります。
- サーバーレス コンテナ コンピューティング
- ユーザーはコンテナイメージを用意するだけでよく、インフラのプロビジョニングや管理を一切行う必要がありません。指定したCPU数・メモリ容量のインスタンスでコンテナが実行され、リクエストを受信します。
- 自動スケーリングとゼロスケール
- ワークロードの負荷(リクエスト数やCPU使用率など)に基づいて、自動でスケーリングが行われます。
- Cloud Run の大きな特徴であるゼロスケールでは、アプリケーションに対して全くリクエストがない時、全てのリソース(コンテナインスタンス)を停止することができます。これにより、停止中はコンピューティングリソース(CPU、メモリ)の利用料金が発生しないため、料金節約につながります。
- リビジョン単位の管理
- コンテナイメージのデプロイや設定変更のたびに、その情報を保持するリビジョンが作成されます。
- これはバージョン管理に使用でき、トラフィック分割機能を使うことで、新しいリビジョンと古いリビジョンの両方を同時に実行することができ、カナリアリリースやロールバックが非常に容易になります。
注目アップデート
Google は Cloud Run に非常に力を入れており、機能追加や改善が続々と行われています。セッションでは、最近の注目アップデートがいくつか紹介されました。
注目アップデート①: GPU の使用
Cloud Run jobs において、NVIDIA-L4 GPU の使用がサポートされました。これにより、機械学習ワークロードへの対応が強化されています。 GPU 利用は通常料金が高くなりがちですが、Cloud Run のゼロスケール機能により、必要な時だけ GPU を利用し、使わない時はゼロにスケールすることで料金を節約できます。ユースケースとして、Gemma 3 等の軽量 LLM のホストや、画像認識・動画のエンコーディングを行うことが挙げられています。
注目アップデート②: Cloud Run Threat Detection (プレビュー)
統合セキュリティプラットフォームサービスである Security Command Center と連携し、Cloud Run で実行されているアプリケーションに対してニアリアルタイムの脅威検出を行います。これには、コンテナエスケープや悪意のあるバイナリの実行などを検出する「ランタイム検出」と、不審な IAM 設定変更などを検出する「コントロールプレーン検出」の2種類があります。
注目アップデート③: Identity-Aware Proxy (IAP) 連携 (プレビュー)
Cloud Run に対して Identity-Aware Proxy (IAP) を有効化できるようになりました。これにより、組織内の Google アカウントによる認証を非常に簡単に実装できます。以前はロードバランサーを前段に配置する必要がありましたが、この統合により、単純な Google アカウントによる認証機能が必要な場合は非常に容易に設定可能となりました。
注目アップデート④: Cloud Run worker pools (プレビュー)
従来の Cloud Run services, Cloud Run jobs, Cloud Run functions に加えて、第4の実行モデルとして Cloud Run worker pools が発表されました。これは、これまで実装が難しかった Pull 型のワークロードに対応します。具体的には、 Pub/Sub のメッセージ処理、 Kafka キューの処理、 GitHub Actions の Runner のホストなどがユースケースとして挙げられています。このモデルでは、ワーカー(コンテナインスタンス)が能動的にメッセージやタスクを取得(Pull)し、手動で 0-N 台にスケーリングできます。ただし、プレビュー時点では自動スケーリングがサポートされておらず、今後のアップデートが期待されています。
さいごに
本記事では、Cloud Run の基礎と注目アップデートについてセッションより紹介しました。
Cloud Run はサーバーレスとコンテナを組み合わせたGoogle Cloudの中核的なコンピューティングサービスであり、インフラ管理負荷が極めて低い点が大きな強みであることが再確認されました。
また、 Cloud Run のアップデートに積極的であることが、GPUサポートによりAI/機械学習ワークロードへの対応を強化し、また、セキュリティ機能(Threat Detection)や認証機能(IAP連携)の強化、さらには新しい実行モデル(Worker Pools)の導入 により、実感することができました。