はじめに

当該記事はラスベガスで行われている Google Cloud Next 2025 の Day1 の What’s new Cloud Run に関する記事となります。

概要

セッション内容では比較的新しい機能の内容が説明され、事例を交えた実際の活用ポイントに対する内容でした。Cloud Run の内容でもいくつか Gemini を活用したサービス、AI Agent を動かすのに適していることなど、AI に関する情報も多くありましたので、AI に関わる部分や気になる機能を中心に記事にします。

ちなみにセッション内で 「Cloud Run のアップデート内容がいっぱいなんだよ」ということで投影されていたものが以下です。こちらでボリュームが大きいことがわかっていただけるかと思います。

※なお、こちらは前編で、Gemini 活用した機能と GPUs について記載します。後編にてその他アップデートや、Cloud Run による AI Agent 実行での活用などふれます。

AI に関連する内容

Gemini Cloud Assist の活用

こちらについては release note にプレビューとして掲載され詳細記載されておりました。参照先のドキュメントも確認しながら記載しております。

Optimize

Cloud Run のリソース最適化を行うとのことでチャットを用いて、最適化の支援をしてくれるような機能のようです。いくつかドキュメントにも例が記載されていますが、コストの節約からダウンタイムを防ぐためのアドバイスを求めることが可能なようです。

Design

チャットを用いて Cloud Run を含めたアーキテクチャの構築に必要な、CLI 及び Terraform が生成したりすることや、デプロイ戦略の支援やそれに関する手順の回答なども行ってもらえるようです。セッション内で構築に関する内容が説明されておりました。

Troubleshoot

ログを分析しそれに対する解決案を提示してくれるようです。セッション内では Cloud Run Functions でコードの修正案をもらっている内容が公開されており、Functions 側でもそのような支援を得られるようです。

Cloud Run Threat Detection

こちらもプレビューの機能で release note に記載がありました。
Security Command Center の一部になるもので、継続的に監視し、自然言語処理(NLP)によりCloud Run の悪意のある攻撃を検出することが可能になり、異常な振る舞い、リモートアクセスなど検出することが可能になります。地味めな機能ですが、 Cloud Run に対するこういったセキュリティ検出を望んでいた人は多いのでは?と感じました。活用されるのが楽しみです。
画像

GPU

ついに GPUs 対応が GA されました。

セッション内では GPU 利用におけるデモも行われておりまして、画像生成の HTTP サービスをデプロイされ、その画像生成コンテンツ上で、コンテナ数の増加に伴いものすごい勢いで画像生成されているのが印象的でした。

特に強調されていた内容は、「zero scale で 5秒で起動するんだぜ」ってところで、これは他社と比べても数桁違うスピードで起動されるとのことです。現時点では NVIDIA A100 がサポートされており、順次新しいものへの対応もしていく予定とのことです。

必要なタイミングで必要な数量の GPU が利用でき、スケールすることもできるなんて、GPU 利用自体が大きくコストを要するものであるため、その点からも嬉しいと思いました。さらに、Cloud Run jobs でもプレビュー対応するとのことで、後述する Direct VPC Egress も対応していることから、GCE で動作させたい長期の学習以外での活用に大きく期待できそうです。

AI に関連する事例 (GPU 活用)

Wayfair 社 の事例が取り上げられており、こちらではセマンティック検索を実装し、顧客がアップロードした類似検索を利用した画像検索する仕組みにて活用されております。

この画像検索において、顧客がアップロードした画像に対する埋込ベクトルを生成に、Cloud Run の GPUs が活用されているとのことです。

それによって得られた効果として、以下が挙げられておりました。

  • Cloud Run GPUs を利用することで、埋め込み生成のステップのパフォーマンスが大幅に向上
    • 初期の CPU のみを利用した実装と比較して、99パーセンタイルにおける応答時間が 85% 改善 し、500 ミリ秒から 70 ミリ秒に短縮
    • コスト効率の向上
    • 高速なオートスケーリング、利用可能な L4 GPU の優れた性能により、コストを 60% 削減
  • 開発者体験の向上。
    • Cloud Run を既に利用していたため、GPU の利用が容易
    • GCE (Compute Engine) のような継続的なメンテナンスが不要
    • 高速なスケールアップが可能
    • モニタリングやトレーシングの統合が容易

上記のような効果が得られ、さらに Vertex AI も活用できるため、Google Cloud を選定された理由ものべられておりました。

纏め

Cloud Run の AI に関する Gemini Cloud Assist、GPUs で多くのボリュームがあり、前編とさせてもらいます。Cloud Run をより効率的に動かすための Gemini の活用や、GPUs によるより多くのシーンで利用できるようになるような内容だったかと思います。GPU でも相変わらず起動が早く、スケールも行えるとのことで協力だと感じました。後編もこのあと記載しますが、今後ももっと利用シーンが増えるので、今後も期待していきたいと思います。では後編でお会いしましょう。