Google Cloud Next’24 にて行われたセッション「How to deploy programmable global front ends for internet-facing apps and content」のレポートです。

Google Cloud Next’24 とは
2024 年 4 月 9 ~ 11 日にラスベガスのマンダレイベイで開催されている、Google Cloud が主催する最大級規模のイベントです。
https://cloud.withgoogle.com/next/

登壇者

Google Cloud Group Product Manager
Peter Blum 氏

Google Cloud Director of Product Management
Raj Gulani 氏

Google Cloud Senior Engineering Director
Robert Love 氏

Uber Staff Software Engineer
Noah Goldman 氏

セッション内容

こちらのセッションでも同じような紹介がされていたので、合わせて読むことをオススメします!

インターネット基盤のアプリとコンテンツのための CCN Global Front End

  • クロスクラウドネットワークを利用して何十億ものユーザーに Google アプリを提供、拡張、保護するインフラストラクチャ

  • 高いパフォーマンス
    • 他社クラウドの CDN と比べて遅延が少ない
    • CDN プロパイダーと比べて平均レイテンシーが最も低く、P75以上
  • 大規模な DDoS 攻撃からの保護
    • 1 日あたりの過去最高 3 億 9800 万 RPS の攻撃をブロック
    • 大規模なネットワーク、高度な DDoS 保護、大量のコンピューティングリソース
  • グローバルな対応とシンプルさによる TCO の削減
    • 他社製品と比べて以下のメリットがある
    • レイテンシを 20% 削減
    • 99.99% の SLA
    • 最大 40% の TCO 削減

主要な機能

  • CDN パフォーマンスとオフロード機能
    • 拡張キャッシュ:カスタム キャッシュキーとホワイトリスト URL パラメーターを調整して、キャッシュヒット率とオリジン オフロードを改善
    • ネガティブ キャッシュ:エラー応答をキャッシュしてオリジンの負荷を軽減し、エンドユーザーのパフォーマンスを向上
    • 最新のプロトコルのサポート:HTTP/3、BBR、TLS 1.3 を使用して遅延を削減し、トランスポート セキュリティを有効にする
    • コンテンツ認証:認証されたプライベート バケットからコンテンツを安全に提供、署名付き URL および署名付き Cookie でアクセスを制限
  • LB の機能
    • 高度なトラフィック シミュレーション:障害、遅延などでキャンセルされたリクエストをトラフィックフローに挿入して、堅牢な自動サービステストを行う機能
    • 分散バックエンド:インフラストラクチャ全体で負荷分散を調整するための広範なアルゴリズム
    • ハイブリッドおよびマルチクラウド:負荷分散を行い、どこにでもインフラストラクチャ全体に配信できる機能
    • 信頼性:忠実度の高いヘルスチェック、スマートなリージョンフェイルオーバー、リクエストの再試行など

新機能

  • サービス拡張機能を備えたオープンでプログラム可能なデータプレーン (New@Next、リリース済み)

  • 推論のための LB (New@Next、まもなくプレビュー)
    • LLM の LB
    • カスタムメトリクスを使用した LB

  • DDoS および Web 保護
    • Cloud Armor Enterprise (New@Next、リリース済み)
    • サービスごとの ML モデル (New@Next、プレビュー)
    • GraphQL API Protection (New@Next、リリース済み)

  • パフォーマンス
    • 動的圧縮 (リリース済み)
    • パフォーマンス オブザーバビリティ パートナー (New@Next)

  • インターネットを介したプライベート オリジン通信
    • Google Cloud App Connector (New@Next、プレビュー)

  • CI/CD Automations Toolkit

Global Front End のデプロイメントパターン

  • Google Cloud インフラストラクチャ
    • マネージドインスタンスグループにより、トラフィックの増減に対して自動でスケーリングすることでコスト最適化
    • グローバル LB により最も近いリージョンにルーティングされ、信頼性とパフォーマンス確保のために他リージョンへフェイルオーバー
    • GKE と統合してポッド、またはノードの増減に対してクラスタを自動スケーリング

  • ハイブリッド、マルチクラウド (プライベート接続)

  • ハイブリッド、マルチクラウド (パブリック接続)

Uver の事例

  • Uver のトラフィックフロー
    • 待ち時間の短縮:グローバル LB の 2 層構造のため、より速いルーティング
    • 簡素化された管理:20 以上のリージョンにわたり、デプロイメントのオーケストレーションが不要

感想

CDN や LB、それに関するセキュリティについての解説が主な内容で、Google Cloud のフロントエンドサービスの性能の高さを認識でき、純粋にすごいなと感じました。
新機能はパフォーマンス面だけでなくセキュリティ面も多く、幅広いニーズに対応してきていることがわかりますね。
また、個人的に今回の出張で Uber を利用する機会があったので、アプリの使用感から実際に低遅延でスムーズであることを体感できたのも説得力がありました。