はじめに

クラウドインテグレーション事業部の中村です。

2024年8月1日にパシフィコ横浜ノースで開催された「Google Cloud Next Tokyo ’24」の
「Google Cloud モニタリング ベスト プラクティス」セッションレポートとなります。

セッション情報

  • セッション概要(公式ページより引用)
    Google Cloud Observability は、Google Cloud にネイティブに統合された強力なモニタリングのプロダクト群です。
    このセッションでは特に Cloud Monitoring にフォーカスし最新情報とベスト プラクティスを紹介します。
    また Ubie では、5 年以上ほぼ Cloud Monitoring のみを利用しておりこの事例についても取り上げます。
  • 登壇者
    Ubie株式会社 坂田 純 氏

セッション内容

アジェンダ

Ubie株式会社について

Ubie株式会社様(以降Ubie社と記載)は一般の利用者および医療機関向けに症状検索アプリを提供しております。

Ubie社のアーキテクチャ特色は以下の通り

  • 主にGoogle Kubernetes Engine(GKE)で構成された分散サービスアーキテクチャ
  • Shared VPCとAnthos Service Meshを活用してサービスメッシュを構成し、プロジェクトを細かく分離
  • モニタリング専用プロジェクトを用意し、アラート設定やダッシュボードを一元化

Cloud Monitoringについて

Cloud Monitoringサービスの中の「SLO Monitoring」機能について紹介がありました。

SLO Monitoringを利用することで、従来のしきい値ベースではなくSLOやそれをベースとした
アラート設定が可能となり、SREのプラクティスを実践することができます。

GMPについて

Google Cloud Managed Service for Prometheus(GMP)の登場でGoogle Cloud環境における
Prometheusの使い勝手が大幅に向上しました。

GMPがリリースされる以前もPrometheusをGoogle Cloud環境で利用することはできました。
しかし、制限も多く実用的ではありませんでした。

GMPを利用するメリットとして、「ほぼ無限にスケールするデータベースとメトリクスの収集機構が提供されていること」が挙げられます。

また、Cloud Monitoringのすべての機能においてPromQLが利用可能になったことも利便性向上に繋がりました。
今まではCloud Monitoring専用のクエリ言語である「MQL」を利用する必要がありました。
PromQLが利用可能になったことで、MQLを別途学ぶ必要がなくなり、
オープンな規格であるPromQLにフォーカスできるようになります。

Ubie社での活用事例

本セッションではUbie社における各モニタリングサービスの活用事例も紹介されておりました。

GMPの利用

もともと自分たちでPrometheusをホスティングして運用していたが、GMPリリース後に移行したことで
かなりコスト削減を実現されたとのこと

Grafanaの利用

GMPをソースとしてGrafanaを利用し、エンジニアが積極的にダッシュボードを利用しているようです。

必要なメトリクスのみ取得することでGMPの利用コストを削減


サービスカタログの利用

SLO Monitoring

SLO MonitoringをGrafanaで利用されているようです。

今後の展望

セッションの最後に今後モニタリング領域で活用できそうなサービスの紹介がございました。

Observability Analystics(プレビュー中)

ログ・メトリクスがBigQueryからクエリ可能になるようです。

Gemini Cloud Assist(プレビュー中)

Next ’24で発表された新機能
AIによる補助を受けながらトラブルシューティングができるようになるみたいです。

まとめ

他クラウドサービスにおいてインフラのモニタリングについては経験しているものの、
PrometheusやGoogle Cloud環境でのモニタリングの経験がないため
本セッションはかなり勉強になりました。

今後Google Cloud環境においてマイクロサービスの運用を行う機会があればGMPの利用も検討したいと思います。