はじめに
エンタープライズクラウド事業部の高橋です。
先日、Oracle AI World 2025に現地参加してきました!
今回は、「Monitoring and Troubleshooting Kubernetes Applications with GenAI」に参加しましたので、内容を紹介します。
セッション概要
Monitoring and Troubleshooting Kubernetes Applications with GenAI [LRN2977]
Kubernetes environments are dynamic, distributed, and inherently complex, outpacing the capabilities of traditional monitoring. See how Oracle’s Kubernetes Monitoring Solution, powered by OCI Log Analytics, transforms observability with automated discovery, full-stack observability data collection, real-time topology visualization, and intelligent alerting. Learn how built-in, GenAI-assisted correlation engines trace anomalies to recent configuration changes—while AI-driven outlier detection identifies emerging issues before they affect users—and how DevOps and SRE can minimize downtime, accelerate root cause analysis, and achieve visibility across infrastructure, platforms, and networks—all through a unified, single-pane interface.
Kubernetes環境は動的かつ分散化されており、本質的に複雑であるため、従来の監視機能を凌駕しています。OCI Log Analyticsを搭載したOracleのKubernetes監視ソリューションが、自動検出、フルスタックの可観測性データ収集、リアルタイムのトポロジ可視化、インテリジェントなアラート機能によって可観測性をどのように変革するかをご覧ください。GenAIを活用した組み込みの相関エンジンが異常を最新の構成変更にまで遡って追跡する方法、AI駆動型の外れ値検出がユーザーに影響を与える前に新たな問題を特定する方法、そしてDevOpsとSREがダウンタイムを最小限に抑え、根本原因分析を加速し、インフラストラクチャ、プラットフォーム、ネットワーク全体の可視性を実現する方法など、すべてを統合された単一ペインのインターフェースから実現します。
Royce Fu, Master Principal Cloud Architect, Oracle
Chandra Komali, Senior Development Manager, Oracle
セッション内容
本セッションは、Log Analyticsが生成AIと機械学習によりデータ断片化や大量のログといった複雑なKubernetes環境の監視課題を解決することや、可視性に基づく原因分析についてが主なテーマでした。

大量のログを統合して管理を行なっていても、手動での追跡や分析では結果を確認するまで時間がかかります。
Log Analyticsを使用することで、IT運用におけるトラブルシューティングの自動化に役立てていました。
OKEのメトリクスやログを取得し、トラブルシューティングを行います。

Log AnalyticsでCPUやメモリなどのメトリクスを相関させ、さらに同じ場所で生のログデータと相関させて、デプロイメントエラー等の問題の原因を特定ことが可能です。
監視対象のリソースが大量にある場合等では運用コストの削減につながると思います。
原因の分析結果まであるとトラブルシューティングも効率化できそうですね。

OKEのClusterやPod等の構成をグラフィカルに表示させることも可能です。
複雑化した構成の把握にも役立てそうです。
また、Log Analyticsは機械学習によって、繰り返し出力されているログをグループ化された問題として表示しノイズの除去も可能とのことを話されておりました。
まとめ
Log Analyticsは、大量のログを出力するOKEを使用する場合のログ分析やトラブルシューティングに役立つサービスだと思います。
大量のログから問題の箇所を特定することがありますが、ログの重複によるノイズの除去を行うだけでも効率化ができると思います。
上記セッションの内容とは対象リソースが異なりますが、以下URLにOCIのLogging Analyticsを使用したログの可視化や分析のチュートリアルがございます。
https://oracle-japan.github.io/ocitutorials/management/audit-log-analytics/
Log Analyticsについて、本記事で興味を持っていただけたら幸いです。