セッションタイトル
Datadog による AI エージェント オブザーバビリティの最前線
はじめに
AIがビジネスの現場で活用されるようになった今、その「見えない部分」に不安を感じる方も多いのではないでしょうか。
私自身、初心者インフラエンジニア(MSP)として、システムの運用・保守・監視を学ぶ中で、AI時代の新たな課題に強い関心を抱いています。
Google Cloud Next Tokyo 2025に参加し本セッションを聞いてこの問いに対するひとつの明確な答えが示されました。
それは、AIエージェントの本格的なビジネス活用には、その『見えない部分(ブラックボックス)』を解消するための高度な『オブザーバビリティ(可観測性)』が不可欠であり、Datadogの最新機能とGoogle Cloudの環境がそれを強力に実現するということです。
本記事では、この重要なテーマについてセッションで学んだ内容を整理し、今後の自身の学習に繋げていきたいと思います。
なぜAIエージェントの「オブザーバビリティ」が重要なのか?
従来のシステムと異なり、AIエージェントは「非決定論的な性質」を持っています。
これは、同じ入力に対しても異なるプロセスを経て、最終的に同じ、あるいは異なる結果を出す可能性があるということです。
そのため、「なぜこの結果になったのか?」という内部動作が「ブラックボックス」になりがちです。
このブラックボックス化は、以下のような問題を引き起こす可能性があります。
- 問題の特定が困難:予期せぬ動作やエラーが発生した際に、その根本原因を特定するのが難しい
- 品質の評価不足:AIエージェントの推論結果の品質を多角的に評価するのが困難
- コスト管理の課題:自律的なモデル呼び出しによるコスト増大を予測しにくい
- セキュリティリスク:不適切な情報出力(ハルシネーション)やプロンプトインジェクションなどのセキュリティ問題
従来のモデル評価やシステム監視だけでは、AIエージェント特有の問題を把握できません。
そこで、外部出力からAIエージェントの「内部状態」を可視化・分析する「オブザーバビリティ(可観測性)」という新しいアプローチが不可欠になります。
Google Cloud:AIエージェントの最適な実行環境
Google Cloudは、AIエージェントを構築・実行するための最適な環境を提供しています。
- マネージドAIエージェント:NotebookLMやGoogle Agentspace、カスタムGemといった、Google/Google Cloudが提供するGeminiベースのAIエージェントを利用できる
- Vertex AI Agent Builder:Vertex AIのエコシステムを活用し、PythonでAIエージェントを構築・管理・評価できるマネージドなインフラストラクチャを提供
- Cloud Run:スケーラブルなサーバーレスランタイムとして、AIエージェントを柔軟かつ堅牢な環境で実行可能
(特にCloud Runはゼロスケール(使わないときにコストゼロ)や、管理不要で堅牢なネットワークとセキュリティが強み)
Datadogが提供する「LLM Observability」:AIエージェントの「見える化」の最前線
Datadogは、このAIエージェントの「見える化」を高度に実現する「LLM Observability」という機能を「最前線」として提供しています。
Datadogが提供する機能
- AI Agent Monitoring:各エージェントの意思決定の流れ(入力、ツールの呼び出し、他のエージェントとの連携、出力)をインタラクティブなグラフで可視化
これにより、無限ループのような予期せぬ挙動を詳細に分析でき、品質、セキュリティ、コストなどの指標と関連付けて把握できます。
そしてこの機能により、AIエージェントのパフォーマンス、品質、コスト、安全性を多角的に評価し、問題解決や改善につなげることが可能になります。
DatadogのAI活用:AIがAI運用を支援する「Bits AI」
Datadogは、AIを基盤としたAIOps機能「Bits AI」も提供し、AIエージェントの運用をさらに効率化します。
- Bits AI SRE:アラートが発生した際に、Datadogのテレメトリーデータ(ログ、メトリクスなど)を活用して根本原因を自律的に調査するAIオンコールチームメイト
人間がPCを開く前に原因を特定したり、インシデントのリアルタイムサマリー作成、関連インシデントの検出、事後分析のドラフト作成などを支援することで、運用チームの負担を大幅に軽減する
- Bits AI Dev Agent:エラーや性能劣化が見つかった場合、本番環境の挙動に基づいて修正コードを提案し、テストコードを含んだプルリクエストを自動で作成するコーディングアシスタント
これにより、開発者はより迅速に品質の高いコードをデプロイできるようになる
AIエージェントオブザーバビリティの「民主化」
DatadogのAIエージェントオブザーバビリティ機能の拡大と、Google Cloudが持つ多様なAIエージェントエコシステムの発展により、AIエージェントオブザーバビリティの「民主化」が加速しています。
これは、従来運用チームがメインで関わっていたオブザーバビリティに、開発者もより深く関与しやすくなっていることを意味します。
Datadogの「Observe(観測)」から「Act(行動)」への進化が、運用の内製化を支援する上で非常に適しているということです!
まとめ
今回のセッションは、AIエージェントが持つ「ブラックボックス」という大きな課題に対し、Google Cloudの堅牢な基盤と、Datadogの先進的な可観測性が具体的な解決策を提示していることを明確に示してくれました。
AIのビジネス活用が当たり前になる未来において、この先進的な可観測性(オブザーバビリティ)が、安心・安全、そしてコスト効率の良いAI運用を可能にするという事実に、大きな感銘を受けました。
特に、AI自身が運用を支援する「Bits AI」のような機能は、人手不足が深刻な現代社会において、必要不可欠なAIをさらに強力に後押しする存在だと感じています。
両社のソリューションが連携することで、AIの力を最大限に引き出し、より多くのビジネスに貢献できる可能性に、期待が膨らみます。
この「AI時代のオブザーバビリティ」という重要なテーマについて、今後も深く学び、日々の業務に活かせるよう精進していきたいと思います。