はじめに

オブザーバビリティツールで日本でも人気の Datadog ですが、最大規模のイベントとして、DASH というものがあります。本社のあるニューヨークのマンハッタンで開催されています。
AWS でいう re:Invent、Google Cloud でいう Next(Next Tokyo などの地域指定のないやつ)に該当するものです。参加者数も数千人を超え、世界各国からエンジニアが集っています。

我々アイレットからも、Datadog Ambassadors に認定いただいた蓮沼と私で参加しています。

この POST では、その中からキーノートについて掻い摘んで紹介させていただきます。
なお、早速、YouTubeでも公開されていました。URL はコチラ
DASH by Datadog 2025 Keynote

この POST を読んでいただいた方が気になるところを確認いただけるよう、勝手にカテゴライズしつつ、随所に YouTube 上での時間を「(h:mm:ss)」の形式で入れておきます。

オープニング

まずは、CEO の Olivier Pomel 氏からの開幕スピーチ(3:26)。

結論から言えば、今回のキーノート、すご過ぎました!現地で直接会話した Datadog スペシャリストたちも、皆さん全員、同様の印象を持たれています。

文字が小さいですが、右端列の赤紫色の文字の機能が、この DASH で公開されるそうです。そして、その多くがこのキーノート内で頭出しされました。

さらに、冒頭で Datadog Ambassadors の顔写真入りの紹介が!

続いては CTO の Alexis Le-Quoc 氏から State of the Art について(6:09)。State of the Art とは、「最新の」とかの意味。結構、IT 系のイベントでは Latest とかではなく、こっちで言われることが多い印象。AI 関連のアップデートが色々発表されるんだろうなぁという期待を抱かせるものでした。

Bits AI

これが個人的なキーノート推しポイントの一つ目!次から次にスゴいことが発表されます。

Engineering Manager の Tristan Ratchford 氏から Bits のアップデート概要について(9:05)。
Bits とは、Datadog のロゴにもなっている犬の名前であるとともに、Bits AI とは昨年の DASH で発表された Datadog の AI 機能になります。
まずは、「Bits AI SRE Agent」。AI エージェント同様、自律的に障害の根本原因を調査してくれます。結果は Slack で。

続いては、Senior Product Manager の Shah Ahmed 氏から On-Call のアップデートの「Handoff Notifications」について紹介されました(14:55)。On-Call は去年の DASH で発表され、一番現地で盛り上がった機能だった模様です。
このデモビデオが衝撃的でした。緊急障害についての電話がかかってきて、まるで人と会話するように事が進んでいきます。会場ででも、派手な新機能の発表のような歓声ではなく、静かな驚き、「これは自分の仕事なくなるなぁ」といった声が所々で上がってました。
デモ部分だけを X にポストもしていますので、運用に関連する業務に携われている方はぜひご覧ください!
https://x.com/pict3desu/status/1932442436669767940

続いて紹介されたのが「Status Pages」。よくある SaaS のヘルスステータスページのようなものを簡単に作る事ができるようです。そして、当然のように自動更新されるので、従来のように、ステータス変更時にコンテンツ担当者に連絡をしてページの更新を依頼するようなことも不要です。

DevSec

ここから、セキュリティと開発のテーマに移ります。

まずは、Staff Product Manager の Ron Feldman 氏から「Bits AI Security Analyst」について(20:58)。
CIEM における分析をサポートします。Bits AI が、正規の担当者による意図的な変更作業だった場合は、判断根拠を明示してくれますし、攻撃が疑われる場合は、ユーザーの隔離やケース起票など、迅速な対応をサポートしてくれます。

バトンは Senior Product Manager の Mike Leach 氏に引き継がれます(27:05)。アプリケーションレイヤの「Bits AI Dev Agent」について。
この機能も衝撃的でした。最近のコーディング生成 AI サービスでは、プロンプトによる指示で、不具合修正を行ってくれるものもありますが、こちらは、元々の Datadog のモニタリング内容を元に、不具合の発見からコード修正のプルリクまで、自律的に対応してくれます。脆弱性の修正も同様です。
開発エンジニアがチームに入ったのと同じと表現されていましたが、“超優秀でよく働き、脆弱性対応のような敬遠されがちなものも文句を言わずに対応してくれる”開発エンジニアです。

次は、Staff Engineer の George Sequeira 氏から「APM Investigator」について(32:19)。
APM は入れて終わりではないです。活用して初めて価値となります。APM や RUM により提供される情報を分析し、不具合解消に向けた強力なサポートを提供します。
さらに、「Proactive App Recommendations」も。これは、名前の通り、そもそも問題が発生する前に改善の推奨をしてくれます。例えば、特定のシーケンシャルな処理を並列化することで、どこにどれくらいの改善が見込まれるのか?また、どのように改修すればいいのかまで教えてくれます。

Platform Engineering

Engineer Manager の Muhan Guclu 氏から「Internal Developer Portal」について(39:30)
これ、個人的には一番、驚いたやつでした。

Platform Engineering で言われる、Internal Developer Portal と同様に、ここからセルフサービスで一定の品質を担保したテンプレからインフラを構築してくれます。このテンプレはローコードで Bits AI が作成して、共有することができます。

3rd Party との連携

ここでまたテーマが変わり、他社とのコラボレーションの話になります。
まずは、Cursor。いきなりの大物。私自身も渡米直前に、Cursor Meetup Tokyo を拝聴してきましたが、日本でもスゴい盛り上がりです。

ここで、Group Product Manager の Ala Shiban 氏から、Datadog MCP Server について(48:10)。
DASH 前にも情報があり、一部で騒がれていたやつです。
MCP により、先ほどの Cursor と連携して、不具合の早期改修を実現します。
また、ローカル環境でテストまで実施できるので、サービス影響を最小化できます。

もう一つの例で、今度は OpenAI との連携です。AI 界の大御所が続きます。
X でもポストしましたが、世界共用語の英語と同じく、MCP により、連携の世界がグッと広がります。

トヨタコネクテッド社事例

ここで Alexis 氏から、 Chief Marketing Officer の Sara Varni 氏に進行が渡されます(55:28)

トヨタコネクテッド CTO の Dave Tsai 氏から事例紹介(56:10)。

何か違和感ありませんか?
そうです!グローバル規模イベントのキーノートセッションで日本語満載のスライドです。
さすが、世界のトヨタ!

内容は、コネクテッドカーとして、AI を駆使した緊急時のサポートや、盗難時のトラッキングなどを実現する中で、その信頼性確保をするために、Datadog をフル活用されているものでした。

ログ

Product Manager の Kelly Kong 氏から(1:01:57)。

まずは、昨年発表された Flex Logs の振り返り。1年間で爆発的に利用が伸びています。
そして、新しく発表された、「Flex Frozen」と「Archive Search」。最大で7年間という監査ログ等の長期保存をコスト効率的に実現しつつ、検索手段も提供します。
さらに、「Datadog Sheets」は、ログの分析結果を可読性が高く、簡易分析も可能なスプレッドシート形式で共有できます。

チーム内で「Notebooks」を使って、メトリクス、ログ、トレースデータを複合的に活用したコミュニケーションを撮ることができます。ここにも、Bits AI が適用されました。Bits AI によって、Splunk との連携方法も生成してくれたりと、GenAI の価値を享受できます。
先ほどのセキュリティと同様、従来、ログアナリティクスという限られた人材が必要だった業務も、AI Bits がサポートしてくれます。

ついで、Okta 社の事例です。Okta CTO の Bhawna Singh 氏により語られました。(1:10:15)
Log Flex は障害調査の効率化による可用性の向上と、コスト最適化を同時に実現できます。
また、Okta では、信頼ある AI エージェントの開発をセキュアに行うために Datadog を活用されています。
今後、多くの企業で実施されるであろう、AI エージェントの生成において、非常に有用な内容でした。

AI におけるセキュリティ

ここで、Chief Product Officer の Yanbing Li 氏にパス。(1:18:31)
AI におけるセキュリティにフォーカスされます。
AI の構造はよくスタックで表されます。ここでも、データ層、モデル層、アプリケーション層で表されています。

続いて、Product Manager の Vijay George 氏から、各層のセキュリティについて。(1:20:23)
まずは、データ層。クラウドインフラを3Dマップで可視化したものから、どこにどのようなデータがあり、どのコンポーネントで利用されているのかを確認できます。
さらに、LLMによって PII を識別し、機密情報の漏洩もいち早く検知して対応することもできます。データポイズニングなどの攻撃検出も今年の後半には拡張される予定とのこと。
次に、モデル層。AI では様々なモデルを活用することが多いです。その中で、危険視されているものの一つがサプライチェーンリスクです。意図せぬ間に、悪意あるモデルを使ってしまうなどです。Datadog でコマンドをモニタすることにより、怪しいプロセスの活動を検知することができます。モデルハイジャックにも対応できます。モデルハイジャックとは簡単にいうと、倫理違反なコンテンツを作り出したり、意図せぬ経路で活用するなど、モデル提供者が意図しない挙動を強制する攻撃です。ここでは、不正利用による高額請求を防ぐ例が示されました。
最後に、アプリ層。アプリ層ではプロンプトインジェクション攻撃の検知と遮断、そしてモデル汚染が解説されました。
各層では、ここで紹介されたもの以外も随時拡張予定とのことです。楽しみ!
Datadog は AWS と連携しながら拡張を進め、マルチクラウドにも対応するようにするとのことです。

AI における可観測性

ここから、Product Manager の Anjali Thatte 氏から、GPU のモニタリングについて。(1:26:53)
30% のモデルトレーニングの失敗の原因が、GPU にあるとのことです。考えたこともなかった。
そこで、「GPU Monitoring」が発表されました。
GPU のどの箇所でどのような問題が発生しているのかを可観測します。
エラー解消や、学習時間の短縮、コスト最適化をサポートします。

次に、Engineering Manager の Victor Vong 氏から、LLM のモニタリングについて。(1:32:59)
2023 年から継続的にアップデートがされ続けてきましたが、2025 年の AI エージェントの普及により、複雑性が一気に上がりました。そこで、「AI Agent Monitoring」が提供されます。
AI Agent Monitoring は複数のエージェントを連携させて構築されたシステムの関連性とそれぞれの役割を可視化します。
これにより、概要は見えるが、トラブルシューティングには、「AI Agent Troubleshooting」が活用されます。エラー箇所が赤色でハイライトされ、あいまいなプロンプトにより意図しないツール呼び出しが原因だったと確認できます。
原因が判明し修正を行う際の検証をサポートするのが、「Experiments」です。修正をするにあたって、複数のプロンプトと複数のモデルの組み合わせでテストを行いたいですが、従来は膨大な手間がかかる作業でした。Experiments は容易かつグラフィカルに実施できます。精度と速度のバランスから最適解を導き出せました。

続いては、Senior Product Manager の Kathy Lin 氏から、複数の AI エージェントを連携させた複雑なシステムでの可観測性について。(1:40:14)
複数の AI エージェントがどのような情報をどのように連携してどのような成果を出しているのかを可視化するのが「AI Agent Console」です。
Cursor や OpenAI のような 3rd パーティにも対応しており、性能とコストを可視化します。
RUM のような形で、どのようなサービスとどのようなやり取りをしていたのかをレコーディングしたものを見るように確認できます。ここでの例では、AI エージェントが連携していた Salesforce の権限不足により、失敗を繰り返していたことが性能に影響を出していたことが確認できました。

AI におけるデータ管理

AI においてデータ管理は重要です。データの良し悪しが AI の良し悪しを決定すると言っても過言ではありません。
Staff Product Manager の Kevin Hu 氏に進行がパスされます。(1:47:07)

Ramp 社の Head of Analytics Engineering & Data Science の Ian Macomber 氏から複数のサービスと連動した金融システムでの活用の事例を。(1:48:22)
金融系で非常に厳しいレイテンシが求められると同時に、クレジットカード決済ででは、Uber ではチップによる重複があったり、承認取り消しがあったりと複雑です。ただ、ミスは許されません。不自然なデータにフラグを立てることで、対応を可能にします。ここで Datadog を活用しています。

Kevin Hu 氏に戻されます。(1:51:31)
“失うことは簡単だが取り戻すことが大変なもの…時間と信頼”。これをサポートするのが、「Data Observability」です。
見積もりミスのアラートを検出した例において、早々に存在しない Amazon S3 オブジェクトの参照が原因とつかむことができ、データパイプラインの何がそれを引き起こしたのか、ここででは、前段の Kafka へのスキーマ変更が原因だったと調査できました。
Data Observability はデータライフサイクル全体の可観測性を高めて早期改善や防止を手助けします。

まとめ

ほんとうに沢山の発表がありました(1:57:12)

でも、これだけじゃないとのこと。DASH では、この緑文字の機能を発表するようです。凄すぎる!

ここまでで気になられている方もおられるかもですが、他の大規模イベントのキーノートと比較して、スピーカーがコロコロと入れ替わっていきます。実際のプロダクト担当者が発表する方針のようです。これはプロダクト担当者もモチベーションになりそうです。

駆け足でキーノートの目次のようなものを紹介させていただきました。
YouTubeで公開されているので、ご興味あるところだけでぜひみてください。