2024年 XX月 XX日 某所にて

上長
上長
笹崎さん、Datadog のワークショップあるんだけど行く?
参り候
笹崎
笹崎

はい、というわけで毎度どうも。
MSP の笹崎です。

今回は、Datadog のワークショップに参加したので、その内容について
運用担当としての視点を交えながら、ご紹介しようと思います!

Datadog とは

Datadog は、インフラからアプリケーション、ログ、セキュリティ、など
まとめて扱える監視プラットフォームです。

幅広い分野で利用されており、インフラ監視に強みがあるなぁと個人的には感じていますが
実際に使ってみるとオブザーバビリティ(可観測性)についても高いレベルで提供している事がわかります。

日本でのユーザー会も活発なので、Datadog のいろんな事例や活用方法についてインプットできるのは
それだけ注目度の高いプラットフォームなんだなと思いますね。

Datadog – モダンなモニタリングとセキュリティ

ワークショップの目玉はこれ!

今回のワークショップでは、APM(Application Performance Monitoring)がメインテーマでした。
APM を使うと、以下のようなことができます。

  • サービス同士の関連を可視化
  • リクエスト経路の追跡(トレース)
  • 処理のボトルネック特定

マイクロサービスや複雑なシステムでも、一目で問題となっていそうな箇所がわかるのですごく便利な機能です。

Datadog – APM

ハンズオン全体の流れ

ワークショップ用の環境として Lab が用意されており、そこには Datadog エージェントがあらかじめインストール済みです!
ログやメトリクスが自動で収集されている状態で、後述の流れを体験しました。

↓ Lab の様子 ↓

↓ 入口付近でわちゃわちゃしている様子 ↓

ハンズオンその1: エージェントの設定をみてみよう!

すでにある程度セットアップされているため、簡単に APM データを収集できました。
複雑な設定を組まずにトレース情報を拾ってくれる仕組みがあるのが印象的でした。

Datadog – アプリケーションインスツルメンテーション

↓ APM Manual Instrumentation のガイド ↓

ハンズオンその2: デバッグしてみよう!

サービスマップからエラーが多発しているポイントを発見!
特定のテンプレートでエラーが起こっていることが判明したので
APM で取得したトレースデータを元に各テレメトリーデータとの相関を把握しながら
被疑箇所を調査して、コードを修正します!

修正後にアプリを再起動すると、エラーが解消されているのを確認できました。

Datadog – サービスマップ
Datadog – トレースビュー

↓ ボトルネックの情報が含まれるトレースデータを発見 ↓

ハンズオンその3: アラート(モニター)を設定してみよう!

Datadog には機械学習を使った異常検知をはじめ
しきい値を決めて通知するなど、様々なアラート方法があります。

設定画面から推奨モニターを簡単に追加できるので、すぐに使い始められるのが魅力です。

今回のハンズオンではデバッグした際に問題となっていた
トレースデータを監視できるようモニターを作成してみました。

Datadog – モニターの構成
Datadog – Recommended Monitors
Datadog – モニターの種類

↓ 次回からレイテンシーの問題を検知できるように Latency anomaly でアラート設定 ↓

ハンズオンその4: ダイナミックインスツルメンテーションを設定してみよう!

再起動なしで実行中のアプリケーションにテレメトリ情報を追加できる
ダイナミックインスツルメンテーションという機能があるとのことで
そのハンズオンをやってみました!

問題箇所をピンポイントで調べたいときに活躍できる機能という印象です。
プログラムの実行を止めることなく情報を収集する「プローブ」を仕込むことができ
指定のテレメトリーデータを取得できます。

今回はコード内の特定の行に対してログプローブを設定しました。

Datadog – ダイナミックインスツルメンテーション

↓ 対象メソッドにログプローブを仕込んでみた ↓

ここが良かった!ハンズオン!

今回のワークショップでは、Datadog の機能を実際に使いながら学べたのが良かったです。

特に、ここがすごい!と思ったのは、Single Step APM Instrumentation という機能です。
最近 GA になったばかりの機能で、コードの変更なしで APM を導入できる機能だと聞いて、驚きました。

まだ、一部の言語とバージョンにしか対応していないのですが、今後のアップデートに期待したいです。
PHP も対応してくれると嬉しいなと思いましたw

Single Step APM Instrumentation

↓ Single Step APM Instrumentation のガイド ↓

最後はみんなで Datadog オフィス見学会

実は今回のワークショップは Datadog のオフィスで行われました!
きれい!ひろい!英語がいっぱい聞こえてくる!

BIG なカウンターの引き出しにはお菓子などが入っていたり、ハイグレードなエスプレッソマシンが鎮座していたり
キンキンに冷えた飲み物がガラス張りの冷蔵庫に並んでいたり、これは出社するのが楽しいそうですな。

「これが世界の力ってやつか…… 降参だぜ……」

↓ BIG なカウンターとハイグレードなエスプレッソマシン ↓

まとめ

今回の Datadog ハンズオンを通じて、監視やデバッグ作業を「ひとつのプラットフォーム」でまとめて行える便利さを実感しました。
サービスの依存関係を可視化し、エラーを素早く発見して修正する流れがとてもスムーズです。

運用担当としては、トラブルシュートの効率化やチーム内での情報共有にも大いに役立ちそうだと感じました。
今後はさらに新機能や設定も試しつつ、Datadogを活用して運用の質とスピードを上げていきたいと思います!

Information

以下のような課題でお困りのお客様はぜひ当社にご相談ください。

  • サービス障害時にインフラ観点だけでなく、俯瞰的なボトルネック調査を行い、問題の特定・解決を早めたい
  • Daadog の導入は決まったものの、ノウハウもなくどうしたらいいかわからない

お客様の課題に合わせて、当社が提供するサービスをご提案させていただきます。
ぜひお気軽にアイレットへご相談ください。