こんにちは、MSPセクションの小野瀬です。

今回、東京で開催された「Datadog Summit Tokyo」に参加してきました。

こちらの記事では、午後に参加したワークショップについて記載します。

イベントの詳細や基調公演の内容は、こちらの記事で紹介しております。

ワークショップ:Datadog 101:SRE(サイト・リライアビリティ・エンジニアリング)

ワークショップ概要

アプリケーション パフォーマンス モニタリング(APM)のトレース収集とプロファイリングを可能にするために、eコマース ウェブ アプリケーションの複数のサービスを計測する方法を学びます。 次に、パフォーマンスの問題を診断するために、アプリケーションからのログとネットワーク パフォーマンス モニタリング(NPM)データをフィルタリングして解析します。 最後に、メトリクスの変更を通知するモニターと、重要な遠隔測定を視覚化するのに役立つダッシュボードを作成します。

SRE向けにカスタマイズされた Datadog の機能を実際に触りながら、学ぶことができる内容でした!

SRE(サイト・リライアビリティ・エンジニアリング)とは

サイト信頼性エンジニアリング(SRE)は、ソフトウェアツールを使用して、システム管理やアプリケーション監視などのITインフラストラクチャタスクを自動化する方法です。

システムの信頼性を重要視する考え方がSREです。

APM(アプリケーション パフォーマンス モニタリング)

Datadog アプリケーション パフォーマンス モニタリング(APM)は、フロントエンド デバイスからアプリケーション、データベースに至るまで、エンドツーエンドの分散トレースを提供します。

SREにおけるAPMの重要性

  • アプリケーションのどこが問題かの特定が早くなる
  • データをベースにした判断ができる
  • 貴重なリソースの浪費の特定にも役立てられる

ワークでは、実際にアプリケーションの処理が可視化されていることを画面上で確認しました!
以下のようなより深く細かく確認できる点が大変便利だと感じました。

  • APMを有効化しているインフラ(ホストやCPU)の処理も取得できる
  • アプリから見たときのDBの処理まで確認できる
  • プロファイラーの活用によりコードレベルの分析ができる

APMの他にもログ、NPM、ダッシュボード、メトリクスとモニターなど、さまざまな機能があり、実際の Datadog 画面で確認することができました。

感想

実際の画面を触ってみて、Datadog の製品コンセプトであるシンプルだが単純でないを体感することができました。
処理にどのくらいの時間がかかったのか、どこで問題が起きているのかなど、分かりやすく可視化されていました。
操作性も分かりやすく、感覚的に操作できる点に魅力を感じました!


弊社は、PagerDutyやAMS、オブザーバビリティツールなどを用いた次世代監視基盤と24/365の体制での運用保守サービス、およびSaaSの調達から運用高度化の支援まで幅広いサービスを提供しています。ぜひ一度ご相談ください。
お問い合わせはこちらから