Datadog コスト最適化検証(API可視化と運用ルールによる継続的削減)

本記事では、Datadogの利用コストを適正化するために実施した APIを用いた可視化と運用ルール整備 の検証内容をまとめます。
ホスト・APM・Lambda などの課金要素の整理、利用状況の取得方法、削減アプローチ、および運用観点でのポイントを中心に整理します。

公式ドキュメント:Datadog Billing

検証の背景

Datadogを複数案件・複数環境で利用していく中で、以下の課題が顕在化しました。

  • どの機能にコストがかかっているか把握できない
  • 不要な監視対象が増加し続ける
  • 利用量増加に伴いコストが予算を超過するリスク

本検証では、これらを踏まえ 「可視化 → 削減 → 継続管理」 のサイクルが実運用に適用可能かを確認しました。

検証環境

対象 Datadog 利用環境(Infrastructure / APM / Lambda)
取得手段 Datadog API(Python)
可視化 CSV + スプレッドシート
検証目的 コスト内訳の可視化と削減ポイントの特定

想定する運用フロー

本構成では、Datadogのコスト管理を以下の流れで運用することを想定しています。

  1. Datadog APIから利用状況を取得
  2. CSVとして出力
  3. スプレッドシートで集計・可視化
  4. 削減対象の特定
  5. 設定変更(Agent / APM / Lambda)
  6. 月次レビューで継続管理

全体構成

.
├── dd_hosts_export.py        # ホスト一覧取得
├── dd_lambda_export.py       # Lambda利用状況取得
├── dd_apm_export.py          # APMサービス取得
├── output/
│   ├── hosts.csv
│   ├── lambda.csv
│   └── apm.csv
└── cost_analysis.xlsx        # 可視化・集計

Datadog API により取得したデータを CSV 化し、
人が判断しやすい形に変換すること を重視しています。

APIによる利用状況の可視化

ホスト一覧の取得

from datadog_api_client.v1 import ApiClient, Configuration
from datadog_api_client.v1.api.hosts_api import HostsApi
import csv

configuration = Configuration()

with ApiClient(configuration) as api_client:
    api_instance = HostsApi(api_client)
    response = api_instance.list_hosts()

    with open("hosts.csv", "w", newline="") as f:
        writer = csv.writer(f)
        writer.writerow(["host_name", "env", "last_reported_time"])

        for host in response.host_list:
            writer.writerow([
                host.host_name,
                host.meta.get("env"),
                host.last_reported_time
            ])

未使用ホスト(最終レポートが古い)を特定することで、削減対象を抽出します。

Lambda 関数の把握

  • 関数数の増加はコスト増に直結
  • 不要関数・検証環境の除外が有効

削減インパクトの大きいポイント

1. ホスト数(Infrastructure)

  • Datadogの基本的な課金単位
  • 不要ホスト(停止済・検証環境)の除外が最も効果的

2. APM(トレース)

  • トレース量に応じてコストが増加
  • サンプリングレート調整や不要サービスの除外が有効

3. Lambda監視

  • 関数数・実行回数に応じて増加
  • 監視対象の整理が重要

4. Live Process Monitoring

  • 単体での追加課金ではなく、Infrastructure(ホスト課金)の一部として提供されるケースが多い
  • ただし、不要なホストやコンテナに対して有効化されている場合、結果的にコスト増加の一因となる
  • 利用状況を確認し、必要な範囲に限定することが重要

コスト可視化のポイント

CSVをもとに以下の観点で整理します。

観点 内容
ホスト 未使用 / 過剰監視
APM サービス数 / トレース量
Lambda 関数数 / 利用頻度
Process 有効化対象の適正性

運用ルールの整備

継続的にコストを抑えるため、以下のルールを設定しました。

  • 検証環境は原則監視対象外
  • Datadogタグ付けを必須化
  • 月次レビューで利用状況確認

運用観点での所感

有効だった点

  • コストの内訳が明確になった
  • 削減対象を定量的に判断可能
  • 属人化を防止できた

留意点

  • API取得だけでは「必要な監視かどうか」は判断できない(業務観点が必要)
  • 削減しすぎると監視品質が低下する
  • 継続的な運用が前提

まとめ

  • Datadogコスト最適化は「可視化」が最重要
  • API活用により現状把握が可能
  • 運用ルールとセットで初めて効果が持続する

終わりに

Datadogは柔軟で強力なツールである一方、
運用次第でコストが大きく変動します。

本記事で紹介したように、
「見える化」→「削減」→「継続管理」 のサイクルを回すことで、
無理なく最適化を実現できます。

Information

以下のような課題をお持ちの場合は、お気軽にご相談ください。

  • Datadogのコストが増加しているが原因が不明
  • 利用状況を可視化したい
  • 監視を維持しつつコスト削減したい

お客様の環境に応じた最適な運用設計をご提案いたします。