Datadog コスト最適化検証(API可視化と運用ルールによる継続的削減)
本記事では、Datadogの利用コストを適正化するために実施した APIを用いた可視化と運用ルール整備 の検証内容をまとめます。
ホスト・APM・Lambda などの課金要素の整理、利用状況の取得方法、削減アプローチ、および運用観点でのポイントを中心に整理します。
公式ドキュメント:Datadog Billing
検証の背景
Datadogを複数案件・複数環境で利用していく中で、以下の課題が顕在化しました。
- どの機能にコストがかかっているか把握できない
- 不要な監視対象が増加し続ける
- 利用量増加に伴いコストが予算を超過するリスク
本検証では、これらを踏まえ 「可視化 → 削減 → 継続管理」 のサイクルが実運用に適用可能かを確認しました。
検証環境
| 対象 | Datadog 利用環境(Infrastructure / APM / Lambda) |
|---|---|
| 取得手段 | Datadog API(Python) |
| 可視化 | CSV + スプレッドシート |
| 検証目的 | コスト内訳の可視化と削減ポイントの特定 |
想定する運用フロー
本構成では、Datadogのコスト管理を以下の流れで運用することを想定しています。
- Datadog APIから利用状況を取得
- CSVとして出力
- スプレッドシートで集計・可視化
- 削減対象の特定
- 設定変更(Agent / APM / Lambda)
- 月次レビューで継続管理
全体構成
. ├── dd_hosts_export.py # ホスト一覧取得 ├── dd_lambda_export.py # Lambda利用状況取得 ├── dd_apm_export.py # APMサービス取得 ├── output/ │ ├── hosts.csv │ ├── lambda.csv │ └── apm.csv └── cost_analysis.xlsx # 可視化・集計
Datadog API により取得したデータを CSV 化し、
人が判断しやすい形に変換すること を重視しています。
APIによる利用状況の可視化
ホスト一覧の取得
from datadog_api_client.v1 import ApiClient, Configuration
from datadog_api_client.v1.api.hosts_api import HostsApi
import csv
configuration = Configuration()
with ApiClient(configuration) as api_client:
api_instance = HostsApi(api_client)
response = api_instance.list_hosts()
with open("hosts.csv", "w", newline="") as f:
writer = csv.writer(f)
writer.writerow(["host_name", "env", "last_reported_time"])
for host in response.host_list:
writer.writerow([
host.host_name,
host.meta.get("env"),
host.last_reported_time
])
未使用ホスト(最終レポートが古い)を特定することで、削減対象を抽出します。
Lambda 関数の把握
- 関数数の増加はコスト増に直結
- 不要関数・検証環境の除外が有効
削減インパクトの大きいポイント
1. ホスト数(Infrastructure)
- Datadogの基本的な課金単位
- 不要ホスト(停止済・検証環境)の除外が最も効果的
2. APM(トレース)
- トレース量に応じてコストが増加
- サンプリングレート調整や不要サービスの除外が有効
3. Lambda監視
- 関数数・実行回数に応じて増加
- 監視対象の整理が重要
4. Live Process Monitoring
- 単体での追加課金ではなく、Infrastructure(ホスト課金)の一部として提供されるケースが多い
- ただし、不要なホストやコンテナに対して有効化されている場合、結果的にコスト増加の一因となる
- 利用状況を確認し、必要な範囲に限定することが重要
コスト可視化のポイント
CSVをもとに以下の観点で整理します。
| 観点 | 内容 |
|---|---|
| ホスト | 未使用 / 過剰監視 |
| APM | サービス数 / トレース量 |
| Lambda | 関数数 / 利用頻度 |
| Process | 有効化対象の適正性 |
運用ルールの整備
継続的にコストを抑えるため、以下のルールを設定しました。
- 検証環境は原則監視対象外
- Datadogタグ付けを必須化
- 月次レビューで利用状況確認
運用観点での所感
有効だった点
- コストの内訳が明確になった
- 削減対象を定量的に判断可能
- 属人化を防止できた
留意点
- API取得だけでは「必要な監視かどうか」は判断できない(業務観点が必要)
- 削減しすぎると監視品質が低下する
- 継続的な運用が前提
まとめ
- Datadogコスト最適化は「可視化」が最重要
- API活用により現状把握が可能
- 運用ルールとセットで初めて効果が持続する
終わりに
Datadogは柔軟で強力なツールである一方、
運用次第でコストが大きく変動します。
本記事で紹介したように、
「見える化」→「削減」→「継続管理」 のサイクルを回すことで、
無理なく最適化を実現できます。
Information
以下のような課題をお持ちの場合は、お気軽にご相談ください。
- Datadogのコストが増加しているが原因が不明
- 利用状況を可視化したい
- 監視を維持しつつコスト削減したい
お客様の環境に応じた最適な運用設計をご提案いたします。