セッションタイトル
How Datadog Saved $1.5M Annually on Storage Costs using Cloud Cost Management
はじめに
企業のクラウド費用管理と最適化は、現代のビジネスにおいて極めて重要な課題です。多くの企業がコスト削減に取り組む中、Datadog社のエンジニアリングチームとFinOpsチームも、この課題に対し真剣に取り組んでまいりました。
その結果、Datadog社は自社開発の「Cloud Cost Management (CCM)」ツールを活用し、ストレージコストだけで年間100万ドル、最終的には年間150万ドル以上もの費用削減を実現しました。
本稿では、Datadog社がいかにしてこの顕著な成果を達成したのか、その挑戦と成功の背景、そしてそこから我々が学ぶべき点を詳細に解説いたします。
クラウドコスト管理における共通の課題
Datadog社もまた、クラウドコスト管理において多くの企業が直面する課題に遭遇していました。貴社においても同様の課題に直面している可能性があります。
- ツールの分断とデータ連携の困難さ:精度に問題のあるツールやスプレッドシートの利用は、FinOpsチームとエンジニアリングチーム間の連携を困難にします。
- 行動可能なインサイトの欠如:コストやパフォーマンスのデータが存在しても、エンジニアがコスト最適化に繋がる具体的なヒントを得にくい状況が生じやすいです。
- コスト意識文化の構築困難:ツールの分散や行動可能なインサイトの不足は、特にエンジニアが日常業務にコスト管理を組み込むことを難しくし、結果として企業全体でコストを意識する文化を構築することを困難にします。
- ブラックボックス化と費用増加:クラウド環境がまるで「ブラックボックス」のように認識され、不必要なリソースの消費や開発・テスト環境における無駄な支出が増加する事態が発生し得ます。
FinOpsチームにとって、2025年における最優先事項は、FinOpsとエンジニアリング間のシームレスな連携を実現することでした。これはまさに、上述の課題解決を目指していたのです。
Datadog Cloud Cost Management (CCM) の導入
これらの課題を解決するため、Datadog社は自社開発のCloud Cost Management (CCM)ツールを導入しました。CCMは、FinOpsチームとエンジニアリングチーム双方が抱える特有の課題を解決し、必要な情報を一元的に把握できるプラットフォームです。
CCMの活用により、企業は以下のことが可能となります。
- エンジニアの日常業務へのコスト情報の組み込み:コストに関する情報を、エンジニアが常用するツールや作業フローに直接表示できます。
- 即時的なコスト削減:AWS、Google Cloud、Azureの主要3大クラウドプロバイダーに対し、すぐに利用可能なコスト削減推奨事項を提供します。
- FinOpsとエンジニアリング間の連携強化:チーム間の協力関係を促進し、共同でコスト最適化を推進することが可能となります。
Datadog社自身も、この「ドッグフーディング」(自社製品の自社利用)を実践し、CCMを活用することで、年間150万ドルものストレージコスト削減を達成しました。
年間150万ドルのストレージコスト削減への道のり
Datadog社の2025年第1四半期の目標(OKR)は、ストレージ費用の削減でした。以前は、CUR(コストと利用状況のレポート)ファイルをダウンロードし、スプレッドシートにアップロードし、手動で検証を行った上でエンジニアに送付するという、極めて手間のかかる作業が必要でした。加えて、情報不足や詳細度の欠如により、成功に至らないケースも多かったといいます。これはまさに、「成功への障壁が高すぎる」状態であったと言えます。
しかし、CCMの導入以降、この状況は劇的に変化しました。
- 初期仮説:インテリジェントティアリングの活用
FinOpsチームのCass氏は、まずCCMのコスト推奨ページから作業を開始しました。CCMは、Datadog社のオブザーバビリティデータとクラウドプロバイダーの請求データを組み合わせることで、具体的なコスト削減提案を提供します。
Cass氏はまず、「S3標準ストレージからS3インテリジェントティアリングへの移行により、月に16,200ドルの節約が可能である」という推奨事項を発見しました。彼はこの推奨事項をノートブックにまとめ、担当チーム(Maxim氏のチーム)をタグ付けし、詳細調査を依頼しました。 - エンジニアの意識変革と共同作業の開始
エンジニアリングチームのMaxim氏は、正直なところ、当時ストレージコストがそれほど高額であるとは認識しておらず、詳細な追跡を行っていなかったと述べています。当時の彼らの考え方は、「必要なだけ使用し、後から見直しを行わない」というものであったといいます。
しかし、Cass氏が作成したデータノートブックは、FinOpsチームが提案を共有し、チーム全体で共同行動計画を策定するための「場」としての役割を果たしました。これにより、Cass氏の発見は即座に行動可能な形となったのです。 - 仮説修正:「古いファイル」が主因
ところが、事態は当初の想定よりも複雑でした。最初に立てられた「インテリジェントティアリングが解決策となる」という仮説は、Maxim氏の調査により覆されました。Maxim氏は、S3バケット内に古く使用されていないオブジェクトファイルのバージョンが多数残存しており、それがコストを大幅に押し上げていることを発見したのです。 - CCMのコストエクスプローラーとJira連携の活用
Maxim氏の調査結果を受け、Cass氏はCCMのコストエクスプローラーを使用し、Maxim氏のチームが保有する高コストなストレージの中から、最初の推奨では特定されなかったリソースを特定しました。これらの検索クエリもノートブックにまとめられ、Maxim氏のチームとの共同作業は一層円滑に進みました。
Maxim氏は、CCMのJira連携機能を利用し、リソースの規模縮小や新しいライフサイクルポリシーの導入に関するチケットを自動で作成しました。これは、エンジニアの日常業務にコスト管理を効果的に組み込む手法として、極めて有効であると言えます。 - カスタマイズ可能なコスト推奨機能による効率向上
さらにDatadog社は、特定のCPUとメモリの使用量、および期間を設定し、コスト削減推奨事項を自社の要件に合わせてカスタマイズできる新機能(プレビュー版)をリリースしました。これにより、チームはビジネスにとって最も影響が大きく、関連性の高い最適化提案を受け取ることが可能となり、即座にアクションを起こしてコスト削減を実現できるようになったのです。
年間150万ドルの削減達成
DatdDog社は、こうした一連の努力の結果、使用されていないバージョンの削除や新しいライフサイクルポリシーの導入により、年間150万ドルという途方もないストレージコスト削減を達成しました。
この成功は、単に数値が減少しただけではありません。CCMは、コスト最適化を日常業務に組み込み、FinOpsとエンジニアが共通のSlackチャンネルで削減状況を追跡できるようにすることで、「コスト意識」の文化を構築する契機ともなりました。この点も非常に重要と思います。
まとめ:Datadog社の事例から得られる3つの教訓
Datadog社の事例は、規模の大小を問わず、企業がクラウドコストを正確に把握し最適化することの重要性を示しています。この取り組みから得られた重要な教訓を3点にまとめ、以下に示します。
- 行動可能性の確保 (Make it actionable): エンジニアが常用するシステム(Datadogのカスタム推奨、エクスプローラー、ノートブックなど)において、関連性が高く、即座に実行可能なヒントを提供することが極めて重要です。
- 柔軟な思考 (Be flexible): 最初から完璧な仮説が立てられなくても問題ありません。初期仮説が誤っていても、それが新たな発見に繋がることもあるためです。柔軟な姿勢で、学習に対し開かれた姿勢であることが肝要です。
- 賢明な行動 (Be smart): 無償で得られるものは存在しません。常にリソースを監視し、コスト削減の機会を特定することが不可欠です。Datadog社は、古いオブジェクトを削除することで、余分なストレージを排除し、計算の結果、多額の節約を達成したのです。
Asana社のようなDatadog CCMの他の顧客も、このツールを用いてクラウドコストを把握し、変化を計画し、請求額を削減することに成功しています。Datadog社のCloud Cost Managementツールは、FinOpsとエンジニアリングの両方にとって、コストを一元的に管理し最適化するための、極めて強力な支援ツールとなるでしょう。
本稿が、みなさまのクラウドコスト最適化への取り組みお役に立てば、これ幸いです。