はじめに
Lookerのスケジュール配信機能(Lookerスケジューラ)を利用してMSPの運用状況をレポートとして配信する仕組みを作成しました。
弊社で運用させていだている一部のお客様で試験的に導入をはじめています。今回はレポート配信の仕組みにフォーカスして解説していきたいと思います。
レポートとして配信するモチベーション
まずはなぜこのような仕組みを作成しようと思ったのか理由を簡単に説明したいと思います。
簡単に説明すると下記のような理由があります。
- レポートを作成しておけば、過去の実績はLookerのダッシュボードを見る必要がないため
従来でも簡易的な分析レポートは都度発行していましたが、過去の詳細な実績を振り返る際にはダッシュボードを見る必要がありました。
また、運用状況がどのように移り変わっていくかという断面はLookerのダッシュボードでは確認が難しいという側面があります。
運用状況の移り変わりを見ようものなら、日時の検索条件を少しずつ変えながらダッシュボードを見る必要があります。
くわえて、MSPの運用情報はさまざまな方法で検索を高速化していますが、データが多いために見たい情報を探すのに時間がかかることがあります。
一番大きなモチベーションとしては
「運用メンバー(MSP)含め、案件に携わる関係各位が運用状況に対する共通認識を持つことができる」という側面があります。
レポート配信の仕組み
仕組みというほどの話ではないですが、Lookerにはスケジュール配信機能(Lookerスケジューラ)があります。
Lookerスケジューラを利用することで、LookerのダッシュボードあるいはLookを指定した時間に指定したメールアドレスに指定した形式で配信できます。
Lookerスケジューラを使用したコンテンツの配信 – 参考
レポートの配信方法
Lookerスケジューラを利用してレポートを配信する方法は下記の通りです。
- Lookerのダッシュボードを開く
- Lookerスケジューラを設定する
- ダッシュボードをスケジューリングを実行する
Lookerのダッシュボードを開く
まずは配信したいダッシュボードを開きます。
https://<ドメイン>/dashboards/<ダッシュボードID>
画面右上の3ドットをクリックしてSchedule Delivery
をクリックします。
Schedule Deliveryを選択します。
Lookerスケジューラを設定する
設定項目は下記のとおりです。
- スケジュール名
- スケジュール名を入力します
- Recurrence
- 分時日、週、月のいずれかを選択するか、カスタムまたはデータグループを更新されたタイミングを選択します
- Destination
- 宛先への送信方法を選択します
- Email Addresses
- メールアドレスを入力します
- Format
- 送信形式を選択します
最後にSaveをクリックします。
なお、FilterやAdvanced optionsを使うことでより細かい配信ができます。
レポートとして配信される内容
Lookerスケジューラを利用して配信されるレポートの内容は弊社が管理している運用分析プラットフォームのデータを利用しています。
運用分析プラットフォームには主に以下のようなデータが管理されています。
- Advanced Monitoring Systemのログデータ
- PagerDutyが収集しているアラート情報
これらのデータを利用して運用状況の分析を行っており、これらのデータをLookerスケジューラを利用して配信しています。
補足:Advanced Monitoring Systemとは
Advanced Monitoring System(以下、本文ではAMSと省略)は、弊社が内製した監視業務の一次対応を自動化するシステムです。
AMSは、サーバーの監視やアラートの通知を自動化することで、対応レベルを均一化することを目的としています。
Advanced Monitoring Systemのログデータ
AMSがどんなものか理解できたところで、AMSのログデータについて説明します。
AMSのログデータは、運用状況の分析において重要なデータのひとつです。
AMSは説明にも記載したとおり、サーバーの監視やアラートの通知を自動化することで、対応レベルを均一化しているため
対応したアラートの内容や対応時間などの情報をAMSのログデータから取得できます。つまりは、AMSのログデータを分析することで、AMSによる運用状況を把握することが可能となり、どれくらいの削減効果をAMSがもたらしているかを把握できます。
AMSが対応するアラートは次に説明するオペレーションクラウドのPagerDutyを活用しています。
補足:PagerDutyとは
PagerDutyはインシデント管理プラットフォームであり、世界中の企業が利用しているオペレーションクラウドプラットフォームです。
公式サイトには以下のような記載があります。
PagerDuty Operations Cloud™️は、ミッションクリティカル、タイムクリティカルなオペレーション業務のダウンタイムを最小限に抑えるためのプラットフォームです。
引用元:PagerDuty|インシデント管理プラットフォーム
余談ですが、弊社ではPagerDutyを提供しています。
アイレット、インシデント管理プラットフォーム「PagerDuty」を提供開始
PagerDutyが収集しているアラート情報
弊社の運用情報においてPagerDutyが収集しているアラート情報は、AMSのログデータと同様に運用状況の分析において重要なデータのひとつです。
とくに有人対応アラートに関してはPagerDutyの履歴を分析に活用しており、cloudpackの応対品質(SLOの達成率など)を把握するために利用しています。
ほかにもアラートが発生してから実際に解決するまでの時間(resolve time)を分析することで、アラートの解決にかかる時間を把握できます。
たとえば、以下のような指標を分析できます。
- 任意の期間におけるアラート解決時間の合計(sum)
- 任意の期間におけるアラート解決時間の平均(avg)
- 任意の期間におけるアラート解決時間の最大値(max)
- 任意の期間におけるアラート解決時間の最小値(min)
- 任意の期間におけるアラート解決時間の標準偏差(stddev)
他にもさまざまな分析が可能です。
- プライオリティで定められた対応時間内にアラートが解決できているかどうか
- エスカレーションポリシー毎のアラート解決時間
- PagerDutyが管理するサービス単位のアラート解決時間
※プライオリティ:アラートごとに定められている対応の優先順位
※エスカレーションポリシー:アラートの対応先、弊社では所属事業部名などをベースにしている
※PagerDutyが管理するサービス:複数のアラート情報を管理する単位、弊社ではサービス(お客様)ごとにアラート情報を管理しています。
実際に配信される内容
今回はMSPからの要望に基づいて、以下の内容を配信することにしました。
- 月次のアラート情報
- アラートの分類
- アラートのランキング
実際には以下のようなレポートがMSP宛に配信されます。
まとめ
Lookerスケジューラを利用してMSPの運用状況をレポートとして配信する仕組みを作成しました。
Lookerスケジューラを利用することでレポートの配信が可能となります。レポートを使えば、運用状況の共通認識を持つことができるというメリットがあります。
今後もAMSとPagerDutyのデータをもとに運用状況の改善を行っていきたいと考えています。