こんにちは!
アイレット広報の羽鳥です。
いきなりですが、みなさんはアイレットの提供するクラウドの導入設計から構築・運用・監視保守までのフルマネージドサービス「cloudpack」の強みといったら何を挙げますか?
いくつか挙がる中に「24時間365日有人による監視運用」が入ってくるのではないでしょうか。お客様のインフラ環境やITシステムの安定運用を実現しているのは、アイレットのManaged Service Provider(MSP)チームが交代制でお客様のサーバーを見張っているからなのです。
そんなMSPにおいて、アイレットではインシデント管理システムである「PagerDuty」を4年前から導入し、アラート対応を実施しています。監視対象となるアラートをすべて「PagerDuty」に集約して一元管理することで、監視業務の効率化と顧客サービスにおける信頼性の向上を実現しました。
また、昨年には「PagerDuty」のAPIやWebhook機能を利用して「次世代監視基盤(Advanced Monitoring System:AMS)」を開発し、監視業務の一次対応を自動化する仕組みの導入を進めています。
今回は、AMSの開発を担当した大阪オフィスMSP開発セクションの高橋修一にインタビューを実施し、開発秘話や「PagerDuty」を利用することのメリットなどを語ってもらいました。
MSPの業務効率化を実現する「AMS」
まずはMSP開発セクションが何をやっているのかを簡単に教えてください。
MSPのチームは、24時間365日体制でお客様のインフラ環境やITシステムの環境のアラートを有人監視しています。今回は、MSPチームからアラートの一次対応のうち、定型のものはできるだけ自動化していきたいという話があり、AMSを開発することになりました。
1.アラートのオープン
2.手順書確認
3.動作確認、情報取得
4.必要に応じて復旧対応、復旧確認
5.エスカレーション
6.アラートのクローズ
AMSでは、上の監視業務を全て自動化します。
また、アラートのタイトルに含まれたAMS用のキーワードを解析し、事前に定義済みの一次対応シナリオを特定して、動作確認・情報取得・復旧対応・復旧確認などの一次対応を自動実行します。
また、一次対応シナリオの処理結果とシナリオ設定にあわせて、インシデントのステータスを更新します。
MSPからの反響はいかがでしょうか?
障害時も止まらない仕組みを構築
また、AMSを運用し始めてからでてきた要望や課題を、優先順位や仕様の整合性、さらにシンプルさを考えながら対応していくのに、今現在でも苦労しています。
様々な障害や利用環境のパターンが考えられるため、テストについても障害のシミュレーション方法、観点、実施方法、自動化について相談し、作成しました。また、2リージョンで平行稼働し、高負荷時は自動スケールアウトなど、高い可用性を備えています。
「PagerDuty」を活用してさらなる進化を目指す
まず、「PagerDuty」から対応が必要なアラートをイベントとして受け取ります。そして必要な一次対応を行い、提供されているAPIで対応の経過や結果を「PagerDuty」に更新しています。もともとの運用を大きく変えずに済んでいるので、徐々に自動化の割合を増やしていっています。
また、完全に自動化しきれないケースではAMSが必要な情報の収集まで行い、その先のオペレーションは人間に引き継ぐといった使い方もしています。
ただ一次運用の幅を広げて「こんなこともできるかな?」といった要望も日々でてくるので整合性をとりながらより柔軟に対応できるようにしていきたいです。
様々な環境から発生したアラートや、人間が行った対応、そしてAMSが行った対応も「PagerDuty」に集約されるため、分析や振り返りにも利用しています。
例えばAWS Event Bridgeもローンチ段階で「PagerDuty」が対応していました。イベントを受ける仕組みとしてこれを採用するのもありかな?と考えていたところちょうどPagerDutyさんからご提案いただき、こちらの疑問や懸念などについても情報をいただくことができました。
これからもお互いにフィードバックしながらMSP業務の改善を進めていけたらと思っています。また、AMS自体は開発をスタートしてから2年以上が経過しています。その間にも新しいサービスや機能がリリースされているので、検証しながら必要な部分で有効活用していきたいです。
編集後記
「お客様環境を守る」をミッションに、24時間365日お客様の環境を監視し、安定運用を実現しているのがMSPチームです。そして、そのMSP業務の効率化を目指し活動をするのがMSP開発チームです。
今回のインタビューを通じて、今後もお客様が安心してcloudpackにお任せいただけるよう、PagerDuty 社と協力してMSPを進化させていきたいという気持ちが強く伝わってきました!
アイレットは運用監視における豊富なノウハウ・実績を活かして、さらにレベルアップしていきます!
運用監視でお困りの際はぜひcloudpackにお任せください!