こんにちは、MSPセクションの秋山です。

今回、東京で開催された「PagerDuty on Tour TOKYO 2024」に参加してきました。
初めてのイベント参加となりますが、セッションの内容について紹介させていただきます。

PagerDuty on Tour TOKYO 2024

イベントの詳細については、こちらを参照ください!

イベント名
PagerDuty on Tour TOKYO 2024
開催日時
2024年8月6日(火)
13:00-20:30 (受付開始12:30)
会場 東京ミッドタウン
ホール&カンファレンスホールA
〒107-0052 東京都港区赤坂9-7-1
参加対象
  • インシデント対応に関係する方
  • CIO/CTO/CDO/IT部門長の方
  • 開発/運用エンジニアの方
主催 PagerDuty株式会社

公式サイト:https://www.pagerduty.co.jp/pagerdutyontourtokyo/

Business Session:エンタープライズ企業の障害対応革新 – PagerDuty導入とその成果

テーマ エンタープライズ企業の障害対応革新 – PagerDuty導入とその成果
登壇者
  • イオンスマートテクノロジー株式会社 齋藤 光様
  • イオンスマートテクノロジー株式会社 林 如弥様

JTCとしてのイオンスマートテクノロジー株式会社が、障害対応プロセスをどのように改善したかを紹介します。PagerDutyの導入により、MTTA(Mean Time to Acknowledge)を大幅に短縮し、複数の開発チームと運用チームとのアラート方針のディスカッションを通じて、生成AIを活用した”PagerDuty Copilot”の導入も行いながら迅速な障害検知と対応を実現しつつあります。PagerDutyの導入をきっかけに全体のプロセス改善を目指した挑戦の全貌をご紹介します。

このセッションを選んだ理由

以下の二点が気になりました。

  • PagerDutyの導入をきっかけに全体のプロセス改善を目指した挑戦
  • 生成AIを活用した”PagerDuty Copilot”の活用

セッション内容

改善前の状況、苦労が伝わります。。

障害対応プロセスが整備されていない中、以下の取り組みを進めたとのことです。

  • オブザーバビリティ基盤の整備
  • PagerDutyの基本機能の活用
  • モニタリングツールへの連携

実際に活用されているPagerDutyの基本機能

  • On-call schedule
  • Escalation Policy
  • Notification Rules
  • My On-call Shifts
  • Dynamic Notifications

などなど

セッションを通じて理解できたこと、感じたこと

弊社の場合はインシデントを検知した際のアクションを自社開発したAMSで自動化しているため、普段使用しないPagerDutyの様々な機能の活用事例を知れて面白かったです。
特に当番制でアラート対応される場合、「Create Override」などで規則性のないオンコールスケジュールに対応できるということは便利だと感じました。

また、今回のプロセス改善にあたっては、以前から進んで協力し合う、個々の対応を責めないなど、メンバー間で良い関係が築けていたことがベースにあったという話も印象的でした。

振り返り/まとめ

イベント全体を通じて、やはり生成AIの話題が多かったです。
どんどん色々な機能に気軽に触れてみて、日々の運用業務の改善に繋げていきたいと思いました。