はじめに
こんにちは、
MSPチームのクリスです!
2024/08/06にて、PagerDuty on Tour に参加させていただきました!
PagerDutyといえば、インシデント管理のツールであり、MSPチームはいつもお世話になっています!
今回はPagerDutyさんが独自開催したカンファレンスに参加させていただいたので、体験談をお伝えいたします!
スケジュール
開催時間:13:00 〜 20:30
ビジネスセッション:13:00 〜 17:00
エンジニアセッション:17:30 〜 20:30
会場:東京ミッドタウン ホール&カンファレンス(ホールA)
会場
開場前30分に着いたので、まだ混んでいなかったのはラッキーでした!
8社がブースを出展していて、その1社としてアイレットも出展しました!
コンセプト
本カンファレンスは、二つのセッションに分かれています。
ビジネスセッション:実際にPagerDutyを活用している企業ユーザーが、効率的なIT運用、システム障害時における迅速な修復力構築、ビジネス拡大の成長を実現するための紹介
エンジニアセッション:日々システム運用を行っている現場のエンジニア、IT担当者向けの紹介
各セッションに関して、個人的に気になったところをハイライトとしてご紹介します。
ビジネスセッションハイライト
基調講演1
列車の予約システムにおけるインシデント対応の高度化
登壇者
Chief Executive Officer of PagerDuty
Ms Jennifer Tejada
株式会社JR東日本情報システム
Suica・駅サービスソリューション本部長
吉川 眞之 氏
運行サービスの進化と課題
JR東日本情報システム社の事業ドメインは、運行関係、スイカなどの電子マネー、ポイント、ステータスサービス(えきねっとなど)に分かれています。20年前、窓口での顧客対応から始まり、自動化と予約機能の導入が行われました。コロナ禍を契機にチケットレスサービスへのシームレスな移行が進み、アプリ社会という今の時代ではアプリが当たり前のコミュニティーへの対応が求められています。お盆時期などのトラフィック量の増加にも対応し、安心安全なサービス提供が重要視されています。
システム運用の挑戦
2024年7月19日のシステム障害を経験し、運用の回復力の重要性が再認識されました。Windows文化という影響があり、サーバーがWindowsに集中しすぎる課題もあります。
エンドユーザーにとって、サービスダウンの原因がサイバー攻撃であれサーバーの障害であれ、関心があるのはサービスが使えるかどうかだけです。そのため、サービスの運用と安定性の確保が最も重要です。
PagerDutyの導入と運用
PagerDuty 代表取締役社長の山根さんからの紹介でPagerDutyを導入したとのこと。PagerDutyを導入してからの2年間、アラートの迅速な対応と年間3回のスパイク(年末年始、ゴールデンウィーク、お盆)時期に短時間でのアラート検知が可能となり、AIを活用して運用とサービスのリンクを強化しました。PDのデータ活用により、クライアントの影響範囲を縮小し、運用の自動化が進んでいます。
リーダーシップと企業文化
リーダーとしての時間の使い方については、ミッションクリティカルな価値観を持ち、それを共有することが重要とされています。変革を嫌う人々に対しては、リーダーが道を示すことが求められます。企業はどこまで目指すかを明確にし、標準化と古いデザインの改変を進めています。AIを活用した運用の自動化により、人の手が関わる部分を減らすことが期待されています。
夏休みの計画
JRが大変混み合うお盆期間を避けてゴルフや飲み会を楽しむ予定とのことでした。(笑)
基調講演2
AIと自動化が実現するオペレーションナルエクセレンス
Chief Product Development Officer of PagerDuty
Mr Jeffrey Hausman
7月19日に発生したグローバル障害で、多くのサーバーを「ブートモード」に陥らせました。
「問題が発生するのは『もし』ではなく『いつ』である」
と彼は述べ、運用の脆弱性がいかに顕著であるかを強調しました。
このような問題は顧客体験やブランドに悪影響を及ぼし、実際に半数以上のインシデントは顧客によって最初に発見されるという事実を示しました。
また、7月19日のインシデントは通常の約200%増加しましたが、PagerDutyは全てのインシデントを問題なく処理しました。
さらに、2倍以上に増えたインシデント数に対して、お客様の対応時間は通常よりわずか29%しか増加しなかったとのことでした。
PagerDuty Operations Cloud
PagerDuty Advanceの日本語版提供が8月29日にベータ版として開始され、9月30日に正式リリースされることが発表されました。
学びの重要性
チームが予防的かつプロアクティブに行動する時間が不足している現状を指摘しました。そして、過去のインシデントから学ぶことがいかに重要であるかを強調し、インシデントを学習の機会と捉えるべきだと述べました。
Special Keynote ハイライト
IT批評家
尾原 和啓
シリコンバレーは一年間の進化を過大評価し、10年間の進化を過小評価する
とBill Gates 氏が述べていたとのこと。
2019から発生したコロナがDXを強制加速させ、その後、生成AIはこの2年半で変革を起こしました。
中国のアパレル会社SHEINは米国で生成AIを利用し、個人カスタマイズフィーチャーの投入などにより、50%ほどの売り上げの増加につながる事例を述べました。
正解主義から修正主義へのシフト
従来では、我々は一つの正解という結果、ゴールを設定し、それを達成するように努力をしてきましたが、変化が加速する現代において、迅速かつ安く結果を出すことがより重要になりました。そのため、求められるものを素早く作り上げ、それからより良い方向に修正していくフィロソフィーを共有しました。
変化が激しくなる時代において、予測不能な未来が激増するでしょう。
予測力を拡大することではなく、コントロール力を拡大し、予測不能な事態をコントロールできる未来を作ることが求められています。
iretセッション
弊社のMSPセクションのセクションリーダーの蓮沼さんも登壇しました。
よろしければぜひ記事を読んでいただけますと嬉しいです!
エンジニアセッション
本セッションはPagerDutyを導入されている企業の現場エンジニアがその背景と運用を共有するセッションです。
その中でイオンスマートテクノロジー株式会社さんのセッションが印象でした。
インシデント対応の“あるある”、あるいは「ステレオタイプ」(固定観念)は、皆さんも経験したことがあるのではないでしょうか?
スピーカーの斎藤さん(左)がそれらを回避、改善する方法を興味深くシェアされました。興味ある方はぜひXでチェックしてみてください!
今の時代でこうした“あるある”はおそらくドラマの中でしか見たことないかもしれませんが、今はほとんどなくなっていて、業界にとってはとてもポジティブなことですね!
Toast & Networking
その後、会場の参加者がスピーカーたちとコミュニケーションできる場として、立食宴会の形で開催されました。
会場はPagerDutyのテーマ色で溢れていました。
Lightning Talk
宴会を楽しみながら、ライトニングトークという5分間だけの短い講演を聞くこともできました。
その中、弊社のMSPセクションの江崎も登壇しました!
「MSP × Operations Consoleの活用法」をお題として、MSPがアラートを柔軟にフィルターできることをシェアしました!
よろしければその記事もチェックしていただけますと嬉しいです!
さいごに
本日のイベントで、弊社MSPと異なる運用をされている企業さんがいらっしゃることを知りました。
イベントを通じて発見したアイデアを吸収し、自社の運用保守体制にアドバンテージを加えることで、MSPセクションをさらに進歩させていきたいと考えています。