みなさん、こんにちは!MSPの村上です!
私は監視業務を行う中で、初めてみるアラートにドキッとさせられたり、大量のアラートに押しつぶされそうになったり…これまでたくさんの経験をしてきました。
日々たくさんのアラートが発報されるわけですが、全てのアラートを人間の手で対応するのには限界があります。
アイレットでは、システムによる自動監視(AMS)と有人による監視によるダブルチェック体制で、24時間365日お客様のシステムを見守っています。
※AMS(Advanced Monitoring System)はアイレットが開発した次世代監視基盤
基本的にはAMSが作動していて品質担保されている中、最後のところは有人で対応しているんです。
AMSのおかげで有人で対応するアラートは減少傾向にあります。
しかし、その中でも有人対応が必要なものが必ずあるんです。
そこで今回は、その有人対応の際に、いかにしてヒューマンエラーを防ぎ、品質向上を保っているか、
私が実践している「アラート対応でミスを減らすための5つのTips」を紹介していきたいと思います。
Tips 1:自分のキャパを把握して、アラート対応数をコントロールする!
アラート対応で大切なのは、まず「自分のキャパを把握すること」です。
一度に処理できるアラートの数には限りがありますよね。
自分のキャパを超えてアラート対応しようとすると、どうしてもミスが発生しやすくなってしまいます。
私も、新人時代は「全部のアラートに完璧に対応しなければ!」と意気込んで、キャパオーバーになってしまい、ミスを連発した経験があります…。
そこから学んだのは、「無理せず、落ち着いて自分のペースで対応することの大切さ」です。
アラートの発生状況や自分の体調などを考慮しながら、対応するアラート数をコントロールするようにしましょう。
自分のキャパを把握し、無理のない範囲でアラート対応を行うことが、ミスを減らす第一歩だと私は思っています!!
Tips 2:手順以外のことが発生したら、必ず立ち止まって確認する!
アラート対応をしていると、手順書に記載されていない事象に遭遇することがあります。
例えば、
「あれ?このアラート、昨日見たのと違うな…」
「このエラーメッセージ、初めて見たかも…」
といった場合です。こんな時、焦って対応してしまうのは危険です。
まずは落ち着いて、状況を整理しましょう。
そして、「これは手順書にないことだ」と認識したら、必ず立ち止まって、先輩や同僚に相談したり、マニュアルやドキュメントを調べたりして、対応策を確認するようにしましょう。
手順書にないことだからといって、自己判断で対応してしまうのはNGです。
必ずチーム内で情報共有し、連携して対応方法を確認してから進めるようにしましょう。
Tips 3:手順書通りに実施!自分の記憶はアテにしない!
「このアラート、昨日も見たな…確か、あのコマンドを実行すればOKだったはず!」
なんて、自分の記憶を頼りに対応するのは絶対に危険です!人間の記憶は、意外と曖昧なもの。
「あれ?このアラートは、確か○○だったはず…」
そうやって自分の記憶を頼りに手順を進めると、ミスにつながることがあるんです。
だから、どんな時でも、手順書に記載がある通りにすすめること!あれ?と思ったら立ち止まってみること!
そして、手順書は常に最新版確認すること。数分前に手順書が更新されていた、、なんてことはよくあることです。
Tips 4:F検索は正義!徹底的に検索する!
アラート対応をするときはどんな些細なワードでもF検索をしてみるのがおすすめです。
※F検索とはMacのcmd+FでchromeやBacklog上などで検索すること
エラーメッセージやアラート内容をキーワードにして、徹底的に検索してみましょう。
同じような状況で困っている人がいなかったのか、何か解決策はないか、探してみるのです。
F検索は、インフラエンジニアにとって必須のスキルと言えると思っています。
F検索のコツとしては、
- 検索するキーワードを明確にする
- 部分一致検索や完全一致検索を使い分ける
- 検索範囲を絞り込む
などを意識すると良いと思います!
F検索を上達させることで、問題解決のスピードを格段に上げることができちゃいます!
Tips 5:どんな場面でも基本動作を怠らない!
アラート対応で、どんなに焦っていても、どんなに忙しくても、基本動作を疎かにしてはいけません。
もう一度言います!!どんなに状況だったとしてもです!!
日頃から行なっている基本動作を徹底することで、ミスを未然に防ぐことができます。
また自分なりのアラート対応のルーティンを確立することで、より効率的かつ正確に対応できるようになります。
得意不得意は人それぞれです。ぜひ自分なりのアラート対応のルーティンを試行錯誤して確立してみてください。
最初は大変ですが、習慣づいてくると自然と身につき、いつどんな時でも基本動作を怠ることなくアラート対応ができるようになると思います。
まとめ
今回は、私が日々のアラート対応で心がけている5つのTipsを紹介しました。
これらのTipsが、少しでも皆さんのアラート対応のヒントになれば嬉しいです♪♪
アラート対応は、決して楽ではありませんが、システムの安定稼働を守る上で、とても重要な役割を担っています。
自信を持って、日々のアラート対応に取り組んでいきましょう!!