次世代MSPの土台を作る

こんにちは、

MSPチームのクリスです!

内部業務改善を担当しており、その経験を皆さんに共有したく、この記事を書かせていただきました!

cloudpackのMSP一次運用は、広い範囲の業務を抱えております。

MSPとは??となる方は、お先に下記の記事をご覧いただけますと幸いです!

なぜ自動化をする?

24時間365日の運用保守業務の中で、数え切れないほどの課題やチケットの問い合わせに対応し、数百件の案件から発報されるアラートの一次対応を行い、その上で対応漏れやミスがないよう日々の業務に取り組んでおります!

そのため、変化の激しい状況の中で、業務効率の向上と情報の透明性を確保するために、私はいくつかの仕組みを作り上げました。

  • 課題管理
  • SLO管理
  • 教育管理

 

課題管理

課題が流れないように管理する

MSPはお客様からの業務依頼、障害に関する問い合わせなどの窓口になっております。

依頼や問い合わせのメールをSlackで受信後、メンバーは順次対応していきますが、件数が多い場合は古い情報は新しい情報に埋もれてしまいます。

意識していないと気がつかずに流れてしまうリスク、対応途中で完了まで見届けられないリスクがあります。

 

それを防ぎ、かつ効率的に管理するため、Google Sheets の内製機能「Google App Script」を活用し、対応すべき課題を一元管理できるようにしました!

スプレットシートにSlackの複数チャンネルで検知した課題を一元的に表示させ、対応・引き継ぎのステータスで管理し、対応完了したものをシートの一覧から自動的に削除する仕組みになっています。

名付けて「Multi課題管理システム」!

 

SLO管理

SLO未達になったアラートをほぼリアルタイムで管理し、改善する

MSPといえば24時間の障害一次対応チームです。

アラート発生時、MSPチームは一次対応を行い、お客様へ報告をします。

そして報告までの目標時間を遵守できるよう常に努力しています。

ただ、さまざまな要因により目標時間を超えてしまう場合があります。

それらの経緯や原因を解析し、次回の改善に繋げられるよう、LookerというGoogleのBIツールを利用するシステムを組み上げました。

リアルタイムでSLO未達のアラートを抽出し、対応したメンバーの記憶が新鮮なうちに、SLO未達になった背景を記入してもらいます。

その後、監視システムを構築するチームと連携し、改善を提案します。

自社開発したAMSのおかげで、半数以上のアラートは自動的に解決されていますが、比較的に複雑で、人間の柔軟の判断が必要とするアラートは多々残っています。MSPチームがムラのないサービス品質を提供し続けられるようにするために、SLO未達になったアラートをアクティブに改善する必要があります。

 

教育管理

MSP研修の進捗管理を可視化する

MSPではGoogle Classroomを利用することで、ムラの少ない業務研修を実現しています。

しかし研修の進捗は入社時期や個人のこれまでの経験により異なるため、管理が難しいという課題がありました。

そこでGoogle ClassroomのAPIを利用し、MSP研修生の進捗を自動管理するシステムを作りました。

Looker Studio のダッシュボードに、研修生たちの状況を集計することで、研修生たちの進捗具合と業務内容の理解度を把握できます。

さらに、進捗具合を主動的に共有するために、Slackにリマインド機能を実装しました。

定期的に進捗状況をアナウンスし、教育担当がすぐフォローできる体制を作りました。

 

さいごに

これらのツールを活用して情報を一元管理すると、マルチタスクの負担は下がり、より迅速かつ正確に業務を行えるようになったと実感しています。

不要な手間を省き、余ったリソースを他の問題解決に向ければ、取り組みたい仕事にさらに集中できる好循環が生まれると思います!

 

問題解決をしている私のグループメンバーの活動も下記内容で投稿していきますので、よろしければご覧いただけますと幸いです!

そしてこんな私たちと一緒に活動したいメンバーを募集しております!詳しくは下記ページからご応募お待ちしております!!!

【未経験からクラウドエンジニアへ!】運用・保守・監視 ★AWS/Google Cloudパートナー★
【職種未経験歓迎!】研修充実★クラウドサポートエンジニア/テクニカルサポート★AWS/Google Cloudパートナー

一緒に楽しく問題解決して、楽しく仕事するのを楽しみにしています!