はじめに

【連載第13回】AIは「最高の相棒」。だが、優れた「都市計画(ITIL)」なくして“スマートシティ”は実現しない

前回、私たちは Amazon Q のような生成AIが、いかにしてクラウド運用担当者の「最高の相棒」となり得るか、その未来像を描きました。「自己修復」という都市の免疫システムと、「生成AI」という都市の神経系が連携し、私たち人間は、より創造的な「都市の脳」としての役割を担っていく。そんな未来に、ワクワクしていただけたなら幸いです。

「うちはAWSのMSPパートナーに運用を任せているから安心だ」——。

多くの企業が抱くその信頼感は、本当にあなたのビジネスの未来を守るものでしょうか?

本記事では、多くのビジネスにとって悪夢である「深夜の障害対応」という具体的なシナリオを通じて、クラウド運用パートナーの二つの異なる姿を浮き彫りにします。それは、契約書通りに動く「従来型MSP」と、ビジネス価値を守るために動く、私たちが目指すべき『次世代MSP』(To-Beモデル)です。

この記事を読み終えたとき、あなたは自社のパートナーシップがどちらの思想に基づいているのか、そして未来のために何をすべきか、明確な視点を得られるはずです。

この記事でわかること

  • 深夜の障害対応」という極限のシナリオで明らかになる、従来型MSPと次世代MSPの違い。
  • パートナーの責任が「契約書(SLA)」にあるのか、「ビジネス価値(SLO)」にあるのかという、根源的な思想の差。
  • 障害対応が「手動の再起動」で終わるか、「自動修復と未来の改善提案」に繋がるかという、行動の差。
  • あなたのパートナーが、未来を共創する「戦略的パートナー」たり得るかを見極めるための、具体的な「問い」

違いその1:責任の対象は「契約書」か、「ビジネス価値」か

最初の、そして最も根本的な違いは、パートナーが「何に対して責任を持つか」という思想にあります。

監視対象:サーバー(モノ) vs ビジネスプロセス(コト)

従来型MSPの役割を例えるなら、彼らは「指示されたルートを巡回する警備員」です。彼らの第一の責任は、契約書(SLA:サービス品質保証)と手順書に記載された通りの業務を、ミスなく遂行することにあります。

そのため、彼らが監視するのはサーバーのCPU使用率やメモリといった、契約で定められた「リソースの死活(モノ)」です。

一方で、私たちが目指す次世代MSPは、「都市の危機管理センター(兼 設計者)」です。彼らの責任は、契約書(SLA)を守ることは当然として、それ以上に都市の機能、すなわち「ビジネス価値(コト)」を守ることにあります。

彼らが監視するのは、例えば Amazon CloudWatch を通じて取得される「API Gateway の 5XXError レート」や「Application Load Balancer (ALB) の TargetResponseTime(ターゲット応答時間)」といった、ビジネスプロセスそのものの健全性に直結する具体的な指標、すなわちSLO(サービスレベル目標)です。

これは、「パートナーとして、何に責任を持つか」という、根源的な「思想」の違いなのです。そしてこの思想の違いが、危機的状況において全く異なる行動を生み出します。

違いその2:対応の起点は「手順書の実行」か、「ビジネスの即時回復」か

この思想の違いが、実際の障害対応でどのように現れるのか。「深夜2時:あるECサイトの障害シナリオ」を通して、その違いを鮮やかに描き出します。

状況: 金曜深夜2時、ECサイトの深夜セール中に決済サービスが応答不能になったとします。仮に、この機会損失が1時間あたり1,000万円と試算されるような、ビジネス上極めてクリティカルな状況だった場合、パートナーの対応によって未来は大きく分岐します。

【従来型MSP】電話越しの確認と手作業の再起動

従来型のMSPは、契約と手順書に基づき、忠実に行動します。

障害検知(深夜2:05)

  • 監視システムが「CPU使用率99%」のアラートを検知。

一次対応(深夜2:15)

  • オペレーターが手順書通りに顧客(あなた)へ電話連絡。「サーバーのCPUアラートが発報しました。手順書通り、再起動を実施してもよろしいでしょうか?」という許可を求めます。

復旧作業(深夜2:25)

  • あなたからのGOサインを受け、オペレーターが手動でインスタンスを再起動。一時的にCPU使用率は低下します。

この対応のゴールは「手順書通りのオペレーション完遂」です。

しかし、仮に根本原因(例:特定の不正アクセス)が解決されていなければ、深夜3時に障害が再発するリスクは残ります。その場合、朝には顧客からのクレームが殺到し、機会損失は甚大なものになるかもしれません。

【次世代MSP(To-Beモデル)】自動修復による10分でのビジネス復旧

私たちが目指す次世代型のMSPは、ビジネス価値の回復を最優先に行動します。

障害検知(深夜2:05)

  • CPUアラートと同時に、「決済APIのエラーレートが5%を超過」や「決済完了までのレイテンシが3秒を突破」といった、ビジネスKPIそのものの悪化(SLO違反)を検知します。

一次対応 / 自動修復(深夜2:10)

  • アラート(症状)をトリガーに、事前に設計された「自己修復アーキテクチャ」が自動で起動します。 例えば、Amazon EventBridgeがSLO違反アラートを検知し、即座にAWS Systems Manager Automation (SSM) のrunbookを起動。Runbookは、この障害パターン(例:特定IPからのリクエスト急増)に対応するよう事前に定義されたAWS WAFのルールを自動で有効化(または更新)し、脅威をブロックします。
  • 並行して、Amazon DevOps GuruやAWS Security Hubがこのインシデントの分析を開始し、その結果を事後の「問題管理」や「恒久対策」(違いその3で後述)のために集約します。

ビジネス復旧

  • 深夜2:15、異常リクエストが遮断され、SLO(決済APIのエラーレート)が正常値に回復。ビジネス影響はわずか10分に最小化されました。

この対応のゴールは「SLOの即時回復と機会損失の最小化」です。人間は深夜の確認や許可に介在せず、事前に設計された仕組みがビジネスを即座に守るのです。

違いその3:報告書は「過去の作業ログ」か、「未来への改善提案」か

障害が収束した後、提出される報告書の内容にも、思想の違いは明確に現れます。

報告内容:「何をやったか」vs「なぜ起きたか、どう防ぐか」

従来型MSPの報告書は、「アラート検知時刻」「お客様への連絡時刻」「再起動の実施時刻」といった、過去に行われた「作業ログ」の記録が中心となります。SLAで定められた通知時間を守り、依頼された作業を完了したことが報告の主体となります。

一方、次世代MSPの報告書は、ITILの「問題管理」プロセスに基づき、未来のリスクをプロアクティブ(積極的)に取り除くための「提案」となっています。その内容は以下の4つの要素で構成されます。

  1. 何が起きたか(インシデント): 決済SLOの違反(ビジネス影響の定量化)。
  2. なぜ起きたか(根本原因): 特定IP群からのDDoS攻撃(ログ分析結果)。
  3. どう対応したか(自己修復): 自動修復プロセスによるWAFでのIPブロック(仕組み化の成果)。
  4. どう防ぐか(恒久対策): Amazon Q (生成AI) による脅威パターンの分析に基づいた、より高度なWAFルールの適用や、AWS Well-Architectedの観点からのアーキテクチャ改善(例:スロットリングの導入)を具体的に提案します。

障害を「対処」して終わりではなく、同じ過ちを繰り返さないための具体的な改善策を提示することこそ、戦略的パートナーの責任だと私たちは考えています

観点 従来型MSP(警備員) 次世代MSP(危機管理センター)〈To-Beモデル〉
監視対象 リソース死活(CPU、メモリ) ビジネスSLO(応答時間、エラー率)
対応の起点 アラート(事象)発生 ビジネス影響(価値毀損)発生
ゴール 手順書通りのオペレーション完遂 SLOの即時回復と機会損失の最小化
主な手段 手作業(電話確認、手動再起動) 自動化(自己修復アーキテクチャ)
報告内容 「何をやったか」(作業ログ) 「なぜ起きたか」「どう防ぐか」(根本原因と改善提案)
関係性 サポーター(指示待ち) 戦略的パートナー(価値共創)
根底思想 契約(SLA)の遵守 ビジネス成果(SLO)へのコミット

まとめ:未来の対話を始めるために

ここまで見てきたように、従来型と私たちが目指す次世代型のMSPの違いは、単なる技術力の差ではありません。それは、「パートナーとして、何に責任を持つか」という根源的な思想の違いから生まれるものです。

あなたのパートナーは、契約書(SLA)という「過去の約束」を守ることに終始していませんか? それとも、ビジネス価値(SLO)という「未来の成果」を共に創り出す存在でしょうか?

この問いに答えるために、ぜひあなたのパートナーとの「対話の出発点」として、以下の質問を投げかけてみてください。

「SLA(契約)を守る関係」から、「いかにしてSLO(ビジネス価値)を共に最大化する関係になれるか?」

「障害報告(過去のログ)」の確認から、「いかにして未来の改善提案を議論する場に変えていけるか?」

このような未来志向の対話を始めることこそが、パートナーシップを次のステージへと進化させる第一歩です。

あなたのビジネスを単に「サポート」するだけの業者ではなく、あなたのビジネスの「未来」を共に創造するパートナーを選ぶこと。それこそが、あなたの「クラウド都市」の未来を決定づける鍵なのです。

次回予告

全15回にわたってお送りしてきたこの連載も、いよいよ次回が最終回となります。

これまで私たちは、「クラウド都市」という壮大な比喩を用いながら、その無秩序な発展(カオス)の理由を探り、ITILという「都市計画のOS」の重要性を再確認し、自動化やAI(免疫システムと神経系)といった未来の仕組みを構想してきました。

最終回となるVol.15では、これらすべての要素を統合します。

次回、【最終回】未来の設計図:AWS上で実現する”自律的サービスマネジメント”

ぜひ、最後までお付き合いください。

過去の連載はこちら

これまでのバックナンバーを見逃した方は、こちらからご覧いただけます。

クラウド運用に関するお悩みや、これからのパートナーシップのあり方にご興味をお持ちでしたら、どうぞお気軽にお声がけください。あなたのビジネスが直面している課題について、ぜひお聞かせいただけませんか。

クラウド導入実績 国内トップレベルの cloudpack クラウドの設計・開発・構築から 運用保守までトータルサポート