2016年10月14日に開催された『cloudpack LIVE』のレポートその2です。

今回は、前回お伝えしたcloudpack LIVE 2016レポート#1の続きで、第2セッション『運用/次世代MSPへの取り組み』についてお伝えします。

cloudpackのMSPは如何にして安定運用を実現しているか

cloudpackのMSPは如何にして安定運用を実現しているか
新谷 充

私たちはお客様のチームの一員です

『cloudpackの運用』を説明すると、この言葉がすべてかもしれません。

実際にcloudpackに運用をご依頼いただくお客様ごとに、依頼する理由があります。

  • サーバー構築をできる人材がいない
  • アプリ開発のリソース確保で精一杯
  • 24時間365日サーバー運用ができない
  • サーバー周りの作業から解放されたい

これらはいくつもある理由の例にすぎません。どのような事情であれ、お客様のお困り内容に応じて、サーバーの構築から監視設定や、緊急時にいつでも対応ができるようにcloudpackでは24時間365日メンバーが待機しています。

だからこそ、私たちの一人ひとりが『お客様のチームの一員』であると考えて日々の運用業務にあたっています。

私たちはお客様のチームの一員です

cloudpackは ただのアウトソース先ではなく、お客様のサービスを一緒に運営するメンバー という自覚を持ってサーバー運用を行っているのです。

管理するサーバーは増加の一途

2010年から開始したcloudpack事業も7年目に突入しました。

運用しているサーバーの台数は約6,200台、毎日上がるアラート通知も合計すると約23,000通/月(2016年8月時点)と、事業開始当初と比べるとだいぶ増えました。

数が増えたことで、お客様の立場でみれば「自分達のサーバーをちゃんと守ってくれるのか?」「依頼に対してスムーズ対応いただけるのか?」など不安になるかもしれませんよね?

お客様の環境を運用システムに統合

cloudpackのMSPでは、自社開発の独自ツールやさまざまなSaaSを導入して監視漏れがゼロになるように対策しています。

ツールをうまく活用することで、人力による作業もだいぶ減りましたし、自動化は日々進んでいます。 まだまだサーバーの台数が増えても対応できる余裕がある ことをお伝えしました。

SREから次世代MSPへ

SREから次世代MSPへ
石田 知也

cloudpackの『SRE』とは?

そもそもSREって何でしょう? MSPと何が違うの?

cloudpackの『SRE』とは?

SREという言葉は、2年前くらいから聞かれるようになった言葉で、恐らく一番はじめに使い始めたのは、Googleだったのではないかと思います。

SREは、Site Reliability Engineering(サイトを安定運用するためのエンジニアリング)ですが、cloudpackでは提供するサービスの特性から、サイトだけの安定運用では不十分であるため、 Service Reliability Engineering(サービスを安定運用するためのエンジニアリング) という位置付けで、特定の期間またはイベントに対応する専門チームとして組織化しています。

SREの約束『サービスを絶対に落とさない!』

SRE Team Misson

SREチームとしては、サーバー構築や監視・運用保守はもちろん、構築と運用を結ぶ DevOpsを重要視 しています。 お客様のサービスを落とすな! と考えている以上、監視アラートが上がってから反応するのでは遅いからです。

監視アラートが上がる予兆をとらえ、負荷の上昇などを予測して対応するために、限りなく自動化を行い、運用負荷低減と作業ミスを防止することに重きをおいています。

なお、自動化することでできた時間を使って、まだ人にしかできないことに注力します。例えばJリーグ様の場合、その日の試合の組み合わせや順位変動、天候からどのような負荷がかかるかを予測して、インフラ準備の精度を上げています。(じきにこの分野もAIが正確に予測してくれるようになるはずですけれどね)

さらに最近の新しい試みとして、CPUやメモリなどのさまざまなメトリクスの監視の中で、微かな異常に対しても対処できるように、通常の予兆と現在の推移との相関関係で異常がみられる場合にアラートが上がる 機械が予測 する仕組みを導入しています。

cloudpackの目指す『次世代MSP』とは

2016年10月、cloudpackはAWSの次世代MSP認定を受けました

AWSのMSP認定は、このタイミングでバージョン3に上がり、以下の要件が追加されており、cloudpackはこれら要件を満たしているとして認定を受けました。

  • DevOps、プロアクティブ監視、顧客環境の合理化された管理における継続的な革新を提供するためのツールを有すること
  • 従来のしきい値監視だけではなく、日々の状況に基づいて予測的な障害検知をツールにより実施できること

次世代MSPはcloudpackが具体化していきます

cloudpackのSREチームが有するノウハウや経験をデータ化し、人力部分の自動化を進めることで、さらにMSPの品質を向上していく取り組みを行っています。

他社にはない新たな価値 が一日も早くお客様にご提供できるよう、cloudpackのMSPは、日々進歩していくのです!

今までどおりの安定運用はもちろん大切ですが、日々進化していく技術とcloudpackのノウハウを融合するからこそ実現できる 新しい価値 が、きっとまもなく当たり前のものとして提供されます。その日をお楽しみに!

cloudpack LIVEレポートは、まだまだ続き…ます。(頑張ります!)