こんにちは、MSPの田所です。
AWS re:Invent 2024 が始まりました!
現場からイベント模様をお届けします。
セッション情報
Building the future of cloud operations at any scale
規模に関わらずクラウドを美しく運用する方法について語られました!
As technology evolves rapidly, business and IT leaders continue to ask: How do we operate at lower cost, improve efficiency, and enhance security and compliance posture while exceeding customer expectations? At AWS, we want to help every customer benefit from transforming their IT operations. Join this talk to learn how you can transform your IT operations to be more agile, resilient, efficient, and secure; make operations more intelligent to eliminate repetitive tasks; and get deeper insight for better decision-making. See a demo of the latest innovations, and explore impactful customer stories.
機動性、回復性、安全性を備えた賢いクラウド運用とはどんなものか、デモがありました!
Session types: Innovation Talks
1時間のイノベーショントークでした
今回のまとめ
- クラウド運用を3つのポイントに分けて紹介
- クラウドのガバナンス、オブザーバビリティ、分析をスマートに実現するための AWS Systems Manager, Amazon CloudWatch の新機能を発表
- 膨大なデータの関連付けと可視化、およびストレスフリーな UI が鍵
セッションの概要
クラウドの運用には以下の3つの重要なポイントがあると言います。
- ガバナンス
- オブザーバビリティ
- 分析
1. クラウド運用のガバナンス
まずガバナンスについてです。
しばしば、リソース利用状況の横断的な可視化、リソース活用の是正やコントロールが課題となります。
それに対して今回、AWS Systems Manager でリソース可視化や解釈をさらに楽にする新機能の発表がありました。
一部抜粋です。
AWS Systems Manager – Integrated with Amazon Q Developer
自然言語で設定状況を確認できるようになりました。
Declarative policies
「VPCのパブリックアクセスをブロックする」など宣言的なポリシー設定が可能になりました。
Resource Control Policies (RCPs)
「指定 Organization 以外の S3 アクセスを禁止する」などリソース単位のポリシー設定ができるようになりました。
またゲストスピーカーから、クラウド運用上のトラブルは以下の2つに分けられ、後者の対応が圧倒的に難しいと話がありました。
- Known unknowns:知らないと気付いていること
- トラブルの原因となるサービス、リソースが特定されている
- Unknown unknowns:知らないと気付いていないこと
- 何が原因か分からないが何か問題が起こっていそう
どのリソースでトラブルが起こっているか分かっていることは比較的対策が立てやすいですが、どこの何が原因か分からないトラブルはどこから手を付けるか考えるところから始める必要があります。
その中で今回の新機能を使えば、多くの設定不備の可能性を排除した状態で原因調査を始められます。
2. クラウド運用のオブザーバビリティ
次にオブザーバビリティについてです。
システムの状態を把握できる体制、事象のなぜを分析できる状況をいかに実現するかの話です。
その手助けとして新しい機能の発表がありました。
こちらも一部抜粋です。
Reports for AWS Fault Injection Service experiments
わざと障害を起こすレジリエンステストのレポートを作成可能になりました。
Amazon CloudWatch adds context to your telemetry data
追加設定なしで関連するテレメトリーを表示できるようになりました。
Enhanced observability for ECS in Amazon CloudWatch Container Insights
エージェントなしでコンテナレベルのダッシュボードやインサイトを活用可能になりました。
ゲストスピーカーによると、AWS でオブザーバビリティの実装だけではなく、対応の自動化にも力を入れてきたとのことでした。
その結果、パフォーマンスを高め、時間を圧縮できて言うことなしですね。
3. クラウド運用の分析
最後に分析についてです。
根本原因の特定の難しさや、分析をビジネス結果に結びつける難しさが挙げられていました。
それに対して今回の新機能発表は以下でした(一部抜粋)
Application transaction spans in Amazon CloudWatch
収集したトランザクションデータを柔軟に検索できるようになりました。
Zero-ETL for Amazon CloudWatch logs and Amazon OpenSearch service
CloudWatch logs と OpenSearch 間のデータ変換が不要になりました。
分析の下準備や分析そのものの労力を減らす機能で、関連データやサービスをまたぐ横断的な機能が充実してきています。
公式ブログ
早速公式ブログがアップされていました。
Top Announcements for AWS Cloud Operations at re:Invent 2024
MSPとして
1. 動線を美しくする
プレゼンテーションやゲストトークの中で、
「(分析に)コピー&ペーストすら必要ない」
という表現が何度か出てきていました。
新機能により関連データへの遷移が劇的に簡単になったという文脈だったのですが、MSPの普段の業務でも言えることであると感じました。
障害の分析や復旧対応において、きれいな動線を辿ることはとても重要です。
早く対応できるだけでなく、ミスを減らしたり、操作に必要な知識のハードルを下げることに繋がります。
美しい動線を辿るプロセスを意識したいものです。
2. データを関連付ける
データの関連付けを行うことで、分析の労力を減らす話がありました。
トレース、ログ、メトリクスについても言えることですが、アラートの傾向の分析や、社内インシデントの管理にも役立つコンセプトであると思いました。
どんなデータでも意味を持たせると、より効果的な活用が見込めると感じます。
おわりに
運用の話で、まさに MSP が聞きたいこと!という内容でした。
進化しているテクノロジーを活用することで、品質向上と効率化は両立できることを実感したセッションでした。
AWS re:Invent 2024 初セッションでしたが、ワクワクした始まりとなりました。
おしまい