まえがき

みなさん、こんにちは大阪オフィス所属の上地です。
2024年11月15日(金)「Well Architected Mini Bootcamp for iret(運用上の優秀性 )in 名古屋」というアイレットとAWS共催のオフライン形式のセミナーに参加しましたので、体験レポートをお届けします!

このシリーズは3弾の人気企画です、関連の参加レポートはこちら!

『第1回 Well Architected Mini Bootcamp for iret(セキュリティの柱) in 東京』
『第2回 Well Architected Mini Bootcamp for iret(コスト最適化の柱 )in 大阪』

この記事がAWS Well-Architected フレームワークを理解するための、一助になれば幸いです。

「Well Architected Mini Bootcamp for iret」とは?

AWSがAPN(AWS Partner Network)の一員である企業を対象に定期的に実施している「AWS Well-Architected Partner Program Bootcamp」の特別版です。

セミナーの受講レベル

通常の「AWS Well-Architected Partner Program Bootcamp」はAWS認定の内プロフェッショナルレベルのエンジニア向けの内容ですが、今回のミニブートキャンプはアソシエイトレベルの知識が前提です。
AWS Well-Architectedフレームワークの柱に基づき、より実務に近い視点で学びを深めることができました。

AWS Well-Architected フレームワークとは?

クラウド上でアプリケーションやシステムを設計・運用する際の重要な概念、設計原則、ベストプラクティスを集約したものです。主に6つの柱が定義されております。

  1. 運用上の優秀性   ←今回はこちらの柱がテーマ
  2. セキュリティ
  3. 信頼性
  4. パフォーマンス効率
  5. コストの最適化
  6. 持続可能性

上述のフレームワークに沿ったクラウドアーキテクチャを目指すことで、信頼性、安全性、効率性、コスト効率に優れ、持続可能なワークロードをクラウド内で設計および運用するための、運用上およびアーキテクチャ上のベストプラクティスを学ぶことができます。

セミナーの概要

セミナー名

「Well Architected Mini Bootcamp for iret」

テーマ

「運用上の優秀性」

開催日時

2024年11月15日(金)14:00〜19:00

場所

アイレット株式会社 名古屋オフィス

弊社の参加メンバー

事業部と所属オフィス(東京・名古屋・大阪)の垣根を超えて、24名のメンバーで参加させて頂きました。


(名古屋オフィスでの写真)

またその内ファシリテーターとしてiret 檜垣 慶太が進行し、AWS 尾崎 周也さん・AWS 堀口さん ・iret 高橋 修一が参加者フォローという体制で開催されました。

Mini Bootcamp開始

当日のスケジュール (todo)

時刻 内容
14:15-14:45 ルール説明とお題読み込みタイム
14:45-16:00 グループディスカッションタイム
16:00-16:15 休憩
16:15-18:00 発表とQA
18:00-18:15 wrap-up(まとめ)
18:15-18:25 アイレットでのWell-Archtected活用の取り組み
18:25-19:00 なんでも相談会、フリータイム

Well-Architectedレビューの進行方法

今回も大まかな流れは以下のように進んでいきました。

  1. ルール説明とお題読み込みタイム
  2. グループディスカッションタイム
  3. Well-Architectedレビューの実施(各チーム内)
    • As-Is(問題点の抽出)
    • To-Be(理想の状態)
  4. Well-Architectedレビューの発表(各チームごと)
  5. 質疑応答&ディスカッション

1. チームの編成

4名のグループを5つ編成し、各チームに別れMini Bootcampが進んでいきました。
ちなみに私はDチームでした。

2. 自己紹介

チーム編成の後、まずは各事業部の所属と簡単な自己紹介から始めました。

今回はアイレット社員同士でも東京・大阪・名古屋オフィスの面々と初対面のメンバーが多く、ディスカッションタイムに入る前にまずはお互いをしっかり知ることを意識しました。

3. 与えられたシナリオの読み込み(各自)

※「与えられたシナリオ(架空の企業のシナリオ)」はネタバレとなるため省略します。

シナリオの読み込みは約10分ありました。
3回目の参加ということもあり割とスムーズに読み進めることができました。

「運用上の優秀性」では、
実施するレビューが11項目ありますが、事前にチームごとに担当の項目が割り振られていました。

私たちDチームで4,9,11の項目をレビューすることになりました!
以下表は各チームへの担当振り分けの項目になります。

4. Well-Architectedレビューの実施(各チーム内)

このステップでは、チーム内で2つのレビューを行いました。

  • As-Is(現状の問題点)
  • To-Be(理想の状態)

各チーム内でのWell-Architectedレビューでは、日々の運用業務での「あるある」について議論が白熱していました!

たとえば、長期運用中の手順書の属人化や、インシデント分析の不足、しきい値ベースのアラート対応に対する疲弊など、運用の課題についてが多かったです。

これらの課題を、どのAWSサービスやSaaSを使えば解決できるのか、または運用体制をどう変えれば良いかをチームで検討し、多くの気づきが得られました。

私が所属したDチームでは、特に手順書やWikiの属人化を防ぐ方法や、AWSリソースの構成管理の徹底について話が盛り上がり、O11y(オブザーバビリティ)向上に必要な監視メトリクスの設定についても活発な意見交換を行いました。
日頃からの運用課題に直結するテーマだけに、実践に結びつくアイデアを多く得られた有意義な時間でした。

5. Well-Architectedレビューの発表(各チームごと)

発表!色々検討した内容を提案しました!

6. 質疑応答&ディスカッション

このステップでは、各チームでまとめたAs-IsとTo-Beを発表し、その後チーム間でディスカッションを行いました。

「運用上の優秀性」というテーマに沿って、現状の問題点に対する理想の状態をアーキテクチャ構成図で発表しているチームやCCoE(Cloud Center of Excellence)といった新たな組織の構築をアイデアとして出てきたりと非常に豊富なアイデアが出されており、時間どおりに収まらない議論で盛り上がりました。

*参考:今から始める CCoE、3 つの環境条件と 3 つの心構えとは

業務に活かせそうな気づき

活発なディスカッションから得られた多くの気づきを、以下にまとめました。(シナリオのネタバレとならない範囲で..)

  • IaC管理とドキュメントの更新の重要性
    • 課題
      • IaC(Infrastructure as Code)化したAWSリソースでは、急な障害対応での手動修正がIaC未反映だと、再デプロイ時に変更が消去されてしまう。
    • 対応方法
      • AWSリソース修正時にドキュメントの更新を必須とするルール化や、TerraformやCloudFormationによる事前差分の確認を徹底する。
      • AWS Configによるリソース変更の追跡を監視する方法がある。しかし変更履歴の記録にはログ料金が発生するため、対象リソースを絞るなどの不要ログに対する考慮が必要
      • AWS ConfigではEC2インスタンスの構成変更は追跡できないので、内部のミドルウェア変更履歴をカバーするにはSystems Manager経由の作業に限定しておき解析用のログを保存しておくなどの運用が有効そう。
  • 手順書の属人化とナレッジ共有文化の構築
    • 課題
      • 運用あるあるのひとつで長期間の運用の場合、手順書やアラート対応の方法が属人化しやすい。
    • 対応方法
      • 知識の分散を促進する取り組みが必要
      • 具体的にはスキルトランスファーの実施や、インシデントのポストモーテム共有を定期的に行うことでナレッジ共有の文化を構築する。
  • 不要アラート多発によるアラート疲れ
    • 課題
      • しきい値ベースのアラート監視では、不要なアラートが頻発しメンバーの負担が増加しがち。
    • 対応方法
      • 提供しているサービスのKPIやSLO、SLAの基準を明確に設定し、ユーザー体験に基づくレスポンスやレイテンシの許容範囲を定めることで、プロアクティブな監視を実現する。
    • 具体的な実装手段
      • CloudWatch Synthetics(合成監視)やCanaryを用いて、ユーザー体験を再現しながらUI操作を監視することで、アプリやサービスのパフォーマンスのモニタリングを実現
      • APMやAWS X-Rayの導入により、アプリケーションのリクエスト単位での詳細な監視を行い、パフォーマンス改善に役立てる

*参考合成モニタリング (canary)

Canary はエンドポイントの可用性とレイテンシーをチェックし、読み込み時間のデータと UI のスクリーンショットを保存できます。REST API、URL、ウェブサイトのコンテンツをモニターリングし、フィッシング、コードインジェクション、およびクロスサイトスクリプティングによる不正な変更をチェックできます。

初参加メンバーへインタビュー!

今回初めてMini Bootcampに参加したCI事業部 MSPセクション 毛利
へ、参加前の意気込みと参加後の感想を聞いてみました!

参加前

CI事業部 MSPセクション 毛利
CI事業部 MSPセクション 毛利
私たちは日々、cloudpackの運用保守サービスを通して、お客様へ365日24時間のサポートを提供しています。
今回の『運用上の優秀性』セッションでは、運用業務に密接に関連するAWSのベストプラクティスを学び、日常の業務に役立つ知見を得られることを期待して参加しました。
本日少し不安もありますが、頑張ります!

参加後

CI事業部 MSPセクション 毛利
CI事業部 MSPセクション 毛利
とても濃い時間を過ごすことができました。

AWS Well-Architectedという存在はもちろん知っていましたが、今回のような機会がなければ正面から向き合い考えることはなかったかも?と思います。
他の参加者とのディスカッションや発表などからも、自分とは異なる視点や考えを知ることができ多くの刺激を受けることができました。

また、AWS Well-Architectedのベストプラクティスからは多くの気づきを得ることができ「学んだ教訓を文書化して共有する」や「改善に時間を割り当てる」などは、わかっていてもできていないことでもあり早速そこから始めてみようと思いました。

今回得た気付きを一つでも多く普段の業務に還元し、良い改善のサイクルを回していきたいです。

まとめ

今回の「Well Architected Mini Bootcamp for iret(運用上の優秀性 )in 名古屋」では、事業部と所属オフィス(東京・名古屋・大阪)を超えた交流を通じて多くの学びがありました!
私は3回目の参加でしたが、今回も新たな視点や知見が得られ、特に「運用上の優秀性」における課題解決に向けた意識が高まりました。

業務のなかでAWS Well-Architectedフレームワークを活用することで、運用課題にも活かせると感じています。
長期的な運用の属人化を避けるための取り組みや、監視設計における重要な指針を改めて理解する機会となりました。
今後の業務改善に役立てたいと思います!

最後まで閲覧いただきありがとうございました!

アイレット社内メンバーとAWSさんとの記念撮影