こんにちは、セキュリティエンジニアの田所です。
現地参加した AWS Summit Japan 2026 のセッションの模様をお届けします。
セッションについて
AIM342 本番運用を見据えた AI エージェント – Amazon Bedrock AgentCore を活用したベストプラクティス
ビジネスで実際に活用する AI エージェントを構築する際に検討するべき内容は、AI エージェントのロジック、フレームワークや LLM の選定だけではありません。セキュリティ、ガバナンス、プロジェクトのスコープなど、多くを総合的に検討する必要があります。本セッションでは、AWS が学んだ 9 つの基本的なベストプラクティスを、Amazon Bedrock AgentCore の活用方法と併せて紹介し、AI エージェントを大規模展開するための指針を示します。
AI エージェント開発者を対象に、AWS が顧客フィードバックも取り入れて策定した 9 つのベストプラクティスを紹介するブレイクアウトセッションでした。

1. 本番運用への課題と AgentCore
プロトタイプから本番環境に進む際には、パフォーマンス、スケーラビリティ、セキュリティ、ガバナンスという 4 つの課題が立ちはだかります。

これらを乗り越えて AI エージェントを大規模に本番運用するための手段として、Amazon Bedrock AgentCore が強力な選択肢となります。
AgentCore は以下のような複数のコンポーネントで構成されます。
- 計算資源を確保する runtime
- 短期・長期の会話を記憶する memory
- アクセスを担う gateway
- 認証を扱う identity
- ポリシー制御の policy
- ブラウザ操作の browser
- コード実行の code interpreter
- モニタリングの observability
- モデル評価の evaluations

9つのベストプラクティスは、これらを「基盤を作る」「高品質に磨く」「継続運用する」の 3 つのフェーズに分けられます。

2. 基盤を作る
最初のグループは「基盤を作る」フェーズです。
エージェント開発の土台づくりにあたるルール1から4です。
ルール1は「課題から逆算して小さく始める」。
エージェントがやること・やらないことを定義し、期待する正解のやり取りをあらかじめ決めておきます。
たとえば財務分析エージェントなら、レポート生成やウェブ検索、データ分析といった機能を持たせます。
利用者目線では「2025年上半期の総利益は?」には答えてほしい一方、「同僚の給与は?」には答えてはならない、といった線引きが必要になります。

ルール2は「ツールと API 連携を計画する」。
ツールを明瞭かつ網羅的に定義し、入出力フォーマットを文書化しておきます。
エージェント間での車輪の再発明を避けておけば、次のエージェントを作るときにショートカットができる、という発想です。
ルール3は「オブザーバビリティを初日から設定する」。
後からデバッグや評価に時間がかからないよう、必要なメトリクス・ログ・トレースを取得できる設計に最初からしておきます。
ルール4は「エージェントの評価を自動化する」。
ここでは技術・ビジネス部門が早期から参加していることが重要だとされていました。
どう使われる想定か、何を良い回答とみなすかの認識を、関係者で合わせておくということですね。

ここまでの要素を盛り込んだアーキテクチャ例も示されました。
runtime から evaluations までが組み合わさり、observability でスパンやイベントフローを確認し、evaluations でモデルの回答を点数化する、という全体像です。

3. 高品質に磨く
次のグループは「高品質に磨く」フェーズです。
作ったエージェントの品質を高めるルール5から7です。
ルール5は「マルチエージェントを検討する」。
それぞれの役割とオーケストレーションの定義が肝心になります。
一つのエージェントに多数のツール呼び出しを詰め込むより、目的特化型でマルチエージェント化する方が、それぞれを簡潔に保てます。
ただし小規模なうちからマルチエージェント化すると、繋ぎ込みが煩雑になってしまう可能性もあるので注意、という補足もありました。

複数のエージェントが連携する構成では、AgentCore memory が会話のコンテキストを保持し、gateway が各種ツールへのアクセスをまとめる形が示されていました。

ルール6は「パーソナルエージェントをセキュアに構築する」。
ユーザーコンテキストやセッションの分離、セキュリティポリシーとガードレールの適用が挙げられました。
ルール7は「できるだけコードを使用する」。
コードは LLM 推論より速く、安く、決定論的です。
推論が必要なタスクのみエージェントに任せ、分岐のように確定的に表現できるものはコードで書く方がよい、という原則でした。
決定論と確率論を使い分けるこのルール7は、個人的に最近直面した障壁だったため勉強になりました。

4. 継続運用する
最後のグループは「継続運用する」フェーズです。
本番に出した後に運用し続けるためのルール8と9です。
ルール8は「何度も繰り返しテストする」。
継続的テストのパイプラインや、バージョン別の A/B テストが挙げられました。
こうした取り組みは重くなりがちですが、Bedrock AgentCore なら楽にできるとのことです。
新たに AgentCore optimization という機能も出たと紹介されていました。

ルール9は「組織体制を整え規模を拡大させる」。
エージェント開発の標準を定めるプラットフォームと、チーム横断の推進活動が必要になります。
作られたエージェントは AWS Agent Registry (Preview) で管理することも可能です。

このルール9のプラットフォームの話は、組織のどの役割が何をするかのデザインが必要です。
そのため「AI エージェントを開発するとは何か」というプロセスへの深い理解があって初めて成り立つものだと感じました。
まとめ
本番運用を見据えた AI エージェントの9つのベストプラクティスを、「基盤を作る」「高品質に磨く」「継続運用する」の3段階で見てきました。
ロジックやモデルの選定だけでなく、セキュリティやガバナンス、評価や組織体制まで含めて総合的に設計していく必要がある、という指針が一本の筋として通っていました。
決定論と確率論を使い分けるルール7の考え方や、開発を組織で支えるルール9など、個人的に大きな気付きが得られたセッションでした。
おしまい