こんにちは、セキュリティエンジニアの田所です。
現地参加している AWS Summit Japan 2026 からセッションの模様をお届けします。
セッションについて
AIM329 社内 AI エージェント展開の勘所 – AI の能力を組織で最大限引き出すための課題と打ち手
社内で生成 AI アプリケーションや内製のエージェントを展開する中で、これで AI の能力を最大限活用できているのだろうか、もっと効果的な進め方はないのだろうかと悩まれることも多いのではないでしょうか。本セッションでは、AWS がお客様と「社内での AI エージェントの展開」に取り組む中で得られた課題や打ち手を、汎用エージェントプラットフォームの全社導入と、エンジニアリングで作り込む業務特化型エージェントという2つの展開パターンを軸に整理します。AI エージェントの組織導入に取り組まれている方が、自社の現在地を把握し、次の一手を見つけていただける内容です。
すでに生成 AI を社内に導入している組織が、「次の一手」を見つけるためのヒントを整理するブレイクアウトセッションでした。

1. AI エージェント活用のいま
冒頭は「こんな状況、身近にありませんか?」という問いかけから始まりました。
全社にチャットボットが入って要約やレビュー、壁打ちには使えている。
でも「AI の恩恵ってこんなものだろうか?」と感じる。
一方でエンジニアが作り込んだエージェントは、構築と継続的なメンテが重くなってきている。
まさに、多くの現場で起きていることではないでしょうか。
いま生成 AI は「仕事を任せられる」方向へ進化してきています。
ざっくり辿ると、こんな発展になります。
- 言語モデル:テキストの続きを生成する
- AI アシスタント:会話に答える
- Function Calling:外部ツールを使う
- Reasoning モデル:筋道を立てて解く
- AI エージェント:自律的にタスクを完遂する

評価の物差しとなるベンチマークも、実務を想定したものが増えています。
ブラウザやファイル操作を横断的に評価する OSWorld-Verified では、スコアが 2024 年の 12% から 85% へと伸びたそうです。
こうした指標からも、AI が人間並みの水準に近づいていることがうかがえます。
進化することは喜ばしいことですが、本当に活用できているのか?もっと力を発揮できるのではないか?という問いも同時に現れます。

そして、活用が広がりきらない現実も指摘されます。
パイロットの 88% が本番環境につながらず、72% の経営層が AI 導入に課題を抱えているという数字が紹介されました。
「できること・できないこと」の境界が日々動く中で、組織としてどう向き合うか。

本セッションでは、「汎用エージェントプラットフォームの全社導入」と「業務特化型エージェントの作り込み」という 2 つの典型パターンに沿って、それぞれに有効な打ち手が提案されました。
2. 汎用エージェントプラットフォームの展開
1 つ目は、全社向けの汎用エージェントプラットフォームです。
導入直後の「一部しか使えない」「活用が広まらない」といった課題は、全社環境の整備やガイドライン、勉強会・事例共有で前に進みます。
ですが、それでも「本当に AI に大きな仕事を任せられたのか?」という問いは残ります。
活用方法が見つからない、使えるデータやサービスが限られている、という壁です。
その打ち手が AI-driven Business Process ReEngineering(AI BPR)、つまり業務を AI エージェント前提に組み替える発想でした。

「今の業務のボトルネックは?」と考えるより、組織・人・AI エージェントそれぞれの強みから役割を設計する方が効果的だといいます。
差別化されない業務は委譲し、競争優位の領域では卓越を狙い、人の強みは AI で強化する。
この「委譲・卓越・強化」の観点は、既存プロセスの改善・新規プロセスの設計どちらのケースにも当てはめやすそうです。

他に立ちはだかる壁として、データとサービスへの統合が挙げられます。
人が必要とする情報は、AI が同じ仕事をするときにも当然必要になります。

アクセス手段の候補として、ナレッジベース・MCP サーバー・デスクトップ型エージェントが挙げられました。
たとえば MCP サーバーで社内システムと連携する場合は、AgentCore Gateway がアクセストークンを束ね、AgentCore Identity が社内 ID プロバイダーと連携する構成が示されていました。

3. 業務特化型エージェントの展開
2 つ目は、エンジニアが作り込む業務特化型エージェントです。
代表例はワークフロー型エージェントで、速度・コスト・安定性に優れデバッグもしやすい反面、作り込みがボトルネックになりやすい、という整理でした。

ここで挙がった課題は 2 つです。
1 つ目は「評価が難しい」こと。
成功・失敗だけでは原因を追えず、意図理解やツール選択、計画の妥当性、安全性まで多観点で見る必要があり、しかも再現しづらい。
打ち手は、手動テストから評価ハーネスの構築・保守へと段階的に育てることで、Amazon Bedrock AgentCore evaluations の LLM-as-a-Judge を使えば多観点の評価が可能になります。

2 つ目は「運用コストが高い」こと。
ここがいちばん刺さりました。
打ち手は、作り込みを増やすのではなく、自然言語の指示書(スキル)とツールを与えて自律動作させること。
エンジニア以外でも修正・改善でき、運用負荷を抑えられます。
開発を抑えて運用の軽いエージェントにする、という方向性はとても腑に落ちました。

最後は、課題と打ち手を 1 枚にまとめた表です。
様々なフェーズの課題において、活用のヒントになるのではないでしょうか。
- 活用方法が見つからない → AI BPR
- 評価が難しい → AgentCore evaluations などを活用した多層の評価
- 運用コストが高い → 指示書とツールで自律化

まとめ
社内 AI エージェント展開の勘所を、汎用プラットフォームと業務特化型という 2 つのパターンから見てきました。
広く配るだけでは「大きな仕事を任せた」とは言えず、AI BPR による役割の再設計と、データ・サービスへの安全な統合がカギになります。
そして作り込みすぎず、指示書とツールで自律動作させて運用負荷を下げる発想が、これからの現実解になっていきそうだと感じました。
委譲・卓越・強化の観点は、自分たちの業務を棚卸しする際にもそのまま使えそうなので、現在地の確認から始めていきたいと思います。
おしまい