はじめに
クラウドインテグレーション事業部の吉村です。
AWS Summit Japanの1日目に開催された「AWSで生成AIアプリケーションを構築する時に役立つサービスと組み立て方を学ぼう」というセッションを視聴しました。
事例をもとに、生成AI導入における懸念点の解消方法や、スケーラブルなアーキテクチャの組み立てについて具体的に紹介されていたため、印象に残ったポイントを整理します。
お客様によって異なる生成AIに対する考え
セッションは、生成AIに対するお客様の姿勢が企業によって大きく異なるという点からスタートしました。
新技術をいち早く取り入れる速度重視
生成AIの技術を素早く評価・導入し、大規模なユーザー基盤や業務領域に短期間で展開していくスタンスです。
数週間という短い期間で新機能を実装したり、自社向けの大規模言語モデルをいち早く構築したりするなど、スピードを最優先に据え、競争優位の確立やノウハウの早期蓄積を図る取り組みが進められています。
便利な既存AIツールを活用する効率重視
生成AIを一から開発するのではなく、すでに提供されている信頼性の高いサービスを業務に取り入れることで、短期間での効果を重視するスタンスです。
通話内容の自動要約やコード生成支援、社内情報の統合管理など、既存のAIツールを活用して業務の手間を減らし、効率的に成果を得ることを目的としています。
十分な安全性が確実になるまで待つ安全性重視
生成AIを業務に活用するにあたり、誤生成のリスクや高コスト、著作権などの法的・社会的課題を慎重に見極めたうえで導入判断を行うスタンスです。
運用前に十分な検証を重ね、品質・コスト・コンプライアンスの観点でリスクを管理可能な状態にすることを前提とし、安全性と信頼性が確保されるまで本格展開を控える姿勢を取っています。
このようにスタンスが異なるため、それぞれの企業文化や方針に応じて導入戦略を検討しなければ、生成AIの価値を最大限に引き出すことはできません。
特に安全性に関する懸念は事業運営に直結する重大な要素ですが、それをカバーするためにはどのAWSサービスを活用すればよいのでしょうか。
懸念点を解消するために活用できるAWSサービス
Amazon Q Business
Amazon Q Business は、企業内のドキュメントと連携し、RAG構成に必要な機能が統合された、自然言語での検索・応答が可能な生成AIアシスタントを手軽に構築できるサービスです。
実際の利用企業からは「導入が非常に容易だった」という声があるそうで、業務部門主導でも展開できる柔軟性があります。
さらに、回答の精度は投入する文書の構成によって大きく向上するため、手軽に導入しつつ、適切な運用で高い正確性も実現でき、手軽さと精度の両立が可能です。
Amazon Bedrock
Amazon Bedrock は、単一のAPIで複数の大規模言語モデルを利用できるマネージドサービスです。
アプリケーション構築に必要なベクトル埋め込み生成、RAG構成、Guardrails などの機能も備えているため、コストを抑えつつ高精度な生成AIアプリケーションを迅速に構築できます。
AIアクセラレータチップ
AWS Trainium2
生成AIの学習に特化したインスタンスです。
大規模モデルを短期間かつコスト効率よく学習させることができます。
AWS Inferentia2
生成AIの推論に特化したインスタンスです。
高スループットかつ低レイテンシで推論処理を実行することができます。
これらを活用することで、130億パラメータを持つ大規模モデルを一からトレーニングするようなユースケースでも、従来と比較してコストを大幅に削減する事例が紹介されていました。
自社モデル構築により、サードパーティ依存による法的・社会的リスクを回避することができるようになります。
生成AIアプリケーションをスケールさせる組み立て方
スピーカーの方が、「基本的な生成AIアプリケーションは、EC2 と Amazon Bedrock の2つさえあれば構築できる」と仰っていたことが印象的でした。
ただ、実際のビジネス要件や利用規模に応じて、適切なスケーリングや構成の見直しが求められることもあります。
本番環境で運用する際に出てくる課題には、どのように対処すれば良いでしょうか。
コストを下げるには
最大のコスト要因は、生成AIが使用する永続的なデータの維持費用です。
生成AIのためのデータストアとしてキャプチャの3つのサービスが紹介されていましたが、コスト効率よく最小コストで始める場合は、OpenSearch Managed Clusterが適しているとのことでした。
リスクに対処するには
ストリーミング処理は、基本的に AWS Lambda と Amazon Bedrock の組み合わせで構成できますが、
その間に Amazon Bedrock Guardrails を挟むことでコンテンツフィルタを設け、安全性を高めることができます。
また、Guardrails は 同期・非同期の両方に対応しており、安全性を優先するなら同期処理、ユーザー体験を重視するなら非同期処理といった使い分けができます。
ちなみに、Amazon Bedrock Guardrails はセッション当日に日本語対応が発表されたとのことでした。
迅速に開発するには
GenU を活用すれば、構築済みのアセットで即座に開発を開始することができます。
データバックエンドやセキュリティもあらかじめ組み込まれており、プロンプト設計に詳しくなくても利用でき、素早く開発する際には非常に有効です。
実際に紹介されていた事例では、教育機関向けに1ヶ月で生成AIアプリを構築し、会議の議事録作成にかかる時間を1/4まで短縮したとのことでした。
まとめ
今回のセッションでは、生成AI導入のハードルと、それに対するAWSの具体的なサービスが整理されていて、とてもわかりやすかったです。
特に、「EC2とAmazon Bedrockだけで始められる」というシンプルさは印象的で、そこから柔軟にスケールできる構成も魅力に感じました。
AWS公式では150件以上の事例集も公開されているので、気になる方はぜひチェックしてみてください。
日本の生成 AI 事例集
https://pages.awscloud.com/japan-genai-case-studies-download-reg.html