はじめに
こんにちは!開発エンジニアのクリスです!
AWS Summit Japan に参加してきました!
数あるセッションの中でも、特に興味深かった「Amazon の事例から学ぶ生成 AI の実践的な活用と実装アプローチ」について、個人的な学びや気づきをレポートします。
生成AIの活用が「PoCの年」から「本番稼働の年」へと移り変わる中、コスト削減やカスタマイズといった具体的な実装のヒントが満載のセッションでした!
セッション概要
タイトル: Amazon の事例から学ぶ生成 AI の実践的な活用と実装アプローチ
登壇者: 田原 慎也 氏
アマゾン ウェブ サービス ジャパン合同会社
フィナンシャルサービスインダストリ技術本部 サービスソリューション部 ソリューションアーキテクト
このセッションは中級者向けで、Amazonの広告(Amazon Ads)における生成AIの具体的なユースケースと、その実装イメージを掴むことをゴールとしていました。
AI活用のシフト:使うべきか?から、どう活用するか?へ
2023年がPoC(概念実証)の年だったのに対し、2024年は本番稼働の年。
「AIを使うべきか?」という議論は終わり、これからは「いかにコストを削減し、どうやって自社向けにカスタマイズしていくか」という具体的な活用フェーズにシフトしている、という話からセッションは始まりました。
まさにその最前線を行く事例として、Amazonの広告事業で活用されている「AI Creative Studio」が紹介されました。
ユースケース:Amazon Adsを加速させるAI Creative Studio
Amazonで商品を検索すると、商品画像やタイトルが表示されますよね。 ユーザーにとって魅力的で、インパクトのある画像は購買意欲を大きく左右します。
しかし、広告主は常に「コンテンツギャップ」という課題に直面しています。
- ユーザーが求める視覚的にリッチなコンテンツの不足
- 季節やイベントに合わせたコンテンツ制作の時間・予算・専門知識の不足
- 古いコンテンツによる機会損失
これらの課題を解決するのが、AIによる画像生成機能です。
広告主は、管理画面から商品をいくつか選ぶだけで、AIが自動で4パターンの広告画像を生成。その中から1つを選んで、すぐにサイトに掲載できます。 さらに、ライブ画像生成や動画生成もワンクリック、わずか数分で完了するというから驚きです。
「画像生成を単純かつ容易にするツールは、広告主をサポートすると同時に、お客様が目にする広告をより魅力的で視覚的に豊かにするもうひとつの方法です。」 – Collen Aubrey, SVP Amazon Web Services
この言葉通り、AIが広告主と顧客の双方に価値を提供している素晴らしい事例だと感じました。
実装アプローチの裏側
では、どのようにしてこの仕組みを実現しているのでしょうか。 セッションでは、そのアーキテクチャについても触れられました。
画像生成の仕組み
上記がImage Generator の構成図になります。
その中枢は、Amazon SageMaker AI の画像生成推論モデルにあります。
画像生成推論
基本的な流れは以下のようになっています。
- 広告主は画像を生成したい商品を選択する
- AIが商品情報(特徴、既存画像など)を収集
- 収集した情報から、自動でプロンプトを生成
- 生成したプロンプトを基に、Text-to-Imageモデルで画像を生成
- 高解像度化(アップスケール)処理を行う
この一連の流れは Amazon SageMaker が中心となっており、AWS Lambda を使って生成されたプロンプトのフィルタや画像の後処理を行っているとのことでした。
責任あるAIの実現
AI活用で非常に重要になるのが、「責任あるAI」という考え方です。
不適切なコンテンツが生成されるのを防ぐため、多層的なフィルターを実装していました。
- Guardrails for Amazon Bedrock: PII(個人を特定できる情報)などを検出。
- Amazon Rekognition: 有名人が写り込んでいないかなどを検出。
- Amazon Comprehend: 不適切なテキストを検出。
- カスタムルール: 独自のルールに基づいたフィルタリング。
カスタムルールはLambdaで実装し、入力(プロンプト)と出力(生成画像)の両方でチェックすることで、安全性を担保しています。
最初から「責任あるAI」に投資し、再利用可能なビルディングブロックとして構築しておくことが重要だと強調されていました。
画像から動く画像へ、そしてプロトタイプから本番へ
画像だけでは、なかなか製品の臨場感を伝わらない場合があります。
より季節感にあった印象とクローズアップなどでユーザにインパクトするには、生成された画像をさらに生成AIで加工させ、ライブ画像を生成することです!
Live Image Generator: AIに生成された画像を動ける画像に変更すること。
また、プロンプト入力なしで広告主が直感的に画像を編集できる機能など、プロトタイプからどんどん本番利用へと進化させている様子が伺えました。
宣言的ワークフローとタスク
このアーキテクチャが強調される便利さはその簡素化されたプロセスにあります。
画像を取得し、ライブ画像を生成するという一連のワークフローはユーザーが簡単に必要なプロセスを宣言すれば出来上がります。
また、お気づきかもしれませんが、コードエディターの中にログの出力などは一切書かれていません。
なぜなら、それはビルディングブロック自体が裏でデータを収集し、ユーザが心配なくロジックに専念できるように設計されています。
さらに奥のことをできるのでしょうか?
さらに驚くべきは、AIが動画を生成する機能です。
基本的には画像生成のアーキテクチャを強化したもので、同じような仕組みで動画も作成できるとのことでした。
Amazon Nova Reel を利用し、プロンプトから6秒のシングルショットや最大2分のマルチショットの動画を生成可能です。
導入効果
実際にこの仕組みを利用した広告主は、目覚ましい成果を上げています。
特に広告された商品の数が5倍に増加され、広告キャンペーンの数が88%増加されるなど。
AIがいかにビジネスインパクトを与えているかがわかる、非常にパワフルな数字です。
気づき
生成AIの広告の画像制作により、単なる生産性の向上に留まらず、これまで時間やコストの制約で難しかった、一人ひとりの顧客に合わせたオーディエンス中心のクリエイティブを高いレベルで実現できるようになります。
結果として、ユーザーの記憶に視覚的に印象に残る広告を届けられるようになるとのことでした。
まとめ
今回のセッションで特に印象的だったのは、「再利用可能なビルディングブロック」と「責任あるAI」という考え方です。
特に「責任あるAI」は、最初にしっかりと投資して構築しておくことにより、新しい機能を開発するたびに同じチェック、フィルター、レビューを繰り返す必要がなくなり、開発スピードが格段に向上するのだと感じました。
生成AIを「どう使うか」という具体的なフェーズにおいて、非常に実践的で学びの多いセッションでした。
さいごに
今回のセッションを通じて、「責任あるAI」への強いこだわりと、AWSが掲げるセキュリティを最優先する姿勢を改めて感じました。
特に印象的だったのは、開発の初期段階からその思想を「ビルディングブロック」として組み込んでおくというアプローチです。これこそが、安全かつイノベーティブなシステムを生み出すための鍵なのだと再認識させられました。
このセッションで得た学びを、社内の業務にも取り入れ、より信頼性の高いシステムの構築に貢献できるように頑張りたいと思います。