はじめに
Global Solutions事業部の緒方です。
AWS re:Invent 2024に現地で参加しています。
今回は [AIM389 | Creative content generation with Amazon Nova Reel & Amazon Nova Canvas] に参加しましたので内容を紹介します。
AWS re:Invent 2024とは
AWSが主催する年次カンファレンスで、主にクラウドコンピューティングに関する最新情報を発表し、エンジニアに限らず様々なロールの人や様々な業種の企業が集う大規模イベントです。2024年は12月2日から12月6日にかけて、アメリカ・ラスベガスで開催されます。
セッション
セッション概要
AIM389 | Creative content generation with Amazon Nova Reel & Amazon Nova Canvas
このセッションでは、Amazon Bedrock の Amazon Nova ビデオおよび画像ジェネレーターの革新的なコンテンツ作成機能を紹介します。画期的な Nova ビデオジェネレーターを体験してください。このジェネレーターは、比類のない視覚的および時間的一貫性を備えた、最長 2 分間の高品質でリアルなビデオを作成します。マルチシーン ビデオを細かく制御するための独自のストーリーボード機能について学びます。また、最先端の画像生成と編集を提供する Nova 画像ジェネレーターについても説明します。これらの機能が、最先端のビジュアル コンテンツ作成ツールで顧客を支援する方法を学びます。このセッションに参加して、AI 駆動型ビデオおよび画像生成の未来を切り開きましょう。
Ashwin Swaminathan, Director, Applied Science, Amazon
Veerdhawal Pande, Principal Product Manager, Amazon
Satoru Yamamoto, Executive Officer, Dentsu Digital Inc.
Rohit Mittal, Product Manager, Amazon
セッション内容
Novaのインスタンスタイプの紹介。
Amazon Nova Canvas は、高品質な画像生成と編集を可能にする最先端の画像生成モデルで、プロンプトを活用して最大2048×2048ピクセルの画像を生成できます。DALL-E3など他のモデルと比較して優れた性能を発揮し、コンテンツフィルタリングや透かしなどの不整利用に対する機能を備えているものです。また、Amazon Bedrock API を介して多様な業界アプリケーションに統合可能で、近日中にカスタマイズ機能も追加される予定とのことです。
Amazon Nova Canvas の利点
・最大2048×2048ピクセルの高解像度画像を生成
・テキストから画像を生成したり、編集機能(インペインティング、背景除去など)が充実
・コンテンツの透明性と安全性を確保したまま、独自のニーズに合わせた微調整が可能
いろいろな比較をされていますが、Amazon Nova Canvas の良さがわかりますね。
その他の豊富な機能(予定も含む)として以下紹介がありました。
・テキストから画像生成、カラーコントロール、バリエーションの調整機能
・インペインティング、アウトペインティング、背景やオブジェクトの削除・置換が可能
・将来的に多様なユースケースに対応
便利な生成 AI ですが、有害なものを作らないための機能も準備されています。
「A dinosaur sitting in a tea cup」というテキストからの生成例。文面からの画像生成の精度はかなり高いように感じました。
「A portrait of a smiling young woman with long, flowing hair, standing in natural sunlight」というテキストからの生成例。少し長いインプットとなっても人間がそのテキストから受取るイメージにかなり近いものが生成されていると思いました。
インペインティングの例。
アウトペインティングの例。
コンディショニングという、インプットの画像とプロンプトをもとに条件付を行ない画像生成した例。テクスチャは似たまま、別の画像が高い精度で生成されていたと思いました。
これもコンディショニングの例。
HEXカラーコードでの色の指示ができます。
対象物以外の背景除去の例。カニだけを対象物だと上手に捉えていてすごいです。
機能の合わせ技での生成例。
こちらも機能の合わせ技での生成例。
Amazon Nova Real の特徴が紹介されました。
・テキストや画像から高品質なビデオを生成し、今は6秒までだが将来的に2分まで対応予定
・カメラのモーションコントロールにより、様々なユースケースに利用可能
・広告分野などで効果を発揮、今後は高解像度・編集機能を追加予定
電通様の事例紹介もございました。
パフォーマンス、コストともに大幅に改善された事例の紹介がありました。
Amazon Novaファミリーの今後の展開の紹介がありました。
・多言語対応の音声生成や自然な会話が可能
・ダイアログや文脈に応じスムーズな音声生成を実現
・ストリーミングAPIやバッチ処理機能を強化し、リアルタイムと大容量データの両方をカバー
さいごに
2024年12月19日(木)18時より、「AWS re:Invent 2024」のポイントを解説する「AWS re:Invent 2024 re:Cap presented by iret」を開催します。 |