DX開発事業部の西田です!
昨日のキーノートで AWS 謹製の新モデル Amazon Nova の発表がありました!
モデルファミリーには、テキスト生成の軽量モデルの「Amazon Nova Micro」。
マルチモーダルの「Amazon Nova Lite」、「Amazon Nova Pro」、「Amazon Nova Premier」。
そして画像生成の「Amazon Nova Canvas」、動画生成の「Amazon Nova Reel」があります。
画像生成は以前からも Amazon Titan Image Generator がありましたが、動画生成は待ちに待った感があり早速この記事で試して行きたいと思います!
Amazon Nova Reelとは
Amazon Nova Reelは、テキストや画像から高品質のビデオを簡単に作成できるようにする動画生成モデルです。
カメラモーションコントロールなどのビジュアルスタイルとペースを制御するための自然言語プロンプトの使用と、AIの安全かつ責任ある使用をサポートする組み込みコントロールをサポートしています。
※公式サイトより意訳
テキストとベースとなる画像から短い動画を生成することができ、最大入力プロンプトのコンテキストサイズは512、対応言語は英語のみです。
ファインチューニングがサポート予定となっており、現在は6秒の動画のみ生成ですが今後2分にアップデートされる予定とのことです。
実際に Amazon Ads では Amazon Nova Reel を使った広告が作られているそうです。
気になるお値段ですが、オンデマンド利用は料金ページを確認すると1秒あたり$0.08となっています(解像度720p、24fps)。
よって6秒なら$0.48、将来的に対応できる2分(120秒)なら$9.60と意外とかかるので、実運用で使うなら無駄打ちを減らすような設計となるよう気を配る必要がありますね。
試し方
Amazon Nova Reel は現在はバージニア北部リージョンの Amazon Bedrock で利用可能です
対象リージョンの Amazon Bedrock のモデルアクセスから有効化することでアクセスが可能になります。
プレイグラウンドの「Image / Video」を選択します。
試してみる
プレイグラウンドからプロンプトを試してみます。
First person view of a motorcycle riding through the forest road.
※公式動画からプロンプトを拝借しました
生成には5分ほどかかりますが、森を走るバイクが一人称視点でバッチリ生成されています。
作成した動画は S3 に自動保存され、右サイドパネルに生成進捗と履歴が表示されます。
同じプロンプトでもシードを変えて生成することで、バリエーションがでます。
また元の画像を用意して、これを動画として動かすこともやってみます。
Amazon Nova Canvas でハンバーガーの画像を生成したので、これをカメラロールで動かします。
Camera rolls and rotates 360 degrees around the burger.
ハンバーガーの周りを、カメラが動いてる動画を作ることができました!
ショート動画を生成できるサービスは、これまでもSNSなどでLuma Dream MachineやPikaがバズっていました。しかしエンタープライズの領域で利用できそうなサービスは、まだ目立ったものがなかったので今後の活用事例の広がりに期待ができますね!