2025年8月5日(火)開催の「Google Cloud Next Tokyo 2025」 に参加してきました!
その中で特に印象に残ったブースの体験談をご紹介します!
私が立ち寄ったブースはこちら!
手書きしたものが動画として生成されるとのことでした!
面白そうだったので、試してみることにしました!
何を書けばいいか分からず、Googleの方に尋ねると、「ドラえもん」というテーマをいただきました。
私が書いた「ドラえもん」がこちら・・・
書いてはみたものの・・・難しい・・・泣
ここからどんな動画が生成されるのか気になりました。
「シーンを生成」ボタンを押し、少し待っていると、どのような画像かを説明する入力欄が表示されました。
画像のように入力欄にはAIが構想した、画像の説明が出力されていました。
ここで自由に「どのような画像にするか」を入力できるようです。
生成された画像を基に、動画が生成されるとのことでした。
今回はそのままAIの構想通りとし、生成ボタンを押してみました。
待つこと数分
生成された内容は・・・
謎のドラえもんから、可愛い熊!が出力されました!!!
実際の動画はこちら
2025年8月時点では、8秒間の動画生成が可能です。
一般に1シーンが8秒と言われているため、8秒の動画が生成される仕様とのことでした。
https://gemini.google/overview/video-generation/?hl=ja
アーキテクチャ
アーキテクチャはこちら
画像説明で入力した内容を読み込んだGeminiがImagenプロンプトを生成し、Imagenプロンプトの内容を基に、画像が生成されるとのことでした。
また生成された画像を読み込んだGeminiがVeoプロンプトを生成し、Veoプロンプトの内容を基に、動画が生成されるとのことでした。
終わりに
今回の体験を通して、Gemini、Imagen、Veoなどの複数のサービスを組み合わせることで、手書きの絵から動画生成という驚くべき結果を得ることができました。
この体験で特に印象に残ったのは、どのようにサービスを組み合わせるかを考えることの重要性です。
単体のAIサービスではなく、複数のサービスを連携させることで、より創造的で実用的なソリューションが生まれることを実感しました。
また、どのようなことにAIが活用できるかを考えることも非常に重要だと感じました。
AIは私たちの業務を効率化するだけでなく、クリエイティブな面でも大きな可能性を秘めていると感じました。
今回のような手書きから動画生成という発想も、AIの新たな活用方法の一例だと思います。
今後もセミナーやイベントに積極的に参加して情報収集を行い、様々なAIサービスの組み合わせ方や活用方法を模索していきたいと思いました!
最後までお読みいただきありがとうございました!