Gemini Omni 動画生成のやり方｜日本語化・生成中で終わらない時の対処法【広報が検証】

こんにちは！広報の羽鳥です。

私はこれまで、Gemini の機能について、スライド生成や音楽生成などを試してきました。

あとは動画生成だなと考えていたところ、2026年5月19日の Google I/O 2026 で 「Gemini Omni」 が発表されました！

テキストを入力するだけで Gemini Omni で動画生成ができて、しかも会話形式で編集もできるらしい。
「これは試すしかない！」とチャレンジしてみました。

ちなみに結論から言うと・・・満足する動画は作れませんでした（笑）。

でも、だからこそ伝えたいリアルな情報がたくさんあります。
これから Gemini Omni の動画生成を試してみたい非エンジニアの方に向けて、つまずいたポイントも含めて正直にお伝えしますね。

先にこの記事の要点だけまとめておくと、こんな感じです。

生成が終わらない・画面が固まったように見えたら、まずはページをリロード。
日本語の動画にしたいときは、チャットで「日本語の動画にして」と送るだけでOK！
ただし日本語音声の発音はまだ発展途上で、満足できる動画に仕上げるにはひと工夫いる、というのが正直なところ

詳しくは、このあと実際の画面を見せながら順番に解説していきます！

※ Gemini Omni については、速報で KDDIアイレットのエンジニアがレポートしてくれています。こちらの記事の中ではしっかり動画が生成できているのでご安心ください！

参考：【Google I/O 2026】Gemini Omni とは？Veo との違いや強み、生成できる動画まで徹底解説！

Gemini Omni とは？動画生成 AI として何ができるのか

Gemini Omni は、Google DeepMind が開発した新しいマルチモーダル動画生成 AI モデルです。2026年5月19日の Google I/O 2026 で発表され、第一弾として 「Gemini Omni Flash」 が同日よりグローバルに順次提供開始されました。

Google 公式ブログではこう説明されています。

Gemini Omni は、動画をはじめとして、あらゆる入力から様々なものを創り出すことができる新しいモデルです。画像、音声、動画、テキストを自由に組み合わせて入力し、Gemini が持つ現実世界の知識に基づいたハイクオリティな動画を生成することができます。
Gemini Omni を発表

Gemini Omni Flash の主な特徴

マルチモーダル入力：テキスト・画像・音声・動画を組み合わせて入力できる
会話型編集：生成した動画を「背景をもっと明るくして」「カメラを引いて」と自然な言葉で何度でも修正できる
一貫性の維持：キャラクターや背景の特徴を保ちながら編集できる
SynthID 自動付与：すべての生成動画に AI 透かし技術が自動で埋め込まれる

Gemini Omni と似た名前の「Veo」というモデルとの違いについては、アイレットのエンジニアが詳しく解説してくれています。機能の詳細が知りたい方はこちらもぜひ！

参考：【Google I/O 2026】Gemini Omni とは？Veo との違いや強み、生成できる動画まで徹底解説！

Gemini Omni の動画生成はどのプランで使える？

実際に試す前に、まず使える環境を確認しました。

プラン	動画生成の可否	備考
Google AI Plus / Pro / Ultra	利用可能	個人向け有料プラン
Google Workspace 契約	利用可能	動画生成を選ぶと Gemini Omni が使える
YouTube Shorts / YouTube Create	無料で利用可能	無料でお試し可能
Gemini 無料プラン	制限あり	一部機能は有料プランのみ

私は会社で契約している Google Workspace の Gemini から試しました。動画生成のボタンを押すと Gemini Omni が使える状態になっていました！

Gemini Omni 動画生成が終わらない・できない時の対処法

このあと体験談でも詳しくお話ししますが、実は私も最初、画面が「生成中」のまま固まってしまい、かなり焦りました。
同じところでつまずく方が多いと思うので、先に対処法だけまとめておきますね。

ページをリロードする（これが最も効果的！）
- 生成自体はバックグラウンドで進んでいても、画面の表示だけが更新されていないことがあります。固まって見えたら、まずリロードしてみてください。
混雑しにくい時間帯に試す
- リリース直後はサーバーが混み合い、生成に時間がかかることがあります。日本時間の早朝・深夜など、混雑しにくい時間帯がおすすめです。
1日の生成上限に達していないか確認する
- 生成回数の上限はプランごとに異なります。上限に達すると、その日はそれ以上生成できなくなります。
そもそも動画生成ボタンが出ない場合
- これは回数の問題ではなく、機能がまだ有効化されていない可能性があります。同じプランでも段階的に提供されるため、アカウントによって使えるタイミングがずれることがあります。数日待つか、Workspace をお使いの場合は管理者に確認してみてください。

それでは、実際にどんな流れで動画を作ったのか、体験談をご紹介します！

【実録】Gemini Omni 動画生成やってみた

1：Gemini in Chrome でプロンプトを作る

生成 AI で何かを生成してもらう時のコツ、それは プロンプトを生成 AI に作ってもらうこと。

ということで、先日記事で紹介した Gemini in Chrome を活用してプロンプトを作成してもらいました。

参考：広報担当が試した、Gemini in Chrome の使い方｜Web 版 Gemini との違いから実際の活用法まで解説

開いているタブの内容を読み込んでもらいながら、動画生成用のプロンプトを作ってもらう作戦です。Gemini in Chrome にこう送りました。

「開いているタブのプロジェクトの PR 動画を作成したいです。動画生成 AI に送るプロンプトを作成してください。必要な情報は質問をして収集してください。」

すると Gemini in Chrome がタブの内容を読み取りながら、「どんな雰囲気の動画にしたいですか？」「ターゲットは誰ですか？」と質問で情報を引き出してくれました。

個人的に質問してもらうことで必要な情報を順番に聞き出してくれるのでおすすめです✨

2：プロンプトを Gemini Omni に送信

ステップ 1 で生成されたプロンプトを Gemini Omni に送信するだけです！

実際に送ったプロンプトはこちら（英語版）：

Cinematic documentary style, a modern tech office in Tokyo. A group of passionate young Japanese engineers are gathered in a meeting room, listening intently to a charismatic leader (VP). The atmosphere is full of anticipation and determination. Natural soft lighting, shallow depth of field, 35mm lens, photorealistic, emotional and inspiring tone. –ar 16:9

日本語に訳すとこんな内容です：

映画のドキュメンタリー風。東京にあるモダンなテック企業のオフィス。情熱に満ちた若い日本人エンジニアたちが会議室に集まり、カリスマ性のあるリーダー（副社長）の話を真剣に聞いている。室内には期待感と決意が満ちあふれている。自然で柔らかい光、浅い被写界深度（背景のボケ）、35mm レンズ、フォトリアル（写実的）、感情的でインスピレーションを与えるトーン。–ar 16:9

完成…のはずが、1時間待っても「生成中」のまま

英語の方がしっかり内容に沿った動画が作れるかと思い、英語版のプロンプトを送信！
業務の合間にちらちら確認しながら待っていたのですが、1時間以上経っても画面は「生成中」のまま。

「壊れた？」「プロンプトが長すぎた？」「何か間違えた？」と不安になりながら、他の業務をしながら横目でちらちら確認し続けました。

いやいや、さすがに長すぎでしょ！と思い、ページをリロードしてみたら、動画が完成していました！

動画の生成自体はバックグラウンドで進んでいたのに、画面の表示が更新されていなかっただけでした。
「生成中」のまま固まって見えても、リロードすれば完成している場合があります。

というわけで、固まったように見えてもリロードで解決することが多いです。焦らず試してみてくださいね。

Gemini Omni の動画を日本語にする方法【日本語化のやり方】

完成した動画を見てみると……

英語じゃん！

Gemini in Chrome が作ってくれたプロンプトが英語ベースだったため、動画も英語で生成されてしまいました。

やり方は「日本語の動画にして」と送るだけ

ここで Gemini Omni の会話型編集の出番です。チャットにシンプルに「日本語の動画にしてください」と送りました。

結果：日本語の動画に変更されました！ 👏

生成し直さずに言葉で指示するだけで修正できるのは便利です。

ただし、日本語音声の発音には注意

発音・イントネーションが不自然で、聞き取りにくい部分がありました😭

現時点では、Gemini Omni の日本語音声はまだ発展途上という印象でした。
なお、字幕やテロップなど日本語テキストの表示はしっかり対応しているようなので、「音声はナレーションなし＋テロップで見せる」といった工夫で回避するのも手かもしれません。

実際に使ってみた正直な感想

#副社長の社内開発プロジェクト、私個人的にも一押しのコンテンツなので、かっこいいドキュメンタリー風の動画ができると嬉しいなと期待していたのですが、あまり満足のいく動画は生成されませんでした。

（頭の中では副社長が登場して、キラキラの目をしたプロジェクトメンバーたちが AI を活用して会議室予約システムを完成させてわーーい！ってなっている完成系がイメージできているのですが、それが実現できない……）

現在、1日の生成上限（プランごとに異なる）があり、私は1日に3つまでしか作成できないため、まだまだ挑戦中です💪

ただ、Google 公式ブログを見るとクオリティの高い動画が紹介されているので、工夫を凝らして満足できる動画生成に引き続き挑戦していこうと思います！

完成したらまた記事で紹介しますね！

まとめ：Gemini Omni 動画生成、やってみてわかったこと

項目	実際のところ
操作の難しさ	会話するだけで OK なので簡単！
生成までの時間	混雑時は時間がかかる。固まって見えたらまずリロード
日本語対応	日本語化は可能。ただし発音に不自然さあり。

リリース直後ということもあり、まだまだ改善が続いていくと思います。今後のアップデートにも引き続き注目していきたいです！

それでは最後までお読みいただきありがとうございました！

企業の生成 AI 活用を、KDDIアイレットが支援します！
業務効率化・AI 導入支援について、お気軽にご相談ください。
お問い合わせ・ご相談はこちら

【非エンジニアが検証】Gemini Omni 動画生成が終わらない・できない時の対処法｜日本語化も解説