DX開発事業部 フルスタックセクションの田村です。
Google Cloud Next ’25 現地参加1日目のイベントレポートをお届けいたします。
セッション情報
セッションタイトル:Unleash adaptive gameplay with Gemma
概要:
ゲームプレイがプレイヤーごとに進化したらどうなるでしょうか?GenAI + Gemma がそれを実現します!このオープンモデルは、微調整と柔軟なデプロイメント(ローカル/Cloud Run GPU)を通じて、ダイナミックな体験を実現します。ライブデモ、場合によってはライブコーディングを通じて、自然な会話と適応的なゲームプレイをご覧いただけます。実用的な実装とアーキテクチャに関する洞察も得られます。スライドは飛ばして、早速お楽しみください。
Gemmaモデルとは?
GemmaはGoogleが公開したオープンソースの大規模言語モデルです。他の生成AIモデルと比較して以下のような特徴があります。
- 商用利用可能なオープンウェイト提供
- モバイル〜サーバークラスターまでスケール
- 主要MLフレームワークと統合可能
- ファインチューニング対応
クラウドではHugging Face TransformersやGoogle Colab、Vertex AI、Google AI Studio、Vertex AI + Keras (JAX backend)、JAXなどのプラットフォームを使用して利用を開始できます。
性能比較:Gemma 3 vs 他モデル
Gemma 3(27B)は、他の大型モデルと比較してもかなり高スコア(Chatbot ArenaスコアでLLaMA3-405BやMistralより上)となっています。
他のモデルに対して少ないGPUリソースでも高性能が出る点が特徴的です。
- マルチモーダル(テキスト+画像処理)
- 128Kトークンのコンテキストウィンドウ
- 140以上の言語対応
- モデルサイズは 1B、4B、12B、27Bが利用可能
以下は他モデルとの比較。
デモ構成:「音声 → Gemma → ゲーム制御」
デモでは、以下のような構成で音声コマンドをリアルタイムに解析し、ゲームを操作していました。
- 音声入力(Audio Input)
- Whisper(音声認識)
- Gemma 3(指示解釈)
- Audio Playback
- Pythonスクリプト → WebSocket経由で Godot製ゲームを操作
この構成により、プレイヤーが直接声で指示を出すことでゲームを操作できるようになっております。
Gemmaのデモコード:Gemma Cookbook(GitHub)
デモで披露いただいたゲームはクリックするとキャラが上昇し、放っておくと重力で落下、障害物を避けながら進むというものでした。
操作する中で次のように音声で指示を与えることで、リアルタイムにゲーム内容を更新していました。
キャラを小さくして → 背景をラスベガスの風景にして → 背景をサンフランシスコの風景にして
GenAI + Gaming によるこれからのゲーム体験
Gemma × GenAI によるゲームの未来像として、以下のような進化が提案されていました。
- プレイヤーに合わせて進化する動的なストーリーテリング
- 個性を持つNPC(自然な会話が可能)
- クエストやキャラが毎回違う=無限のバリエーション
- マルチプレイヤーの楽しさはそのままに、煽り・嫌がらせ(toxicity)を排除
個人的に刺さったポイント
音声ベースでリアルタイムに自分好みにゲームを作っていくことができる点が興味深かったです。例えばRPGだとセリフやパターンが固定されていますが、プレイヤーの選択や行動がゲームのシナリオに影響するのであれば、周回価値が高くなると思います。
生成AIは“仕事のためのツール”という印象が強かったですが、ゲームのような“遊び”の世界においても確実に影響を与えはじめている点に面白みを感じました。
最後に
まだまだ生成AIの進化や利活用の方法は発展途上だと思います。
これからAIモデルがもっと進化すれば、私たちの体験そのものがどんどんアップデートされていくのではないでしょうか。