目次
1.はじめに
環境情報
2.Agents CLIのセットアップについて
3.Agents CLIを使ったGemini CLIでのエージェント開発について
エージェントの仕様書作成
プロジェクトの作成とコード生成
ローカルでの動作確認
Agent Runtime へのデプロイ
4.おわりに
1.はじめに
Agents CLI はエージェントの構築、評価、Google Cloud へのデプロイを支援するツールです。
Agents CLI をインストールし、 Agents CLI コマンドを直接実行することでエージェントの開発を進めることが可能なのですが、Gemini CLI や Claude Code のようなコーディングエージェントツールから使用することもできます。
具体的には Agents CLI の Skills を経由し自然言語の指示に応じて必要な Agents CLI コマンドが実行されていく形です。
本記事では Agents CLI をインストール、Gemini CLI 上での自然言語指示によるエージェントの構築からデプロイまでを実施してみたので紹介します。
環境情報
- macOS:Tahoe 26.5.1
- Node.js のバージョン(
node --version):24.11.1 - Gemini CLI のバージョン(
gemini --version):0.46.0 - uv:0.11.21
2.Agents CLIのセットアップについて
以下のコマンドを実行し Agents CLI をインストールします。
uvx google-agents-cli setup
実行すると Google Cloud の認証、Agents CLI 本体のインストール、そして7つの Skills のインストールが行われました。
$ uvx google-agents-cli setup Installed 101 packages in 178ms Setting up... █▀█ █▀▀ █▀▀ █▄ █ ▀█▀ █▀ █▀▀ █ █ █▀█ █▄█ ██▄ █ ▀█ █ ▄█ █▄▄ █▄ █ From prototype to production — one CLI away. 1. Authentication ───────────────── Authenticated as xxx for project xxx (Application Default Credentials) 2. CLI Installation ─────────────────── ▸ uv tool install google-agents-cli 3. Skills Installation ────────────────────── ▸ npx -y skills list --json ▸ npx -y skills@1.4.8 add https://github.com/google/agents-cli -y -g skills │ Source: https://github.com/google/agents-cli.git │ ◇ Repository cloned │ ◇ Found 7 skills │ Installing all 7 skills │ ◇ 45 agents │ Installing to: Antigravity, Claude Code, Continue, Cursor, Gemini CLI, OpenCode ~/.agents/skills/google-agents-cli-adk-code │ ~/.agents/skills/google-agents-cli-deploy │ ~/.agents/skills/google-agents-cli-eval │ ~/.agents/skills/google-agents-cli-observability │ ~/.agents/skills/google-agents-cli-publish │ ~/.agents/skills/google-agents-cli-scaffold │ ~/.agents/skills/google-agents-cli-workflow │ Gen Socket Snyk │ google-agents-cli-adk-code Safe 0 alerts Med Risk │ google-agents-cli-deploy Safe 0 alerts Med Risk │ google-agents-cli-eval Safe 0 alerts Med Risk │ google-agents-cli-observability Safe 0 alerts Low Risk │ google-agents-cli-publish Safe 0 alerts Med Risk │ google-agents-cli-scaffold Safe 0 alerts Med Risk │ google-agents-cli-workflow Safe 0 alerts Med Risk │ Details: https://skills.sh/google/agents-cli │ │ ◇ Installation complete ~/.agents/skills/google-agents-cli-adk-code │ ~/.agents/skills/google-agents-cli-deploy │ ~/.agents/skills/google-agents-cli-eval │ ~/.agents/skills/google-agents-cli-observability │ ~/.agents/skills/google-agents-cli-publish │ ~/.agents/skills/google-agents-cli-scaffold │ ~/.agents/skills/google-agents-cli-workflow │ Done! Review skills before use; they run with full agent permissions. Linked 8 skill(s) into ~/.gemini/config/skills Linked 8 skill(s) into ~/.gemini/antigravity-cli/skills 4. Summary ────────── Auth: xxx for project xxx (Application Default Credentials) CLI: agents-cli installed Skills: Done! Review skills before use; they run with full agent permissions. Scope: global Done.
念の為 Agents CLI がインストールできていることを確認しておきます。
$ agents-cli --version agents-cli, version 0.4.0
uvx google-agents-cli setup を通じて Skills がインストールされたので、コーディングエージェントツールでの ADK エージェント開発では、それらを活用できます。
後続では実際にインストールされた Skills を使ってみます。
3.Agents CLIを使ったGemini CLIでのエージェント開発について
Gemini CLI を起動し、自然言語でのエージェント構築から Google Cloud のAgent Runtime へのデプロイまでを実施してみます。
エージェントの仕様書作成
作成するエージェントは「技術ブログ要約エージェント」とします。
Gemini CLI を起動しユーザープロンプトに以下を入力、実行します。
agents-cliを使って以下の機能を備えたエージェントを作成してください。 1. 技術系ブログ記事のURLを入力として受け取る 2. ブログ記事の内容を取得して読み込む 3. 元のコンテンツが英語であっても、要点を日本語で要約する 4. 読者が興味を持ちそうな関連トピックや記事を1~3件、簡単な理由とともに提案する 技術コンテンツを効率的に把握したいエンジニアにとって役立つエージェントとしてください。応答は常に日本語で行ってください。
実行すると google-agents-cli-workflow スキルを検知しました。(SKILL.md の内容はこちらです)
このスキルは開発を進めるためのルール、段取りが定義されているので、まずはこのスキルが動く形となります。

google-agents-cli-workflow スキルの実行を承認すると、作成するエージェントに関する質問が表示されたので回答します。

回答後、開発を進めるエージェントの仕様書作成が行われます。

作成された仕様書の内容は以下で、作成するエージェントの目的、必要なツール、制約条件、受け入れ基準、デプロイ先の情報がまとめられています。
これに沿う形で開発が進められていきます。
# Agent Spec: Tech Blog Summarizer Agent ## Overview エンジニアが技術系ブログ記事(英語・日本語問わず)を効率的に把握するためのエージェント。 指定されたURLからコンテンツを取得し、日本語で要約を作成、さらにGoogle検索を活用して関連するトピックや記事を提案します。 ## Example Use Cases - 英語の最新技術ブログ(例:Google AI Blog, AWS Blog)の要点を素早く日本語で把握する。 - 読んだ記事に関連する他の技術スタックや最新動向を調査する手間を省く。 ## Tools Required 1. **Web Content Fetcher**: 指定されたURLから記事の本文を抽出するツール(BeautifulSoupを使用)。 2. **Google Search**: 関連トピックや記事を検索するためのツール。 ## Constraints & Safety Rules - 応答は常に日本語で行う。 - 元のコンテンツが英語であっても日本語で要約する。 - 関連トピックの提案は1~3件とし、それぞれに簡潔な理由を添える。 - 公開されている技術ブログを対象とし、認証が必要なページや機密性の高いページへのアクセスは行わない。 ## Success Criteria - 入力されたURLから正しく本文を取得できること。 - 英語の記事を正確に日本語で要約できること。 - 提案される関連トピックが元の記事の内容と整合性があり、有益であること。 ## Deployment - 開発フェーズ: ローカルプロトタイプ - 最終デプロイ先: Agent Runtime
プロジェクトの作成とコード生成
仕様書作成に続いて google-agents-cli-scaffold スキルが稼働します。(SKILL.md の内容はこちらです)
このスキルで ADK エージェントプロジェクトとして必要な基本的なファイル群が作成されます。

次に google-agents-cli-adk-code スキルが稼働します。(SKILL.md の内容はこちらです)
このスキルでエージェントのメインロジックからツール周りの実装が行われます。

エージェントの実装が完了すると実装内容のまとめ、動作確認と評価結果が表示されました。
評価に関しては google-agents-cli-workflow スキルで作成された仕様書の中に受け入れ基準が定義されているので、それを満たすものとなっているか、google-agents-cli-adk-code スキルでの実装の延長で行われました。

最終的に Google Cloud の Agent Runtime にデプロイしてみるのですが、その前にローカル環境で動かしてみます。
ローカルでの動作確認
プロジェクトディレクトリにて依存関係のインストールを実施し、Playground を起動します。
$ pwd /Users/xxx/Documents/agents_cli_test/tech-summarizer $ agents-cli install ▸ uv sync Resolved 158 packages in 3ms Uninstalled 31 packages in 650ms - absl-py==2.4.0 - fastuuid==0.14.0 - filelock==3.29.3 - gepa==0.1.1 - hf-xet==1.5.1 - huggingface-hub==1.19.0 - jinja2==3.1.6 - jiter==0.15.0 - joblib==1.5.3 - litellm==1.85.5 - markdown-it-py==4.2.0 - markupsafe==3.0.3 - mdurl==0.1.2 - narwhals==2.22.1 - nltk==3.9.4 - numpy==2.4.6 - openai==2.41.1 - pandas==3.0.3 - regex==2026.5.9 - rich==15.0.0 - rouge-score==0.1.2 - ruamel-yaml==0.19.1 - scikit-learn==1.9.0 - scipy==1.17.1 - shellingham==1.5.4 - tabulate==0.10.0 - threadpoolctl==3.6.0 - tiktoken==0.13.0 - tokenizers==0.23.1 - tqdm==4.68.2 - typer==0.25. $ agents-cli playground Using project root directory: /Users/xxx/Documents/agents_cli_test/tech-summarizer ╭───────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────╮ │ Starting your agent playground... │ │ │ │ Running command: uv run adk web . --host 127.0.0.1 --port 8080 --allow_origins '*' --reload_agents │ │ Will be available at: http://127.0.0.1:8080/dev-ui/?app=app │ ╰───────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
agents-cli playground コマンドの実行で表示された URL にアクセスします。
今回作成したエージェントは、技術ブログの URL を入力することがトリガーなので、Google for Developers の Bringing Gemma 4 12B to your Laptop: Unlocking Local, Agentic Workflows with Google AI Edge の記事の URL を入力、ツール呼び出しを含めたエージェントの処理が行われ、記事の要約が出力されるかを見てみます。

実行結果として入力した URL の記事の内容を取得する fetch_web_content ツールと取得した内容をもとに関連トピックの最新情報を検索する google_search_agent ツールが起動しています。
そして最後に期待通り記事の要約と関連トピック情報が出力されました。

出力内容の全容(記事の要約と関連トピック情報)は以下です。
Google DeepMindの技術ブログ記事を拝見しました。以下に、記事の要約と、読者が次に興味を持つであろう関連トピックをご提案します。 記事の要約 記事のタイトル Bringing Gemma 4 12B to your Laptop: Unlocking Local, Agentic Workflows with Google AI Edge (Gemma 4 12Bをラップトップにもたらす:Google AI Edgeでローカルなエージェントワークフローを解き放つ) 概要(3行) Google DeepMindは、最新のオープンモデル「Gemma 4 12B」を発表しました。 このモデルと「Google AI Edge」スタックを組み合わせることで、一般的なラップトップ上で高性能かつ自律的なローカルAI(エージェントワークフロー)を実現できます。 これにより、データの処理からコード生成、音声によるテキスト編集まで、多岐にわたるタスクを完全にオンデバイスで実行可能になります。 主な要点(箇条書き) ・ローカル・エージェントワークフローの実現: Gemma 4 12Bの能力とGoogle AI Edgeの最適化技術により、データ分析、コード生成、視覚的洞察の生成など、自律的な(エージェント的な)タスク実行をユーザーのローカル環境で可能にします。 ・Google AI Edge Gallery (macOS): このアプリケーションでは、自然言語で分析目標を指示するだけで、GemmaがPythonコードを生成・実行し、データをグラフ化するといった複雑なコーディングタスクをローカルで完結できます。 ・Google AI Edge Eloquent (macOS): 音声入力・編集アプリで、Gemma 4 12Bの推論能力を活用し、「エグゼクティブサマリーに再構成する」といった音声コマンドによる高度なテキスト編集を、完全にオフライン環境で実現します。 ・LiteRT-LM CLIによるローカルサーバー機能: LiteRT-LMのコマンドラインインターフェースにserveコマンドが追加され、Gemma 4 12BをバックエンドとしたローカルLLMサーバーを簡単に構築できるようになり、既存のエージェントツールやフレームワークとの連携を容易にしました。 ・データ保護と効率性: 全ての処理がオンデバイスで実行されるため、データはユーザーのデバイス内に留まり、プライバシーを保護しつつ、応答性、実用性、コスト効率を維持します。 関連トピックの提案 本記事は、ローカル環境での高性能LLMとエージェント技術の融合という、現在のAI開発の最先端を扱っています。読者が次に知るべき関連トピックを3点提案します。 1. 競合ローカルLLMとの性能・ライセンス比較 ・提案トピック: Gemma 4 12Bと、主要な競合モデル(Llama 3 8B, Mistral 7Bなど)のベンチマーク性能、ローカルでの動作要件(VRAM)、および商用利用が可能なライセンス(Apache 2.0 vs. Meta License)の比較。 ・提案理由: Gemma 4 12Bの大きな強みの一つは、Apache 2.0ライセンスへの移行とGoogle AI Edgeによる最適化です。読者は、現在最も使われているローカルLLMのエコシステム(例:GGUF、Ollama)において、Gemma 4が他のモデルに対してどのような優位性やトレードオフを持つのかを理解することで、自身のプロジェクトに最適なモデルを選択できるようになります。 2. ローカルAIエージェント構築のための最新フレームワーク ・提案トピック: ローカルLLM(Gemma 4 12Bなど)を活用したマルチターンエージェント(Multi-turn Agent)を構築するための具体的な開発フレームワーク(例:LangChain, CrewAI, LiteRT-LM CLIの活用事例)の最新動向とハンズオンガイド。 ・提案理由: 本記事の核となるのは「エージェントワークフローのロック解除」です。モデルが利用可能になった今、開発者は次に「どうやってエージェントを構築するか」に関心を移します。LiteRT-LM CLIのserveコマンドはローカルエンドポイントの提供を容易にしますが、実際に自律的なタスクを実行させるための、具体的な計画立案、ツール使用、自己修正を組み込んだエージェントを開発する実践的な知識が求められます。 3. Google AI Edgeのマルチプラットフォーム展開とハードウェア最適化 ・提案トピック: 現在macOSを中心に展開されているGoogle AI Edgeが、WindowsやLinuxといった他の主要OSへどのように展開されるのか、また、様々なCPUやGPU環境(例:Intel, AMD, NVIDIA)でのGemma 4 12Bの具体的なベンチマークと最適化のロードマップ。 ・提案理由: ローカルAIを真に普及させるには、特定のOSに留まらず、広範なユーザーのハードウェア環境で効率よく動作する必要があります。Google AI Edgeの今後のプラットフォーム戦略や、モデルカードに示されている具体的なパフォーマンス数値の詳細を追うことで、ローカルAIの将来的なアクセシビリティと実用性を評価できます。
ローカルにて期待通りの挙動が確認できたので、Google Cloud の Agent Runtime へのデプロイに進みます。
Agent Runtime へのデプロイ
Gemini CLI にて以下をユーザープロンプトに入力します。
Agent Runtimeにデプロイしてください
google-agents-cli-deploy スキルが検知されたのでこれを実行します。(SKILL.md の内容はこちらです)

およそ10分前後でデプロイが完了しました。
Agent Runtime Playground への URL が表示されているのでアクセスし、エージェントを実行してみます。

技術ブログの URL を入力することがトリガーなので、Google for Developers の DiffusionGemma: The Developer Guide の記事の URL を入力、ツール呼び出しを含めたエージェントの処理が行われ、記事の要約が出力されるかを見てみます。

ローカル環境での動作確認時と同様 URL の記事の内容を取得する fetch_web_content ツールと取得した内容をもとに関連トピックの最新情報を検索する google_search_agent ツールが起動しています。
そして最後に期待通り記事の要約と関連トピック情報が出力されました。


出力内容の全容(記事の要約と関連トピック情報)は以下です。
DiffusionGemma: The Developer Guide 要約 記事のタイトル DiffusionGemma: The Developer Guide 概要 Googleが開発したDiffusionGemmaは、Gemma 4を基盤とする実験的なテキスト生成モデルです。従来のオートレグレッシブ(AR)モデルのメモリ帯域幅のボトルネックを計算(Compute)にシフトさせることで、最大4倍の高速なトークン生成を実現します。画像生成で使われる拡散モデルの手法をテキストに適用し、トークンを逐次生成するのではなく、双方向のコンテキスト認識と自己修正を伴いながら、テキストブロック全体を並列で改善していくのが特徴です。 主な要点 ・高速な並列生成: 「一様状態拡散(Uniform State Diffusion)」を採用し、トークンを並列で生成・改善することで、メモリ帯域幅のボトルネックを回避し、推論速度を大幅に向上させています。 ・双方向コンテキストと自己修正: 双方向アテンションにより、テキストブロック全体を同時に評価し、リアルタイムでのエラー修正(Re-Noising)を可能にします。これは、ARモデルが苦手とする非シーケンシャルな問題(例:数独)の解決に特に有効です。 ・ブロック・オートレグレッシブ拡散: 256トークンのブロックを並列処理し、完了後に次のブロックに進む仕組みを採用。拡散モデルの高速な並列性と、ARモデルの長文に対する安定性を兼ね備えています。 ・効率的なデプロイメント: 26BのMixture of Experts (MoE) モデルでありながら、推論時にアクティブになるのは3.8Bパラメータのみ。これにより、18GB VRAM内で量子化デプロイが可能となり、コンシューマー向けGPUでも効率的に動作します。 ・既存フレームワークとの統合: vLLMチームと連携し、vLLMの標準的なOpenAI互換サーバーを通じて効率的にサービングできるよう最適化されており、デプロイが簡素化されています。 関連トピックの提案 DiffusionGemmaは、非オートレグレッシブな手法、拡散モデルの応用、および効率的なデプロイメントという、次世代LLMの重要なトレンドを体現しています。読者が次に深掘りすべき関連トピックを提案します。 提案トピック 提案理由 1. 拡散モデルのテキスト生成への応用事例と課題 DiffusionGemmaの根幹技術である拡散モデル(Diffusion Model)が、画像生成からテキスト生成へどのように転用され、従来のARモデルの限界(遅延、エラーの蓄積)をどのように克服しているのかを深掘りすることで、非ARモデルの全体像を理解できます。 2. vLLMやSGLangにおける非ARモデルのサービング技術 記事内でvLLMとの連携が強調されています。DiffusionGemmaのような新しい並列アーキテクチャのモデルを、vLLMやSGLangといった既存の推論エンジンがどのように効率的にサポートしているのか、具体的な実装やベンチマークを調査することは、実務的なデプロイメント知識となります。 3. Gemma 4ファミリーにおけるMoE (Mixture of Experts) 技術の活用 DiffusionGemmaはGemma 4をバックボーンとし、MoE構造を採用しています。MoEがどのように推論時のアクティブパラメータ数を削減し、パフォーマンスと効率性のバランスを取っているのか、またGemma 4ファミリーの他のモデルとの比較を通じて、モデル選択と設計の知見を得ることができます。
4.おわりに
Agents CLI をインストールし、Gemini CLI で Agents CLI の Skills を使って技術ブログ要約エージェントの構築から Agent Runtime へのデプロイまでを実施しました。
Agents CLI は単体でも使えますが、コーディングエージェントツールから使用すれば自然言語の指示に応じて必要な Agents CLI コマンドが Skills 経由で実行されるので、自分でコマンドを調べて入力する手間が省けます。
インストールされた 7 つの Skills のうち、今回使用したのは google-agents-cli-workflow、google-agents-cli-scaffold、google-agents-cli-adk-code、google-agents-cli-deploy になります。
他にも評価用の google-agents-cli-eval、オブザーバビリティ用の google-agents-cli-observability、例えば作成したエージェントを Gemini Enterprise に公開したい場合に使用する google-agents-cli-publish がありますので、興味の湧いた方はこれらも試してみてください。