本記事はGoogle Cloud AI Agent Summit ’25 Springで行われたセッション「AI エージェントを理解して積極活用するための基礎知識 〜AI エージェントの迷宮で迷わないために〜」のレポートです。
はじめに AIエージェントとは
エージェントとは、代理人を意味する
- 作業を代理で遂行してくれる人
- 専門知識を活かしてあなたよりも効率的に作業を実行
AIエージェントは大きく2つに分かれる
- ➀すでに活用されている(広い意味での)AIエージェント
- 従来は人間にしかできなかった作業をAIが代行する技術(生成AI / 大規模言語モデル)
- 元々はルールが非常に明確で、AIの学習用データを簡単に大量に集められる分野に限定されていたが、生成AIや大規模言語モデルの技術によって、ルールが非常に曖昧でデータを集めることが難しい内容もAIが対応できるようになった
- 生成AI / 大規模言語モデルをエージェントとして利用するメリットは、誰でも簡単に手軽に使うことができるという点
- 生成AIは、現実世界の大量のドキュメント、画像、動画等から、人間の知的活動を事前に学んでいるため、タスクに特化したモデル設計・学習処理が不要
- 汎用性が高く、利用の敷居が低い
- エンドユーザーのビジネス業務を直接肩代わりする
- 専門家が職人技で行っていた作業を代替する
- 生成AI/大規模言語モデルをエージェントとして利用する際の課題は、その汎用性と柔軟性ゆえに、特定用途への適応や詳細な指示が必要となり、期待した結果が得られない場合の調整が困難であるということ
- 汎用的である反面、特定用途に特化したチューニングには独特のテクニックや技術が必要
- 非常に柔軟に対応してくれるが、どういう手順で、どんな考え方でやって欲しいかを人間が事細かに指示しないと思い通りに動いてくれない
- ➁これから来るAIエージェント
- 与えられたゴールを実現するために必要なステップを自ら判断して、自律的にデータ収集や外部機能との連携を遂行するAIエージェント
- 生成AIに加えて次のような機能が必要
- データ収集機能
- 必要なステップを自ら考えるためには、情報を外部から自立的にデータを収集する機能が必要
- 外部連携機能
- ゴール達成のため、APIを通じて外部システムと自律的に連携し、処理を実行する。
- この機能の実装にはエンジニアによる開発が必要
- データ収集機能
Google Cloudで実現する次世代AIエージェント
コア業務でAIを活用するにあたって、Googleが支援する4つの観点
業務で取り扱うデータには、動画や音声、テキストや画像などの様々なデータがある
Googleではマルチモーダルに対応した生成AIモデルとして「Gemini」が提供されている
Geminiの最新モデルである2.0は、用途にあわせた選択が可能
Gemini(生成モデル)を活用したうえで、業務で使用しているデータやシステムと連携することが重要
そのような業務の連携を実現するAIエージェントを開発するためのプラットフォーム「Vertex AI」
AI開発プラットフォームの選択肢として以下のようなサービスがある
・ノーコード、ローコードでクイックに始めることが可能
・自社の業務に適用させていく、使い始めてみる場合の選択
フルコードの開発支援を行うソリューションも提供されている
・柔軟にカスタマイズを行いたい場合の選択
最後に
AIエージェントやGoogle Cloudの多様なサービスについて理解が深まりました。
Google Cloudのサービスを活用してお客様の課題を効果的に解決するには、お客様の業務、データ、既存システムを深く理解し、最適なAIサービスを選択・カスタマイズすることが重要だと分かりました。今後はお客様の業務や既存システムを十分に理解した上で、最適なAIソリューションを提案・実装していきたいと思います。