Google Cloud Next で発表された BigQuery の新機能について、特に注目すべき Gemini を活用した AI アシスト機能の拡張、Data preparation 、データエージェント、そして AI Query Engine に焦点を当てて紹介します。
Gemini を活用した AI アシスト機能の拡張
BigQuery に昨年導入された Gemini を活用した AI アシスト機能は、データ専門家の生産性向上に貢献しています。データ準備、データ探索、分析、コード支援(SQL および Python のコード生成、補完、要約など)といった機能は、多くの方に利用されており、その利用率は年間で 350% の増加を見せています。
また、生成されたコードの受け入れ率は 60% を超えており、その実用性が示されています。
さらに、これらの 主要な Gemini 機能(コード生成、SQL/Python のコード補完、データプロファイリング、データ準備)が、現在の BigQuery の料金に含まれることが発表されました。
これによって、より多くの方が Gemini の高度な AI アシスタンスを利用しやすくなったと思います。
Data preparation
Data preparation 機能がGAとなり、データ準備の効率化が期待されます。
Accelerate analytics with AI-assisted data preparation in BigQuery, now GA
- GitHub との連携により、生データファイルのスキーマ不一致などの問題を Gemini が自動的に検出し、修正のための SQL コードを生成します。
- 標準化されたスキーマを持つデータファイルを取り込むだけで、コードが自動生成され、ユーザーはそれを編集してデータパイプラインを構築できます。
データエージェント
BigQuery の将来的な方向性として、データエージェントの構想が示されました。これは、AI がデータエンジニア、データサイエンティスト、ビジネスユーザーといった様々な役割のユーザーを支援し、データ関連のタスクを自動化していくものです。
- データエンジニアリングエージェントは、データの取り込みから監視、ガバナンスまで、データエンジニアのワークフロー全体をサポートします。チャットインターフェースを通じて、ファイル変換やテーブルへの書き込みといったタスクのコード生成、データパイプラインの可視化・編集などが可能です。
- データガバナンスエージェントは、データモデリング、データ生成、異常検知などを支援し、データの品質と信頼性を向上させます。
- データサイエンスエージェントは、データ探索、モデルのトレーニング、デプロイメント、監視といった機械学習のライフサイクル全体を支援し、Colab Enterprise で既に利用可能です。
- 会話型エージェントは、ビジネスユーザーが自然言語でデータに関する質問を行うことを可能にします。
AI Query Engine
構造化データと非構造化データの分析を、単一の SQL クエリで実現する AI Query Engine が発表されました。
- AI Query Engine は、セマンティックな理解と分析を可能にし、「トップ顧客からの最新のフィードバックは?」といった、従来の SQL では困難だった質問にも対応できます。
- このエンジンは、LLM (大規模言語モデル) の呼び出しをクエリプランに組み込むことで、BigQuery のスケーラビリティを活かしながら、高度な分析を効率的に実行します。
- 複数のチームや複雑なデータパイプラインを必要とせず、シンプルな SQL だけで AI を活用したデータ分析が可能になるため、ビジネスの意思決定を迅速化し、新たな洞察を得ることに貢献します。
まとめ
Gemini との連携強化、データ準備の効率化、データエージェント、そして統合的な分析を可能にする AI Query Engine は、今後 BigQuery を活用するデータエンジニアの方に非常に有用なアップデートになると感じました。
また、個人的には Gemini の機能が標準で搭載されるという点に驚きました。将来は AI によるアシストが当たり前の世界になる可能性も見え、今後の Google Cloud の展開が楽しみです。