DX開発事業部モダンエンジニアリングセクションの田村です。
Google Cloud Next’24現地参加1日目の2本目のイベントレポートをお届けいたします。

セッション情報

セッションタイトル:What’s new in AI: Explore Google Cloud’s latest tools for generative AI

このセッションではAIのエコシステムやフレームワークの紹介、AIを活用した顧客エクスペリエンスの改善事例、開発者向けのGeminiの活用方法について説明がありました。

GoogleのミッションとMLエコシステム


Responsible AIの原則を守りながら、すべての開発者が無料のオープンソースのフレームワークやColabのような開発ツール、そして機械学習のリソースを使用して製品を改善できるようにすることを使命として掲げています。
特にGoogleはエンドツーエンドのソリューションを提供しリードしていくことに力を入れています。MLのライフサイクルにおける全ての構成要素(データの取り込みからモデルの定義・トレーニング、モデルの開発、運用保守)を保有しているため、包括的にソリューションを提供することが可能になっています。

機械学習フレームワーク

Googleが提供する機械学習フレームワークはいくつかありますが、それぞれの特徴について解説されました。

JAX


JAXでは自動量子化やシャーディング、SPMD distributionなどの最適化により最小限の調整で最大のパフォーマンスへ簡単に近づけることができます。
BardやGemini、GemmaはJAXで作成されており、その他ほぼ全ての研究と生成AIの開発にJAXが使用されています。

Keras3


Keras3はPyTorchやTensorFlowのデプロイメントとの統合がサポートされており、自然言語処理のKerasNLPやKerasCVといったライブラリが生成AI開発に必要なライブラリが含まれています。
Kerasを完全に書き直して、135,000行のソースコードを45,000行に書き換えたのは驚きです。

Gemma



GemmaはGeminiのモデル作成に使用したものを同じ研究とテクノロジーに基づいて構築されました。特徴としては軽量のオープンモデルで、KerasNLPで利用可能なようです。
Geminiはクローズドモデルと呼ばれることが多いですが、オープンモデル型として提供されることでより自由に生成AIを活用した開発ができるため、さらに身近な存在になりそうですね。

生成AIソリューションが加速させるタスク


画像にあるように生成AIソリューションによって次のようなタスクが効率化、加速化されます。

  • コンテンツ生成と推奨
  • 会話型検索やチャットボットの強化
  • 反復タスクのワークフロー拡張と自動化
  • ドキュメントやデータ内を見つける
  • コード生成や開発者のコード作成や説明、文書化の支援

これからはGeminiの時代だ



Geminiモデルのエコシステムは3つの軸で説明されています。

顧客向け

  • appやwebでのアプリケーションとして
  • Gemini in Google App
  • Gemini in Gmails, Docs

開発者向け

  • GeminiのAPIとして
  • Google AI Studioを使って簡単にAPIを使用することができます。

ビジネスやエンタープライズ向け

  • Gemini for Google Workspace
  • Gemini in Google Cloud
  • Gemini in Vertex AI

生成AIの活用事例

Healthcare


Healthcareの分野においては、臨床医が何度も繰り返す必要があるタスクを自動化することで患者と関わる時間を増やせるようになったり、予約を取りやすくして顧客サービスの向上という観点で役立っています。

Financial


Finalncialの分野においては、リスクの管理やコンプライアンスを確実に維持するために役立っています。たとえば、多くの情報を参照する必要がある投資会社の従業員は、生成AIが洞察して生成した結果を読むことで調査時間を短縮し生産性と効率性を向上しました。

Retail(小売業)


Retailの分野においては、検索と推奨の仕組みを作ることによって売り上げを伸ばしたりコンバージョン率の改善、平均注文額の増加、顧客維持率の向上に役立ちます。

Gemini APIを使ってみよう

Google AI Studio

GeminiのAPIを使うにあたってはGoogle AI Studioというサービスが提供されており、ここでGenerative API Keysの管理やプロンプトの作成やテストや保存、数分以内でのモデルのカスタマイズ、starter codeの生成などが行えます。
https://aistudio.google.com/app/prompts/new_chat?hl=ja

SDKs


REST APIでPythonやNode、Swift、JavaからAPIを使用することができます。

Platforms(Google Cloud)


APIやSDKsもですがもちろんVertex AIサービスとしてGeminiモデルへのアクセスが可能です。

Google AIでBuildしたい

Google for DevelopersというチャンネルでGoogle AIを使ったbuildの方法が解説されているようです。

まとめ

このセッションではとりわけGeminiに関して、そのエコシステムからユースケース、APIやプラットフォームでの活用方法などを知ることができました。
Gemmaという軽量かつ高パフォーマンスのオープン型モデルが出たことでより試しやすく、開発者としてもAPIやSDKsでGeminiを活用しやすくなりました。途中にWelcome to the Gemini eraとありましたが、活用の幅が広がりまさにGemini(生成AI)の時代になっていることを感じました。