12/14(木)に開催された「Generative AI Summit Osaka」に参加してきました!!
セッションの内容や個人的な感想をレポートしていきたいと思います。

Generative AI Summitとは

生成 AI を企業で活用するためのポイント、活用ルール作りのヒントや、開発者、IT 企画、ビジネスまで広く利用できる生成 AI 関連の企業向けソリューションについて、わかりやすく解説してくれる場です。
デモブースで実際に生成 AI の活用について体験できる場も提供されます。

大阪でのオンサイトとオンラインとのハイブリッドでの開催でしたので、
私はオンラインで参加してきました。

「生成AIの未来:創造性とイノベーションの新たな時代」

まずは基調講演として、生成AIの実態について説明がありました。

生成AIの実態

生成AIはプロンプトに応じた、もっともらしい文章を返すのが実態であり
事実に基づかない情報を生成してしまう事があります。
これをハルシネーション(幻覚)と呼ぶみたいです。

生成AIモデルだけであれば、与えられたプロンプトからの推論を行う
「要約」、「分類」、「生成」が適しているタスクとなります。

生成AIを更に活用する為に、
Vertex AIには色々なサービスが提供されており
代表的なサービスを紹介されてました。

Gemini

最初のセッションではGeminiというモデルの紹介がありました。
MMLU(大規模多目的言語理解)というベンチマークで
人間の専門家を上回るスコアを達成するモデルのようです。
マルチモーダルに対応しており、「画像」「音声」「動画」といった複数の要素を扱えます。(日本語でも利用できます。)

これまでは、音声データから文字起こしを行った後にLLMで分析を行っていたが
Geminiは音声データをそのままインプットデータとして利用できる。
新しいモデルの登場により、非構造化データから簡単に価値を抽出できるようになった。

 

「生成AI〜Vertex AIで始めるGoogleの大規模言語モデルの活用」

続いてのセッションでは、LLMの活用法についてのレクチャーがありました。

企業における生成AIの利用パターン

Vertex AIを利用するメリット

・エンタープライズレディなAIプラットフォーム
・お客様のデータは保護され、Google Cloudにデータは利用されない

生成AIソリューションの開発における課題

ハルシネーション(幻覚)の問題があり、作成されたテキストが事実に即している保証は無い。その為、目的に応じたLLMのカスタマイズが必要となる

LLMの代表的なカスタマイズ手法

1.プロンプトデザイン

2.ファインチューニング

3 . グラウンディング

ファインチューニングのメリット

・プロンプトデザインだけでは実現が困難だったタスクを独自のデータを用いたモデルのカスタマイズで実現
・コストとカスタマイズ性のバランスの取れたチューニング方法を提供
・100程度のサンプルデータでモデルパフォーマンスの向上
・人間のフィードバックもモデルの学習に利用できる

グラウンディングとは

利用者が指定した情報だけに基づいて、LLMに回答を生成させる手法。
質問に対してもっともらしい答えを外部データベースから取得する。

グラウンディングの実施手法

・LangChain

・Vertex AI Search & Conversation

感想

最初の2つのセッションの内、個人的に気になったのはGeminiです。
これまで、画像データをOCRでテキスト化してプロンプトのデータとしていたのですが、
画像データをそのまま渡せる事で手間がかなり減ります。
実際にGeminiモデルをVertex AI Studioで使用して画像解析を行ってみたのですが、かなりの精度で解析できており、解析したテキストデータを基に質問へ回答する事もできてました。驚きです!!