概要
公式より
大規模言語モデル(LLM)をビジネスに活用する際は、LLM を単体で使うのではなく、他の機能と組み合わせた「アプリケーション」を構築する必要があります。LLM の仕組みをわかりやすく説明した上で、LLM を組み込んだビジネス アプリケーションのアーキテクチャー、ユースケース、評価方法など、「やってみた」で終わらないための現実的なアプローチを解説します。
- 「ビジネスアプリケーション」に注目してください!とのことです!
内容
- 生成AI活用のポイント
- 対話形の生成AIですべてを処理するのではなく、他の技術と組み合わせた「アプリケーション」を構築する
- 既存のビジネス プロセスの中で生成AIを有効活用できるポイントを発見する
- 生成AIによる「完全な自動化」を目指すと失敗する
- 生成AIの出力を効率的にチェック・修正するツールの開発が必要
- 生成AIと連携したワークフロー設計がポイント
- 生成AIをアプリケーションに統合するための技術を理解して活用する
- Google Cloud はマルチモーダル(動画・画像・音声)対応の技術を提供
- Googleが自社サービスで培ってきた高性能な技術を提供
- 登壇者様より・・・
- 生成AIだけではなく、周辺のどんな技術とくみあわせるのか?も注目して他の技術セッションも聞いてほしいです
現在の生成AIの事例は、放送業界のが多いのかなあとお話を聞いてて思いました。
- 放送映像のメタ付け→人の経験値による品質のばらつきがある
- 生成AIのハルシネーション(不正解が起きてしまう)
- ハルシネーションの解決
- ダブルチェックをしていた→1次担当だけGeminiで自動化
- 人間と違ってAIはサボらないので、一定のクオリティを保持できる。
- CSVで構造化
- データを構造化することで利用が容易になる
- 映像内容・テロップ・音声を分離ぢて構造化データとして自動出力
- AIで完全自動化をすると失敗することが多い
- まずは できるところだけやってみる が成功しやすい
生成AI活用におけるプロンプトエンジニアリングの重要性
- 生成AIの「間違い」
- プロンプトの内容によってAIの間違いを減らすことができる!
要望を「リクエスト」で伝えるように、プロンプトを使ってGeminiに渡さなければならない。
- プロンプトエンジニアリング
- 順番、整理など基本的な考え方はプログラミングと同じ。ステップバイステップで論理的に考える。
- 同じことをプロンプトの世界でやる。
- 順番、整理など基本的な考え方はプログラミングと同じ。ステップバイステップで論理的に考える。
- 生成AIを使いこなすのもエンジニアの技術が必要
- 生成AIがエンジニアの仕事を奪うという話ではない。
- プロンプトエンジニアリングにはむしろ必要!
マルチモーダル生成AI Geminiのご紹介
- Gemini 1.5 Pro のロングコンテキスト対応
- 2Mのコンテキスト ウィンドウに対応
- 約2時間の動画ファイル
- 約60,000行のコー
- 約1,400,000 単語の文書(英字新聞の朝刊で約2週間分)
- AIが間違っているのであれば、人が新しい判断をGeminiに教えてあげる!
- もっと詳しく!!!Zennで公開中のブログ記事
- RAGについてコードを交えて詳しく書かれておりました!
感想
生成AIがエンジニアの仕事を奪うというのはWeb系メディアや雑誌で見かけ自分のエンジニアとしての将来を心配していましたが・・・プロンプトを作るのにもステップバイステップでの論理的思考が必要でエンジニアはまだ不要ではないのだと、今回のセッションを聞いて安心しました!
現在、業務でプロンプトを書いているのですがなかなかうまくいかないなあと感じていたのでとても勉強になりました。
一気にすべてを解決しようとするからよくわからなくなってくるのですね。反省。イベントが終わったらガッツリ実施していこうと燃えてきました!!!