第四開発事業部の西田です。
2024年3月7日、Google Cloud主催のGenerative AI Summit Tokyo ’24に参加してきたので感想ブログの投稿です!
会場撮影はOKでしたので写真も交えてレポートします📸
会場は六本木アカデミーヒルズ。
受付を済ますとフォトスポットがお出迎えです🤳
会場内はセッションルームが4つとブースエリアに分かれています。
オープニングを待つ間、いただいた漫画やパンフレットを読みます。
【基調講演】生成 AI の実践展開へ:Google Cloud の最新進化と企業導入のための重要なポイント
基調講演はGeminiの話題からスタートしました。
Geminiの名前の由来は星座の双子座からとってるそうですが、その名付けの由来について話されていました。
Google内のGoogle DeepMindとGoogle Brainの2つのチームの協力によって作られたと言うのが一つ。
さらにNASAが2人組の宇宙飛行士を月に届けるために行ったジェミニ計画がもう一つとのことでした。
総じてチャレンジングなことをするのが由来であり、双子座はチャレンジ、好奇心の意味合いもあるとのことでした。
この一年で生成AIは「試す」から「使い倒す」へフェーズが変わってきてユースケースも色々なものが出てきています。
実際のユースケースについてファッション業界を例に取り上げていました。
ファッション業界で生成AIがどれくらい使われているかというアンケートでは、半分の人は使っているが、業務に定常的に(システムに組み込んで)使われているのはまだ4%とのこと。
それでは4%の部分に到達するには何が必要か。
それは生成AIの仕組みを理解すること。
アプリケーションのパーツとして生成AIモデルを捉えて、データと組み合わせることを検討する。
モデルだけでできることは意外と少ない。
続いてGeminiについて。
Geminiの最大の特徴はマルチモーダルであること文字や動画像様々な情報を統一して扱える。
人間の受ける試験を解かせても好成績を叩き出し、用途に応じて複数サイズを提供している。
さらに最近Gemini 1.5を発表
コンテキスト長が伸びることにより、最大100万トークン扱えるようになる。
例えばJAXのような巨大なデータセットをプロンプトに放り込める。
この絵のシーンはどのページ?みたいな使い方もできる。
続いてはセマンティック検索について。
今、生成AIとともに注目されている技術。
従来の検索とは異なり、自然文に対応した検索。
文字列を検索するだけではなく、文字列が意図している意味をAIが理解して検索するための仕組み。
AIが意味が近いと思ったものをマッチングしている。
生成AIを活用から利用へ移すためのGemini for Google Workspaceの紹介もありました。
早く弊社のGWSでも使ってみたい…。
生成AIをPoCから実装へと移すためにはどうすればよいか?
実際の事例として日本テレビ放送網株式会社様の取り組みが紹介されました。
2022年に「コンテンツ制作にAIを導入する」という目標の元プロジェクトを発足。
その際にレベル0から5まで定義して、最終的なAIによるコンテンツ生成がレベル5でその時が来るのは当初2030年想定だったそうです。
印象的だったワードは「生成AIを何かの機会と考える。我々は組織変革の機会と考えた。」でした✨
他にも印象的な話題がたくさんありましたが弊社の牧田のレポートもでさらに詳しく触れているのでこちらをどうぞ!
クロージングにてAI活用におけるGoogle Cloudの強みの紹介。
さらに弊社アイレットが生成AIパートナーとしてしっかり取り上げられていました🙌
つい先日LPページもオープンしたのでご覧ください!
PaLM と Vertex AI Search で実現する次世代の働き方に向けた取り組み
基調講演でも話があった日本テレビ放送網株式会社様の取り組みをさらに詳しく掘り下げたセッションです。
我々のようなエンジニアが組織の主体じゃない会社において、ITエンジニアのカルチャー、ノウハウやナレッジの蓄積、リテラシーの向上を実現するためにどのような取り組みを行ったか。
そして日テレ様の生成AIプロジェクト『Mate』のコンセプト、アーキテクチャについて語られました。
AIの怖いイメージを払拭して、たまに間違えてしまう(ハルシネーション)ところを可愛く思えるよう、親しみやすいキャラクターをデザインしたというのがユニークでした。
最後にまとめとして、社内を巻きこんで大きなプロジェクトを実行するために必要な3つをあげられておりました。
- 現在地を知ること
- 創りたい世界観を表現すること
- Mate(仲間)を増やすこと
ブース見学
ブースコーナーではコーヒーが振る舞われており、Googleとパートナー企業によるサービス紹介とデモ、そして抽選会も開催されていました。
Google Cloud Innovatorsに登録してこちらのようにプロフィールを作っておくと抽選権が得られます。
当選すると記念品に加えて素敵デザインのTシャツをもらえました🙌
Tシャツももらえて興味のあるサービスについても直接聞けて満足です😋
以降はずっとTrack2でGoogleさんのセッションを聞いていました。
録画のYouTube配信もされてるので興味があればぜひ見てみてください!
プロンプト エンジニアリングのコツ:生成 AI を最大限に活用しよう
Track2の中でも特に面白かったこちらのセッションについてレポートします!
LLMの回答結果はGIGO、インプットの質問が悪ければアウトプットの答えも悪くなる。
とはいえ、質問者にプロンプトエンジニアリングを強制するのは難しそう、どうすればよいか。
エンジニアリングと身構える必要はなく、プロンプトの作成はもっと直感的。
仕事でのコミュニケーションテクニックとよく似ている。
相手の理解度に合わせて依頼することでよい結果を引き出せる。
では生成AIの理解度をどうやって把握するか。
理解度を知るには学習の仕方を知ればよい。
LLMは学習データやプロンプトに明確に書かれてないことにも対応でき。これをICL(In-context Learning)呼ぶ。
LLMはコンサル会社の優秀な新卒に例えられる。
プロンプトテクニックはLLMを擬人化し、人間の能力で例えると整理しやすい。
ここからプロンプトエンジニアリングの具体的な手法(ベストプラクティス)についての紹介。
手法を学ぶその前に、生成AIへの期待値が高いため曖昧な指示をしていないか考え直す。
同僚にタスクをお願いするのと同じことを心がける。
- 明確かつ簡潔に
- 1つのタスクのみ依頼
- 必要な知識を全て説明
- 背景情報を提供
- 目的と期待値を明確化
- 誤字脱字に気を付ける
- 作業のプロセスを分解して最小単位で与える
なんとプロンプトに感情をのせると性能が上がる!
複数のLLMとタスクで実証実験されていて平均で10.9%上がったと言われている。
一度に複数のタスクをお願いしない。
指示は肯定文で。
これは指示学習における学習データに肯定系が多いためと言われている。
複数個の例を提示。Few-shot prompting。
思考プロセスの例示。Chain of Thought。
回帰や算術計算はLLMの得意分野ではない。
まとめ:性能が出ない場合はモデルの比較よりまずはプロンプトの検討をしましょう。
生成AIを触り始めた人も、使い始めてる人にも勉強になる、非常に知見の富んだイベントでした!
もし来年も開催されるならぜひ参加したいですね!その時の生成AI系プロダクトの進化も楽しみです✨