お酒が好きなDX事業部の野呂瀬と申します。本稿の目的は、Geminiの扱い方や他の生成AIチャットとの比較・その応用としてGeminiにおすすめのカクテルを聞いてみたという記事になります。
Geminiとは?
Geminiの概要
「Gemini(ジェミニ)」とは、2023年12月にGoogleが開発した高機能生成AIモデルです。テキストや画像、音声、動画を用いて、チャット形式で簡単に高度なタスクを指示できます。
マルチモーダルAIとは
Geminiは「マルチモーダルAI モデル」と呼ばれます。マルチモーダルモデルとは、テキストから画像、音声、動画といった、複数の異なるデータを同時に学習、処理できるように統合されたAIモデルのことです。
マルチモーダルAIの例には、大規模言語モデル(LLM)に画像入力を対応させることで進化したOpenAIの「GPT-4」などがあります。種類の異なる情報やデータを行き来し、関係性を作りながら推論する能力を、自然言語処理技術と組み合わせることで、より自然で効率的なタスク処理の実現が期待されています。
Geminiの最新モデル
主なモデル
- Gemini 1.5 Pro
- 長文の理解と分析に優れており、100万トークンという非常に大きなコンテキストウィンドウを持つことが特徴
- Gemini 2.0 Flash
- 応答速度が速く、効率的な情報処理に重点を置いています
- Gemini 2.0 Flash Thinking Experimental
- 推論能力を強化し、思考プロセスを可視化することに重点を置いた実験的なモデル
他の生成AIとの比較
- 情報収集・分析ならGemini:
- Googleが開発したGeminiは、検索能力がピカイチ!
- 機能:
- マルチモーダル対応(テキスト、画像、動画、音声など)
- Google検索との連携によるリアルタイム情報提供
- 高度なデータ分析と推論
- 最新情報に基づいた回答や、複雑なデータ分析もお手の物。
- 「ちょっと調べ物したいな」って時に頼りになります。
- クリエイティブな作業にはChatGPT:
- OpenAIのChatGPTは、自然な対話や文章生成が得意。
- 機能:
- 自然言語処理による対話型インターフェース
- 多様なテキスト生成(記事、詩、コードなど)
- プラグインによる機能拡張
- ブログ記事の作成、小説の執筆、アイデア出しなど、クリエイティブな作業にぴったり。
- 「なんか面白いことしたいな」って時に刺激をくれます。
- 安全重視ならClaude:
- AnthropicのClaudeは、安全性と倫理性を重視。
- 機能:
- 有害なコンテンツの生成抑制
- 長文テキストの処理能力
- 倫理的なAI開発
- 長文の処理能力も高いから、契約書のチェックやレポート作成にも使えます。
- 「安心して使いたいな」って人にオススメです。
応用:おすすめのカクテルを聞いてみた
おそらくこの記事を読んでいる方は、コーディングについてGeminiに聞いている方が多数だと思われます。
私は検索能力に長けているGeminiを色んな場面で活用して欲しいということで、プライベートでGeminiを扱った1場面を紹介しようと思います。
- 初来店のbarに行った際に人見知りが発動し、お店のマスターに話しかけづらいという場面がありました。
- その際に、Geminiにおすすめのカクテルを聞き注文することになりました。
質問:テキーラ・ジン・ウォッカをベースに、おすすめのカクテル3つ教えて
それぞれこのような回答が返ってきました。
今まで飲んだことがないカクテルをおすすめしてくれるので、とても助かります。
補足説明もつけてくれるので、名前の由来などを知れて豆知識になりますね。
実際に頼んでみた結果:
見た目も味もおそらくほとんど同じものが提供されました。
真ん中の「ギムレット」は、ベースの味が強く、かなり効きました。
Geminiはお酒が強いかも知れません。
まとめ
最近話題の「生成AI」。仕組みや機能が難しく毛嫌いしている方は、まずは「触れてみる」ことが大切です。
今回の体験を通して、Geminiは私たちの生活を豊かにしてくれる素晴らしいツールだと改めて感じました。
これからは、生成AIについて深掘りしたものを時折発信していこうと思います。