アイレット株式会社 DX開発事業部です!
DX開発事業部ではお客様のDX実現のために、生成AIのキャッチアップに日々取り組んでおります🔥
本記事では日々アップデートされる生成AI周りのニュースを週刊でお届けします🚀
AWS
Amazon Bedrock Marketplace にて Mistral AI の Pixtral 12B が利用可能に
Amazon Bedrock Marketplace にて Mistral AI の Pixtral 12B が利用可能になりました。 Pixtral 12Bは、 120億パラメータを持つビジョン言語モデルで、テキストと画像の処理に強みがあります。具体的なユースケースとしてドキュメント理解、論理的推論、手書き文字認識、画像比較、構造化データの抽出などに活用できます。Mistral AI社が公開しているベンチマークでも高いパフォーマンスを誇っているため、今後様々な業界での活用が期待されます。
Amazon Bedrock Data Automationが一般提供開始
AWS re:Invent 2024でプレビュー版として提供されていたAmazon Bedrock Data Automation (BDA) が一般提供されました。AWSは、AWS re:Invent 2024でプレビュー提供されていた Amazon Bedrock Data Automation (BDA) を正式に一般提供開始しました。BDAは、文書・画像・動画・音声などの非構造化データから有益なインサイトを抽出できる機能であり、データの整理や分析を効率化します。
正式版では、ドキュメントの抽出精度や動画の要約精度が向上し、新たに企業ロゴの検出をサポートするなど、機能が強化されています。また、AWS Key Management Service (KMS)や AWS PrivateLink との統合により、文書・画像・動画・音声などの非構造化データから洞察を抽出することもできます。従来版と比較し、ドキュメントの抽出精度や動画の要約精度の向上がされている点や、企業ロゴの検出のサポートなど機能的に充実している点もさることながら、AWS Key Management Service (KMS)やAWS PrivateLinkとの統合もサポートしており、セキュリティ面も強化されています。
AWS Amplify Gen 2と AWS CDK を用いて RAG アプリケーションを構築する方法が紹介されています
AWSのWebマガジン「builders.flash」にて、
AWS Amplify Gen 2 の Amplify AI Kit を活用した RAG(Retrieval-Augmented Generation)アプリケーションの構築手順が詳しく紹介されています。この解説では、AWS CDK(Cloud Development Kit)と組み合わせて、クラウド環境で効率的に生成AIアプリケーションを開発する方法に焦点を当てられています。
Amazon Nova Pro基盤モデルのレイテンシー最適化推論がプレビュー版として提供開始
Amazon Bedrockにおいて、Amazon Nova Pro基盤モデルのレイテンシー最適化推論がプレビュー版として提供開始されました。これにより、生成AIアプリケーションの応答時間が短縮され、ユーザーエクスペリエンスの向上が期待できます。特に、リアルタイム性が求められるアプリケーションにおいて、エンドユーザーの体験が向上し、開発者はユースケースに合わせてパフォーマンスを最適化する柔軟性を得られます。これらの機能を利用するために追加の設定やモデルの微調整は必要なく、既存のアプリケーションをすぐに強化し、応答時間を短縮できます。レイテンシー最適化推論は、米国西部(オレゴン)、米国東部(バージニア北部)、および米国東部(オハイオ)リージョンでクロスリージョン推論を介して利用可能です。
Amazon Q DeveloperのCLIエージェント機能の強化
AWSは、Amazon Q DeveloperのCLIエージェントを強化し、ターミナル内でよりスムーズな対話型開発が可能になったと発表しました。このアップデートにより、開発者はコマンドライン上で直接コードの作成や修正、AWSリソースのクエリ、ローカルファイルの操作などを行うことができるようになりました。
本機能はAmazon Q Developerの無料プランとProプランの両方で利用可能です。
Amazon Bedrock Knowledge Basesの、GraphRAG機能の一般提供開始
AWSは、Amazon Bedrock Knowledge BasesにGraphRAG機能を追加し、一般提供を開始しました。GraphRAGは、データのエンティティ(要素)とその関係性をグラフ構造で表現し、より精度の高い情報検索を実現する機能です。
この機能では、Amazon Neptune Analyticsを活用し、データの関係性を表すグラフと、ベクトル埋め込みを自動的に生成・保存。ベクトル検索とグラフ探索を組み合わせることで、異なるが関連性のあるデータソースから、より正確な情報を取得できます。これにより、FAQ検索やナレッジベースの問い合わせに対し、ユーザーに最適な回答を提供できるようになります。
GraphRAGは、米国(バージニア北部・オハイオ・オレゴン)、アジア(東京・シンガポール)、欧州(アイルランド・ロンドン・フランクフルト)のAWSリージョンで利用可能です。
Vertex AI Agent Engineが一般公開されました
今週のアップデートでVertex AI Agent Engineが一般公開されました。こちらはLangChain on Vertex AIやVertex AI Resoning Engineとしてリリースされていたサービスがリブランディングされたサービスとなります。AIエージェントを本番環境でデプロイ管理しスケーリングできるフルマネージドサービスであり、アプリケーションの開発を簡素化することができます。エージェントはさまざまなPythonフレームワークを使用して構築でき既存のエージェントを適応させることも可能なようです。
Google Slides のサイドパネルのGeminiが日本語対応しました
2025年3月5日より Google Slides のサイドパネルで日本語を含め7つの新しい言語で Gemini を利用できるようになりました。Gemini を活用することで、メールやドキュメントから収集した情報を基にコンテンツの生成や要約、ブレインストーミングが可能になります。これらの機能はGoogle Workspaceを利用中のユーザーのみ使用することができます。
Gmailで Salesforce for Gemini extension が利用可能に
Google WorkspaceにSalesforce for Geminiの拡張機能が追加されました。これによりGmailのサイドパネルからSalesforceの情報を取得したり直接リードや連絡先を作成したりできます。Geminiに直接指示を出すことでSalesforceのタスクを効率的に処理でき、営業活動をサポートします。管理者は拡張機能をインストールする必要があり、現在は英語のみ対応しております。またGmailブラウザ版で利用可能となっているようです。
最近GAされたModel Armorの検証記事を公開しました
Google CloudのModel ArmorはLLMのプロンプトとレスポンスの安全性を確認するサービスです。危険なコンテンツ、プロンプトインジェクション、機密データなどをフィルタリングして危険性がないかを確認してくれます。使用シーンや実行方法などを検証記事を公開しておりますのでご参照下さい。
個人向けGemini Code Assistの紹介記事を公開中
先日、Gemini Code Assistの無償版がプレビュー提供されました。概要やプランごとの比較、利用開始方法を記事にて紹介しておりますので、Geminiによるコード生成やコード補完などAIコーディング支援にご興味がありましたら、こちらの記事もぜひご参考ください。
Gemini Code Assist for GitHubについての記事も公開しています。
Google検索のAI Overviewsの拡張とAI Modeの発表
GoogleはAI機能を強化し、AI OverviewsをGemini 2.0にアップグレードしました。
これによって、より複雑な質問にも対応できるようになり、特にプログラミングや高度な数学の質問に対して迅速かつ質の高い回答を提供します。
また、新たに導入された AI Modeでは、ユーザーが複雑な質問を投げかけると、AI が関連情報を集約して答えることができます。この機能は現在、限られたユーザーにテスト提供されており、フィードバックを基に改善が進められています。
新しい実験的な Gemini Embedding テキストモデルの発表
Gemini API に新しい実験的なテキスト埋め込みモデル gemini-embedding-exp-03-07 が発表されました。
このモデルは言語理解と文脈のニュアンスを保持し、さまざまな用途に適用可能です。
MTEB のマルチリンガルリーダーボードで最高のスコアを達成し、長い入力トークンのサポートや高次元の埋め込みを提供します。
Gemini Embedding は、情報検索、テキスト分類、類似性の識別など多くのアプリケーションに利用可能です。
Whisk で作成した画像を、Veo 2 モデルを使用して 8 秒のクリップに変換できる「Whisk Animate」のプレビューが発表
Here’s a quick preview of Whisk Animate, which lets you turn images you create in Whisk into 8 second clips using our Veo 2 model. Stay tuned for updates on when this will be made more widely available. pic.twitter.com/2uBqARCVEr
— Google Labs (@labsdotgoogle) March 5, 2025
OpenAI
ChatGPT PlusユーザーにもGPT‑4.5が開放されました
Great day to be a Plus user. pic.twitter.com/d4aIwCK0iq
— OpenAI (@OpenAI) March 5, 2025
Mistral AI
Mistral OCRの発表
Mistral AIが高速にPDFをMarkdown化することができるAPI、Mistral OCRを発表しました。
多言語対応に加え既存のOCRでは難しい図表入りのドキュメントも取り込むことができます。
アイレット
株式会社第一興商様の導入事例を公開しました
通信カラオケ「DAM」を展開する株式会社第一興商様は、ユーザーにもっと快適な体験を提供するため、生成 AI を活用した汎用ツールを開発。本プロジェクトをアイレットが支援しました。
「AI Agent Summit ’25 Spring」のイベントページを公開しました
2025年3月13日(木)10:30〜18:30にて ハイブリッド(ベルサール渋谷ガーデン / オンライン配信)で開催される Google Cloud 主催のイベント「AI Agent Summit’25 Spring」に スポンサーとして協賛します。ブース出展に加え、DX開発事業部 山中がセッション登壇をします。
Next × Jagu’e’r プレイベント「Join us for the Next 2025」のイベントページを公開しました
2025年3月17日(月)19:00〜21:10にて「Next × Jagu’e’r プレイベント「Join us for the Next 2025」」が開催され、アイレットから DX開発事業部 田村が登壇します。
iret.mediaに生成 AI おすすめコンテンツ紹介ページができました!
DX開発事業部の西田が監修する生成 AI のおすすめコンテンツをまとめて紹介するページがオープンしました!
随時更新を予定しております🚀
その他
Figma AI ほぼ全機能使ってみた
Figma AI のほぼ全機能を試してみた記事がiret.mediaに公開されています!
デザイナーは必見です!
次週はどんなニュースがあるでしょうか。お楽しみに✋
🚀 Powered by
👤 Shunji Nishida 👤 Naoki Tamura 👤 Yuki Maeno
クラウドと生成AIでの業務改善のご相談はコチラ👇