アイレット株式会社 DX開発事業部です!
DX開発事業部ではお客様のDX実現のために、生成AIのキャッチアップに日々取り組んでおります🔥
本記事では日々アップデートされる生成AI周りのニュースを週刊でお届けします🚀

AWS

新しい AI モデル Amazon Nova Act の発表

AmazonのAI研究チーム「Amazon AGI SF Lab」は、ウェブブラウザ上で動作する新AIモデル「Amazon Nova Act」を発表しました。このモデルは、ブラウザ内のタスク実行に特化しており、操作を信頼性の高い基本コマンドに分解し、詳細な指示やAPI呼び出し、Playwrightによるブラウザ制御を組み合わせて複雑なワークフローを実現します。日付選択やドロップダウンなどの要素で90%超の精度を達成し、ScreenSpotやGroundUI Webといったベンチマークでも高評価を得ています。開発者向けにSDKが研究プレビューとして提供されています。

Amazon Q Developer が Amazon OpenSearch Service で一般利用可能に

Amazon Q Developer が Amazon OpenSearch Service で一般利用可能になりました。自然言語での可視化生成、インテリジェントなアラート要約、クエリ結果の要約、推奨される異常検出器、専用のチャットインターフェースなどの AI 支援機能により、運用分析と調査プロセスが迅速化されます。東京リージョンでも利用可能となっています。

AWS MCP Servers がオープンソースでリリース

新しいAIコードアシスタント向けのオープンソースツール「AWS MCP Servers」が発表されました。このツールは、Model Context Protocol(MCP)を活用し、AWSのベストプラクティスを開発ワークフローに直接組み込むことを目的としています。各MCPサーバーは特定のAWSドメインに特化しており、セキュリティ対策、コスト最適化、AWS Well-Architectedフレームワークの原則をコードに反映させることで、開発時間の短縮と品質向上を支援します。これにより、開発者は複雑なサービス設定やインフラストラクチャのコード化、ナレッジベースの統合などの課題に対処しやすくなります。

RAG プロジェクトを成功させる方法 #2の公開

AWSのウェブマガジン「builders.flash」にて、RAG(検索拡張生成)システムにおけるベクトル検索の限界とその原因について、技術的な観点から詳細に分析した記事が公開されています。
従来の「チャンキング + ベクトル検索」では、文脈の断絶や情報の取りこぼしが発生しやすいという課題に対して、AWSの開発者向けドキュメントを題材に検証が行われています。
そのうえで、目次構造を活用し、関連ページを単位として情報を抽出・提示する「目次RAG」という新たなアプローチが提案されています。
ただし、これも万能な解決策ではなく、RAGの結果を丁寧に分析しながら、課題に応じて柔軟に手法を選択することの重要性が強調されています。

Google

NotebookLMにDiscover sources機能追加

情報を収集してほしいトピックについて、Webからソースを探し出して、インポートできる機能となります。
最大 10 件の推奨されるソースが表示され、それぞれにトピックとの関連性を説明する注釈付きの概要が表示されます。
新しいことをすばやく理解したり、トピックに関する重要なソースを集めるのが容易になります。

NotebookLMでPDF内の画像やグラフを理解できるように

PDFをソースとし、そのコンテンツ(テキスト、画像、グラフ、etc)を理解できるマルチモーダル対応になりました。

Gemma meetup 開催

Google のオープンモデル Gemma に焦点を当てた Meetup が 2025 年 4 月 24 日(木)に開催されます。
Gemma の技術的な詳細、活用方法、事例など、幅広いテーマを取り上げるセッションが行われます。
今回の Gemma Meetup には、特別ゲストとして、Gemma の開発に携わる Google DeepMind のエンジニアが来日し、Gemma の最新情報や今後の展望について話される予定です。

Gemma 3 QAT リリース

量子化を考慮したトレーニング(QAT)を活用した Gemma 3 QAT がリリースされました。
これにより、性能を維持しながらメモリ使用量を3分の1に抑えることに成功しました。

Gemini 2.5 Pro ExperimentalがVertex AIでPre-GAされました

今回のアップデートでGeminiの最新モデル「Gemini 2.5 Pro Experimental」がVertex AIにもPre-GAされました。Google Colabで使ってみた検証ブログを弊社の西田が執筆しておりますので、ぜひ記事をご参考にお試しください。

Google DocsでHelp me create機能が日本語でも使用可能に

Google Docs で Gemini の Help me create 機能が日本語を含む7つの言語で利用可能になりました。プロンプトを入力することで生成AIがドキュメントの作成を支援してくれます。この機能はGoogle Workspaceの Business Standard や Enterprise Standard、 Google One AI Premium Gemini Education などを利用中のユーザーのみ利用可能となっております。

OpenAI

ChatGPTの音声モードに気だるげで皮肉屋な新しい声「Monday」が追加

Apple

Apple Intelligenceが日本語に対応

Apple Intelligenceが、これまで提供されていた英語に加え、新たに日本語にも対応しました。このアップデートにより、対応するiPhone、iPad、Macで以下のAI機能が日本語で利用可能になります。

主な新機能:
* 文章作成支援: メールの作成補助、文章の校正、要約、トーンの変更など。
* 画像生成 (Image Playground): テキスト指示に基づき、オリジナルの画像を生成。アニメーション、イラスト、スケッチの3つのスタイルから選択可能。
* Genmoji: テキスト入力でオリジナルの絵文字を作成。
* 強化されたSiri: より自然な言葉での対話、文脈理解の向上、デバイス上の操作連携強化。
* 優先通知: 機械学習により重要な通知を識別し、上位に表示。
* 要約機能: Safariの閲覧ページやボイスメモの録音内容などを要約。

Meta

Llama 4シリーズが発表

Meta社がLlama 4 Scout、Llama 4 Maverick、Llama 4 Behemothを発表しました。
Llama 4 Scoutは10Mコンテキストウインドウというこれまでに前例のない膨大なコンテキスト長をサポートします。
Llama 4 ScoutとLlama 4 Maverickはllama.comやHugging Faceでダウンロード可能です。

アイレット

【Google Agentspace】Google Cloud 様によるハンズオン参加レポート

2025年3月19日、Google Cloud様ご協力の下「Google Agentspace」のハンズオンを開催頂きました。
Google Agentspace の2つケースについてハンズオンを行い、その内容が記載されています。
このハンズオンを通じて、Google Agentspace の理解を深めることができ、導入支援や業務効率化などのDX促進に貢献していきたいと思います。

その他

Sakana AIが「からまる」を公開

Sakana AI が、現代日本語で質問すると、江戸時代の世界観に基づいた古文風テキストで回答するチャットボット「からまる」を公開しました。
特徴

  • 約2500万文字の江戸テキストデータセットを用いて継続学習
  • 日本語に特化した大規模言語モデルLlama-3-ELYZA-JP-8Bを使用

今後の展開として、古文に関するテキスト検索、機械翻訳、テキスト分類などに活用できる可能性があると述べられています。
さらに大規模かつ多種のテキストを学習させたモデルの公開も検討中。


次週はどんなニュースがあるでしょうか。お楽しみに✋

🚀 Powered by
👤 Shunji Nishida 👤 Tetsuya Yamagiwa 👤 Yuki Maeno 👤 Naoki Tamura

クラウドと生成AIでの業務改善のご相談はコチラ👇

生成 AI 導入・活用支援サービス|クラウドの活用ならcloudpack
生成 AI 導入・活用支援サービスでは、PoCの実施検証、開発支援はもちろん、本番導入のための教育支援や導入後の内製化支援までワンストップでサポート。お客様の業務課題解決やDX を促進するため、様々な生成 AI のユースケースから、最適なソリューションをご提案いたします。