アイレット株式会社 DX開発事業部です!
DX開発事業部ではお客様のDX実現のために、生成AIのキャッチアップに日々取り組んでおります🔥
本記事では日々アップデートされる生成AI周りのニュースを週刊でお届けします🚀
AWS
Nova Prompt Optimizer:Amazon Nova Models専用のプロンプト最適化SDK
Amazon Nova Models専用に設計されたPython SDKとして「Nova Prompt Optimizer」が公開されました。このSDKは、プロンプトの自動最適化を通じてAIモデルの性能向上を支援する包括的なソリューションです。
Nova公式プロンプティングガイドに基づくメタプロンプティングとDSPyのMIPROv2オプティマイザーを組み合わせており、システム指示とユーザーテンプレートの自動識別、Few-shotサンプルの自動追加などの高度な機能を提供します。モジュラー設計のアダプターシステムにより、テキストファイルからの読み込み、Amazon Bedrockを通じた推論実行、データセット処理、カスタム評価指標の実装が可能です。
Kiro:プロトタイプからプロダクションまで働く新しいAgentic IDE
「プロトタイプからプロダクションまで、あなたと共に働く新しいAgentic IDE」として、AI統合開発環境「Kiro」が発表されました。従来のAIコーディングツールが単発のプロンプトでアプリケーションを生成するのに対し、Kiroはプロダクション環境への移行を重視した仕様駆動開発を支援します。
Kiroスペック機能では、単一プロンプトから詳細なユーザーストーリーと受け入れ基準を生成し、データフロー図、TypeScriptインターフェース、データベーススキーマ、APIエンドポイントを自動作成します。Kiroフック機能により、ファイルの保存・作成・削除時にイベント駆動自動化を実行し、品質チェックやチーム標準の統一を図ることができます。
Code with Kiro Hackathonも同時に開催されており、賞金総額10万ドルで2025年8月25日まで参加可能です。
Anthropic Claude for Enterprise:AWS Marketplaceで利用可能に
Anthropic社のAIアシスタント「Claude for Enterprise」がAWS Marketplaceで利用可能になりました。エンタープライズレベルのセキュリティと20万トークンの広大なコンテキストウィンドウが特徴。コードのデバッグ、市場データ分析、調査の統合など、企業の生産性向上に貢献することが期待されます。
Amazon S3 Vectors:ネイティブベクトルサポートを備えたクラウドストレージ
Amazon S3でネイティブベクトルサポートを提供する革新的なサービス「Amazon S3 Vectors」がプレビュー版として発表されました。従来のS3にベクトル検索機能が統合され、最大90%のコスト削減が見込めます。Amazon BedrockなどのAWSサービスとシームレスに連携可能で、検索拡張生成(RAG)などのAIアプリケーション開発が容易になることが期待できます。
Amazon Bedrock AgentCore:あらゆるスケールでAIエージェントを安全にデプロイ・運用
Amazon Bedrock AgentCoreがプレビュー版として発表されました。これまで開発者が個別に構築する必要があった、会話履歴の記憶(メモリ管理)、安全な権限管理、外部システムとの連携といった、AIエージェントの運用に不可欠なバックエンド機能をAWSが提供します。特定のフレームワークに縛られないため、開発者は使い慣れたツールでエージェントのビジネスロジック開発に集中でき、本番環境への導入を大幅な加速が期待できます。
Amazon Nova カスタマイゼーション:Amazon SageMaker AIで利用可能に
Amazon Nova カスタマイゼーション機能がAmazon SageMaker AIで利用可能になりました。AWSの基盤モデル「Amazon Nova」を、ユーザーが自身のビジネスに合わせて詳細にカスタマイズできるようにする新機能です。
Amazon SageMakerの使い慣れた環境で、事前学習からファインチューニング、アライメント調整まで、モデル開発のあらゆる段階でNovaモデルを柔軟に調整できます。これにより、企業は業界特有の要件やタスクに最適化された、より高性能な独自のAIモデルを構築することが可能になります。
Strands Agents 1.0:本番環境対応のマルチエージェントオーケストレーション
本番環境対応のマルチエージェントオーケストレーションフレームワーク「Strands Agents 1.0」が発表されました。複数のAIエージェントを連携させて複雑な問題を解決する「マルチエージェント・オーケストレーション」を簡単かつ本番環境で実現するためのオープンソースSDKです。
従来は、単一エージェントの開発を簡素化してきましたが、バージョン1.0では、専門エージェントをツールとして呼び出したり、チームとして協調させたりといった、複数のエージェントを連携させるための機能が追加されました。これにより、単一エージェントでは難しい複雑なタスクを、開発者がより簡単に構築・運用できるようになります。
AWS Knowledge MCP Server:AI支援のAWS知識ベース
AWS Knowledge MCP Serverがプレビュー版として公開されました。このサーバーは、LLM(大規模言語モデル)がAWS公式ドキュメント、ブログ投稿、What’s New発表、Well-Architected ベストプラクティスにアクセスできるようにするツールです。Model Context Protocol(MCP)をサポートするクライアントや基盤モデルが、信頼できるAWSの文脈、ガイダンス、ベストプラクティスに基づいて回答を生成できるようになります。手動管理の削減により、開発者は情報検索ではなくビジネス課題に集中可能です。
Amazon Bedrock Data Automation:5つの新リージョンで利用可能に
Amazon Bedrock Data Automation(BDA)が5つの新しいAWSリージョンで一般提供開始されました。ヨーロッパ(フランクフルト、ロンドン、アイルランド)とアジアパシフィック(ムンバイ、シドニー)が追加され、合計7つのリージョンで利用可能となりました。
BDAは非構造化マルチモーダルコンテンツ(文書、画像、動画、音声)から価値ある洞察を自動生成し、GenAIベースのアプリケーション構築を支援します。インテリジェント文書処理やメディア分析などの用途に活用でき、Amazon Knowledge BasesのRAGワークフローでパーサーとしても利用可能です。
Luma AI Ray2:Amazon Bedrockで画像から動画生成が可能に
Amazon BedrockでLuma AIのRay2モデルによる画像から動画生成機能が利用可能になりました。1月に導入されたテキストから動画生成機能を拡張し、.jpegおよび.png画像(最大25MBまで)を魅力的な動画に変換できます。
この機能は広告業界、エンターテインメント業界、Eコマース業界で特に価値があり、企業は時間とリソースを節約しながら高品質で動的なコンテンツを大規模に制作できるようになります。現在US West (Oregon) AWS Regionで利用可能です。
AWS API MCP Server:自然言語でAWS APIと対話
AWS API MCP Serverの開発者プレビューが発表されました。このツールにより、基盤モデル(FM)が自然言語を通じてAWS APIと対話し、ワークロードのトラブルシューティング、アプリケーションデプロイメントの管理、AWSサービスと機能の探索を実行できます。AWS Identity and Access Management(IAM)認証情報と事前設定されたAPI権限を通じた安全なアクセス制御を提供し、FMが許可されたAWS APIでのみ認可されたアクションを実行できるよう保証します。AWS Labs GitHubリポジトリからオープンソースプロジェクトとしてダウンロード可能です。
Gemini Embedding:Gemini APIで一般提供開始
Gemini Embedding text model(gemini-embedding-001)がGemini APIとVertex AIで一般提供開始されました。このモデルは3月の実験的リリース以降、Massive Text Embedding Benchmark(MTEB)Multilingual leaderboardでトップ位置を維持しています。
100以上の言語をサポートし、最大2048トークンの入力長、デフォルト3072次元の出力(1536や768次元への調整も可能)を提供します。Matryoshka Representation Learning(MRL)技術により、検索から分類まで多様なタスクで既存モデルを上回る性能を実現しています。
- 価格:$0.15 per 1M input tokens
- Google AI Studioで無料実験可能
- 科学、法律、金融、コーディングなど多分野で最先端性能
- 出力次元調整により性能とストレージコストの最適化が可能
AI Agent Summit ’25 Fall
Google Cloudが2025年10月30日(木)と31日(金)の2日間にわたり「AI Agent Summit ’25 Fall」を開催します。ベルサール渋谷ガーデンでの初の2日間開催となり、全セッション同時ライブ配信も提供されます。
1日目はビジネスリーダー向けにAIエージェントを活用した業務効率向上と新たなビジネス価値創出を、2日目はデベロッパー向けに独自AIエージェント構築のヒントや技術的ユースケースを深掘りします。生成AI事例アワード「Innovation Awards」とAI Agent Hackathonファイナリストのピッチ大会も開催されます。
NotebookLM:Featured Notebooks機能を導入
NotebookLMが新しい「Featured Notebooks」機能を導入しました。The AtlanticやThe Economistなどの著名な出版社が厳選したコンテンツを使用した特別なノートブックを提供します。
この機能により、ユーザーは信頼性の高いコンテンツに基づいてNotebookLMの分析機能を活用でき、専門的なトピックの学習や研究の出発点として効率的で質の高い学習体験が可能になります。特定のテーマに関する高品質なコンテンツが事前に整理されているため、すぐに分析や学習に活用できます。
Cloud SQLとVertex AI Vector Searchの統合強化
Cloud SQL for MySQLとVertex AIの統合による新しいベクトル検索機能が発表されました。mysql.ml_embedding
関数を使用してSQL内で直接ベクトル埋め込みを生成し、VECTOR型カラムに保存できるようになります。
CREATE VECTOR INDEX
でベクトルインデックスを作成し、approx_distance
関数で類似度検索を実行可能です。また、mysql.ml_predict_row
関数でGeminiなどのVertex AIモデルを直接呼び出せるため、外部システムへのデータ移動が不要になります。
- 外部埋め込み生成の排除によるワークフロー簡素化
- データに近いAI処理の実現
- Eコマース製品検索や顧客レビュー分析などの使用例に最適
DeepSeek R1:Vertex AI Model Gardenで利用可能
DeepSeek R1モデルがVertex AI Model GardenでModel-as-a-Service(MaaS)として提供開始されました。通常8台のH200 GPUが必要な大規模モデルを、完全管理されたサーバーレスAPIとして提供し、GPU管理の複雑さを回避できます。
エンタープライズグレードのプラットフォームとして組み込みのデータプライバシーとコンプライアンス機能を提供し、セキュリティのためDeepSeek MaaSエンドポイントにはアウトバウンドインターネットアクセスはありません。Vertex AI Model Gardenから簡単にアクセス・テスト・デプロイが可能です。
Veo 3:Gemini APIで音声同期動画生成が可能に
Googleの最新AI動画生成モデル「Veo 3」がGemini APIとGoogle AI Studioで有料プレビューとして提供開始されました。Google I/O 2025で発表されたこのモデルは、動画と音声を同期生成できる初のモデルです。
対話、効果音、音楽を動画と一体で生成し、細かなテクスチャから微妙な照明効果まで高品質な映像を表現します。自然なキャラクター動作、水の流れ、影の投影を正確に再現するリアルな物理演算も特徴です。
- 価格:動画・音声出力 $0.75/秒
- より高速で低コストな「Veo 3 Fast」も近日提供予定
- Cartoon制作、マーケティング動画、教育コンテンツなど幅広い用途
OpenAI
ChatGPT の Record mode が Plus ユーザーで利用可能に
Plus users, the mic is yours.
Record mode is now available to ChatGPT Plus users globally in the macOS desktop app. https://t.co/xmReUOx473
— OpenAI (@OpenAI) July 16, 2025
ChatGPT Agent
ChatGTPが「仮想コンピュータ」を操作し、ウェブ閲覧や解析、スライド・スプレッドシート作成などを自動で実行できるエージェント機能を搭載しました。
OperatorとDeep Researchの機能を統合し、利用者は任意のタイミングで操作停止や権限承認が可能です。
この機能はPro/Plus/Teamプランで提供され、今後EnterpriseやEducationにも拡大予定で、安全対策として許可確認や監視モードも備えています。
Anthropic
ワンクリックで Claude に接続できるアプリとツールを公開
We've published a directory of apps and tools that connect to Claude with one click.
Browse and connect Claude to @canva, @figma, @linear, @NotionHQ, @stripe, and more. pic.twitter.com/BtVmNDpPf4
— Anthropic (@AnthropicAI) July 14, 2025
アイレット
EnterpriseZine(エンタープライズジン)にアイレット 山田 顕人の寄稿記事が掲載されました
アイレット株式会社の山田顕人氏がEnterpriseZine(エンタープライズジン)の連載「Jagu’e’r発!Gemini活用大全」第3回に寄稿しました。Google WorkspaceのGeminiを活用した業務効率化について解説しています。
加賀FEI様の生成AI導入事例公開
加賀FEI株式会社の生成AI導入事例を公開しました。UI/UXソリューション事業における業務効率化を目指し、Google CloudのVertex AI Searchを使用した社内ナレッジ検索システムをアイレットが構築支援しました。
当初の正答率は約5割でしたが、3ヶ月間でバージョン8まで改良を重ね、最終的に8割の正答率を実現。Gemini 2.0の導入が転換点となり、XML構造からJSON形式への変換、非構造化・構造化データ双方への対応など、技術的な改善を重ねました。
第一興商様のマルチAIエージェントシステム導入事例
株式会社第一興商様の「LIVE DAM WAO!」において、楽曲関連情報の収集業務を自動化するマルチAIエージェントシステム「楽曲リサーチエージェント」の導入事例を公開しました。Google CloudのAgent Development KitとVertex AI Agent Engineを活用しています。
情報収集の工数負担、外部データ購入コスト、作業の属人化といった課題を、5つのサブエージェント(楽曲関連情報収集、DAM配信楽曲データベースSQL検索、楽曲関連情報構造化、DAMセマンティック検索、YouTube検索)で構成されたマルチエージェントシステムで解決しました。
その他
Grokコンパニオンモード
— Elon Musk (@elonmusk) July 14, 2025
Mistral AI Voxtral:最先端の音声理解モデル
Mistral AIが最先端のオープンソース音声理解モデル「Voxtral」を発表しました。「Voice: the original UI」として位置づけられ、人間とコンピューターの自然な音声インタラクションを実現することを目的としています。
Voxtral(24B)は商用アプリケーション向け、Voxtral Mini(3B)はローカル・エッジデプロイメント向けとして、両バージョンともApache 2.0ライセンスで提供されます。32kトークンのコンテキスト長で、転写は最大30分、理解は最大40分の音声を処理可能です。
- 内蔵Q&A・要約機能で音声コンテンツに直接質問
- 8言語の自動検出・処理(英語、スペイン語、フランス語、ポルトガル語、ヒンディー語、ドイツ語、オランダ語、イタリア語)
- 音声からの直接関数呼び出し機能
- 音声転写でWhisper large-v3を全面的に上回る性能
先週のポイント
先週は、AI開発インフラとツールチェーンの大幅な進歩が目立った週でした。特に音声・動画といったマルチモーダル機能の実用化と、開発者向けツールの充実が注目されます。
エンジニアリングへの影響では、AWS Kiroの発表により、プロトタイプから本番環境まで一貫したAI開発体験が提供されるようになりました。Nova Prompt OptimizerやAWS API MCP Serverの登場により、プロンプトエンジニアリングとAWS API操作の自動化が大幅に進歩します。Google CloudのCloud SQL・Vertex AI統合強化により、データベース内でのAI処理が直接実行できるようになり、アーキテクチャの簡素化が期待されます。
ビジネスへの影響として、Veo 3の音声同期動画生成やLuma AI Ray2の画像から動画変換機能により、マーケティングコンテンツ制作の自動化とコスト削減が現実的になりました。Mistral AIのVoxtralは音声インターフェースの新たな可能性を示し、カスタマーサポートや教育分野での応用が期待されます。
特に重要なのは、Amazon Bedrock Data Automationの5リージョン拡大やDeepSeek R1のVertex AI Model Garden提供など、グローバルなAIインフラの拡充です。これにより、地域を問わず高度なAI機能にアクセスできる環境が整いました。また、弊社の導入事例(加賀FEI様、第一興商様)でも示されているように、実際のビジネス課題解決での生成AI活用が成熟段階に入っていることが確認できます。
次週はどんなニュースがあるでしょうか。お楽しみに✋
🚀 Powered by Claude Code
この記事はAIによって生成され、人の手でレビュー、修正が行われています。
クラウドと生成AIでの業務改善のご相談はコチラ👇
一緒に働くメンバーを募集しています!