アイレット株式会社 DX開発事業部です!
DX開発事業部ではお客様のDX実現のために、生成AIのキャッチアップに日々取り組んでおります🔥
本記事では日々アップデートされる生成AI周りのニュースを週刊でお届けします🚀
今週は、生成AI業界の大型アップデートが集中した週となりました。特に注目すべきはAnthropicのClaude Sonnet 4.5のリリース。このモデルはSWE-bench Verifiedでトップスコアを記録し、世界最高のコーディングモデルとして登場しました。AWS、Google Cloud、GitHub Copilotなど主要プラットフォームで同時利用可能となり、エンタープライズでの採用が加速しています。またOpenAIはSora 2をリリースし、動画生成AIの新時代を切り開きました。Microsoftは新たにMicrosoft Agent Frameworkを発表し、マルチエージェントシステムの構築を簡素化する統合フレームワークを提供開始しています。画像生成においてもGoogle Gemini 2.5 Flash ImageがGAとなり、10種類のアスペクト比に対応するなど実用性が大幅に向上しました。
AWS
Anthropic’s Claude Sonnet 4.5 now available on Amazon Bedrock
Anthropicの最新モデルClaude Sonnet 4.5がAmazon Bedrockで利用可能になりました。
このモデルは、複雑なエージェント機能、コーディング、長期タスクに特に優れており、SWE-bench Verifiedベンチマークではトップスコアを記録。コードの生成とリファクタリングで業界をリードしています。
企業向けには、自律的なマーケティング、部門横断ワークフロー、サイバーセキュリティの脆弱性修正、金融予測モデリングといった高度な用途に最適です。
Amazon Bedrock Data Automation adds support for enhancing transcription
Amazon Bedrock Data Automation(BDA)において、音声ファイルの文字起こし機能を強化し、話者識別とチャンネル識別の機能が追加されました。
このアップデートにより、マルチパーティの音声会話において各話者を検出し、話者の変化を追跡する話者識別機能と、各チャンネルの音声を個別に処理できるチャンネル識別機能が利用可能になります。ガイド付きおよび自然言語ベースのインターフェースを使用してカスタムインサイトを抽出するブループリント作成が拡張され、ドキュメント、画像、音声、動画を含むマルチモーダルコンテンツに対応可能です。
本機能は米国西部(オレゴン)、米国東部(バージニア北部)、欧州、アジア太平洋地域を含む7つのAWSリージョンで利用可能です。
AWS API MCP Server v1.0.0 release
AWS API Model Context Protocol(MCP)サーバーのv1.0.0がリリースされました。このリリースにより、基盤モデルが自然言語を通じてあらゆるAWS APIと対話し、構文的に正しいCLIコマンドを作成・実行できるようになります。
Model Context Protocol(MCP)は、AIモデルとエージェントが標準化されたインターフェースを通じて外部システムやAPIと対話できるようにするフレームワークです。
開発者は人気のあるMCPレジストリやAmazon ECR Public Galleryのコンテナとして利用でき、AWS LabsのGitHubリポジトリからソースコードにアクセスできます。MCP対応クライアントとエージェントフレームワークで設定することで、自然言語でのAWS API操作が可能になります。
Cohere’s Embed v4 multimodal embeddings model available on Amazon Bedrock
Cohere社の最新マルチモーダル埋め込みモデル「Embed v4」が、Amazon Bedrockで利用可能になりました。テキスト、画像、さらには複雑なビジネス文書から高品質な埋め込みを生成します。
このモデルは、プレゼン資料、財務報告書、図表、手書きメモといった多様なドキュメントをネイティブに処理でき、日本語を含む100以上の言語をサポートします。
面倒な前処理が不要になるため開発ワークフローが簡素化され、これまで困難だったマルチモーダルなビジネスコンテンツを対象とした高度なAI検索アプリケーションの構築が可能になります。
Announcing Claude Sonnet 4.5 on Vertex AI
Google CloudがAnthropicの最も高性能なモデルClaude Sonnet 4.5のVertex AIでの一般提供を開始しました。同時に、Vertex AIがAnthropicのClaude Codeのアップグレード(VS Code拡張機能とターミナルインターフェースバージョン2.0を含む)をサポートすることも発表されました。
Claude Sonnet 4.5は自律的な動作と複雑な問題解決のために設計されており、以下の分野で強化された機能を提供します。
- コーディング:数時間から数日にわたるソフトウェアプロジェクトを自律的に完了
- サイバーセキュリティ:脆弱性が悪用される前にパッチを適用できるエージェントの展開
- 財務分析:基本的な分析から高度な予測モデリングと規制コンプライアンス監視まで
- 研究:ツールとコンテキストを処理してアクションにつながる洞察と最終成果物を提供
Vertex AI Model GardenとGoogle Cloud Marketplaceを通じて利用可能で、Claude Sonnet 4.5モデルカードに移動して「Enable」を選択することでアクセスできます。Vertex AI統合により、Agent Development Kit(ADK)とAgent Engineを通じたマルチエージェントオーケストレーション、専用キャパシティと固定コストのためのプロビジョンドスループット、バッチ予測、100万トークンコンテキストウィンドウ、プロンプトキャッシング、引用サポートなどの拡張機能、可用性向上とレイテンシ削減のためのグローバルエンドポイント、組み込みのセキュリティとデータガバナンス制御が利用できます。
Augment Code、spring.new、TELUSなどの顧客は既にVertex AI上のClaudeをコーディング支援、迅速なアプリケーション開発、エンタープライズ生産性プラットフォームに活用しています。TELUSは「Vertex AIでClaudeのような強力なモデルを利用できることは、私たちの生活を非常に楽にするWin-Winです」とコメントしています。
AI コーディングエージェント “Jules” に CLI と API を追加
Google は AI コーディングエージェント「Jules」に対し、コマンドライン操作を可能にする軽量なインタフェース “Jules Tools” を導入し、さらに Jules API によって開発者が自分のシステムやワークフローに直接統合できるようにしました。
これにより、チャット形式で Jules とやりとりするだけでなく、ターミナルでコマンドを実行したり、バグ登録時に自動で処理を走らせたり、CI/CD に組み込んだりといった使い方が可能になります。
Gemini 2.5 Flash Image now ready for production with new aspect ratios
GoogleがGemini 2.5 Flash ImageがGAとなり、一般提供を開始したことを発表しました。実験段階から本番環境での利用に適した製品レベルへと移行し、エンタープライズおよび商用アプリケーションに適したものになりました。
最も注目すべき新機能は、10種類の異なるアスペクト比のサポートです。
- ランドスケープ:21:9、16:9、4:3、3:2
- スクエア:1:1
- ポートレート:9:16、3:4、2:3
- フレキシブル:5:4、4:5
画像のみの出力指定、自然言語ベースのターゲット編集、マルチ画像ブレンディング、世代を超えたキャラクター一貫性などの追加機能も提供されます。
Cartwheelは「Pose Mode」機能にこのモデルを使用しており、共同創業者のAndrew Carrは「他のモデルでは任意のカメラアングルからキャラクターをレンダリングしたり、ポーズへの忠実性を維持したりできませんでした」とコメントしています。Volleyはこれを彼らのAIダンジョンクローラーゲームに統合し、キャラクターポートレートやシーンスチルを含むリアルタイムビジュアル生成に活用しています。
- Gemini API:包括的なドキュメントを提供
- Google AI Studio:テストとプロトタイピング用
- Vertex AI:エンタープライズデプロイメント用
料金は生成画像あたり0.039ドル、100万出力トークンあたり30.00ドルです。Googleは開発者ドキュメント、クックブック、サンプルアプリケーション(Bananimate、Enhance、Fit check)、AI Studioの「ビルドモード」での迅速なアプリ作成、即座の実装のためのPythonコード例を提供しています。
OpenAI
未成年向けにペアレンタルコントロールを導入
OpenAI は未成年ユーザー向けにペアレンタルコントロール機能を導入し、保護者が子どもの ChatGPT 利用を管理できるようにしました。これにより、暴力や性的表現などのコンテンツ制限、利用時間帯の制御、音声モードや画像生成の無効化、記憶機能のオフなどを設定できます。また、自己傷害の兆候が見られる場合に通知する仕組みも取り入れており、今後は年齢予測を用いた自動適用も視野に入れています。
ChatGPT内でのショッピング機能を発表
OpenAI は ChatGPT 上で商品をチャットの流れの中から直接購入できる新機能 Instant Checkout を開始しました。現在は米国の Etsy 出品者との単一アイテム購入に対応しており、今後は複数商品対応や Shopify 出品者、他地域への拡大も予定されています。購入はチャット画面内で支払い・配送先を確定するだけで完了し、注文や決済・発送は出品者の既存体制で処理されます。さらにこの仕組みを支える技術「Agentic Commerce Protocol」をオープンソース化しており、他の事業者や開発者も統合を試みられるようにしています。
OpenAI、新世代ビデオ生成モデル “Sora 2” と Sora アプリを発表
OpenAI はテキストからビデオ・音声を生成する次世代モデル Sora 2 を公開し、それを支える専用のモバイルアプリ Sora もローンチしました。
このモデルは従来より物理挙動の精度、映像のリアリズム、音声との同期性、指示への従順性(制御性)などを強化しており、より自然で説得力のある短尺動画を生成できます。
また、Sora アプリではユーザーが自分自身や他者を “カメオ (cameo)” として動画に登場させたり、他者の作品をリミックスしたり、横スクロール型のフィードで動画を楽しんだりできます。
安全性・責任の観点でも配慮がなされており、不適切な内容の制限、本人同意なしの顔・声利用の制限、透かしの埋め込み、著作権者向けの制御オプションなどが導入されています。
Anthropic
Claude Sonnet 4.5
AnthropicがClaude Sonnet 4.5をリリースしました。「世界最高のコーディングモデル」であり「複雑なエージェントを構築するための最強モデル」として位置づけられています。本リリースには主要な製品アップグレードと新しい開発者ツールが含まれています。
製品アップデートとして、Claude Codeには進捗を保存してインスタントロールバックを可能にするチェックポイント、刷新されたターミナルインターフェース、ネイティブVS Code拡張機能が追加されました。Claude APIには長時間実行エージェント向けの新しいコンテキスト編集機能とメモリツールが搭載され、Claude Appsには会話内でのコード実行とファイル作成(スプレッドシート、スライド、ドキュメント)が統合されました。Claude for Chrome拡張機能がMaxユーザーに提供開始されています。
新しい開発者ツールとして、Claude Codeを支えるインフラストラクチャと同じものを開発者が利用できるClaude Agent SDKが提供され、Claudeがリアルタイムでソフトウェアを生成する研究プレビュー「Imagine with Claude」がMaxサブスクライバー向けに5日間利用可能となりました。
ベンチマークパフォーマンスでは、SWE-bench Verifiedで実世界のソフトウェアコーディング能力においてトップの成績を達成し、OSWorldでコンピュータ使用タスクにおいて61.4%(4ヶ月前のSonnet 4の42.2%から向上)を記録しています。推論、数学、金融、法律、医学、STEM分野で大幅な改善を遂げ、複雑な多段階タスクにおいて30時間以上集中力を維持できます。
- Chrome拡張機能を通じて実証された強化されたコンピュータ使用能力
- 複雑なエージェントを構築するための改善されたエージェント機能
- より優れたコード理解と多段階推論
- 高度なファイル作成とコード実行機能
安全性とアライメントにおいて、Anthropicはこれを「リリースした中で最もアライメントされたフロンティアモデル」と呼び、おべっか使い、欺瞞、権力追求、妄想的思考を助長する傾向などの懸念される行動の削減で改善を達成しました。プロンプトインジェクション攻撃に対する防御も強化されています。
利用可能性と料金については、Claude APIを通じてclaude-sonnet-4-5を使用して今日からすべての場所で利用可能です。料金はClaude Sonnet 4と同じで100万トークンあたり3ドル/15ドルとなっています。
ClaudeのSlackアプリが登場
Claude is now available in Slack.
Chat with Claude through DMs, tag @.Claude in threads, or use the AI assistant panel—with access to web search, document analysis, and your connected tools. pic.twitter.com/qbRcuXl8aR
— Claude (@claudeai) October 1, 2025
Microsoft
Microsoft Agent Frameworkを発表
Microsoftがマルチエージェントシステムのオーケストレーションを簡素化するオープンソースSDKおよびランタイムであるMicrosoft Agent Framework(現在パブリックプレビュー)を発表しました。同時に、マルチエージェントシステムの構築、観察、ガバナンスのための新しいAzure AI Foundry機能も発表されています。
Microsoft Agent Frameworkは、AutoGen(元Microsoft Researchプロジェクト)とSemantic Kernelを統一フレームワークに統合し、OpenAPI経由での任意のAPIとの統合をサポートし、ランタイム間でのAgent2Agent(A2A)コラボレーションを可能にします。Model Context Protocol(MCP)を使用してツールに動的に接続し、Magentic Oneなどの最新のマルチエージェントパターンを含んでいます。
追加機能として、複雑なビジネスプロセスをオーケストレーションするマルチエージェントワークフロー(プライベートプレビュー)、標準化されたトレーシングのためのOpenTelemetryコントリビューションによる強化された可観測性、リアルタイム音声対音声インターフェースのためのVoice Live API(一般提供)、タスク遵守、プロンプトシールド、PII検出を含む責任あるAI機能が提供されます。
開発者はローカルで実験した後、組み込みの可観測性とコンプライアンスを備えたAzure AI Foundryにデプロイでき、永続的な状態を持つ構造化ワークフローにエージェントをオーケストレーションし、Azure AI Foundry、Microsoft 365 Copilot、その他のプラットフォーム全体でマルチエージェントシステムを接続できます。複数のフレームワーク(LangChain、LangGraph、OpenAI Agents SDK)で構築されたエージェントに対して統一された可観測性を活用できます。
- Azure AI Foundry
- Microsoft 365 Copilot
- Visual Studio Code拡張機能
- 複数のエージェントフレームワーク(LangChain、LangGraph、OpenAI Agents SDK)
- Elasticsearch(ネイティブコネクタ)
エンタープライズアプリケーションとして、顧客オンボーディング自動化、金融取引処理、サプライチェーン自動化、アバター駆動型カスタマーサポート、コンテンツ管理とデジタル資産処理などのユースケースがあります。KPMGはKPMG Clara AI監査プラットフォームに使用し、Commerzbankはアバター駆動型カスタマーサポートをパイロット中です。Citrixは仮想デスクトップインフラストラクチャ内でのエージェントAI探索を行っています。
GitHub
Anthropic Claude Sonnet 4.5 is in public preview for GitHub Copilot
GitHubがAnthropicのClaude Sonnet 4.5モデルをGitHub Copilot向けにパブリックプレビューでリリースしました。「コーディングと実世界のエージェントにおけるAnthropicの最先端モデル」として説明されています。
モデルはCopilot Pro、Pro+、Business、Enterpriseサブスクライバーに段階的にロールアウトされています。すぐに表示されない場合は後ほど確認することが推奨されています。
アクセス方法は以下の通りです。
- Copilot Chat:Visual Studio Code、github.com、GitHub Mobile(iOS/Android)のモデルピッカーを通じて利用可能
- Copilot CLI:
npm install -g @github/copilotで最新バージョンに更新し、/modelコマンドを使用 - Enterprise/Business:管理者がCopilot設定でClaude Sonnet 4.5ポリシーを有効にする必要があります
- BYOKオプション:ProおよびPro+ユーザーはVS CodeでAnthropicのAPIキーを持ち込むことができます
GitHubの初期テストに基づき、「ツールオーケストレーション、コンテキスト編集、ドメイン固有機能における大幅なアップグレード」が強調されています。このモデルは強化されたコーディング支援と改善された実世界のエージェント機能を約束していますが、具体的なパフォーマンスメトリクスは今回の発表では詳述されていません。GitHubはプレビューの継続中、コミュニティディスカッションフォーラムを通じてフィードバックを奨励しています。
アイレット
第7回雲勉特別編 Google Cloud を扱う上での AI の脅威について
iret tech labo with partners #27 AI とマルチクラウドが熱い!ラスベガスからの最新情報をお届け!Oracle AI World 2025 recap
2025年10月28日(火) 15:00〜16:00「iret tech labo with partners #27 AI とマルチクラウドが熱い!ラスベガスからの最新情報をお届け!Oracle AI World 2025 recap」を開催します。
本セッションでは、10月13-16日にラスベガス(米国)で開催される OCI 最大のイベント「Oracle AI World」で発表された最新情報を、ゲスト登壇の日本オラクル様とともに、いち早く皆様にお届けします!弊社エンジニアが現地で体感した熱気そのままに、ここでしか聞けない貴重な情報を余すことなくお伝えします。OCI はもちろん、マルチクラウドを推進する弊社が1時間で大事なポイントをギュッと絞ってご紹介いたします。
アイレット、従業員1,300人超に「Google Agentspace」を全社導入
アイレットは、Google Cloud の次世代の生成 AI プラットフォーム「Google Agentspace」を、2025年9月に全従業員1,300人超を対象に全社導入したことを発表します。本導入により、従業員が社内情報を迅速に活用できる環境を構築し、業務効率の向上とお客様への提供価値の最大化を目指します。
Agentspaceの導入支援サービスも承っております。
その他
PerplexityのAIブラウザ、Cometが一般公開
Comet is now available to everyone in the world.
In the last 84 days, millions have joined the Comet waitlist looking for a powerful personal AI assistant and new ways to use the internet.
The internet is better on Comet. pic.twitter.com/te82RnzssJ
— Perplexity (@perplexity_ai) October 2, 2025
次週はどんなニュースがあるでしょうか。お楽しみに✋
🚀 Powered by Claude Code
この記事はAIによって生成され、人の手でレビュー、修正が行われています。
クラウドと生成AIでの業務改善のご相談はコチラ👇
一緒に働くメンバーを募集しています!