アイレット株式会社 DX開発事業部です!
DX開発事業部ではお客様のDX実現のために、生成AIのキャッチアップに日々取り組んでおります🔥
本記事では日々アップデートされる生成AI周りのニュースを週刊でお届けします🚀


今週は、OpenAIの最新モデルGPT-5.1のリリースとそのGitHub Copilotへの統合、GoogleのBigQueryにおけるAI関数の発表、そしてMetaの1,600言語対応ASRシステムなど、AI技術の大幅な進化が続々と発表されました。また、AWS GovCloudでのClaude Sonnet 4.5の提供開始により、政府機関向けクラウド環境でも最先端のAI活用が可能になります。エンタープライズ向けの機能強化とオープンソース技術の民主化が同時に進む、生成AI市場の成熟を示す一週間となりました。

AWS

Claude Sonnet 4.5が AWS GovCloud (US)のAmazon Bedrockで利用可能に

AnthropicのClaude Sonnet 4.5がAWS GovCloud (US-West)およびAWS GovCloud (US-East)のAmazon Bedrockで利用可能になりました。US-GOVクロスリージョン推論経由でアクセスできます。
Claude Sonnet 4.5はAnthropicの最高性能モデルとして位置づけられ、複雑なエージェント構築、コーディング、長期タスクに優れた性能を発揮します。SWE-bench Verifiedベンチマークで現在トップの成績を記録しており、命令追従の向上、コード改善の識別精度向上、リファクタリング判断の強化、本番環境対応コード生成の効率化が実現されています。

Google

Gemini Code AssistへのAIコードレビュー用のメモリ機能の追加

2025年11月11日、GitHub上のGemini Code Assistに新しいメモリ機能(persistent memory)がリリースされました。この機能は企業開発者と個人開発者の両方が利用可能です。

メモリ機能は、チームのコーディング標準、スタイル、ベストプラクティスを動的に学習・記憶します。プルリクエストがマージされた際にコメントスレッドからフィードバックを分析し、開発者の異議や承認を記録して、完了した会話から真のルールを抽出します。Geminiモデルを使用して具体的な指摘から汎用的なルールを推論し、新しいプルリクエストの分析前に関連ルールを検索してレビューを形成します。

従来の静的なstyleguide.mdとは異なり、メモリ機能は手動作業不要で動的に学習し、関連するコードにのみ適用される効率的な検索・保存を実現します。メモリはGoogle管理のプロジェクト固有の領域に安全に保存され、他ユーザーから隔離された状態で管理されます。

この機能により、過去に却下したフィードバックが繰り返されることを防止し、チームの暗黙知をコードベース全体に自動展開することで、AIコードレビューが単なる静的なツールから、チームと共に学習・成長するインテリジェントなアシスタントへと進化します。

Google Photosにおける新しいAI機能の追加

2025年11月11日、Google Photosに複数のAI機能を追加したことを発表しました。新しいAI画像生成オプションとして「Nano Banana restyle option」が導入され、AIテンプレート機能により、ユーザーが写真を加工・編集する際のテンプレート機能が追加されました。また、Ask Photos機能が拡張され、写真に関する質問に答えるAI機能が強化されています。

この発表は、Googleが写真管理サービスにおけるAI活用を大幅に強化し、生成AI技術を消費者向けサービスに統合していく戦略を示しています。画像生成機能の追加は、競合する写真編集アプリとの差別化を図る重要な一手といえます。

Google DriveのPDF向けAI搭載音声概要機能を提供開始

2025年11月11日、Google DriveにおいてPDFファイルに対する新しいAI搭載の音声概要機能が発表されました。この機能により、長文のPDFドキュメントをポッドキャスト風の会話形式の音声要約に変換できます。

業界レポート、契約書、長時間の会議の議事録など、テキストが多いPDFをワンクリックで音声ファイルに変換し、自動的にDriveに保存されます。この機能はNotebookLMで人気の高いAudio Overview機能と同じ基盤技術を活用しています。

主な利点として、2~10分の音声要約で長文書の要点を素早く把握できる効率性の向上、コンテンツを別の形式で消費できるアクセシビリティの向上、会議やプレゼン前の資料確認が容易になる準備の強化が挙げられます。デスクトップで音声概要を生成すると、ユーザーにメール通知が送られ、音声ファイルはDrive内の新しい「Audio overviews」フォルダに自動保存され、モバイルやデスクトップのあらゆるデバイスからアクセス可能です。

ロールアウトは、Rapid Releaseドメインでは即座に利用可能で、Scheduled Releaseドメインでは2025年11月12日から段階的展開(機能反映まで最大15日間のラグが発生することが想定されています)されます。Google Workspace Business Standard/Plus、Enterprise Standard/Plus、Google One AI Pro/Ultra、Google AI Ultra for Business、Google AI Pro for Educationで利用可能です。なお、ローンチ時点では英語のPDFのみサポートされています。
※Rapid ReleaseドメインとScheduled Releaseドメインについては、こちらの記事をご参照ください。

GeminiによるGoogle Driveのデータ分類機能のクローズドベータ申請の受付を開始

Geminiモデルを活用してGoogle Drive内のファイルに自動でデータ分類ラベルを適用する新機能が発表され、本機能のクローズドベータの申請受付が開始しました。

この機能の最大の特徴は、従来必要だった手動のAIモデルトレーニングが不要になる点です。管理者が定義した指示(プロンプト)に基づき、Geminiがファイルを評価し、適切なデータ分類ラベルを適用します。これにより、データ保護やコンプライアンス遵守のために不可欠な、大規模ファイルの分類作業をAIの推論能力で高精度かつ効率的に実現することが期待されます。

なお、Geminiによって自動適用されたラベルは、権限を持つユーザーが後から確認し、承認または変更することが可能です。本機能は Google Workspace Enterprise Plus プランのユーザーが対象となります。

Private AI Compute: Googleの新しいプライバシー保護AI技術

2025年11月11日に「Private AI Compute」が発表されました。これはクラウドのAI処理能力を活用しながら、ユーザーデータのプライバシーを保護する新しいアプローチです。

ユーザーのデータは個人のデバイスに保持され、クラウドでの処理時も厳格に保護されます。AI計算をプライベートな環境で実行し、ユーザー固有の情報を保護しながら、どのようにデータが処理されるかをユーザーに明示することで透明性を確保しています。従来はクラウドAIの高性能とプライバシー保護がトレードオフの関係でしたが、Private AI Computeはこの両方を実現することを目指しています。

より強力なAI機能を利用しながら個人データの管理権を保持できるようになることで、プライバシーを犠牲にすることなく高度なAI支援を受けられます。この技術は、AI時代におけるプライバシー保護の新しい標準を示す可能性があり、他のテクノロジー企業にも影響を与える重要な一歩となります。

BigQueryにおける新たなマネージドAI関数のパブリックプレビューの発表

BigQueryにおいて、新たなマネージドAI関数のパブリックプレビューが発表されました。これにより、SQLクエリ内で生成AIを直接活用できるようになります。

3つの新AI関数が提供されます。AI.IFはセマンティックフィルタリングと結合を実現し、WHERE句やON句で自然言語条件によるデータフィルタリングが可能になります。AI.CLASSIFYはテキストや画像を指定したラベルで分類し、ニュース記事のトピック分類やサポートチケットのルーティングに活用できます。AI.SCOREは自然言語基準による行のランク付けを行い、プロンプトを自動的に構造化されたスコアリング基準に最適化します。

組み込み最適化として、Gemini向けにプロンプトを構造化形式に自動最適化し、AI関数の呼び出し回数を削減するためフィルターを並び替え、モデルエンドポイントとパラメータチューニングを自動調整することで結果品質と一貫性を向上させています。システムは非AIフィルターを先に評価することで、LLMへの呼び出しを最小限に抑えます。

この発表により、データ移動が不要で標準SQLフロー内でLLMを統合でき、複雑なプロンプトチューニングやパラメータ調整が不要になります。データ実務者が新ツールを学ぶ必要なく高度な分析が可能になり、SQLが非構造化データ(テキスト、画像、動画)からの洞察を得る手段として進化しました。

Google Ads AdvisorとAnalytics Advisorの発表

2025年12月に英語アカウント向けに提供開始する2つのAIツール「Ads Advisor」と「Analytics Advisor」について発表されました。

Ads Advisorは広告キャンペーンの最適化を支援するエージェント型AIツールで、広告主の目標達成に向けた洞察と推奨事項を提供します。Analytics Advisorはデータ分析を簡素化し、アナリティクスから実用的な知見を導き出すことを支援するツールです。

これらのツールは、GoogleのAI技術を活用した「agentic tools」として位置づけられており、広告運用とデータ分析の自動化・最適化、専門知識がないユーザーでも高度な分析や最適化が可能、AIによる推奨事項でより効果的なマーケティング戦略の立案が可能になります。

Gemini Liveに新しい音声機能を追加してより自然な会話を実現

2025年11月12日、Gemini Liveに5つの新しい音声機能を追加し、AIとの会話をより自然にすることが発表しました。

主な新機能として、ユーザーはGeminiが話している途中で自然に割り込むことができるようになり、実際の人間同士の会話に近い体験が可能になりました。10種類の新しい音声が追加され、抑揚やトーン、ペーシングが改善されました。新たに複数の言語がサポートされ、グローバルなユーザーがより自然な会話を楽しめるようになりました。Geminiは文脈をより適切に理解し会話の自然な流れを維持できるようになり、応答時間が短縮されよりスムーズな対話が実現しました。

この更新により、Gemini Liveは日常的なタスク支援から学習サポート、ブレインストーミングまで、幅広い用途でより実用的なツールとなります。音声インターフェースの自然さの向上は、AIアシスタントの実用性を大きく高める重要な進化です。

Looker Conversational Analyticsが正式リリース

LookerのConversational Analyticsが正式リリース(General Availability)されました。この機能により、自然言語でデータに質問することで、組織全体のユーザーがBIボトルネックなしに迅速な意思決定が可能になります。

主な新機能として、最大5つの異なるLooker Explores(事前結合されたビュー)にわたってデータ分析が可能なクロスドメイン分析、作成したエージェントを同僚と共有可能なエージェント共有機能が提供されます。簡単な質問から深い分析まで対応し、マルチターン会話により継続的な質問が可能です。「How was this calculated?」機能により、クエリの根拠を自然言語で説明し、データリテラシーと信頼性が向上します。

技術的特徴として、Googleの最新Geminiモデルの推論能力を統合し、Lookerのセマンティックレイヤーがすべてのメトリック、フィールド、計算を一元的に定義してAIのコンテキストエンジンとして機能します。LookMLを統合してファインチューニングと出力精度を向上させ、Conversational Analytics APIによりカスタムアプリケーションから最新のGeminiモデルを活用可能です。

全Lookerプラットフォームユーザーが利用可能で、管理者がLookerインスタンスで有効化することで即座に利用開始できます。この正式リリースにより、Lookerは自然言語によるデータ分析を全社的に展開し、AIとBIの融合による生産性向上を実現しています。

Google Colab、無料ティアでのGemini Flashモデル利用や「AIプロンプトセル」の利用が可能に

Google ColabのX公式アカウントでの発表です。
Google Colabにおいて、google.colab.aiライブラリを使用することが可能になりました。それに伴い、Colabノートブック上でGeminiモデルを使用できるようになりました。
また、ローコードで簡単にAIと対話できる新しい「AIプロンプトセル」が利用可能になりました。

Google Formsの「Help me create」機能が7つの言語で利用可能に

2025年11月13日、Google Formsの「Help me create」機能が、新たにスペイン語、ポルトガル語、日本語、韓国語、フランス語、イタリア語、ドイツ語の7言語で利用可能になりました。

「Help me create」機能は、今年6月に英語版として発表されたGemini搭載のフォーム作成支援機能です。ユーザーは作成したいフォームの内容を自然言語で入力するか、Google Docs、Sheets、Slides、PDFなどのファイルを参照するプロンプトを入力することで、Geminiがドラフトフォームを自動生成します。参照ファイルの詳細も組み込まれ、生成されたフォームはそのまま使用することも、さらにカスタマイズすることも可能です。

この多言語対応により、英語圏以外のユーザーもAIを活用したフォーム作成の恩恵を受けられるようになりました。管理者は、ユーザーがこの機能を利用できるように、スマート機能とパーソナライゼーションを有効にする必要があります。

ロールアウトは、Rapid Releaseドメインでは2025年11月12日から段階的に開始され(機能反映まで最大15日間のラグが発生することが想定されています)、Scheduled Releaseドメインでは2025年11月26日から段階的に開始されます(機能反映まで最大15日間のラグが発生することが想定されています)。Google Workspace Business Standard/Plus、Enterprise Standard/Plus、Google AI Pro for Education、Google AI Pro/Ultra、Gemini Business/Enterpriseの各プランで利用可能です。

Workspace ユーザー向けに Gemini in Chrome(Gemini Live搭載)が正式に提供開始

Chrome UnboxedのX公式アカウントでの発表です。

Chromebook Plus向けのAI機能に関する発表で、Workspace ユーザー向けに Gemini in Chrome(Gemini Live搭載)が正式に提供開始されることが発表されました。また、Cameyo統合によりレガシーWindowsアプリとの連携も可能になります。

NotebookLM カスタムプロンプトによる動画要約機能の追加発表

NotebookLMのX公式アカウントでの発表です。

NotebookLMに待望の新機能が追加されました。カスタマイズボックスにプロンプトを入力することで、独自のカスタム動画概要スタイルを作成できるようになりました。この機能により、ユーザーは自分好みのスタイルでコンテンツの動画要約を生成できるようになります。

Microsoft

Microsoft Agent FrameworkがAG-UIプロトコルに対応

Microsoft Agent FrameworkがAG-UI (Agent-User Interaction Protocol)と完全互換になったことが発表されました。これは、エージェントのバックエンドとフロントエンドアプリケーション間の通信を標準化するオープンスタンダードです。

Microsoft Agent Frameworkは.NET (C#)とPythonをサポートするコードファーストのSDKで、Azure AI Foundry、Microsoft Graph、Microsoft 365と深く統合されています。ユーザー入力の推論、ツール(API、プラグイン)の呼び出し、メモリ保持、分岐、承認、エージェント協調を伴う複数ステップのワークフロー編成、Microsoft Teams、Azure AI Foundryなど複数環境での実行、状態の永続化、コンテンツ安全性、可観測性などエンタープライズ対応機能を提供します。

AG-UIプロトコルはCopilotKitが作成したオープン標準で、リアルタイムでのストリーミング応答、ツールの呼び出しと結果処理、エージェントとUI間の共有状態更新、UIコンポーネントとエージェントアクティビティの同期を定義しています。LangGraph、CrewAI、Mastra、ADKなど複数のフレームワークで既に採用されています。

この統合により開発者は、フルスタックエージェントアプリケーション構築、リッチなフロントエンド体験、リアルタイム配信、シームレスなデプロイが可能になります。カスタムソケットコード、ポーリングループ、個別APIなしで実装できることが大きな利点です。

OpenAI

GPT-5.1のリリース

最新モデルGPT-5.1がリリースされました。GPT-5.1は次世代の汎用AIモデルで、複雑な推論能力、コード生成、多様なタスク処理において大幅な性能向上を実現しています。このモデルは、より高度な文脈理解と精緻な出力生成により、ビジネス、研究、教育など幅広い分野での活用が期待されます。

GPT-5.1の主要な技術的特徴には、従来モデルを上回る推論能力、コーディングタスクにおける高精度な実装、長文コンテキストの処理能力向上、マルチモーダル対応の拡張などが含まれます。このリリースにより、OpenAIは生成AIの性能と実用性をさらに高め、エンタープライズ市場での競争力を強化しています。

Meta

Omnilingual ASR: 1,600以上の言語に対応する自動音声認識システムを発表

Meta FAIR(Fundamental AI Research)チームは2025年11月10日、Omnilingual ASRを発表しました。これは1,600以上の言語に対応する自動音声認識(ASR)モデルスイートで、そのうち500言語は従来AIによる文字起こしが行われたことのない低リソース言語です。

7億パラメータの自己教師あり多言語音声表現モデル7B wav2vec 2.0と、CTC(Connectionist Temporal Classification)デコーダーとTransformerデコーダー(LLM-ASR)の2つのデコーダー方式を提供します。モデルサイズは300M(軽量デバイス向け)から7B(高精度)まで対応しています。また、350の未提供言語における転写済み音声データセットであるOmnilingual ASR Corpusは、超低リソース自然発話ASRデータセットとしては最大規模です。

性能指標として、1,600以上の言語のうち78%で文字誤り率(CER)10%未満を達成し、従来の最先端システムを大幅に上回る性能を実現しています。最大の特徴は「Bring Your Own Language」機能で、数個の音声-テキストペアだけで新言語に対応可能です。従来必要だった大規模データ収集や専門知識、高性能コンピュータが不要となり、LLMのインコンテキスト学習能力をASRに導入しています。

Apache 2.0ライセンスで全モデルを公開し、CC-BYライセンスでデータセットを提供することで、音声テキスト化技術のユニバーサルアクセスを実現し、多様な言語・文化背景を超えたコミュニケーションを可能にする基盤技術として位置づけられています。

GitHub

GitHub CopilotにOpenAIの最新GPT-5.1シリーズモデルが追加

GitHub Copilotの利用可能モデルにOpenAIの最新モデルシリーズであるGPT-5.1、GPT-5.1-Codex、GPT-5.1-Codex-Miniが、パブリックプレビューとして追加されました。

GPT-5.1は汎用モデルとして、Visual Studio Code、JetBrains、Xcode、Eclipse、github.com、GitHub Mobile、Copilot CLIで利用可能で、チャット、質問、編集、エージェントなど全モードに対応しています。GPT-5.1-CodexとGPT-5.1-Codex-Miniはコーディング特化モデルで、Visual Studio Code 1.104.1以降、JetBrains 1.5.61以降、Xcode 0.45.0以降、Eclipse 0.13.0以降で利用可能です。

Copilot Pro、Pro+、Business、Enterpriseユーザーが利用可能です。EnterpriseおよびBusinessでは、管理者がCopilot設定でポリシーを有効化する必要があります。ProおよびPro+では、モデルピッカーから選択し、初回プロンプトで確認するだけで利用開始できます。

この発表により、GitHub Copilotユーザーは最新のAIモデルを活用したコード補完、チャット、エージェント機能を利用できるようになります。特にCodexシリーズはコーディングタスクに最適化されており、開発生産性の向上が期待されます。

アイレット

週刊BCN+にアイレット代表取締役会長のインタビュー記事が掲載

2025年11月13日、週刊BCN+にアイレット株式会社の代表取締役会長である齋藤将平氏のインタビュー記事が掲載されました。

記事では、アイレットが提供する企業の生成AI活用を支援する統合ソリューション群「gaipack」に焦点が当てられています。齋藤会長は、サービスの概要、今後の展開、業界での位置づけについて語り、「大手SIerに肩を並べる」という目標を掲げています。

この記事は、アイレットがクラウド支援サービスに加えて、生成AI領域でも積極的に事業を拡大していることを示しています。AWS、Google Cloud、Oracle Cloudの公認技術力と2,500社以上の支援実績を活かし、クラウドサービスと生成AIソリューションの統合提供により、市場での競争力強化とAI開発領域における存在感の向上を目指しています。

Google Cloud Partner Tech Influencer Challenge 2025で2名が受賞

2名の社員が、Google Cloudパートナーによるテクニカルブログチャレンジ「Google Cloud Partner Tech Influencer Challenge 2025」において、個人の部 – 特別賞を受賞しました。

山田顕人氏はマルチメディア賞を受賞し、YouTubeでのAgent Development Kit (ADK)を使用したLINE Bot作成の解説動画が、ユニークなメディア媒体を用いた投稿として評価されました。田村直樹氏はGemini賞を受賞し、Google Cloudの新認定資格「Generative AI Leader」受験レポート記事が、Geminiによる審査で特に優秀と判断されました。

第4回目となる本取り組みは、従来の技術ブログに加えて、YouTube等の動画コンテンツ、スライド共有サイトのコンテンツ、URLが存在して誰でもアクセスできるWeb媒体全般も対象としました。この受賞により、アイレットはGoogle Cloudエコシステムにおける技術的インフルエンサーとしての地位を確立し、顧客への信頼性向上につながることが期待されます。

大企業の DX を加速する「Oracle Database@Google Cloud」活用セミナーに登壇

2025年11月17日(月)15:00〜18:00にGoogle Cloudが主催する「大企業の DX を加速する「Oracle Database@Google Cloud」活用セミナー」のライトニングトークセッション(16:30-17:00)に、クラウドインテグレーション事業部 副事業部長の橘 弘樹氏がに登壇します。

このセッションでは、Oracle Database on Google Cloud の提供開始が多くの企業にとってデータ戦略を再構築する大きな機会をもたらすことについて、実際のプロジェクトで培われた知見や、お客様が直面する課題をいかに解決し、ビジネス価値を最大化していくかについて具体事例を交えながら紹介されます。

イベントはGoogle 渋谷ストリームオフィスとオンラインのハイブリッド形式で開催され、参加費は無料(事前登録制)です。

その他

ElevenLabs、Scribe v2 Realtimeを発表 – 150ms以下の超低レイテンシ音声認識

ElevenLabsにより2025年11月11日、最も正確な低レイテンシ音声認識モデル「Scribe v2 Realtime」が発表されました。このモデルは150ms以下でリアルタイム文字起こしを実現します。

Scribe v2 Realtimeは、音声エージェント、会議アシスタント、リアルタイム字幕生成などのライブユースケース向けに設計されており、英語、フランス語、ドイツ語、イタリア語、スペイン語、ポルトガル語を含む90言語に対応しています。500の困難なサンプル(背景ノイズや複雑な情報を含む)でテストした結果、他の全モデルを大幅に上回る性能を示しました。

主要機能として、次の単語と句読点を予測するネガティブレイテンシ機能、任意の言語を自動検出し会話途中での言語切り替えにも対応する自動言語検出、前のバッチに基づいて文字起こしを継続するテキストコンディショニング、音声活動検出(VAD)、トランスクリプトセグメントを確定するタイミングを完全制御できるマニュアルコミット、PCM(48kHz)とμ-lawエンコーディングなど複数の音声形式をサポートしています。

また、SOC 2、ISO 27001、PCI DSS L1、HIPAA、GDPR準拠、EUおよびインドのデータレジデンシーオプション、機密ワークロード向けのゼロ保持モードなど、エンタープライズ対応機能を提供します。Scribe v2 Realtimeは30の一般的な欧州およびアジア言語で93.5%の精度を達成し、人間レベルの理解をリアルタイムで実現します。

Scribe v2 RealtimeはElevenLabs APIを通じて利用可能で、ElevenLabs Agents内でも直接利用できます。これにより、サポート、営業、製品内体験向けの自然で人間らしい音声アシスタントを構築し、リアルタイムで理解・応答するエージェントをデプロイできます。

Figma関連の発表

FigmaのX公式アカウントでの発表です。
Figma in ChatGPTがBusiness、Enterprise、Eduプランで利用可能になったことが発表されました。


次週はどんなニュースがあるでしょうか。お楽しみに✋

🚀 Powered by Claude Code
この記事はAIによって生成されていますが、DX開発事業部の新卒メンバーによってネタ集め、レビュー、修正が行われています。

クラウドと生成AIでの業務改善のご相談はコチラ👇

生成 AI 導入・活用支援サービス|クラウドの活用ならcloudpack
生成 AI 導入・活用支援サービスでは、PoCの実施検証、開発支援はもちろん、本番導入のための教育支援や導入後の内製化支援までワンストップでサポート。お客様の業務課題解決やDX を促進するため、様々な生成 AI のユースケースから、最適なソリューションをご提案いたします。
AI導入をワンストップで支援。開発・運用・セキュリティを統合する「gaipack」|アイレット株式会社
AI開発から既存システムのAI化、セキュリティ強化まで。アイレットの「gaipack」が企業のAI課題をワンストップで解決し、安心のAI活用基盤を実現します。

一緒に働くメンバーを募集しています!