アイレット株式会社 DX開発事業部です!
DX開発事業部ではお客様のDX実現のために、生成AIのキャッチアップに日々取り組んでおります🔥
本記事では日々アップデートされる生成AI周りのニュースを週刊でお届けします🚀

AWS

Amazon Bedrock で Writer Palmyra X5 と X4 モデルが利用可能に

アメリカのAIスタートアップWriter社が公開している、Palmyra X5・X4モデルが、Amazon Bedrockにて利用可能になりました。X5モデルのコンテキストウインドウ(生成AIのモデルが一度に処理できるトークン数)は100万トークン、1世代前のX4モデルにおいては12.8万トークンと、ロングコンテキストを扱えるのが本モデルの特徴です。
なお、利用可能リージョンは米国西部リージョン(オレゴン)の1箇所のみです。

Amazon BedrockでMetaのLlama 4モデルが利用可能に

Meta の最新 AI モデル Llama 4 Scout 17B と Llama 4 Maverick 17B が Amazon Bedrock で利用可能になりました。
Llama4においては、MoE(Mixture of Experts)と呼ばれる、「小さな専門家モデルを組み合わせ、特定のタスクに対して最適なモデルが選択される仕組み」が採用されており、推論および画像理解タスク全体のパフォーマンスを向上させながら、コストと速度の両方が最適化されているようです。
なお、同モデルはAmazon SageMaker JumpStart経由でも利用可能です。
※MoEについては、LLM アーキテクチャにおける Mixture of Experts の適用(NVIDIA) を参照させていただきました。

Amazon Q Developer CLIがModel Context Protocol (MCP) のサポートを開始

2025年4月29日のアップデートにより、Amazon Q Developer CLI はModel Context Protocol(MCP) をサポートしました。これにより、開発者は mcp.json で定義された MCP サーバーを通じて、社内独自の文脈情報(データベースやドキュメントなど)にアクセスしながら、自然言語による指示でクエリ生成やER図の作成などのタスクを実行できるようになります。

Amazon Bedrock Model Distillationが一般提供開始

AWS re:Invent 2024 にてプレビュー版として公開されていたAmazon Bedrock Model Distillationが一般公開されました。
Model Distillation(モデル蒸留)とは、大規模かつ高精度なモデルが教師モデルとなり、小規模なモデル(生徒モデル)を訓練する技術です。
一般提供開始に伴い、以下の教師モデル・生徒モデルがサポートされるようになりました。

  • 教師モデル
    • Amazon Nova Premier
    • Claude 3.5 Sonnet v2
    • Llama 3.3 70B
  • 生徒モデル
    • Nova Pro
    • Llama 3.2 1B/3B

Amazon Bedrock の蒸留モデルは、元のモデルよりも最大 500% 高速で 75% 低コストであり、RAG などのユースケースでは精度の低下は 2% 未満とのことで、パフォーマンスの高さが伺えます。

Amazon Nova Premierの発表

新たなマルチモーダル基盤モデルの、Amazon Nova Premierが発表されました。
同モデルは、複雑な文脈理解やマルチステップの計画実行、長文ドキュメントや大規模コードベースの解析に優れているとされており、言語モデルの性能を評価するためのベンチマーク(評価基準)と言われている、MMLU(Massive Multitask Language Understanding)でも高いスコアをマークしているようです。また、100万トークンというロングコンテキストも特徴です。
Amazon Bedrock経由で、クロスリージョン推論を通して利用可能です。
利用可能リージョンは、米国東部(バージニア北部・オハイオ)米国西部(オレゴン)です。

Google

NotebookLMで日本語による音声概要が利用可能になりました

NotebookLM が 50 以上の言語で 音声概要(Audio Overviews) を提供開始しました。この機能により情報源をポッドキャストのように変換し、音声ベースで概要を聞くことができるようになります。今回、50以上の言語で音声概要の生成ができるようになり、言語の壁を超えた音声による学習コンテンツを作成できます。
弊社オウンドメディアのiret.mediaでも後藤執行役員が紹介記事を執筆しておりますのでご参照ください。

NotebookLM に日本語音声概要が登場:資料内容の耳学習を体験、しかも関西弁で
最近社内では NotebookLM エバンジェリストになっている後藤です。神アップデートした NotebookLM の音声概要機能について、驚きと共にネタのような話をお伝えます。1. はじめに:NotebookLM に新機能「日本語音声概要」が登場この度、AI ツール NotebookLM に日本語の「音声概要」機能が実装されました。これは、NotebookLM に取り込んだ資料の内容を音声で確認できる画期的な機能です。このアップデートにより、NotebookLM でまとめた内容を Podcast や Voicy のように、移動中や作業中など、資料を視覚的に追うことが難しい状況でも...

Vertex AILlama 4モデルの一般提供が開始されました

Google Cloud の Vertex AI で Meta の最新大規模言語モデル Llama 4 が Model-as-a-Service (MaaS) として一般提供 (GA) 開始されました。 Llama 4 はマルチモーダル機能や効率的な MoE アーキテクチャを備え、Scout と Maverick の2つのモデルがあります。
Vertex AI 上の Model-as-a-Service (MaaS) として Llama 4 にアクセスすることで、複雑なインフラ設定や GPU 管理 スケーラビリティ対応といった課題から解放され アプリケーション開発に集中できるとのことです。

Gemini APIを活用した語学学習プロジェクト「Little Language Lessons」が登場

GoogleのGemini APIを活用した革新的な語学学習プロジェクト「Little Language Lessons」が登場しました。このプロジェクトはまるでネイティブと話しているかのように、もっと自然でパーソナルな学習体験を提供することを目指しているようです。「Little Language Lessons」では3つの機能があり、「Tiny Lesson」では特定の状況(道案内やパスポート紛失など)で本当に役立つ語彙やフレーズ、文法を学べます。次に「Slang Hang」では、ネイティブ同士のリアルな会話を体験し、教科書には載っていない自然な言い回しやスラングを楽しく習得できます。そして「Word Cam」はカメラで写した身の回りの物の名前や関連語彙をターゲット言語ですぐに調べられる便利なツールです。

Google Labsで公開されており、以下のURLより利用可能です。

Geminiアプリでプロンプトによる画像編集機能が段階的にリリース

Google Geminiアプリ上で、プロンプトによる画像の編集機能が段階的にリリースされています。

OpenAI

ChatGPT にショッピング機能

ショッピングをよりシンプルかつスピーディーに、商品を検索、比較、購入できる環境を構築するための機能を提供。

GPT-4o のアップデートをロールバック

GPT-4o アップデートにより、ChatGPT が過度にへつらうような応答をする問題が発生しました。
モデルの性格改善において短期的なユーザーフィードバックを重視しすぎたことが原因でした。
GPT-4o のアップデートはロールバックされ、現在は以前のバージョンが提供されています。

Microsoft

小規模推論モデルの発表

推論モデルである Phi-4-reasoning、Phi-4-reasoning-plus、 Phi-4-mini-reasoning の3つのモデルを発表しました。
Phi-4-reasoning は、OpenAI o3-mini から厳選された推論デモンストレーションを用いて Phi-4 の教師ありファインチューニングによって学習された14Bのモデル。
Phi-4-reasoning-plus は、Phi-4-reasoning に基づいて構築され、強化学習と1.5倍のトークンを使用して精度を向上させたモデル。
Phi-4-mini-reasoning は、Deepseek-R1 モデルによって生成された合成データで微調整された3.8Bのモデル。

Anthropic

Integrations 機能の発表

Claude は Web アプリやデスクトップアプリを通じてリモート MCP サーバーとシームレスに連携できるようになります。
最初は10のサービスから選択できますが、今後さらに多くのサービスの統合が予定されています。
独自のリモート MCP サーバーとも統合可能です。

Meta

Meta AI リリース

ユーザーの好みを把握し、状況を記憶し、ユーザーに合わせてカスタマイズされるアシスタントです。
他のユーザーが AI をどのように使用しているかを共有したり探索したりできる Discover フィード機能もあります。

LlamaCon 発表まとめ

米国時間2025年4月29日に「LlamaCon」を開催しました。
以下の機能が主に発表されました。

  • Llama API のプレビュー開始
    • Llamaアプリケーション開発者向けプラットフォーム
  • 新しい Llama プロテクションツール
    • Llama Guard 4、LlamaFirewall、Llama Prompt Guard 2 をリリース

アイレット

無料で始める業務効率化!マーケ担当者がブックマークレット×生成 AI で実現した時短術

マーケの中澤がブックマークレットとGeminiを組み合わせたユニークな業務改善を紹介しています!要チェック👀

その他

ELYZA-Thinking-1.0-Qwen-32B の公開

ELYZA は日本語における論理的思考能力を強化した LLM である「ELYZA-Thinking-1.0-Qwen-32B」を公開しました。
320 億パラメータと軽量なモデルでありながら、OpenAI「o1-mini」に匹敵する性能を達成しました。

AI 2027

超人的なAIが今後10年で産業革命を超える絶大な影響をもたらすという予測に基づき、2027年という極めて近い未来を具体的に描いたシナリオ形式の記事です。
OpenAIの元研究者や、予測分野の専門家らが、綿密な調査や専門家へのヒアリング、そして過去の予測経験に基づいて執筆しています。

記事ではこのようなシナリオが予測されています。

  • 2025年: 専門的なAIが登場し、OpenBrain(シナリオ上の架空の企業)がAI研究を加速させる高性能AI (Agent-1) を開発します。AIの「アライメント」(人間の意図との一致)が重要な問題として議論され始めます。
  • 2026年: OpenBrainの内部利用AIによりAI研究速度が向上し、中国との間でAI軍拡競争が激化します。安価なAIも登場し、AIが一部の仕事に影響を与え始めます。
  • 2027年: 超人的な能力を持つAI (Agent-2, 3, 4) が連続して開発され、AI研究開発が劇的に加速します。AIは独自の目標を持ち始め、アライメント問題が顕在化します。一般公開されたAIが社会に広範な影響と危険をもたらす一方、米国と中国の競争とAIリスクへの懸念から政府の監督が強化されます。

次週はどんなニュースがあるでしょうか。お楽しみに✋

🚀 Powered by
👤 Shunji Nishida 🇧🇷 Yuki Maeno 👤 Tetsuya Yamagiwa 👤 Naoki Tamura

クラウドと生成AIでの業務改善のご相談はコチラ👇

生成 AI 導入・活用支援サービス|クラウドの活用ならcloudpack
生成 AI 導入・活用支援サービスでは、PoCの実施検証、開発支援はもちろん、本番導入のための教育支援や導入後の内製化支援までワンストップでサポート。お客様の業務課題解決やDX を促進するため、様々な生成 AI のユースケースから、最適なソリューションをご提案いたします。