言語モデル

記事数: 11 件

2026年7月22日

Alibaba Qwen Audio 3.0 TTS Plus、Speech Arena リーダーボード1位、16言語対応の音声生成モデル

Alibaba の Qwen Audio 3.0 TTS Plus が Artificial Analysis の Speech Arena リーダーボードで首位獲得。16言語対応、自然言語によるボイススタイル調整が可能。ただし処理速度が課題で、毎秒16文字と既存製品より著しく遅い。

Alibaba テキスト音声変換音声生成言語モデル

米海軍が発表した「AI-first 艦隊」戦略──データから軍事行動までの自動化サイクル、2027年から本格展開

政策・規制

2026年7月18日

米海軍が発表した「AI-first 艦隊」戦略──データから軍事行動までの自動化サイクル、2027年から本格展開

米国防省海軍省が承認した新しい AI 戦略は、「Bits2Effects Cycle」と呼ぶ 5 段階フレームワークで、軍事データ収集から実際の軍事行動までを自動化・加速させる。大型言語モデルの艦上配置、通信遮断時の AI 自律システム、エンジニア倍増計画。

軍事AI 米防衛省自律システム AI戦略データ駆動

AI 検索エージェントの真の課題——曖昧クエリへの対応能力が欠如、新ベンチマーク DiscoBench が指摘

LLM・生成AI

2026年7月5日

AI 検索エージェントの真の課題——曖昧クエリへの対応能力が欠如、新ベンチマーク DiscoBench が指摘

Tencent・Tsinghua 研究チームが新ベンチマーク DiscoBench を発表。AI 検索エージェントの失敗原因は検索性能ではなく、曖昧クエリに対して質問を返すスキルの欠如だ。

AI検索ベンチマーク言語モデル LLM 検索エージェント

ByteDance開発の拡散言語モデル「iLLaDA」がQwen2.5と同等レベルを実現——自己回帰型との性能競争始まる

LLM・生成AI

2026年6月27日

ByteDance開発の拡散言語モデル「iLLaDA」がQwen2.5と同等レベルを実現——自己回帰型との性能競争始まる

人民大学とByteDanceの研究者が開発した拡散型言語モデル「iLLaDA」がQwen2.5 7Bと同等のベンチマーク性能を達成。12兆トークンで一から学習した新モデルが、従来の自己回帰型との競争の可能性を示唆します。

ByteDance 拡散言語モデル iLLaDA LLM 言語モデル

LLM・生成AI

2026年6月11日

Google DiffusionGemma、4倍高速テキスト生成を実現——品質と速度のトレードオフを選べるモデル

GoogleがMoE搭載の実験的言語モデルDiffusionGemmaを発表。従来の拡散テキスト技術により、リアルタイム推論が必要なアプリケーションで最大4倍の高速化を実現します。

Gemma 言語モデル推論高速化オープンソース

テクノロジー

2026年6月8日

大規模モデルが稀なスキルを習得できる理由：研究が解明したメカニズム

言語モデルのサイズと学習効率の関係について、研究者たちが新たなメカニズムを発見。モデルを大きくするだけでなく、訓練データの構成を工夫することで、小規模モデルでも稀なスキルを習得できる可能性が示唆されました。

言語モデルスケーリング機械学習 AI research モデル効率化

ByteDance の研究が長文書処理の訓練方法を刷新、QA学習が転記よりも5～6ポイント効率化

LLM・生成AI

2026年5月25日

ByteDance の研究が長文書処理の訓練方法を刷新、QA学習が転記よりも5～6ポイント効率化

マルチモーダル言語モデルの長文書処理能力は、アーキテクチャではなくデータセット設計で大きく向上することが判明。より小規模なモデルでも業界標準の性能を目指せる可能性が広がった。

ByteDance マルチモーダルAI 訓練方法言語モデル

Cohere、最高性能の言語モデル Command A+ をオープンソース公開——218 億パラメータ、48言語対応

LLM・生成AI

2026年5月22日

Cohere、最高性能の言語モデル Command A+ をオープンソース公開——218 億パラメータ、48言語対応

カナダの AI 企業 Cohere が、同社最強の言語モデル Command A+ を Apache 2.0 ライセンスでオープンソース化。218 億パラメータの Mixture of Experts モデル、マルチモーダル対応、128K トークンのコンテキスト、Hugging Face で即座に利用可能。開発者に新たな選択肢。

Cohere オープンソース言語モデル Command A+ Mixture of Experts