NextAI 海外で話題の最新AIニュース

タグ一覧に戻る

モデル圧縮

記事数: 2 件

Allen Institute × UC Berkeley、Mixture-of-Experts モデルを12.5%に圧縮―EMO で AI 推論のコスト削減が現実に

テクノロジー

2026年5月16日

Allen Institute × UC Berkeley、Mixture-of-Experts モデルを12.5%に圧縮―EMO で AI 推論のコスト削減が現実に

Allen Institute for AI と UC Berkeley の研究チームが、従来の Mixture-of-Experts（MoE）モデルを、全エキスパートの12.5%だけで従来同等の性能を実現する新手法『EMO』を発表。メモリ制約環境での AI 運用が劇的に改善される可能性。

Mixture-of-Experts モデル圧縮効率化推論 AI アーキテクチャ

続きを読む

TurboQuantで切り拓くAIの極端圧縮

2026年3月25日

TurboQuantで切り拓くAIの極端圧縮

Google Researchが発表したTurboQuantは、データとモデルの極端な圧縮でAIをより速く、より安価に動かすことを目指す新提案で、公式の続報が今後の鍵となります。

TurboQuant モデル圧縮推論速度エッジ推論

続きを読む