Allen Institute × UC Berkeley、Mixture-of-Experts モデルを12.5%に圧縮―EMO で AI 推論のコスト削減が現実に
Allen Institute for AI と UC Berkeley の研究チームが、従来の Mixture-of-Experts(MoE)モデルを、全エキスパートの12.5%だけで従来同等の性能を実現する新手法『EMO』を発表。メモリ制約環境での AI 運用が劇的に改善される可能性。
続きを読むAllen Institute for AI と UC Berkeley の研究チームが、従来の Mixture-of-Experts(MoE)モデルを、全エキスパートの12.5%だけで従来同等の性能を実現する新手法『EMO』を発表。メモリ制約環境での AI 運用が劇的に改善される可能性。
続きを読むOpenAIが新たに『Codex for Work』としてビジネス各職種向けのCodex活用ガイドを公開。営業チームは提案資料の自動作成、経営チームは戦略文書の生成、データ分析チームは分析レポートの作成に活用できるようになり、実務的なワークフローの効率化が可能に。
続きを読むTencent が極度に圧縮された AI 翻訳モデル「Hy-MT1.5-1.25bit」をオープンウェイト公開。3.3GB から 440MB に圧縮し、33言語をサポート。スマートフォンで完全オフライン実行でき、商用サービスと同等の翻訳精度を実現。
続きを読むMeta は 10% の人員削減(約 8,000 人)を 5 月に実施。Microsoft は約 7% の自発的早期退職プログラムを展開。両社とも AI 投資の拡大と生産性向上を背景に、戦略的なリストラを推進している。
続きを読むBlockが約4,000人の削減を発表しAI導入で生産性向上を図る動きが加速していますが、企業は再訓練と組織設計の両立で未来を描く必要があります。
続きを読む