タグ一覧に戻る

推論

記事数: 8
Allen Institute × UC Berkeley、Mixture-of-Experts モデルを12.5%に圧縮―EMO で AI 推論のコスト削減が現実に

Allen Institute × UC Berkeley、Mixture-of-Experts モデルを12.5%に圧縮―EMO で AI 推論のコスト削減が現実に

Allen Institute for AI と UC Berkeley の研究チームが、従来の Mixture-of-Experts(MoE)モデルを、全エキスパートの12.5%だけで従来同等の性能を実現する新手法『EMO』を発表。メモリ制約環境での AI 運用が劇的に改善される可能性。

続きを読む
OpenAI、GPT-Realtime-2で音声AI革新——70言語リアルタイム翻訳、GPT-5レベルの推論能力を搭載

OpenAI、GPT-Realtime-2で音声AI革新——70言語リアルタイム翻訳、GPT-5レベルの推論能力を搭載

OpenAIが3つの新音声モデルを発表。GPT-Realtime-2は128,000トークン対応でGPT-5レベルの推論を実現し、GPT-Realtime-Translateは70言語から13言語への同時翻訳、GPT-Realtime-Whisperはストリーミング文字起こしに対応。すべてRealtime APIを通じて利用可能。

続きを読む
Google、ReasoningBank を発表――AI エージェントが経験から学習できるメモリフレームワーク

Google、ReasoningBank を発表――AI エージェントが経験から学習できるメモリフレームワーク

Google AI が新しいメモリフレームワーク『ReasoningBank』を発表。エージェントが成功と失敗の両方の経験から推論戦略を学習し、継続的に性能を向上させることで、WebArena で 8.3%、SWE-Bench-Verified で 4.6% の成功率改善を実現。

続きを読む