タグ一覧に戻る

推論

記事数: 11
Etched が $50 億評価に達成、AI 推論チップで Nvidia への直接競合が現実に

Etched が $50 億評価に達成、AI 推論チップで Nvidia への直接競合が現実に

AI 推論チップ開発の Etched が $50 億の評価に到達。既に $10 億の契約注文を確保し、Stripers の投資ラウンドで総 $8 億の資金調達。推論処理のボトルネックをハードウェアレベルで解決し、Nvidia の独占に風穴を開ける可能性。

続きを読む
Sina の VibeThinker-3B が示唆:推論は圧縮可能、知識は圧縮不可

Sina の VibeThinker-3B が示唆:推論は圧縮可能、知識は圧縮不可

Sina Weibo が公開した 30 億パラメータの VibeThinker-3B は、数学・コーディングで 200~333 倍大きいモデル(DeepSeek V3.2、Kimi K2.5)と互角のスコア。一方、事実知識の問題では大規模モデルに大きく劣後。研究から浮かぶのは、論理的推論は小型モデルに圧縮可能だが、事実知識は圧縮困難という知見。

続きを読む
Allen Institute × UC Berkeley、Mixture-of-Experts モデルを12.5%に圧縮―EMO で AI 推論のコスト削減が現実に

Allen Institute × UC Berkeley、Mixture-of-Experts モデルを12.5%に圧縮―EMO で AI 推論のコスト削減が現実に

Allen Institute for AI と UC Berkeley の研究チームが、従来の Mixture-of-Experts(MoE)モデルを、全エキスパートの12.5%だけで従来同等の性能を実現する新手法『EMO』を発表。メモリ制約環境での AI 運用が劇的に改善される可能性。

続きを読む
OpenAI、GPT-Realtime-2で音声AI革新——70言語リアルタイム翻訳、GPT-5レベルの推論能力を搭載

OpenAI、GPT-Realtime-2で音声AI革新——70言語リアルタイム翻訳、GPT-5レベルの推論能力を搭載

OpenAIが3つの新音声モデルを発表。GPT-Realtime-2は128,000トークン対応でGPT-5レベルの推論を実現し、GPT-Realtime-Translateは70言語から13言語への同時翻訳、GPT-Realtime-Whisperはストリーミング文字起こしに対応。すべてRealtime APIを通じて利用可能。

続きを読む
Google、ReasoningBank を発表――AI エージェントが経験から学習できるメモリフレームワーク

Google、ReasoningBank を発表――AI エージェントが経験から学習できるメモリフレームワーク

Google AI が新しいメモリフレームワーク『ReasoningBank』を発表。エージェントが成功と失敗の両方の経験から推論戦略を学習し、継続的に性能を向上させることで、WebArena で 8.3%、SWE-Bench-Verified で 4.6% の成功率改善を実現。

続きを読む