NextAI 海外で話題の最新AIニュース

タグ一覧に戻る

推論

記事数: 8 件

Allen Institute × UC Berkeley、Mixture-of-Experts モデルを12.5%に圧縮―EMO で AI 推論のコスト削減が現実に

テクノロジー

2026年5月16日

Allen Institute × UC Berkeley、Mixture-of-Experts モデルを12.5%に圧縮―EMO で AI 推論のコスト削減が現実に

Allen Institute for AI と UC Berkeley の研究チームが、従来の Mixture-of-Experts（MoE）モデルを、全エキスパートの12.5%だけで従来同等の性能を実現する新手法『EMO』を発表。メモリ制約環境での AI 運用が劇的に改善される可能性。

Mixture-of-Experts モデル圧縮効率化推論 AI アーキテクチャ

続きを読む

OpenAI、GPT-Realtime-2で音声AI革新——70言語リアルタイム翻訳、GPT-5レベルの推論能力を搭載

2026年5月8日

OpenAI、GPT-Realtime-2で音声AI革新——70言語リアルタイム翻訳、GPT-5レベルの推論能力を搭載

OpenAIが3つの新音声モデルを発表。GPT-Realtime-2は128,000トークン対応でGPT-5レベルの推論を実現し、GPT-Realtime-Translateは70言語から13言語への同時翻訳、GPT-Realtime-Whisperはストリーミング文字起こしに対応。すべてRealtime APIを通じて利用可能。

OpenAI 音声AI GPT-5 翻訳推論

続きを読む

Google、ReasoningBank を発表――AI エージェントが経験から学習できるメモリフレームワーク

2026年4月22日

Google、ReasoningBank を発表――AI エージェントが経験から学習できるメモリフレームワーク

Google AI が新しいメモリフレームワーク『ReasoningBank』を発表。エージェントが成功と失敗の両方の経験から推論戦略を学習し、継続的に性能を向上させることで、WebArena で 8.3%、SWE-Bench-Verified で 4.6% の成功率改善を実現。

Google AI エージェントメモリシステム推論自動化

続きを読む

CoT-Controlが示す推論制御の課題

2026年3月6日

CoT-Controlが示す推論制御の課題

OpenAIのCoT-Control提案は、思考連鎖（推論過程）を可視化して安全性を高める試みであり、具体的な検証を待ちつつ開発者は監視性重視の設計と運用リスク評価を早めに進めることが重要です。

CoT-Control 推論推論ログ監視性

続きを読む

AIの推論力を問うFirst Proof

2026年2月21日

AIの推論力を問うFirst Proof

First Proof submissionsは、AIが専門問題に対する最初の証明（推論過程）を公開する取り組みです。現状は情報が限定的ですが、透明性が高まれば研究・教育・実務で役立つ可能性があります。

First Proof 大規模言語モデル推論透明性

続きを読む

Netomiが示す現場で動くAIの3要素

2026年1月9日

Netomiが示す現場で動くAIの3要素

NetomiはGPT-4.1やGPT-5.2を活用し、同時実行・多段推論・ガバナンスという三要素を組み合わせることで、現場で信頼できるエンタープライズAI運用を目指しています。

Netomi 大規模言語モデル企業導入推論ガバナンス

続きを読む

Nvidia、Groq買収検討でAI競争が加速

2025年12月28日

Nvidia、Groq買収検討でAI競争が加速

NvidiaがGroqの買収を検討しており、チップ技術と人材の融合でデータセンターの推論効率向上やメモリコスト削減が期待され、AIハードの競争とエコシステム拡大が加速する見込みです。

NVIDIA AIハードウェア推論データセンター買収

続きを読む

Lean4で拓くProof付きAIの未来

2025年11月23日

Lean4で拓くProof付きAIの未来

Lean4を核に、AIの出力に「証明」を添える検証エコシステムが注目されています。医療や自動運転など高リスク領域での安全性向上に期待が高まり、AristotleやSafeなどの実装と自己修正型の進展で実用化が近づいています。

Lean4 形式検証推論説明性

続きを読む