NextAI 海外で話題の最新AIニュース

タグ一覧に戻る

推論能力

記事数: 3 件

ARC-AGI-3が示す「前線モデル1%未満」の謎

更新 2026年5月3日

ARC-AGI-3が示す「前線モデル1%未満」の謎

ARC-AGI-3が提案したゲーム型の新ベンチマークでは主要な前線モデルが1%未満にとどまり、評価設計が能力の見え方を左右することと、透明性や再現性、データ倫理の整備が現場導入の鍵であることを示唆しています。

ARC-AGI-3 大規模言語モデル推論能力ベンチマーク GPT-5.5

続きを読む

OpenAI研究者が提唱する「数学がAGIへの道」――推論能力の急速な進化で示された証

2026年4月30日

OpenAI研究者が提唱する「数学がAGIへの道」――推論能力の急速な進化で示された証

OpenAIの研究者Sebastian BubeckとErnest Ryuは、数学が汎用AI（AGI）達成度の客観的測定基準であると主張。2年間で小学算数から研究数学へ進化したモデルの能力から、長期的推論能力の急速な拡張を指摘する。

OpenAI AGI 数学推論能力 Podcast

続きを読む

Alibaba の HopChain、視覚言語モデルの多段推論能力を改善

テクノロジー

2026年4月7日

Alibaba の HopChain、視覚言語モデルの多段推論能力を改善

Alibaba の Qwen チームが開発した HopChain は、視覚言語モデルが複数ステップの推論で失敗する問題に対応。多段階の画像質問を自動生成し、ベンチマーク24個中20個で性能向上を実現した。

AI研究ビジョン言語モデル Alibaba 推論能力 Qwen

続きを読む