SOOHAK ベンチマーク、AI が「解けない問題」を認識できない根本的な限界を露呈――計算量増加でも改善されず
64人の数学者が開発した439問のベンチマーク SOOHAK。AI は複雑な数学問題は解くが、「この問題は解けない」と認識する能力に致命的な欠陥を持つことが判明
続きを読む64人の数学者が開発した439問のベンチマーク SOOHAK。AI は複雑な数学問題は解くが、「この問題は解けない」と認識する能力に致命的な欠陥を持つことが判明
続きを読むOpenAIの研究者Sebastian BubeckとErnest Ryuは、数学が汎用AI(AGI)達成度の客観的測定基準であると主張。2年間で小学算数から研究数学へ進化したモデルの能力から、長期的推論能力の急速な拡張を指摘する。
続きを読むOpenAI の最新モデル GPT-5.4 Pro が数学界の難題「エルデシュ open problem #1196」を約 80 分で解決。フィールズ賞受賞者テレンス・タオは、この証明が「整数の構造」と「マルコフ過程理論」の新たな関連性を示す有意義な貢献だと述べた。
続きを読むAxiomがAIで4件の未解決数学問題を解いたと報告しました(WIRED報道)。解法の公開と第三者検証が進めば、AIの推論力と計算資源が学術と産業に新たな可能性をもたらす期待があります。
続きを読む