新ベンチマーク『WorldReasonBench』で判明―AI動画生成モデル、推論能力はまだ未成熟
ByteDance の Seedance 2.0 が初めてランクイン。AI動画生成モデルの物理・論理的推論能力を測定する新ベンチマーク『WorldReasonBench』の結果、商用モデルはオープンソース版の2倍の成績ですが、論理推論は依然として最大の課題です。
続きを読むByteDance の Seedance 2.0 が初めてランクイン。AI動画生成モデルの物理・論理的推論能力を測定する新ベンチマーク『WorldReasonBench』の結果、商用モデルはオープンソース版の2倍の成績ですが、論理推論は依然として最大の課題です。
続きを読むGoogle Research が開発した Vantage は、AI アバターとの対話を通じて批判的思考やコラボレーション能力などの現代的スキルを評価。ニューヨーク大学との共同研究で人間の評価者と同等の精度を実証。
続きを読むYuppの短期間での閉鎖は、クリス・ディクソンら著名投資家の関与を浮き彫りにし、資金調達の透明性や早期事業検証の重要性を改めて示しました。今後の情報公開に注目ください。
続きを読む