NextAI 海外で話題の最新AIニュース

タグ一覧に戻る

Opus

記事数: 2 件

ARC-AGI-3が示す「前線モデル1%未満」の謎

更新 2026年5月3日

ARC-AGI-3が示す「前線モデル1%未満」の謎

ARC-AGI-3が提案したゲーム型の新ベンチマークでは主要な前線モデルが1%未満にとどまり、評価設計が能力の見え方を左右することと、透明性や再現性、データ倫理の整備が現場導入の鍵であることを示唆しています。

ARC-AGI-3 大規模言語モデル推論能力ベンチマーク GPT-5.5

続きを読む

Opus 4.6で変わるAI活用と100万トークン

2026年2月6日

Opus 4.6で変わるAI活用と100万トークン

AnthropicのOpus 4.6は、Agent Teamsと100万トークンの文脈ウィンドウで長文処理とチーム協働を現実に近づけます。段階導入とデータ整理で実務効果を引き出せます。

Opus 大規模言語モデル AgentTeams 長文処理企業導入

続きを読む