Claude Fable 5 が FrontierMath で GPT-5.5 を大幅上回る、88% 対 75%
Anthropic の Claude Fable 5 が高難度数学ベンチマーク FrontierMath で 88% の精度を達成。OpenAI の GPT-5.5(75%)を 13 ポイント上回り、AI の数学推論能力の急速な進化を示す。
続きを読むAnthropic の Claude Fable 5 が高難度数学ベンチマーク FrontierMath で 88% の精度を達成。OpenAI の GPT-5.5(75%)を 13 ポイント上回り、AI の数学推論能力の急速な進化を示す。
続きを読むAnthropic の最新モデル Claude Fable 5 は確かに強力だが、Opus 4.8 と比べてコスト対パフォーマンスの判断が重要。トークン価格を2倍に設定しながら、性能向上は5.7%にとどまる現実を、ベンチマーク分析から読み解く。
続きを読む6月9日に公開されたAnthropicの最強モデルClaude Fable 5。SWE-Bench Proで80.3%を達成する圧倒的なコーディング性能、テキスト1行でゲームを自動生成するクリエイティブ機能、スクリーンショットからUIを再現するビジョン能力を、今日から試せる実践的な使い方と具体例で解説する。
続きを読む