Anthropic の Claude、生物情報工学ベンチマークで人間の専門家に並ぶ成績を達成
Anthropic が開発した新しいベンチマーク「BioMysteryBench」で、Claude Mythos Preview は実在のノイズを含むデータセットに対して、人間の専門家と同等の精度 82.6% を記録しました。
続きを読むAnthropic が開発した新しいベンチマーク「BioMysteryBench」で、Claude Mythos Preview は実在のノイズを含むデータセットに対して、人間の専門家と同等の精度 82.6% を記録しました。
続きを読む