Anthropic の Claude、生物情報工学ベンチマークで人間の専門家に並ぶ成績を達成
Anthropic が開発した新しいベンチマーク「BioMysteryBench」で、Claude Mythos Preview は実在のノイズを含むデータセットに対して、人間の専門家と同等の精度 82.6% を記録しました。
続きを読むAnthropic が開発した新しいベンチマーク「BioMysteryBench」で、Claude Mythos Preview は実在のノイズを含むデータセットに対して、人間の専門家と同等の精度 82.6% を記録しました。
続きを読むAlphaFoldが登場して5年、研究現場での変化と現在地をWIRED取材の視点で分かりやすく整理しました。精度向上と実用化の広がり、残る課題と今後の展望が見えてきます。
続きを読む