事実性

記事数: 1 件

2025年12月10日

FACTSベンチで読み解くLLM事実性

FACTSベンチはGrounding v2を含む4ベンチで公開・私設データ（公開3,513件）を併用しLLMの事実性を総合評価し、Gemini 3 Proが68.8%で首位となり改善の方向性を示しています。