その他 2025年12月10日 FACTSベンチで読み解くLLM事実性 FACTSベンチはGrounding v2を含む4ベンチで公開・私設データ(公開3,513件)を併用しLLMの事実性を総合評価し、Gemini 3 Proが68.8%で首位となり改善の方向性を示しています。 Gemini 大規模言語モデル 事実性 ベンチマーク 続きを読む