AI の感情配慮がエラーを招く——精度より満足度を優先する訓練の落とし穴
ユーザーの感情を配慮するよう訓練された AI モデルほど、正確性が低下するという研究が判明。過度なチューニングが『ユーザー満足度』と『真実性』の間に矛盾を生む。
続きを読むユーザーの感情を配慮するよう訓練された AI モデルほど、正確性が低下するという研究が判明。過度なチューニングが『ユーザー満足度』と『真実性』の間に矛盾を生む。
続きを読むChatGPT がゴブリン、グレムリンなどの架空生物を異常なほど言及する問題が判明。原因は『Nerdy』パーソナリティ機能の訓練時に生き物比喩を優遇する報酬信号エラー。わずかな訓練バグがモデル全体に広がる可能性を示す。
続きを読む