LLM・生成AI 2026年6月18日 OpenAI、実ユーザー会話で AI モデルの失敗を予測する新手法 従来の安全テストより92%高い精度で実世界の問題を検出。GPT-5シリーズで130万会話を分析し、テストでは気付けなかった不正動作を事前に捕捉 OpenAI 安全テスト GPT-5 続きを読む