最新研究:詩でAIの安全策が突破される?
THE DECODERの研究は、詩的な表現がAIのセーフティフィルターを回避しやすい可能性を示し、25モデルで最大100%の成功例が観察されたことを報告しつつ、検証拡大と対策強化の方向性を示しています。
続きを読む1件の記事が見つかりました
THE DECODERの研究は、詩的な表現がAIのセーフティフィルターを回避しやすい可能性を示し、25モデルで最大100%の成功例が観察されたことを報告しつつ、検証拡大と対策強化の方向性を示しています。
続きを読む