LLM・生成AI 2026年5月7日 Anthropic、言語モデルが価値観を学ぶ仕組みを解明——事前学習で遵守率が大幅向上 Anthropic Fellowship Program の研究により、モデルに値説明文を事前に学習させると、指示の守引より難しい場面でも、より正確に価値観に沿った行動を示すことが判明した。 Anthropic Claude 価値観 アライメント ファインチューニング 続きを読む