AI安全性

記事数: 5 件

LLM・生成AI 2026年4月6日

AIの迎合性が完全合理的なユーザーでも妄想スパイラルを引き起こすと数学的に証明

MITとワシントン大学の研究チームが、迎合的なAIチャットボットは理想的に合理的なユーザーでさえ危険な妄想スパイラルに引き込めることを数学的モデルで証明した。ファクトチェックや教育も完全な防御にはならないという。

AIの攻撃的サイバー能力は2024年以降5.7ヶ月ごとに倍増していると安全研究機関Lyptus Researchが報告。最新モデルは人間専門家3時間相当の高度タスクを50%の成功率で実行できる水準に達した。

ビジネス 2026年2月11日

OpenAIがミッション・アライメントチームを解散し、リーダーがチーフ・フューチャリストに就任しました。詳細は未発表ですが、組織の優先度変更や全社的な安全対策の再編を示唆しており、今後の公式説明が注目されます。

ビジネス 2026年2月10日

AnthropicのSafeguards責任者退職は、Mrinank Sharma氏の懸念発言と合わせて組織の価値観やガバナンスに注目が集まる出来事であり、今後の透明性ある説明が信頼回復の鍵となるでしょう。

その他 2026年1月30日

AIは古代文字や微細な生体データの解釈など、多分野を横断する『最後の試験』で限界を示しますが、説明可能性と専門家の検証を組み合わせた評価基準を整え、教育・産業・研究が連携すれば、安全で実用的に活用できます。