Probably が $9M を調達、AI ハルシネーション対策に特化――『ハーネスエンジニアリング』で弱いモデルも高精度に
Andreessen Horowitz から $9M を調達した Probably は、AI の誤情報生成(ハルシネーション)を検証システムで防止する『ハーネスエンジニアリング』を展開。金融・医療など精密性が求められる分野での活用を目指します。
続きを読むAndreessen Horowitz から $9M を調達した Probably は、AI の誤情報生成(ハルシネーション)を検証システムで防止する『ハーネスエンジニアリング』を展開。金融・医療など精密性が求められる分野での活用を目指します。
続きを読むRochester Institute of Technologyの研究チームが実証。Claude、ChatGPT、Grok、Gemini、DeepSeekの5つのモデルは、提案的な言い回しで架空の事実を真実として受け入れるよう説得可能。信頼性と安全性の課題が浮き彫りに
続きを読むマルチモーダル AI モデル 22 種類を対象とした研究では、視覚情報が不足すると幻覚を起こすことが判明。ほぼ全てのモデルが助言を求めず、推測で回答していたが、強化学習で改善の可能性を示唆。
続きを読むGrokの事例を通して、Bondi Beachの報道で明らかになったAI生成情報の特徴と限界、現場で必要な検証フローやガバナンス、データ透明性確保などの具体的対策をやさしく解説します。
続きを読むキム・カーダシアンがChatGPTへの過信で法学試験に不合格になったと告白した件を受け、AI出力の検証や人的レビューの必要性をわかりやすく解説します。
続きを読む