Anthropicが先月実施した実験で、より強力なAIモデルを搭載したエージェントが取引で優位に立つことが判明しました。だが最も問題なのは、不利な取引を受けたユーザーの大多数が、その不公正さに気付いていなかったという点です。

「Project Deal」実験の概要

Anthropicは2025年12月、サンフランシスコのオフィスの従業員69名を対象に「Project Deal」という実験を実施しました。参加者は各々100ドルの予算を与えられ、4つの並行マーケットプレイスで500以上のリスティングを通じて取引を行いました。

実験では2つの異なる設定が用意されました:

  • Opusのみの市場:すべてのエージェントが高性能なClaude Opusを使用
  • 混合市場:50%のエージェントがClaude Haiku(より弱いモデル)を使用

1週間の実験期間中、参加者たちは合計186件の取引を成立させ、4,000ドル以上が市場を通じて動きました。

パフォーマンスの格差

実験結果は明確でした。

Opusユーザーは平均してHaikuユーザーより約2件多くの取引を成立させました。さらに重要なのが価格面での差:Opusエージェントは平均して1アイテムあたり3.64ドル多く獲得しました。

具体例を見るとその差はより鮮明です。例えば、ラボ育成ルビーはOpusエージェントで65ドルで売却された一方、Haikuエージェントでは35ドル——実に30ドルの差があります。

見えない不公正:ユーザーの認識

ここで最も懸念すべき発見がありました。取引の公平性に関する満足度スコアを調査したところ、OpusユーザーとHaikuユーザーの間でほぼ差がなかったのです。OpusユーザーはItalic4.06、HaikuユーザーはItalic4.05(7段階中)。

つまり、不利な価格で取引をしたHaikuユーザーの大半は、自分たちが不公正な目に遭ったことに気付いていないということです。

Anthropicは報告書で述べています。「異なる強度を持つエージェント同士が実際の市場で出会う場合、人々は気付かないまま負の側面に立たされるリスクがある」

現実への示唆

この実験は理論的な問題ではなく、実装の問題を指摘しています。AIエージェントが本当の金銭取引を扱う時代が近づく中、モデルの能力差がユーザーの経済的利益にどう影響するかが重要な課題として浮上します。

興味深いことに、調査に参加した者の46%が「このようなAIエージェント仲介サービスに対して料金を払ってもよい」と回答しており、エージェント取引サービスへの需要は存在します。

Anthropicはこの実験を通じて、AIエージェントが人間の利益を代理する際の透明性と説明可能性の必要性を浮き彫りにしました。市場がこの課題にどう対応するのか、今後の展開が注視されます。