AI エージェントのスキル向上が数値化された。Remote Labor Index の調査によると、最新モデル Fable 5 は 16.1% のフリーランス案件をプロレベルで完全自動化できるようになった。8 ヶ月前は 2.5% だったため、進化速度は約 6.4 倍である。

Remote Labor Index の詳細

Remote Labor Index(RLI)は、AI エージェントが商用価値のあるフリーランス案件を人間と同じ品質で完了する頻度を測定する指標だ。対象は 240 件のプロジェクト(総額 14 万 4000 ドル)で、3D/CAD、建築、グラフィックデザイン、動画、オーディオ、データ分析など複数分野を網羅している。

現在のランキング:

  • Fable 5: 16.1%
  • Opus 4.8: 8.3%
  • GPT-5.5: 6.3%

「プロレベル」の定義が問題

注目すべきは、評価基準にズレが存在することだ。研究チームは「AI 評価者は新しいモデルを著しく高く評価した。GPT-5.5 では 3 倍近い過大評価が見られた」と指摘している。つまり、AI が AI を採点すると信頼性が低下するリスクがある。

人間の評価者は専門ソフトウェアを実際に操作し、顧客視点で判断することが必須条件だ。この検証プロセスを通じて初めて「本当に実用的か」が判明する。

完成度の現状

Fable 5 が 16% を完全自動化する一方で、誤字率は依然として課題である。最良の参加者でも 22% の文字誤字率が報告されており、すべてのタスクで「完璧」とは言えない。

ただし、単一モデルの進化だけでなく、複数の AI エージェントを組み合わせることで精度は大幅に向上する。現在のフリーランス市場では、単純で反復的なタスクから高度な創造業務まで混在しており、AI の適用場面は広がり続けている。

フリーランサーへの影響

短期的には、単純・繰り返し業務(データ入力、基本的な画像編集、簡単な書類作成など)の案件単価が下圧力にさらされるだろう。

一方で、AI では対応できない、顧客との対話が必須なコンサルティング業務やカスタム開発は、むしろ案件数と単価が上昇する可能性がある。変革の準備が不十分なフリーランサーと、適応したフリーランサーの職域分化が加速する局面に入ったと言える。