タグ一覧に戻る

実務評価

記事数: 1

投資銀行 500 人が AI 出力を本番評価:ゼロ件が『そのまま送付可能』

投資銀行マン 500 人による実務レビューで、最高性能の GPT-5.4 でも 0 件が クライアント送付可。修正の出発点として使用可能は 16% のみ。Claude Opus 4.6、Gemini でも同様傾向。AI が高性能化する一方、実務信頼性の課題が明らかに。

続きを読む