ChatGPT の医療機能が医師を上回る精度に——GPT-5.5 で医学的正確性が大幅向上
OpenAI が ChatGPT に搭載した医療機能を GPT-5.5 Instant にアップグレード。医師による評価で全項目で医学的精度が向上し、医療情報のエラーが 71% 削減された。
OpenAI は ChatGPT の医療機能を GPT-5.5 Instant にアップグレードしたと発表した。医師による比較テストで、新バージョンは医学的な正確性、明確さ、完全性の全項目で医師の回答を上回る性能を示している。特に、医療情報の不正確さに関するエラー率が過去2ヶ月で 71% 削減されるなど、利用者が信頼できる医療情報源として機能し始めている。
医師テスト済みの性能向上
新しい GPT-5.5 Instant は、260人以上の医師(60カ国から参加)による評価を経て開発された。評価では、ChatGPT の回答とGPT-4o の回答、そして医師による回答を5つのカテゴリで比較。その結果、GPT-5.5 Instant が指示遵守で最大 89.9% のスコアを達成し、全項目で既存モデルを上回った。
OpenAI は開発段階で 700万件以上のモデル応答をレビューし、医療情報の精度を継続的に改善してきた。この投資の成果が、エラー率の大幅な削減に反映されている。
現在の利用規模と今後の展開
ChatGPT は既に医療情報の相談窓口として大規模に利用されている。週間で 2億3000万人以上のユーザーが医療関連の質問を投げかけており、特に病院が遠い地域からの相談が急速に増えている。新しい医療機能は、無料ユーザーにも制限付きで提供される予定だ。
OpenAI は同時に「ChatGPT for Clinicians」という医療従事者向けの専用ツールも提供開始。医学文献の検索や患者データの整理など、医師の日常業務を支援する機能が組み込まれている。この動きは、ChatGPT が医療機関の診療フローに統合される動きが急速に進んでいることを示唆している。
医療 AI の信頼構築に向けた重要な段階
医療分野での AI 導入は「信頼」が最大の課題だ。単に性能が高いだけでなく、医師や患者が「このツールは正確である」と確信を持つことが必須条件となる。今回の医師テストを含めた段階的な検証は、その信頼構築の重要なステップだ。
一方で、ChatGPT が医学的判断の全責任を担うわけではない点も重要だ。OpenAI は医学的な複雑なケースでは医療専門家への相談を促す設計を維持している。AI が医療の一次相談窓口として機能する一方で、最終的な診断・治療判断は医師が担う、という役割分担がこれからの医療 AI の標準形になるだろう。