Google の AI Overviews 精度 91%、だが毎時「400万件の誤答」を生成か

2026年4月8日 05:12

💡

Google の AI Overviews 精度は Gemini 3 で 91% との研究結果が報告されたが、同社のスケールでは毎時数百万件の誤った回答が生成される。さらに、正しい回答の半分以上が引用元で検証できず、透明性と信頼性の課題が浮き彫りに。

AI スタートアップ Oumi による研究で、Google の AI Overviews が 91% の精度で正確な回答を提供していることが判明した。しかし、Google のスケールに照らし合わせると、毎時数百万件の誤った回答が生成されていることになり、ユーザーの信頼を揺るがす可能性がある。

「9割正確」の陰に隠れた課題

New York Times の依頼で実施されたこの研究では、SimpleQA ベンチマークを使用して 4,326 件の Google 検索を分析した。結果は以下の通りである：

Gemini 2: 85% の精度
Gemini 3: 91% の精度

一見すると、精度の改善は好ましい傾向に思える。しかし、The Decoder の報道によると「Google のスケールでは、9割の成功率であっても毎時数百万件の誤った回答が生成される」ことになる。この数字の重みを理解するうえで、表面的な「正確性」は十分な指標ではないことが明らかになった。

検証可能性の深刻な低下

より深刻な問題は、回答の検証可能性の低下である。Gemini 3 では、正確とされた回答の 56% が提供された引用元を通じて実際には検証できなかった。これに対し、前バージョン（Gemini 2）では同じ問題が 37% にとどまっていた。

加えて、Google は Facebook や Reddit といった信頼性に疑問がある情報源を頻繁に引用していることが判明した。これらのソースが上位 4 位以内にランクインしているという事実は、AI による回答の信頼性に対する疑問をさらに深める。

Google の反論と業界への影響

Google はこの研究に対し、SimpleQA ベンチマークが「不正確な情報を含んでおり、Google での実際の検索行動を反映していない」と反論している。しかし、より根本的な課題として指摘されているのは、Google が直接回答を提供することで、外部の Web サイトへのトラフィックを削減し、パブリッシャーの経済基盤を脅かしているという点である。

AI Overviews の導入は、ユーザー体験の向上を狙ったものだが、その過程で情報の出所となるメディアやパブリッシャーへの影響は十分に考慮されていない可能性がある。精度と透明性、そして情報エコシステムのバランスをどう取るかが、Google に問われる重要な課題となっている。

記事をシェア

参考ソース

★ 注目 The Decoder

テクノロジーの記事

「Vibe Coding」——Bluesky で AI ツール非難が流行、スケープゴート化する生成 AI

テクノロジー

2026年4月8日

「Vibe Coding」——Bluesky で AI ツール非難が流行、スケープゴート化する生成 AI

Bluesky ユーザーの間で、あらゆる技術問題の原因を「vibe coding」——AI コーディングツール使用——のせいにするトレンドが蔓延。生成 AI が便利なスケープゴートになっている実態が指摘される。

テクノロジー

2026年4月7日

Intel がチップパッケージング技術に全力投資、AI 市場での競争力強化

Intel Foundry は EMIB パッケージング技術の拡大により、Google や Amazon との大型パッケージング案件獲得に向けて動いている。120mm×120mm のパッケージで NVIDIA の最新 AI チップを上回るサイズを実現予定。

X公式MCPサーバー「xmcp」完全ガイド：AIエージェントでX APIを自在に操る

テクノロジー

更新 2026年4月7日

X公式MCPサーバー「xmcp」完全ガイド：AIエージェントでX APIを自在に操る

X Developer Platformが公開したxmcpを使えば、Claude・OpenClaw・Claude Codeなど140以上のX APIエンドポイントをAIへの口頭指示だけで操作できる。全ツールリスト・活用アイデア・自動化の注意点まで徹底解説する。

Anthropic、Google・Broadcomとの提携を拡大——計算能力が急増する需要に対応

Anthropicが計算インフラ契約をGoogle・Broadcomとの間で拡大。Claude利用の急増に対応するため、TPU（Tensor Processing Unit）チップとネットワーク技術を活用した大規模な計算能力の拡張を実施。

Google、開発者向けに最新AIモデル「Gemini 3」を公開　AI StudioとVertex AIでプレビュー提供開始

特集記事

2025年11月19日

Google、開発者向けに最新AIモデル「Gemini 3」を公開　AI StudioとVertex AIでプレビュー提供開始

Googleが公開した最新AI「Gemini 3」は、1Mトークン長文理解とマルチモーダル、エージェント的自動コーディングを一体化した“開発者向けモンスターLLM”。AI Studioで無料試用し、そのままVertex AIで本番投入も可能です。既存LLMと何が違い、どんなアプリを一気に現実にできるのか、具体例とAPIの勘所を解説します。