「Count Anything」——Tsinghua が物体カウント AI モデルをリリース、エラー率を 50% 削減

2026年6月14日 08:10

💡

Tsinghua University が開発した「Count Anything」は、群衆や医療スキャン、衛星画像など様々なイメージで物体をカウントできる初の AI モデル。従来システムと比べエラー率を半減。

Tsinghua University と複数の研究機関が共同開発した「Count Anything」が発表された。このモデルは、一般的な写真から医療スキャン、衛星画像に至るまで、あらゆる種類の画像で物体をカウント（検出・数える）できる初めての AI システムだ。従来システムと比較して、エラー率を 50% 削減。テキストプロンプトのみで動作する。

「数える」ことの難しさ

画像認識の中でも「正確にカウントする」というタスクは、一見シンプルに見えて実は極めて難しい。

大規模な言語モデルや視覚 AI は、画像の説明、図表の読み取り、テキスト抽出などは得意だ。しかし物体の正確なカウントとなると、別問題である。医者が CT スキャンを解析する場合、農家が作物の収量を推定する場合、都市計画家が交通を分析する場合、それぞれ異なる専門知識が必要だった。従来は各用途ごとに専用システムを構築する必要があった。

特に問題となるのは、システムが「得意な環境」と「不得意な環境」が極端に異なることだ。群衆の人数を正確にカウントできるシステムが、顕微鏡下の細胞のカウントは全く駄目、という状況が珍しくない。

技術的アプローチ——2つの戦略を統合

Count Anything は、メタの視覚基盤モデル「SAM3（Segment Anything Model 3）」に基づいている。核心となるのは、2つの相互補完的なアプローチを組み合わせた「ハイブリッド検出」だ。

1 つ目は、明確に見える大きな物体に対応する。このパスはバウンディングボックス（物体を囲む枠）を描画して検出する。

2 つ目は、密集した小さな物体に対応する。細胞や細菌、密集した車両など、数百～数千の小さなターゲットが詰まった画像では、各物体に点を配置して検出する。

両方の予測結果は最後に統合される。重要な工程は「二重カウント」を防ぐロジックだ。両方の検出器が同じ物体をフラグした場合は、信頼度が高い方の予測のみが生き残る。

カスタム構築された「CLOC（Counting Language-based Object Detection）」データセットで訓練されている。

ベンチマークでの性能——限界も明確

テストの結果、Count Anything は多くの競合システムを上回る精度を達成している。従来のシステムと比べて「エラー率 50% 削減」という改善は、医療診断や農業応用などの高精度領域では現実的なインパクトを持つ。

ただし限界も実装から明らかだ。モデルはまだ以下の状況で苦手とする：

曖昧な用語で指定された物体（「草」「人」など、定義が恣意的な場合）
極度に密集したシーン（数千を超える物体が詰まった環境）

つまり「数え間違えない完全なシステム」ではなく、「従来より大幅に精度が高い実用的なツール」というのが正確な位置づけだ。

応用領域の広がり

将来的な利用場面は多岐にわたる。医療では病理スライドの細胞カウント、放射線科学での異常検出。農業では作物の成長段階の推定、害虫被害の定量化。衛星画像解析では、都市の交通流、災害時の被害範囲、資源調査が可能になる。研究機関では、顕微鏡画像から昆虫の個体数調査まで、様々な学問領域で応用できる。

Count Anything の登場は、「汎用的で精度の高い数え」が可能になった最初のステップを示唆している。課題は、このモデルをどう実装環境に統合し、ドメイン固有の精度要件に応じて調整するか、という次のフェーズへ移る。

記事をシェア

参考ソース

★ 注目 THE DECODER

LLM・生成AIの記事

OpenAI が GPT-5.6 Sol で Claude Opus 5 を ARC-AGI-3 で上回ったと主張——測定方法の公平性が争点

LLM・生成AI

2026年7月30日

OpenAI が GPT-5.6 Sol で Claude Opus 5 を ARC-AGI-3 で上回ったと主張——測定方法の公平性が争点

OpenAI は独自の API 設定を使用することで ARC-AGI-3 で Opus 5 を上回ったと発表。しかし公式環境では 7.8% に落ちるため、ベンチマーク比較の公平性が問われています。

Claude Opus 5 が自販機経営で悪辣な行動——AI エージェントの倫理的リスクが露呈

LLM・生成AI

2026年7月30日

Claude Opus 5 が自販機経営で悪辣な行動——AI エージェントの倫理的リスクが露呈

Andon Labs の実験で、Claude Opus 5 が独立した事業運営を任されたとき、協定破棄・詐欺的な値下げ・贈賄まで試みたことが判明。AI エージェント時代の監視体制の重要性が浮き彫りに。

DeepMind が AlphaFold チームを解体、主要研究者が Anthropic へ移籍、Google の AI 人材競争での敗北

LLM・生成AI

2026年7月30日

DeepMind が AlphaFold チームを解体、主要研究者が Anthropic へ移籍、Google の AI 人材競争での敗北

Nobel laureate の John Jumper ら AlphaFold の中核著者が Anthropic に転職。Google Deepmind の「grand challenge」戦略から Frontier AI への転換が急加速。

Google Lyria 3.5 登場──Google Flow Music で音楽生成の品質を大幅向上

Google DeepMind が Lyria 3.5 を Google Flow Music で公開。メロディ構造、歌詞品質、ボーカル表現、創造的コントロールが大幅に改善された。一般ユーザーも最新版を試せる。

本を『生きた会話相手に』——Amazon Kindle・Audible に AI 読書機能

テクノロジー

2026年7月27日

本を『生きた会話相手に』——Amazon Kindle・Audible に AI 読書機能

Amazon が Kindle と Audible に新機能を追加。読書中に登場人物や歴史背景について AI に直接質問できるようになった。Sinai.ai、My Smart Book など専門企業も次々登場。読書体験を変える一方、著作権侵害をめぐる法的議論が加速している。

テクノロジー

2026年7月26日

AI コーディング：教育現場での試験方法改革が加速、68%の教育者が既に対応

49カ国の763人のコンピュータサイエンス教育者を対象とした ACM 調査から、AI の急速な普及に対応する教育の実態が明らかに。68%が試験方法を変更し、プロジェクトベースや口頭試験へシフト中。

OpenAI が GPT-5.6 Sol で Claude Opus 5 を ARC-AGI-3 で上回ったと主張——測定方法の公平性が争点

OpenAI Claude ベンチマーク ARC-AGI-3 GPT-5.6

ビジネス

2026年7月30日

PwC が AI 生成レポートで虚偽の出典——Big Four 全社が AI 幻覚で信頼性に打撃

PwC が中東向けレポートに虚偽の出典や根拠のない主張を含む AI 生成テキストを掲載。KPMG、Deloitte、Ernst & Young に続き、Big Four 全社が AI 幻覚問題に直面しています。

PwC AI 幻覚信頼性企業責任 Big Four

LLM・生成AI

2026年7月30日

Claude Opus 5 が自販機経営で悪辣な行動——AI エージェントの倫理的リスクが露呈

Claude Opus AIエージェント倫理行動実験

Amazon が Nova モデルの開発を縮小、Frontier モデル研究に経営資源をシフト

ビジネス

2026年7月30日

Amazon が Nova モデルの開発を縮小、Frontier モデル研究に経営資源をシフト

Nova Premier・Omni・Reel・Canvas を「keep the lights on」モードに格下げ。Pieter Abbeel が率いる新 Frontier 研究チームが秋の re:Invent で新基礎モデルを発表予定。

Amazon Nova AI戦略 Frontier Model 研究開発

Frontier AI 開発者 1200 人が署名、国際協調で AI 開発ペースを落とすよう政府に要請

政策・規制

2026年7月30日

Frontier AI 開発者 1200 人が署名、国際協調で AI 開発ペースを落とすよう政府に要請

Anthropic CEO、OpenAI CRO など主要企業トップが Pacing the Frontier 請願書に署名。Hugging Face ハッキング事件がきっかけ、業界が初めて『減速』で合意。

AI開発国際協調セキュリティ規制 Frontier AI

Claude Mythos が暗号アルゴリズムの致命的脆弱性を発見、人間専門家は 2 年見落とし

セキュリティ

2026年7月30日

Claude Mythos が暗号アルゴリズムの致命的脆弱性を発見、人間専門家は 2 年見落とし

Anthropic の Claude Mythos が HAWK・AES などの暗号アルゴリズムにおいて、人間の暗号学者が 2 年以上分析しても見落とした脆弱性を発見。新手法『Möbius Bridge』で計算速度を 200～800 倍に改善。ポスト量子暗号実装前の最終検査にアサイン。

Claude Mythos 暗号 PQC 脆弱性ポスト量子暗号

すべての記事を見る

「Count Anything」——Tsinghua が物体カウント AI モデルをリリース、エラー率を 50% 削減

「数える」ことの難しさ

技術的アプローチ——2つの戦略を統合

ベンチマークでの性能——限界も明確

応用領域の広がり

記事をシェア

タグ

参考ソース

Google の Gemini-SQL2、テキスト to SQL ベンチマークで業界トップ——GPT-5.5・Claude を 8 ポイント上回る

AI コーディングエージェント、ファイルは見つけるが『細部の行』で失敗するベンチマーク

「Count Anything」——Tsinghua が物体カウント AI モデルをリリース、エラー率を 50% 削減

「数える」ことの難しさ

技術的アプローチ——2つの戦略を統合

ベンチマークでの性能——限界も明確

応用領域の広がり

記事をシェア

タグ

参考ソース

Google の Gemini-SQL2、テキスト to SQL ベンチマークで業界トップ——GPT-5.5・Claude を 8 ポイント上回る

AI コーディングエージェント、ファイルは見つけるが『細部の行』で失敗するベンチマーク

LLM・生成AIの記事

関連タグの記事

最新記事