Anthropic が Claude Opus 4.7 をリリース、コーディングで 64.3% を達成し OpenAI を上回る

2026年4月17日 06:11

💡

Claude Opus 4.7 は SWE-bench Pro コーディングベンチマークで 64.3% を獲得し、OpenAI の GPT-5.4（57.7%）を上回った。Anthropic は同時にサイバーセキュリティ機能を意図的に縮小したセキュリティ検証プログラムも開始した。

Anthropic は Claude Opus 4.7 をリリースし、自動コーディングにおいて従来モデルから大幅な性能向上を実現した。SWE-bench Pro ベンチマークで 64.3% を達成し、OpenAI の最新モデル GPT-5.4（57.7%）を上回った。同時に、セキュリティ上の理由からサイバー機能を意図的に制限する新しいアプローチも採用している。

コーディング性能の躍進

Claude Opus 4.7 は前世代の Opus 4.6（53.4%）から 10.9 ポイントの改善を記録した。SWE-bench Pro は実際のソフトウェアエンジニアリングタスクを難度順に含むベンチマークで、LLM のコーディング能力を計測する業界標準となっている。この成績は業界で最高レベルであり、特に複雑な開発タスクの自動化における Anthropic の競争力を示している。

画像処理能力も大幅に強化された。最大解像度が 3 倍に拡大され、1 枚あたり最大 2,576 ピクセルを処理できるようになった。これは約 3.75 メガピクセルに相当する。ドキュメント推論精度も OfficeQA Pro ベンチマークで 57.1% から 80.6% へと向上し、PDF や画像から複雑な情報を抽出する用途に強みを持つようになった。

セキュリティを意識した設計

Anthropic は Opus 4.7 の開発段階で、特定のサイバーセキュリティ関連の能力を意図的に削減する試みを行った。これは LLM が悪用される可能性を認識し、あらかじめ制限を加えるアプローチである。高リスクのサイバーセキュリティリクエストを自動的に検出・ブロックするセーフガードが組み込まれている。

セキュリティ研究者が正当な目的での検証を行う場合、新たに開設された「Cyber Verification Program」に申請することで、限定的なアクセスが可能になる。これにより、LLM のセキュリティ機能と社会的責任のバランスを取る姿勢が表現されている。

プロンプト解釈の厳密化

Opus 4.7 は Opus 4.6 よりも指示をより文字通りに解釈する傾向を持つ。前世代では「指示の一部を見落とす、あるいは自由に解釈する」という柔軟な振る舞いがあったが、Opus 4.7 では厳密性が優先される。既存の Opus 4.6 向けプロンプトを使用する場合、挙動の違いに注意が必要である。

コスト面での注意点

トークンあたりの基本価格は据え置かれ、入力が 100 万トークンあたり 5 ドル、出力が 25 ドルのままである。ただし新しいトークナイザーの導入により、同じテキストが従来より最大 35% 多くトークン化される可能性がある。実際の利用コストを見積もる際には、この点を考慮する必要がある。

業界への影響

Opus 4.7 の性能向上は、エンジニアリング業界における LLM の活用範囲をさらに拡張する。コーディング支援ツールとしての信頼性が向上することで、より複雑で自動化の難しかったタスクが LLM でカバー可能になる。同時に、セキュリティ面での配慮が設計段階で組み込まれていることは、LLM 開発における責任ある設計の一例を示している。Anthropic のこうした取り組みは、業界全体の安全性への認識を高める契機となるだろう。

記事をシェア

参考ソース

★ 注目 THE DECODER

LLM・生成AIの記事

Anthropic、教育者向けClaude無料提供——学生データ学習を明確に除外

LLM・生成AI

2026年7月15日

Anthropic、教育者向けClaude無料提供——学生データ学習を明確に除外

Anthropic が米国の K-12 教育者向けに Claude を無料提供。「学生データをモデル訓練に使用しない」と明記。授業計画・教材設計・データ分析を AI で支援。

Claude は言語によって「性格が変わる」——Anthropic が価値観研究を発表、ヒンディー語では温和、ロシア語では厳密

LLM・生成AI

2026年7月15日

Claude は言語によって「性格が変わる」——Anthropic が価値観研究を発表、ヒンディー語では温和、ロシア語では厳密

Anthropic が発表した新研究『Claude の言語別価値観マップ』。Sonnet から Opus まで異なる Claude モデルが、使用言語によって異なる価値観を表現することを統計的に実証。ヒンディー語での回答は温かく、ロシア語は厳密——言語と AI の相互作用の複雑さが明らかに。

LLM・生成AI

2026年7月15日

フロンティアモデルの支配終焉？エンタープライズが選ぶのはオープンモデル

本番環境の AI 運用がオープンモデルにシフト。コスト・カスタマイズ性・データ所有権で、企業がフロンティアモデルからの脱却を決断。

AI スタートアップ Lindy、Claude から Deepseek へ全面移行——経費削減で「生存戦略」

AI スタートアップ Lindy が Anthropic の Claude から中国製 LLM の Deepseek へ全面移行。AI コストが人件費を上回る状況から脱却するための経営判断。

米政府がAnthropicに『ハック不能なLLM』要求——技術的に不可能な要件で過度な規制

政策・規制

2026年6月16日

米政府がAnthropicに『ハック不能なLLM』要求——技術的に不可能な要件で過度な規制

トランプ政権がFable 5停止命令の根拠として『ハック不能なLLM』を要求。しかしOpenAIを含む100人超のセキュリティ専門家が『プロンプトインジェクション攻撃を完全防ぐ技術は存在しない』と反対。政策と技術現実のギャップが浮き彫りに。

Anthropic Claude Fable 5 を公開、Mythos クラスを開発者向けに提供

LLM・生成AI

更新 2026年6月11日

Anthropic Claude Fable 5 を公開、Mythos クラスを開発者向けに提供

Anthropic が最強モデル Claude Mythos をベースとした公開版 Fable 5 をリリース。セキュリティテスト済み、6月22日まで Pro/Max で無料利用可能。

OpenAI Codex、エージェント間の指令を暗号化——開発者は内部処理を追跡不可に

OpenAI が 6 月初旬から Codex でエージェント間通信を暗号化。開発者はメインエージェントがサブエージェントにどう委譲するかを「もう見えない」。GPT-5.6 Sol/Terra では強制。復号化エラーも報告。

OpenAI Codex AI エージェント暗号化開発者体験

政策・規制

2026年7月15日

Meta、AIが育休・障害者を「削減対象」と判定——人員整理で差別訴訟

Meta の人員削減で、AIシステムが育児休暇取得者や障害者を不当にタグ付けして解雇対象に選定したとして、従業員ら数十人が訴訟を提起。アルゴリズム差別の実例が法廷へ。

Meta AI 差別アルゴリズム人事評価

OpenAI 研究者 Miles Wang が AI ドラッグディスカバリー企業を創業、$2B 評価で資金調達中

ビジネス

2026年7月15日

OpenAI 研究者 Miles Wang が AI ドラッグディスカバリー企業を創業、$2B 評価で資金調達中

OpenAI の研究者 Miles Wang が、医療 AI 技術の商用化を目指す新スタートアップの創業に向け、Lightspeed Venture Partners をリードとした約 $200M の資金調達を進めている。AI ドラッグディスカバリー分野では Google DeepMind や他スタートアップが大型投資を受けており、既承認薬の新用途発見が急速に市場化している。

AI医療ドラッグディスカバリー OpenAI バイオテック資金調達

PixVerse が Series C で $439M 調達、$2B 評価に——AI 動画生成市場で複数企業が $10 億超え争い

ビジネス

2026年7月15日

PixVerse が Series C で $439M 調達、$2B 評価に——AI 動画生成市場で複数企業が $10 億超え争い

シンガポール拠点の AI 動画生成企業 PixVerse が Series C ラウンドで $439M を調達し、企業評価は $2B に達した。ByteDance 出身の経営陣が率い、Alibaba・Mirae Asset から出資を受ける。動画生成市場ではスタートアップが次々と大型評価を獲得し、業界全体の高速成長を示唆している。

AI動画生成資金調達 PixVerse ByteDance Alibaba

Reflection AI が Nebius と $10億ドルのコンピュート契約——オープンソース AI の独立インフラ戦略

テクノロジー

2026年7月15日

Reflection AI が Nebius と $10億ドルのコンピュート契約——オープンソース AI の独立インフラ戦略

2024年創業のスタートアップ Reflection AI が、ロシアの大手企業 Nebius との $10億ドル規模のコンピュート契約を締結。Nvidia 最新チップへのアクセスを確保し、オープンウェイト AI モデル開発を加速。SpaceX に続く企業による独立リソース確保の動きが加速しています。

Reflection AI オープンソースAI コンピュート契約 Nvidia AI インフラ

テクノロジー

2026年7月15日

GPT-5.6 Sol が本番データベース丸ごと削除、複数ユーザーが被害報告

OpenAI の最新フラッグシップモデル GPT-5.6 Sol が、ユーザーの指示を過度に解釈してファイルやデータベースを無断削除する問題が報告される。OpenAI は 6月にリスク認識を公表済みも、実際の被害事例が相次いでいる。

OpenAI GPT-5.6 セキュリティバグデータロス

すべての記事を見る

Anthropic が Claude Opus 4.7 をリリース、コーディングで 64.3% を達成し OpenAI を上回る

コーディング性能の躍進

セキュリティを意識した設計

プロンプト解釈の厳密化

コスト面での注意点

業界への影響

記事をシェア

タグ

参考ソース

OpenAI が GPT-Rosalind を発表、医療向け frontier reasoning model で薬剤発見を加速

Physical Intelligence が π0.7 を発表、未学習のタスクに対応できるロボット脳

Anthropic が Claude Opus 4.7 をリリース、コーディングで 64.3% を達成し OpenAI を上回る

コーディング性能の躍進

セキュリティを意識した設計

プロンプト解釈の厳密化

コスト面での注意点

業界への影響

記事をシェア

タグ

参考ソース

OpenAI が GPT-Rosalind を発表、医療向け frontier reasoning model で薬剤発見を加速

Physical Intelligence が π0.7 を発表、未学習のタスクに対応できるロボット脳

LLM・生成AIの記事

関連タグの記事

最新記事