Anthropic が 6 月 30 日にリリースした「Claude Sonnet 5」が、AIエージェントの使い方を大きく変えようとしている。同社の説明を借りれば「これまで最もエージェント的なSonnetモデル」——ブラウザを自律的に操作し、ターミナルでコマンドを実行し、複数のツールを組み合わせて長い業務フローを最初から最後まで完走できるモデルだ。

そして何より重要なのは、これが Free プランを含む全ての Claude.ai プランで今日から使えるという点だ。

Claude Sonnet 5 とは何か——「エージェント特化」の意味

従来の LLM は「質問に答える」という受動的な使い方が中心だった。ユーザーが指示を出し、AIが回答し、またユーザーが次の指示を出す——このやりとりを繰り返すのが基本のスタイルだ。

Claude Sonnet 5 が目指すのは、このループを自分で回すことだ。

たとえば「この Salesforce のアカウント情報を更新して、変更が完了したら担当者にメールを送信して」という一文の指示を受け取ると、モデルが自律的に Salesforce を操作し、変更内容を確認し、メールを作成・送信するまでを一気に実行する。人間が各ステップを監督する必要はない。

この「エージェント的な振る舞い」を可能にしているのは、以下の 3 つの能力の向上だ。

計画立案(Planning)

複雑なタスクを受け取ったとき、どのステップをどの順番で実行するかを自分で組み立てられる。途中で予期しない状況が発生しても、計画を修正して対応できる。

ツール使用(Tool Use)

ブラウザの操作、ターミナルへのコマンド入力、外部 API の呼び出し、ファイルの読み書きなど、多様なツールを文脈に応じて選択・実行できる。

自己検証(Self-Verification)

生成した結果が正しいかどうかを自分でチェックし、エラーがあれば修正を試みる。バグを修正してテストが通るまで自律的に試行を繰り返す、といった動作が実現した。

他モデルとどう違うか

Sonnet 5 の位置づけを整理しておこう。

モデル特徴価格(入力/100万トークン)
Claude Fable 5最強・最大。複雑な研究・創作向け非公開(Enterprise中心)
Claude Opus 4.8高性能・汎用。難しい推論に最適$15
Claude Sonnet 5エージェント特化。Opus 4.8に迫る性能$2(〜8月31日)
Claude Haiku 4.5最速・最安。シンプルな処理向け$0.80

特筆すべきは「知識作業能力」を測定するベンチマーク「GDPval-AA v2」で、Sonnet 5 が 1,618 ポイントを記録し、Opus 4.8 の 1,615 ポイントをわずかに上回った点だ。エージェント的なタスクに限っていえば、より高価な上位モデルに勝るとも劣らない。

コーディングの指標「SWE-bench Pro」では 63.2%(前モデル Sonnet 4.6 から 5.1 ポイント向上)、ターミナル操作能力を測る「Terminal-Bench 2.1」では 80.4%(13.4 ポイント向上)を達成した。

今日から試せる 5 つのユースケース

1. バグ調査から修正まで一気通貫

「このコードでテストが落ちている。原因を調べて直して」と伝えるだけで、Sonnet 5 はエラーログを読み、問題のある箇所を特定し、修正コードを書き、テストを再実行して確認するまでを自律的に行う。

Claude.ai の Projects 機能でリポジトリのコードをコンテキストに読み込ませておくと効果が高い。

2. 繰り返し業務フローの自動化

社内ツールや SaaS との連携にはAPIアクセスが必要だが、Claude.ai のブラウザツール機能(Pro / Max / Team プランで利用可能)を使うと、ウェブ上の操作なら手動で試せる。

典型的な使い方:

  • 競合他社のニュースをウェブで収集し、カテゴリ分けしてスプレッドシートに整理
  • 複数サイトから製品情報を取得して比較表を作成
  • フォームへの入力作業を代行

3. 法的・学術リサーチの補助

原文ドキュメントを貼り付けて「この契約書の中でリスクのある条項を洗い出して、その理由と対応策をまとめて」と指示すれば、詳細な分析レポートを生成できる。

Sonnet 5 はリサーチ業務(法律・財務・学術)での採用事例が多く、長い文書の要点把握や論点整理に強い。

4. データ分析パイプラインの構築

CSV や JSON データを添付して「売上の傾向を分析して、異常値を検出して、可視化用の Python スクリプトを書いて」と依頼すると、分析・コード生成・出力確認を一連でこなせる。

Claude.ai の Analysis 機能(Pro 以上)ではサンドボックス環境でコードを直接実行できるため、結果の確認まで Claude 上で完結する。

5. 長文ドキュメントの作成・編集

複数の参考資料をコンテキストに読み込ませた上で「これらをもとに技術仕様書の初稿を書いて」と指示すると、内容を整合させながら構造的な文書を生成できる。

書き終えたドキュメントのレビューを依頼すると、矛盾点や曖昧な記述を自動的に洗い出して修正案を提示してくれる。

Claude.ai で使う方法

無料(Free)プランでも利用可能だが、エージェント機能を本格的に使うには Pro プラン(月額 $20)以上が推奨だ。

  1. claude.ai にログインする
  2. モデル選択で「Claude Sonnet 5」を選ぶ(現時点では「Sonnet」と表示される場合がある)
  3. 通常のチャットとして使う場合は普通に会話すればよい
  4. ブラウザ操作を伴う複雑なタスクは「Projects」や拡張機能を活用する

API で使う方法

開発者が Anthropic API から使う場合、モデル ID は claude-sonnet-5 だ。

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-5",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "この Python スクリプトのバグを特定して修正してください: ..."
        }
    ]
)

エージェント的なタスクには tools パラメータでツール定義を渡し、tool_use ループを実装するのが標準的なパターンだ。Anthropic の公式ドキュメントに詳細なサンプルコードが掲載されている。

価格の目安

2026 年 8 月 31 日までの導入価格:

  • 入力:100 万トークンあたり $2
  • 出力:100 万トークンあたり $10

9 月 1 日以降は入力 $3・出力 $15 の標準価格に移行する。8 月末までの間に本番環境での評価を済ませておくとコスト面で有利だ。

まとめ——「頼んで終わり」が現実になってきた

Claude Sonnet 5 の登場が示しているのは、AIエージェントが「技術的な実験」から「実務で使えるツール」に移行しつつある段階に差し掛かったという事実だ。

バグ修正、データ整理、ドキュメント作成、ウェブリサーチ——これらのタスクを「頼んで、あとは自分で確認するだけ」に変えられる可能性が、今日の時点でほぼ全員に開かれている。

試すハードルは低い。Claude.ai を開いて、いつもより少しだけ大きなタスクをそのまま投げてみることから始めてみるといい。思ったより遠くまで走ってくれるはずだ。