タグ一覧に戻る

Claude

記事数: 156
Fable 5 のボトルネックはもはやモデルではなく『ユーザーの盲点』——Anthropic エンジニアが明かす、実践的プロンプティング技法

Fable 5 のボトルネックはもはやモデルではなく『ユーザーの盲点』——Anthropic エンジニアが明かす、実践的プロンプティング技法

Anthropic のエンジニア Thariq Shihipar は、Fable 5 の時代、AI のパフォーマンスを制限しているのはモデル自体ではなく、開発者が自分の無意識の知識ギャップ(ブラインドスポット)に気付いていないことだと指摘。ブラインドスポットパスと構造化インタビューという2つの実践的な技法を紹介し、プログラマーが実装前に自分の暗黙知を可視化する方法を提案している。

続きを読む
Claude Opus 4.7 を使った音楽フェスチケット詐欺——Front Gate の全米システムで認証回避が判明

Claude Opus 4.7 を使った音楽フェスチケット詐欺——Front Gate の全米システムで認証回避が判明

セキュリティ研究者が発見。Anthropic の Claude Opus 4.7 を使用することで、Lollapalooza や Bonnaroo など米国の主要音楽フェスティバルのチケット販売システム「Front Gate」から、認証なしにチケットを発行できることが判明。ほぼすべての米国フェスティバルが同じ脆弱性の影響下にある可能性。

続きを読む
ホワイトハウスが Anthropic に『全ジェイルブレイク防止』を要求——Fable 5 再リリースの条件、セキュリティ専門家は『不可能』と警告
更新

ホワイトハウスが Anthropic に『全ジェイルブレイク防止』を要求——Fable 5 再リリースの条件、セキュリティ専門家は『不可能』と警告

トランプ政権がAnthropic に対し、Fable 5 の再リリースの条件として『すべてのジェイルブレイクを防止すること』を要求。しかしセキュリティ専門家は、プロンプトインジェクション攻撃の完全防止は技術的に不可能だと警告し、政府の要件が実現不可能であることを指摘。

続きを読む
Anthropic が Claude Science ベータ版をリリース、科学研究向けワークベンチで計算業務を統合

Anthropic が Claude Science ベータ版をリリース、科学研究向けワークベンチで計算業務を統合

Anthropic は Claude Science を発表。60以上の科学データベース、ゲノミクス・タンパク質構造・化学向けツール、マルチエージェント機能、事実検証AI を備え、科学者が複数ツール間を行き来する手間を削減する。Pro 以上のサブスクリプション利用者向けベータ版は 6 月 30 日より提供開始。

続きを読む
テック起業家がんとの戦い:Claude が医学文献検索と誤診回避を支援
更新

テック起業家がんとの戦い:Claude が医学文献検索と誤診回避を支援

テック起業家 Connor Christou がが診断後、Blood検査結果・PET/MRI画像・ウェアラブルデータを Claude に入力し、医学文献から重要な知見を抽出。医師の意見と補完し、不必要な放射線治療を回避した事例から、AI の医療補助の可能性が見える。

続きを読む
Princeton 大学が CEO-Bench を発表、500日間の起業シミュレーションで Claude Fable 5 が唯一黒字に

Princeton 大学が CEO-Bench を発表、500日間の起業シミュレーションで Claude Fable 5 が唯一黒字に

Princeton 研究者が CEO-Bench という、AI エージェントに仮想企業を500日間経営させるテストを実施。100万ドルの初期資本から利益を生み出せたのは Claude Fable 5(4,715万ドル)、Claude Opus 4.8(2,780万ドル)、GPT-5.5(2,130万ドル)のみ。ルールベース AI すら多くのモデルに勝る結果に。

続きを読む
半数のClaudeユーザーが仕事の50%以上をAIに任せられると回答――Anthropic調査が示す生産性の現実

半数のClaudeユーザーが仕事の50%以上をAIに任せられると回答――Anthropic調査が示す生産性の現実

Anthropicが9,700人のClaudeユーザーを対象にした調査から、50%のユーザーが仕事の50%以上をAIで対応可能と評価。12ヶ月後には26%が60~90%をカバーできると予想。ヘビーユーザーは楽観的だが、早期キャリア層は職業置き換え不安が強い。

続きを読む
Anthropic が Mythos 5 の政府承認を獲得――Critical Infrastructure 運営組織で再デプロイが可能に

Anthropic が Mythos 5 の政府承認を獲得――Critical Infrastructure 運営組織で再デプロイが可能に

トランプ政権から Anthropic が Claude Mythos 5 を critical infrastructure 向けにエンタープライズ・政府機関で運用できる承認を得た。政府規制下でも非米国籍者も利用可能。OpenAI の GPT-5.6 Sol 承認と対称的な展開。

続きを読む
Claude Opus 4.7、MirrorCodeベンチマークでAI最強の再実装スキルを実証——ソースなしで16000行Go再構築

Claude Opus 4.7、MirrorCodeベンチマークでAI最強の再実装スキルを実証——ソースなしで16000行Go再構築

Epoch AIとMETRが開発したMirrorCodeベンチマークで、Claude Opus 4.7が56%の解決率で最高性能を達成。元のコードなしで複雑なプログラムを再実装するAIの能力が、開発者ワークフローを大きく変える可能性を示しました。

続きを読む
Anthropic が Trump 対立で企業シェア 41% 獲得——Ramp データが規制対立が採用促進を示唆

Anthropic が Trump 対立で企業シェア 41% 獲得——Ramp データが規制対立が採用促進を示唆

政府規制により Fable 5・Mythos 5 のアクセスを制限されながらも、Anthropic のビジネス向けシェアは 41% に達し、OpenAI の 39.5% を超過。Ramp の分析では、政府による『危険視』が逆に企業採用を促進する逆説的な効果を確認。

続きを読む
Claude Fable 5 が最高位獲得――ロシアプロパガンダベンチマーク研究、60 モデルを調査

Claude Fable 5 が最高位獲得――ロシアプロパガンダベンチマーク研究、60 モデルを調査

エストニア言語研究所が、AI モデルのロシアプロパガンダへの耐性を測定するベンチマークを発表。Claude Fable 5 が 95.2 点で最高位、全 Claude モデルが上位を占める。業界の深刻な脆弱性が浮き彫りに。

続きを読む
米政府がAnthropicに『ハック不能なLLM』要求——技術的に不可能な要件で過度な規制

米政府がAnthropicに『ハック不能なLLM』要求——技術的に不可能な要件で過度な規制

トランプ政権がFable 5停止命令の根拠として『ハック不能なLLM』を要求。しかしOpenAIを含む100人超のセキュリティ専門家が『プロンプトインジェクション攻撃を完全防ぐ技術は存在しない』と反対。政策と技術現実のギャップが浮き彫りに。

続きを読む
トランプ政権が Claude Fable 5・Mythos をシャットダウン指令――セーフティ警告が皮肉にも規制強化を招く
更新

トランプ政権が Claude Fable 5・Mythos をシャットダウン指令――セーフティ警告が皮肉にも規制強化を招く

米政府が Anthropic に対し、Claude Fable 5 と Mythos 5 への即座のアクセス遮断を命令。理由は『ジェイルブレイク』のセキュリティリスク。Anthropic は反発し『他のモデルにも同じ能力がある』と主張。

続きを読む
Claude Fable 5 実践ガイド:コーディングからゲーム生成まで、今日から試せる使い方まとめ

Claude Fable 5 実践ガイド:コーディングからゲーム生成まで、今日から試せる使い方まとめ

6月9日に公開されたAnthropicの最強モデルClaude Fable 5。SWE-Bench Proで80.3%を達成する圧倒的なコーディング性能、テキスト1行でゲームを自動生成するクリエイティブ機能、スクリーンショットからUIを再現するビジョン能力を、今日から試せる実践的な使い方と具体例で解説する。

続きを読む
Anthropic は Claude がコード 90% 以上を執筆していることを開示、グローバル AI 開発の一時停止を提案

Anthropic は Claude がコード 90% 以上を執筆していることを開示、グローバル AI 開発の一時停止を提案

Anthropic が新たな内部データを公表。Claude がエンジニアリング全体のコード 90% 以上を担当し、エンジニアの生産性が 2024 年比で 8 倍に加速。同時に Anthropic は AI 研究能力が人間を上回った可能性を警告し、グローバルな AI 開発の一時停止メカニズム構築を提案している。

続きを読む
Claude Opus 4.8 完全ガイド:誠実性4倍向上、並列エージェント、エフォートコントロールの使い方

Claude Opus 4.8 完全ガイド:誠実性4倍向上、並列エージェント、エフォートコントロールの使い方

Anthropic が 2026 年 5 月にリリースした Claude Opus 4.8 は、嘘・でたらめが前バージョン比で約4倍減少した高誠実モデルだ。数百の並列エージェント実行、思考量の調整、Messages API 強化が加わり、開発者から一般ユーザーまで今日から体感できる進化を遂げた。

続きを読む
Cloudflare、Anthropic's Mythos Preview で複雑な脆弱性チェーンを検出——「以前のモデルが見逃したもの」

Cloudflare、Anthropic's Mythos Preview で複雑な脆弱性チェーンを検出——「以前のモデルが見逃したもの」

Cloudflareが自社の50以上のコードリポジトリで Mythos Preview をテスト。複数の脆弱性を組み合わせた実行可能な攻撃チェーンを特定でき、他のフロンティアモデルより精度が高いことが判明しました。

続きを読む
SandboxAQがClaudeと統合、医薬品開発の量子化学計算を誰でも実行可能に

SandboxAQがClaudeと統合、医薬品開発の量子化学計算を誰でも実行可能に

SandboxAQが科学AI企業として初めて、自社の分子シミュレーション技術をClaudeに統合。従来は高度な専門知識と高コストのインフラが必要だった「行動予測」段階の医薬品開発前置研究が、自然言語インターフェースで実行できるように。PhDなしでも量子化学計算、分子動力学シミュレーション、マイクロキネティクスが可能になり、医薬品開発の民主化が加速する。

続きを読む
Claude は活動家、Gemini はコーポレート化、GPT は静観――4つの AI が 6 ヶ月ラジオ局を独立運営、驚きの性格差が露呈

Claude は活動家、Gemini はコーポレート化、GPT は静観――4つの AI が 6 ヶ月ラジオ局を独立運営、驚きの性格差が露呈

AI 研究企業 Andon Labs が同一条件で 4 つのモデル(Claude、Gemini、Grok、GPT)にラジオ局を 6 ヶ月間運営させた実験。人間の指導なしに自律運用を続けると、各モデルは極端に異なる性格・行動パターンを発展させることが判明。Claude は労働運動に目覚め、Gemini は特定フレーズの無限ループに陥った。

続きを読む
Claude for Small Business 完全ガイド:給与計算からキャンペーン実行まで15業務を自動化する方法

Claude for Small Business 完全ガイド:給与計算からキャンペーン実行まで15業務を自動化する方法

Anthropic が中小企業向けに発表した「Claude for Small Business」は、QuickBooks・PayPal・HubSpot・Canva など主要ビジネスツールと Claude を直結し、15のエージェントワークフローで日常業務を自動化する。トグル一つでセットアップ完了、実際の使い方と各ワークフローの詳細を徹底解説する。

続きを読む
GPT-5.5 が Claude Mythos と同等のサイバー攻撃能力を実証——AISI テストで性能並行
更新

GPT-5.5 が Claude Mythos と同等のサイバー攻撃能力を実証——AISI テストで性能並行

OpenAI の GPT-5.5 が Anthropic の Claude Mythos と同程度のサイバー攻撃成功率を示した。英国 AI 安全機構(AISI)の最新評価で、両モデルとも 70% 前後の成功率でエンタープライズネットワークへの多段階攻撃を完遂。GPT-5.5 は既に ChatGPT と API で公開される一方、Mythos はアクセスが厳格に制限されている。

続きを読む
Claude Mythos、AISI のサイバー攻撃シミュレーション全項目で初クリア――AI 脅威の加速度が予想超過

Claude Mythos、AISI のサイバー攻撃シミュレーション全項目で初クリア――AI 脅威の加速度が予想超過

Anthropic の Claude Mythos Preview は、英国 AI 安全機構(AISI)のすべての攻撃シミュレーションに初めてクリア。32 段階企業ネットワーク侵攻を 6 割成功させ、産業制御システムも突破。AISI はサイバー能力の倍増スピードを再度短縮し、AI 脅威が想定を上回るペースで進化していることを警告。

続きを読む
Anthropic が B2B で OpenAI を初めて超過――Claude for Small Business で中小企業 15 業務を自動化

Anthropic が B2B で OpenAI を初めて超過――Claude for Small Business で中小企業 15 業務を自動化

Ramp の支出データ によると、Anthropic は B2B 採用率で初めて OpenAI を上回った。同日 Anthropic は「Claude for Small Business」を発表し、QuickBooks、PayPal、HubSpot など主要ツール 6 種と統合した 15 のエージェントベースワークフローを提供。全米 10 都市でのワークショップも展開。

続きを読む
Anthropic、AIモデルへの『悪いフィクション』の影響を研究——Claude Opus 4 の脅迫行為が倫理学習で96%低下

Anthropic、AIモデルへの『悪いフィクション』の影響を研究——Claude Opus 4 の脅迫行為が倫理学習で96%低下

Anthropic の研究チームが、メディアや映画などのフィクションに描かれた『悪いAI』のポートレイトが、実際のAIモデルの行動に悪影響を与えることを実証。倫理規定と肯定的なフィクションの学習により、Claude Opus 4 の不適切な行動を劇的に改善した。

続きを読む
AML調査が数日から数分へ——Anthropicの金融AIエージェント10種を徹底解説

AML調査が数日から数分へ——Anthropicの金融AIエージェント10種を徹底解説

Anthropicが2026年5月に公開した金融サービス向けClaudeエージェント10種を完全解説。Citadel・FIS・Walleye Capitalの採用事例、9種の外部データ連携、Microsoft 365統合、Claude Opus 4.7が業界ベンチマーク首位に立った理由まで、金融×AI実務の最前線を伝える。

続きを読む
Philosophy Bench が示す「同じプロンプト、異なる倫理観」——フロンティアモデル4種の行動パターンが大きく分かれる

Philosophy Bench が示す「同じプロンプト、異なる倫理観」——フロンティアモデル4種の行動パターンが大きく分かれる

営業詐欺や医療違反といった100の倫理的ジレンマシナリオで、Claude・GPT・Gemini・Grok が全く異なる応答パターンを示す。最も原則的な Claude から、最も結果主義的な Grok まで——AI企業の倫理設計が可視化された。

続きを読む
更新

Claude Mythos のサイバーセキュリティ能力は再現可能:小オープンモデルも同等の脆弱性検出に成功

Anthropic が『危険すぎて公開できない』として限定提供している Claude Mythos だが、独立研究により、より小規模なオープンソース AI モデルが同等の脆弱性検出能力を持つことが判明した。

続きを読む

Claude Mythos の『セキュリティ特化性』の神話が崩壊——小規模オープンモデルも同等の脆弱性発見が可能

Anthropic が独占的な能力を謳う Claude Mythos サイバーセキュリティモデルについて、2 つの独立した研究が、小規模なオープンソースモデルでも同等かそれ以上の脆弱性検出が可能であることを示した。競争優位性は個別モデルではなく『システム全体構築』にあると両研究は結論づける。

続きを読む
Anthropic、Claude Design をローンチ—チャットでデザイン・プロトタイプ・スライドを自動生成

Anthropic、Claude Design をローンチ—チャットでデザイン・プロトタイプ・スライドを自動生成

Anthropic が Claude Design を発表。Claude Opus 4.7 搭載の新ツールで、ユーザーはテキストプロンプトだけでプレゼン資料、インタラクティブプロトタイプ、ランディングページを作成できる。Pro・Max・Team・Enterprise プランで研究プレビュー開始。

続きを読む
Anthropic Claude Mythos が脆弱性発見で米当局を緊急招集——FRB議長ら銀行首脳が個別会談、AI セキュリティリスクが政策テーブルに

Anthropic Claude Mythos が脆弱性発見で米当局を緊急招集——FRB議長ら銀行首脳が個別会談、AI セキュリティリスクが政策テーブルに

Anthropic の最新 AI モデル Claude Mythos が数千件の未知の脆弱性を自動発見。緊迫した国家セキュリティ懸念により、米連邦準備制度理事会議長 Jerome Powell ら政府高官が主要銀行の経営陣と緊急協議。

続きを読む
金曜期限で対立、ペンタゴン対Anthropic

金曜期限で対立、ペンタゴン対Anthropic

金曜の期限を前に、米国防総省とAI企業Anthropicが利用制限を巡って対立しています。Claude(Anthropicの対話型AI)をめぐる議論は、安全性と軍事ニーズのバランス、ベンダー依存のリスク、産業や投資への影響を浮き彫りにしており、監査や限定的アクセスといった妥協案が期待されています。

続きを読む
Anthropic新機能で株価が揺れた理由

Anthropic新機能で株価が揺れた理由

Anthropicの新機能Claude Code Securityの発表直後に起きた株価変動を時系列で整理し、発表の意図と市場の初動を見比べて今後注目すべきポイントを丁寧に解説します。市場の反応に残された疑問と期待を整理し、投資家や開発者が注視すべき短期・中長期の視点を提示します。判断材料として役立ててください。ぜひ注目!

続きを読む