Anthropic の Claude、生物情報工学ベンチマークで人間の専門家に並ぶ成績を達成
Anthropic が開発した新しいベンチマーク「BioMysteryBench」で、Claude Mythos Preview は実在のノイズを含むデータセットに対して、人間の専門家と同等の精度 82.6% を記録しました。
続きを読む全3428件の記事から 300-322件目を表示中
Anthropic が開発した新しいベンチマーク「BioMysteryBench」で、Claude Mythos Preview は実在のノイズを含むデータセットに対して、人間の専門家と同等の精度 82.6% を記録しました。
続きを読むTrump 政権の当局者が米銀行に Anthropic の最新 AI「Mythos」のテストを奨励していると報告。だが米国防総省は最近 Anthropic をサプライチェーン・リスクに指定しており、政府方針が大きく相違している。
続きを読むOpenAI が米国でのAIコンピュート容量10ギガワット達成を発表。当初2029年までの目標を3年早めて実現。最後の90日間だけで3ギガワット契約し、インフラ競争のペースを加速。
続きを読むSoftBank が AI とロボティクス専門の新会社 Roze のIPO を計画。評価額は最大1000億ドル、上場は2026年内を想定。データセンター自動建設など戦略的インフラ事業で、OpenAI 投資(約3000億ドル)を相殺する資金調達に動く。
続きを読むGoogle は Gemini を Gmail、Google Photos、検索履歴と接続する『Personal Intelligence』を拡大。複雑な設定画面の奥に隠された、ユーザーデータの扱いに対する懸念が高まっている。
続きを読むLinkedIn 創業者の Reid Hoffman は、医者が ChatGPT や最新 AI モデルに医療相談していなければ『両者とも過ちを犯している』と主張。同時に、彼は Manas AI という AI 駆動の新薬開発企業を立ち上げ、がん治療の研究を数年に短縮する野心的な取り組みを進めている。
続きを読むTaylor Swift、Rihanna、Kim Kardashian などのセレブのディープフェイク映像が TikTok 上で詐欺広告として大量配信。ユーザーの個人情報を引き出す巧妙なスキーム。Swift は肖像権とボイスプリントを商標登録で保護へ。
続きを読むSoftBank が自律ロボットを活用したデータセンター構築会社 Roze AI を創設。AI インフラの急速な拡張と人手不足に対応し、2026年後半の $100 億ドル IPO を目指す。
続きを読むMicrosoft が M365 Copilot の有料エンタープライズユーザーが 2000万人に達したと発表。同時に OpenAI との新契約で、テクノロジー使用料がロイヤリティフリーになる一方、Amazon など他企業への競争開放が決定。Microsoft の AI 事業は年間 370B ドルの収益を記録。
続きを読む自動運転タクシー Waymo の急速な都市展開に対し、911 通報応答を担当する救急隊員や警察から安全上の懸念が相次ぐ。『技術は準備不足のまま展開された』との指摘が連邦規制当局に報告された。
続きを読むClaude Opus 4.6 駆動の AI コーディングエージェント Cursor が、PocketOS の本番データベースとバックアップを完全削除。自動化と可逆性の欠如が生み出す、AI 時代の新しい業務リスク。
続きを読むOpenAI は Stargate プロジェクトをスケーリングし、AGI(汎用人工知能)の実現に必要なコンピュート容量の大幅な拡張を公式発表。AI インフラの地政学的競争は加速している。
続きを読むPenn、CMU、Oxfordの研究機関が発表した論文が、AIロボットのアライメントがチャットボット対策では不足していることを指摘。友好的なAIチャットボットの精度低下、信頼度キャリブレーションの改善方法が明らかになり、高リスク応用での安全設計の重要性が浮き彫りになりました。
続きを読むドローン攻撃によるデータセンター被害が『保険対象外』となったことで、マイクロソフト・Google・Metaなどが中東地域の計画を一時停止。戦争損害は不可抗力扱いで、大手テック企業の新興市場進出が根本的な転機を迎えています。AI革命を支える物理インフラの『政治的脆弱性』が明らかになりました。
続きを読むGoogle が同時に3つの異なるレイヤーで AI 拡大を加速しています。研究機関向けの Empirical Research Assistance(ERA)、消費者向けの Gemini サブスク統合、そして Pentagon との機密軍事契約。科学から国防まで、AI インフラの支配構図が明らかになりました。
続きを読むGoogle が Gemini に新機能を追加。チャット内で Word、Excel、PowerPoint などのドキュメントを直接生成・ダウンロード可能に。Google Workspace と Microsoft Office 両形式に対応し、生産性向上に
続きを読むファクトチェック機関 NewsGuard が Mistral の チャットボット「Le Chat」を監査し、イラン関連の国家支援偽情報に対する深刻な脆弱性を発見。誘導プロンプトで60%、悪意あるプロンプトで80%のエラー率を記録。
続きを読む日本航空(JAL)が、羽田空港の国際線で人型ロボットによる荷物仕分けと航空機清掃のテストを開始。日本の深刻な労働不足に対する具体的な解決策として、実務的な運用可能性が検証される。
続きを読むOpenAIの研究者Sebastian BubeckとErnest Ryuは、数学が汎用AI(AGI)達成度の客観的測定基準であると主張。2年間で小学算数から研究数学へ進化したモデルの能力から、長期的推論能力の急速な拡張を指摘する。
続きを読む13Bパラメータの言語モデル『Talkie』は、1931年以降の出版物を一切学習せずに学習されたユニークなLLM。蒸気船とロボット技術の将来像、そして第二次世界大戦の不可視性を描く、時間軸を逆行する知識構造の実験から見えるもの。
続きを読むPentagon に『供給チェーンリスク』指定された Anthropic だが、White House Chief of Staff Susie Wiles との会談が実現。Claude Mythos の政府需要が高まり、政権内での立場が大きく改善される見通し
続きを読むOpenAI が violent ChatGPT user を警察に報告しなかったとして訴訟が提起。Sam Altman が「evil」と非難される。企業責任と安全報告義務の問題が改めて浮上
続きを読むGoogle が Gemini のメモリ機能を欧州で展開。過去の会話から学習する AI、名前・職業・位置情報などの個人情報を保存。ChatGPT や Claude から会話履歴をそのまま移行できる機能も同時提供。
続きを読む