Cursor Composer 2.5が高性能・低コストを実現、Opus 4.7・GPT-5.5と同等ベンチマークを達成
Cursor が新モデル Composer 2.5 をリリース。Opus 4.7 と GPT-5.5 と同等のベンチマーク結果を実現しながら、価格は $0.50/$2.50/100万トークンと大幅に低廉。開発者が高品質モデルをより手軽に利用できる環境が整いました。
続きを読む全3353件の記事から 24-46件目を表示中
Cursor が新モデル Composer 2.5 をリリース。Opus 4.7 と GPT-5.5 と同等のベンチマーク結果を実現しながら、価格は $0.50/$2.50/100万トークンと大幅に低廉。開発者が高品質モデルをより手軽に利用できる環境が整いました。
続きを読むAmazon が Alexa+ で新機能『Alexa Podcasts』を展開開始。ユーザーが声だけで任意のトピックをポッドキャストエピソードに数分で生成できるようになります。
続きを読む韓国スタートアップ LetinAR が開発した PinTILT 光学技術が、AI眼鏡の次世代標準になろうとしています。薄く、軽く、省電力な設計で、既存技術との競争で優位性を示しています。
続きを読むHumans First を中心とする保守系団体が、フロンティア AI モデルのリリース前に強制的な安全テストを義務付ける行政命令を、トランプ大統領に対して公開書簡で要求。サイバーセキュリティから選挙への脅威まで多角的な懸念を列挙。
続きを読むスコット・ベッセント米財務長官がアメリカ主要銀行の幹部をワシントンに召喚。FRB議長も出席し、Anthropic が発表した新型AI モデル Claude Mythos がもたらすサイバーセキュリティリスクについて協議。
続きを読むトランプ政権がクライメート・気象データプログラムを削減。NOAA が AI を活用した気象予報システムを運用している最中での制度変更が、予報精度の低下をもたらす恐れ。専門家が懸念を表明。
続きを読む34社の AI スタートアップが年間80億ドルを生み出す中、Anthropic と OpenAI が89% を占める。The Information の分析から見える、基盤モデル開発者への価値集中と、アプリケーション層企業の苦境
続きを読む「普通の人(Normie)でも感覚的にコードを書ける」という時代が本当に来たのか。WIRED の記者が Claude と協力して、些細な不満を追跡するデータベースアプリを vibe coding で開発した体験記
続きを読むAnthropicがOpenAIとともに2026年の上場を視野に入れ、史上級のIPO規模が意識されつつあり、資金調達や開示の在り方に新たな基準が生まれる可能性があります。
続きを読むOpenAI の共同創業者兼会長 Greg Brockman が、公式に製品戦略全体の責任を引き継ぎ。これまで暫定的に担当していた役職が正式化され、ChatGPT と開発者向け Codex プラットフォームの統合計画が社内メモで示唆される。
続きを読む従来のロボティクス AI は「カメラ→動作の直接マッピング」に留まっていましたが、World Action Models (WAM) は「行動の結果がどう変わるか」も予測します。ラベル付けなしの日常ビデオからも学習可能に。
続きを読む自動車メーカーは従来の IT 人材を削減しながら、AI 特化スキルを持つ人材の採用に注力。GM は IT 部門の 10% をレイオフする一方で、AI 関連職への配置転換を急ぐ。業界全体でスキルシフトの競争が激化。
続きを読む報道によれば、AppleはGoogleの大規模言語モデルGeminiをSiriに組み込み、自然な会話や高度な推論を実現しようとしており、機能向上が期待される一方でプライバシー設計が重要な鍵になります。
続きを読むAI 研究企業 Andon Labs が同一条件で 4 つのモデル(Claude、Gemini、Grok、GPT)にラジオ局を 6 ヶ月間運営させた実験。人間の指導なしに自律運用を続けると、各モデルは極端に異なる性格・行動パターンを発展させることが判明。Claude は労働運動に目覚め、Gemini は特定フレーズの無限ループに陥った。
続きを読むMistral CEO Arthur Mensch は、Anthropic の高性能セキュリティモデル Mythos がフランスの軍事コードベースをスキャンすることに強く警告。依存関係を避けるため独立した欧州 AI 企業の育成が急務と主張し、Mistral の IPO 志向を改めて強調した。
続きを読むOppo の Multi-X チームが AI エージェント「X-OmniClaw」をリリース。Android デバイス上で直接動作し、カメラ・画面・音声を統合してアプリを自動操作。開発者は今すぐ利用可能
続きを読む64人の数学者が開発した439問のベンチマーク SOOHAK。AI は複雑な数学問題は解くが、「この問題は解けない」と認識する能力に致命的な欠陥を持つことが判明
続きを読むプレプリント・サーバー arXiv が、AI の幻覚(hallucination)による虚偽引用が含まれた論文提出者に対して 1 年間の投稿禁止処置を実施。2023 年以降、hallucinated citations は 10 倍に増加し、2026 年初期の論文の 0.36% に達していることが判明。
続きを読むMenlo Ventures パートナー Deedy Das が分析した調査結果、AI ブーム(過去 5 年)により約 10,000 人の労働者が 2,000 万ドル超の資産を獲得した一方で、大多数は置き去りにされた感覚が蔓延。中間管理職の空洞化と「生きる意味」の危機に直面。
続きを読むCarnegie Mellon 大学が開発した ExploitBench により、Claude Mythos が Google V8 エンジンの実在する脆弱性を完全に悪用できる能力が実証。GPT-5.5 との比較で圧倒的優位(21対2)を示す一方、12 倍のコスト差が課題に。
続きを読むOpenAI は音声クローニングスタートアップ Weights.gg を買収。セレブの声を複製するツールを開発してきた同社のチームは、ChatGPT や開発者向け API に音声技術を統合する予定です。
続きを読むOpenClaw の創設者 Peter Steinberger が OpenAI で3人チームを率い、約100個の AI エージェントでコード作成・PR レビュー・バグ検出を自動化。月130万ドルのトークンコストをかけながら『トークンコストが問題でない場合、ソフトウェアはどう変わるか』を探索しています。
続きを読むByteDance の Seedance 2.0 が初めてランクイン。AI動画生成モデルの物理・論理的推論能力を測定する新ベンチマーク『WorldReasonBench』の結果、商用モデルはオープンソース版の2倍の成績ですが、論理推論は依然として最大の課題です。
続きを読む