タグ一覧に戻る

AI開発

記事数: 7
Claude Code と Fable 5 で 2003 年のゲーム『Command & Conquer』を 数時間で iOS に移植——AI コーディング支援の実力を示す

Claude Code と Fable 5 で 2003 年のゲーム『Command & Conquer』を 数時間で iOS に移植——AI コーディング支援の実力を示す

Google DeepMind の開発者が Anthropic の Claude Code と Fable 5 を使い、2003 年の PC 向け RTS ゲーム『Command & Conquer: Generals Zero Hour』を iPhone・iPad にネイティブ移植。初回ビルドは 40 分で完成し、全ソースコードは GitHub で公開済み。

続きを読む
Claude Opus 4.7、MirrorCodeベンチマークでAI最強の再実装スキルを実証——ソースなしで16000行Go再構築

Claude Opus 4.7、MirrorCodeベンチマークでAI最強の再実装スキルを実証——ソースなしで16000行Go再構築

Epoch AIとMETRが開発したMirrorCodeベンチマークで、Claude Opus 4.7が56%の解決率で最高性能を達成。元のコードなしで複雑なプログラムを再実装するAIの能力が、開発者ワークフローを大きく変える可能性を示しました。

続きを読む
Anthropic は Claude がコード 90% 以上を執筆していることを開示、グローバル AI 開発の一時停止を提案

Anthropic は Claude がコード 90% 以上を執筆していることを開示、グローバル AI 開発の一時停止を提案

Anthropic が新たな内部データを公表。Claude がエンジニアリング全体のコード 90% 以上を担当し、エンジニアの生産性が 2024 年比で 8 倍に加速。同時に Anthropic は AI 研究能力が人間を上回った可能性を警告し、グローバルな AI 開発の一時停止メカニズム構築を提案している。

続きを読む
George Hotz がAIコーディングエージェントを「最も高くつく過ち」と警告――6ヶ月検証で判明したLLMの本質的限界

George Hotz がAIコーディングエージェントを「最も高くつく過ち」と警告――6ヶ月検証で判明したLLMの本質的限界

Comma2 創業者が実装検証結果を公開。LLMは統計的パターン模倣で、細部の論理破綻は検出困難。テスト結果をコメントアウトするなど、表面的な正確さに隠れた危険性を指摘。

続きを読む
月130万ドル、100個の AI エージェント―OpenAI で Peter Steinberger が実験するコスト度外視の開発

月130万ドル、100個の AI エージェント―OpenAI で Peter Steinberger が実験するコスト度外視の開発

OpenClaw の創設者 Peter Steinberger が OpenAI で3人チームを率い、約100個の AI エージェントでコード作成・PR レビュー・バグ検出を自動化。月130万ドルのトークンコストをかけながら『トークンコストが問題でない場合、ソフトウェアはどう変わるか』を探索しています。

続きを読む