OpenAI は developer 向けツール Codex を大幅に拡張した新版をリリースした。macOS・Windows 版のアプリケーションに computer use(画面自動操作)、in-app browsing、image generation、memory、plugin サポートが追加され、これまで以上に高度な開発タスクを自動実行できるようになった。

新機能の核となる「computer use」

Codex の最大の進化は computer use 機能だ。これにより Codex は直接ユーザーの画面を監視・操作し、複数のアプリケーションを自動で操作できるようになった。ブラウザでの検索、テキストエディタでのコード編集、IDE でのビルド実行といった一連の作業を、エンジニアの指示の下で自動実行する。

in-app browsing は Codex 内蔵のブラウザで web サイトを参照でき、外部ツールの切り替えなしにコーディングを続けられる。image generation 機能は UI のプロトタイプやドキュメント内の図表を Codex が直接生成する。memory 機能は過去の作業内容や開発者の好みを記憶し、次の作業で活用できる。

数週間の自律実行にも対応

これら新機能の組み合わせにより、Codex は単一の短いタスク以上の規模で動作できるようになった。開発プロジェクトの初期設計からテスト実装、ドキュメント作成、さらにはリグレッション対応まで、数週間の時間軸で自律的に実行し続けることが可能になった。

plugin サポートは、開発チームが独自のワークフロー・ツールを Codex に統合することを意味する。Slack、GitHub、Jira などの既存の開発ツールと seamlessly 連携し、より統合された開発環境を実現する。

Anthropic Claude Code との競争激化

OpenAI のこの動きは、Anthropic が提供する Claude Code への直接的な対抗姿勢を示している。Claude Code も AI による自動コーディング機能を強みにしているが、Codex の新機能は画面操作による自動実行という技術的な深さで勝負を挑んでいる。

開発ツール市場は今、LLM を基盤とした自動化へと急速にシフトしている。単なるコード補完から、高度な自律実行まで、その範囲は拡大している。

エンジニアの働き方への影響

これらの機能強化は、エンジニアの日常的な作業の意味を大きく変える可能性がある。ルーチンワークやコード生成は Codex に任せ、エンジニアは設計判断やアーキテクチャ検討など、より高次の判断に専念できるようになるかもしれない。

一方で、AI に長時間のタスク実行を任せることの管理・監視、セキュリティ・品質保証のあり方は、組織ごとに新しい課題として浮上する。OpenAI はこれからも plugins や memory 機能を拡充し、enterprise user 向けの対応を進める見込みだ。