OpenAI と Broadcom、LLM 推論特化チップ「Jalapeño」発表——性能/ワット比で業界最先端を実現
OpenAI が Broadcom と共同開発したカスタムチップ Jalapeño を発表。LLM 推論を高速・効率的に実行するために最適化。現在テスト段階で、実運用への展開が期待される。
OpenAI が 2026 年 6 月、初となるカスタム設計のコンピュータチップ「Jalapeño(ハラペーニョ)」を Broadcom との共同開発により発表しました。このチップは、ChatGPT などの LLM を「推論」(ユーザーの質問に対して回答を生成する段階)で高速・効率的に動作させるために特化設計されたものです。
Jalapeño の設計思想
OpenAI は、現在の AI インフラのボトルネックを特定し、それを解決するために Jalapeño を設計しました。
具体的には、以下の課題に対応:
- 従来チップの非効率性:汎用チップ(NVIDIA GPU など)は、LLM 推論のワークロードに完全には最適化されていない
- 電力消費の多さ:推論を大規模に実行する際、電力コストが事業採算性に直結
- スケーラビリティの限界:デジタルに複数の推論タスクを並行実行する際の管理複雑性
Jalapeño は、これらの制約を念頭に設計された、推論専用チップ です。
パフォーマンス——性能/ワット比で最先端
OpenAI の発表では、Jalapeño が以下を達成したと述べています:
「従来の最先端ソリューションと比較して、有意に高い性能/ワット比を実現」
つまり、同じ電力消費で、より多くの推論タスクをこなしたり、同じタスク負荷でより少ない電力で実行できるということです。
OpenAI は特に リアルタイムコーディングモデル(ChatGPT の Code Interpreter など)の運用コスト低下 を強調しており、これらが「より高速で信頼性が高く、コスト効率的」になることを目指しています。
開発プロセス——AI 自身も参与
興味深い点は、Jalapeño の設計プロセスにおいて、OpenAI の AI モデル自身が参加したことです。チップ設計の最適化に AI を活用することで、反復開発のサイクルを短縮し、より洗練された設計に到達しました。
現在の状況と今後
発表時点では、Jalapeño は 「テスト・検証段階(still being tested)」 にあります。
具体的な実運用への展開時期は明言されていませんが、以下が想定されています:
- 社内システム(ChatGPT の推論サーバーなど)への統合
- 段階的な容量増強
- Broadcom との製造・供給チェーンの確立
AI インフラ競争の激化
このチップ発表は、AI 業界が急速に成熟化し、「汎用」から「特化」へシフトしていることを象徴しています。
- Google:TPU という独自推論チップで既に先行
- Amazon:Trainium・Inferentia チップで投資拡大
- Meta:自社設計チップへの投資強化
OpenAI が Broadcom と組んで Jalapeño を開発したことは、独立系 AI ラボが 単なるモデル開発を超えて、ハードウェアレベルでのエコシステム構築 に乗り出したことを示しています。