AI 訓練の「メモリ壁」を Ethernet ベースの拡張技術で突破、韓国 ETRI が OmniXtend 開発
大規模 AI 訓練を阻害する「メモリ壁」問題を解決する技術が登場。韓国の電子通信研究院(ETRI)が開発した OmniXtend は、Ethernet を メモリ相互接続ファブリックとして活用し、分散デバイス間でのメモリ共有を実現。LLM 推論性能を 2 倍以上改善します。
大規模 AI 訓練を阻む「メモリ壁」問題
GPU やアクセラレータの処理能力が指数関数的に向上しても、メモリ容量の制限が計算効率を急激に低下させる問題が「メモリ壁」です。
LLM の訓練データ量が増え続ける中、単一の GPU や TPU では対応しきれず、複数サーバーを接続する必要があります。しかし従来の相互接続技術(PCIe、Infiniband など)では、高速性とスケーラビリティの両立が難しい状況が続いていました。
OmniXtend の革新的アプローチ
韓国の 電子通信研究院(ETRI) が開発した OmniXtend は、この課題を根本的に解決する新世代技術です。
コアテクノロジー
Ethernet をメモリ相互接続ファブリックとして活用
OmniXtend は、標準的なネットワークプロトコルである Ethernet を、単なるデータネットワークではなく、分散メモリプールとして機能させます。
- FPGA ベースのメモリノード: 各サーバーに接続された専用ノードが、Ethernet 経由でメモリ要求を高速処理
- ユニファイドメモリプール: 物理的に分散したデバイスのメモリを、単一の大規模メモリプールとして統一的に管理
- スケーラブルな容量拡張: サーバーを追加するだけで、メモリ容量が直線的に増加
実装のシンプルさ
既存の企業ネットワークで使用されている 汎用 Ethernet インフラをそのまま活用できるため、データセンターの投資効率が高まります。高価な専用インターコネクト(Infiniband など)を購入する必要がありません。
パフォーマンスの実績
検証結果
- メモリ不足環境での LLM 推論性能: 従来比 2 倍以上の改善
- 転送遅延: Ethernet レイテンシに最適化(マイクロ秒オーダー)
- スループット: PCIe と比較して大幅に向上
実世界での応用
| 分野 | 利点 |
|---|---|
| 大規模 LLM 訓練 | メモリ制約を排除し、より大規模なモデルをトレーニング可能 |
| マルチGPU 推論 | クエリあたりのメモリ帯域幅を増大 |
| 自動運転 | エッジデバイス間での実時間メモリ共有 |
| AI 検査システム | 複数 NPU/GPU を統合した高信頼組込システム |
業界への影響と標準化戦略
ETRI は、OmniXtend の採用を加速させるために、以下の戦略を展開しています:
オープンスタンダード化
- Linux Foundation 配下の CHIPS Alliance への主導投稿を通じ、業界標準として OmniXtend を位置づけ
- GPU ベンダー、データセンター企業との協力により、グローバル採用を推進
技術移転・商用化
- 主要データセンターベンダーとの技術パートナーシップ交渉
- 次世代 AI インフラ市場への展開計画
市場への波及
OmniXtend の登場は、AI インフラ企業(Nvidia、AMD、Graphcore など)のビジネスモデルに大きな影響を与える可能性があります:
- メモリコスト削減: スケーラブルなメモリ拡張により、全体的な計算コストが低下
- スタートアップのエントリー機会: 既存インフラで OmniXtend を採用すれば、AI 訓練環境を低コストで構築可能
一方、既得権益を持つインターコネクト企業(Infiniband、カスタム相互接続)との競争が激化することも予想されます。
次のマイルストーン
ETRI は、2026 年〜2027 年にかけて、以下の実装を目指しています:
- パイロットデータセンターでの実装検証
- 大型クラウドプロバイダーとの統合テスト
- OmniXtend チップセットの商用化
OmniXtend が本格採用される段階では、LLM 訓練コストの大幅低下が見込まれ、それに伴って AI サービスプロバイダーの市場競争も一層激化するでしょう。