Alibaba Qwen-Image-2.0、圧縮 2 倍・推論ステップ 40→4 で高速化——画像生成競争が加速
Alibaba の最新画像生成モデル Qwen-Image-2.0 が圧縮率を 2 倍に向上。16 段階の空間圧縮とトランスフォーマー改善により、生成ステップを 40 から 4 に削減。LMArena で第 9 位を獲得、テキスト描写精度も向上。開発者向けベータ API で利用可能。
続きを読むAlibaba の最新画像生成モデル Qwen-Image-2.0 が圧縮率を 2 倍に向上。16 段階の空間圧縮とトランスフォーマー改善により、生成ステップを 40 から 4 に削減。LMArena で第 9 位を獲得、テキスト描写精度も向上。開発者向けベータ API で利用可能。
続きを読むグラフ構造とトランスフォーマーを組み合わせた研究がInternational Journal of Reasoning-based Intelligent Systemsに掲載され、都市のリアルタイム交通予測の実用化に希望を示しています。
続きを読むD4RTは4D(空間+時間)の動的シーンを一つの仕組みで同時に再構成し、並列処理による高速化でロボットやARの即時応答を実現する次世代技術として期待できます。
続きを読む