Google、Gemma 4 にマルチトークン予測搭載で推論速度を3倍に高速化
Google は、Gemma 4 オープンモデルにマルチトークン予測機能を追加し、テキスト生成速度を最大3倍に加速。小規模な補助モデルが複数トークンを同時に提案し、メインモデルが一度に検証する新技術を採用しました。
続きを読むGoogle は、Gemma 4 オープンモデルにマルチトークン予測機能を追加し、テキスト生成速度を最大3倍に加速。小規模な補助モデルが複数トークンを同時に提案し、メインモデルが一度に検証する新技術を採用しました。
続きを読む