タグ一覧に戻る

小型言語モデル

記事数: 1
Sina の VibeThinker-3B が示唆:推論は圧縮可能、知識は圧縮不可

Sina の VibeThinker-3B が示唆:推論は圧縮可能、知識は圧縮不可

Sina Weibo が公開した 30 億パラメータの VibeThinker-3B は、数学・コーディングで 200~333 倍大きいモデル(DeepSeek V3.2、Kimi K2.5)と互角のスコア。一方、事実知識の問題では大規模モデルに大きく劣後。研究から浮かぶのは、論理的推論は小型モデルに圧縮可能だが、事実知識は圧縮困難という知見。

続きを読む