タグ一覧に戻る

スケーリング

記事数: 1
大規模モデルが稀なスキルを習得できる理由:研究が解明したメカニズム

大規模モデルが稀なスキルを習得できる理由:研究が解明したメカニズム

言語モデルのサイズと学習効率の関係について、研究者たちが新たなメカニズムを発見。モデルを大きくするだけでなく、訓練データの構成を工夫することで、小規模モデルでも稀なスキルを習得できる可能性が示唆されました。

続きを読む