Olmo 3.1が拓くRL訓練と企業向け透明性
Ai2のOlmo 3.1はRL訓練を延長して推論力を高め、Think 32BとInstruct 32Bで研究と実務を橋渡しします。OlmoTraceで透明性も強化され、チェックポイントはAi2 PlaygroundとHugging Faceで入手可能です。
続きを読む1件の記事が見つかりました
Ai2のOlmo 3.1はRL訓練を延長して推論力を高め、Think 32BとInstruct 32Bで研究と実務を橋渡しします。OlmoTraceで透明性も強化され、チェックポイントはAi2 PlaygroundとHugging Faceで入手可能です。
続きを読む