現実を学ぶAI:RunwayとNomos 1の新潮流
Runwayの世界モデルとNomos 1は物理を模倣して現実の動きを再現し映像やロボット応用で新たな可能性を拓き、Nomos 1の高効率設計とオープン公開が実務導入を後押しします。
最先端AIの潮流が静かに変わり始めました。単に大量のデータを覚えるだけでなく、現実世界の動きや物理を学ぶ「世界モデル」が注目を集めています。世界モデルは、環境の物理や動きを学習して予測するAIの仕組みです。まるで現実世界のミニチュアを作って試行錯誤するようなイメージです。
Runwayの世界モデルと音声統合で広がる没入感
Runwayは物理現象の模倣を目指す世界モデルを発表しました。これはエージェントの訓練だけでなく、映像制作やロボティクス、アバター表現の基盤にも使える設計です。さらに最新の映像モデルにはネイティブな音声統合が入りました。音声と映像が自然に結びつくことで、没入感の高い体験が作りやすくなります。
イメージしやすく言えば、これまでは映像と音声が別々に演奏されていたオーケストラが、同じ指揮者のもとで一体となって鳴るような変化です。結果として、シミュレーションの堅牢性やエージェントの学習効果が高まる可能性があります。
Nomos 1の成績と設計思想
Nomos 1は30Bパラメータ級のオープンソースモデルで、Putnamという評価で87/120を記録しました。PutnamはAIモデルの能力を測る競技的評価のひとつです。チームはポスト訓練と高品質なデータがこの成果に寄与したと説明しています。
注目点は推論の安定性を担う「2段階推論ハーネス」です。これは大まかな推定を先に行い、続いて精密化するという設計で、効率よく安定した出力を得るための工夫です。Nomos 1はApache 2.0で公開されており、Hugging FaceやGitHubで入手できます。オープンで協働しやすい開発体制が意図されています。
他モデルとの比較と実用性
Nomos 1は30Bながら、およそ3B相当が「アクティブ」に働く設計とされ、消費者向けハードでも動かせる可能性が報じられています。対照的に、DeepSeekのMath-V2は118/120を獲得し、性能の高い先行例として参照されています。
ここから読み取れるのは、単純なパラメータ数だけでなく、推論設計やデータ品質が性能の鍵だという点です。小型で効率的なモデルは現場導入の敷居を下げます。開発側がオープンにすることで、透明性や再現性も高まります。
GWM-1と大手の競争、業界展望
RunwayのGWM-1を含む世界モデル群は、GoogleやNvidiaといった大手とも競合しています。Runwayは数分間の一貫性を保てる世界モデルを示唆しており、これは映像やロボティクス、アバター領域での実用化を後押しします。
激しい競争は技術の成熟を早めます。研究と実装の両輪が回ることで、実務で使えるツール群が短期間で増えていくでしょう。
結び:現場を変える“小さな世界モデル”の台頭
重要なのは、小さくて効率的な世界モデルが現場で具体的に役立つ点です。Nomos 1のようなオープンな公開は、導入のハードルを下げ、共同開発や検証を進めます。今後は、こうしたモデルが工場のロボットや映像制作、インタラクティブなアプリケーションの核になる場面が増えることを期待しています。
変化は静かに始まっていますが、その影響は確実に広がっていくはずです。ぜひ次世代の世界モデルに注目してください。