AI 生成ビデオの最大の課題の 1 つが、キャラクターやオブジェクトの動きを精密に制御することだった。複雑なプロンプトや専門的な知識がなければ、ユーザーの意図した動きを実現できない。この課題に対して、Technion(イスラエル工科大学)が革新的なソリューションを発表した。TTM(Time-to-Move) だ。

マウスの動きで、ビデオの中身を操る

TTM の基本的な使い方は驚くほど直感的である。ユーザーはマウスを動かすだけで、AI 生成ビデオ内のキャラクターやオブジェクトの動きを制御できる。たとえば、「キャラクターを左に移動させたい」という場合、マウスカーソルを左に動かすだけだ。複雑なテキスト指示や追加の設定は不要だ。

Technion のチームは「デュアルクロック・ノイズ除去」と呼ぶ革新的な手法を採用している。これにより、ユーザーの意図への忠実性と、生成ビデオ自体の自然さのバランスを取ることに成功した。従来は、このバランスが崩れやすく、ユーザーの指示に完全に従わせると動きが不自然になるか、あるいは生成品質が低下するという問題があった。

追加の計算コスト、ゼロ

TTM を導入する際の最大のハードルが、通常であれば新しい機能には新しい計算インフラが必要だという点だ。だが、TTM はそれを不要にする。既存の AI ビデオモデルに対して、プラグインとして統合でき、再トレーニングも追加の計算リソースも必要ない

この設計は開発者にとって極めて重要だ。Google や Meta のような大規模企業はもちろん、スタートアップや個人開発者も同じ技術を活用できるようになる。計算リソースのアクセス格差が縮小し、AI ビデオ生成技術の民主化が一段と進む。

開発者向けで、すぐに試用可能

TTM は 2026 年 6 月に国際機械学習会議 ICLR で発表されたばかりだ。Technion の研究チームが公開している GitHub リポジトリ time-to-move.github.io では、実装の詳細や試用環境への情報が提供されている。

開発者にとっての実用性は高い。既存のビデオ生成ツール(Runway、Pika、または独自開発モデル)に TTM を統合すれば、ユーザー体験を大きく向上させることができる。複雑な指示書や UI 設計を必要としない直感的なインタフェースが実現できるということだ。

AI ビデオ生成の次のステップ

これまで AI ビデオ生成は「どうやって望む画像を生成させるか」という指示方法の工夫に注力されてきた。プロンプトエンジニアリングや複数回のリトライが当たり前だった。

TTM のような技術は、その次のステップを示唆している。つまり、「生成後の細かい制御を、エンドユーザーでも簡単にできるようにする」ということだ。これにより、AI ビデオはアマチュア動画制作者にも、プロダクションの現場にも、より身近な存在になる。

業界全体で見れば、マウス操作のような汎用的で低学習コストなインタフェースの採用が広がれば、AI 動画ツールの普及速度が加速することは確実だろう。