Stability AI は新オーディオモデルファミリー Stable Audio 3.0 をリリースした。最大の特徴は、プロフェッショナルグレードの楽曲を 6分以上にわたって生成できる点で、従来モデルの生成時間を大幅に延長した。同時に、オープンウェイト戦略とエンタープライズライセンスを組み合わせた層別ビジネスモデルを採用している。

モデルラインアップと仕様

Stable Audio 3.0 は 4 つのモデルで構成される:

  • SFX 小型モデル(459M パラメータ):効果音生成に最適化、最大 2 分のオンデバイス対応
  • 小型モデル(459M パラメータ):音楽生成、デバイス内で 2 分まで生成
  • 中型モデル(1.4B パラメータ):6 分 20 秒まで生成、高品質な楽曲制作に対応
  • 大型モデル(2.7B パラメータ):同じく 6 分 20 秒対応、音楽的構造とメロディックトーンの維持を強化

小型・中型・大型モデルすべてが「fully licensed data」に基づいており、Warner Music Group および Universal Music Group とのパートナーシップを活用している。

オープンウェイト × エンタープライズライセンスの二層戦略

小型・SFX モデル、中型モデルの 3 種はオープンウェイト公開され、開発者は自由に利用・改変・商用利用が可能。一方、大型モデルは API またはペイドサービスを通じてのみアクセス可能で、年間売上 100 万ドル以上の企業はエンタープライズライセンスの契約が必須である。

このアプローチにより、Stability AI は研究者・個人開発者へのアクセスを確保しながら、エンタープライズ顧客からの継続的な収益確保を実現している。

プロフェッショナル向けスイートへの投資

Stability AI は Universal Audio の元チーフデジタルオフィサーを採用し、プロフェッショナル製品スイートの開発を強化中。音声スタジオ業界との連携を深めることで、単なるオープンソース AI ではなく、実務的なワークフローに統合可能なツールへの位置付けを目指している。