穩定AI發布全新音訊模型可創作六分鐘歌曲

Stability AI 推出全新音訊模型系列 Stability Audio 3.0，旨在提升專業音樂生成能力。該系列包含四種模型：小型 SFX（4.59 億引數）、小型（4.59 億引數）、中型（14 億引數）和大型（27 億引數）。其中，小型 SFX 和小型模型適合在裝置上生成長達兩分鐘的音效與音樂；中型與大型模型則能創作結構完整、旋律穩定的六分二十秒長曲。這比 2024 年推出的 Stable Audio 2.0 生成功能長一倍以上。Stability AI 開放小型 SFX、小型及中型模型的權重供公眾使用與修改，而大型模型僅透過 API 或自託管付費服務提供，且年收入超過一百萬美元的公司需申請企業授權。此前 2024 年推出的 Stable Audio Open 僅支援四十七秒音樂生成，此次升級顯著提升產出長度。Stability AI 已與 Warner Music Group 及 Universal Music Group 簽約，確保最新模型基於完全授權資料訓練。儘管 Google 與 ElevenLabs 等企業也在音樂生成領域投入，但 Suno 與 Udio 的訴訟顯示，資料授權與唱片公司合作對服務長期生存至關重要。此外，Stability AI 前首席數位官 Ethan Kaplan 加入領導專業音樂業務，同期 Suno 與 ElevenLabs 也分別聘請前 Merlin 執行長及 Kobalt 音樂出版商高層以強化專業聲譽。

穩定AI發布全新音訊模型 可創作六分鐘歌曲

穩定AI發布全新音訊模型可創作六分鐘歌曲