Stability AI 推出全新音訊模型系列 Stability Audio 3.0,旨在提升專業音樂生成能力。該系列包含四種模型:小型 SFX(4.59 億引數)、小型(4.59 億引數)、中型(14 億引數)和大型(27 億引數)。其中,小型 SFX 和小型模型適合在裝置上生成長達兩分鐘的音效與音樂;中型與大型模型則能創作結構完整、旋律穩定的六分二十秒長曲。這比 2024 年推出的 Stable Audio 2.0 生成功能長一倍以上。Stability AI 開放小型 SFX、小型及中型模型的權重供公眾使用與修改,而大型模型僅透過 API 或自託管付費服務提供,且年收入超過一百萬美元的公司需申請企業授權。此前 2024 年推出的 Stable Audio Open 僅支援四十七秒音樂生成,此次升級顯著提升產出長度。Stability AI 已與 Warner Music Group 及 Universal Music Group 簽約,確保最新模型基於完全授權資料訓練。儘管 Google 與 ElevenLabs 等企業也在音樂生成領域投入,但 Suno 與 Udio 的訴訟顯示,資料授權與唱片公司合作對服務長期生存至關重要。此外,Stability AI 前首席數位官 Ethan Kaplan 加入領導專業音樂業務,同期 Suno 與 ElevenLabs 也分別聘請前 Merlin 執行長及 Kobalt 音樂出版商高層以強化專業聲譽。
穩定AI發布全新音訊模型 可創作六分鐘歌曲
分享這篇文章: