(取自Stability AI X)
根據《 TechCrunch 》報導,9 月 13 日,Stability AI 宣布推出人工智慧音樂生成器 Stable Audio,這是首款能夠通過一種名為潛擴散的技術,為商業用途創建「高品質」44.1 kHz 音樂的工具,通過對音訊元數據以及音訊文件的時長和開始時間進行訓練。
Stability 公司表示,與之前發表的生成式音樂工具相比,Audio Diffusion 的底層模型大約有 12 億個參數,可以對合成音訊的內容和時長進行更好的控制。
一年前,Stability AI 悄然發表 Dance Diffusion,但隨後 Stability 公司資助創建模型的研究機構 Harmonai 停止了對 Dance Diffusion 的更新,如今推出的 Stable Audio 並不是由 Harmonai 單獨開發的。
Stability 的音訊團隊於四月份正式成立,他們受 Dance Diffusion 的啓發創建了一個新模型,作為 Stable Audio 的基礎,然後由 Harmonai 對其進行訓練。
目前,Stable Audio 只能通過網路應用程式使用,Stability 也沒有宣布以開源方式發表 Stable Audio 背後模型的計劃。
本文為巴比特授權刊登,原文標題為「Stability AI 推出人工智能音樂生成器 Stable Audio」