Riffusion 是一(yī)個免空跳費(fèi)開(kāi)源的具有穩定擴散的實時音樂和音頻(pín)生(匠對shēng)成庫,用戶隻需輸入音樂描述,AI便可以生(shēn唱日g)成對應風格的音樂。該開(kāi)源項目由行但Seth Forsgren 和 Hayk Ma煙大rtiros推出,Riffusion的背後原理是基于S新和table Diffusion(文本生(shēng)成圖像模型)微調頻(著可pín)譜圖,頻(pín)譜圖是音頻(pín)慢上的視覺表示,顯示不同頻(pín)率随時間的振視市幅,而後再将高保真度的頻(pín)譜圖圖像轉換爲音頻(pín)。
理謝