Riffusion 是一(yī)個免費(f輛哥èi)開(kāi)源的具有穩定擴散的實時音樂和音頻(pín)生(shēng)匠器成庫,用戶隻需輸入音樂描述,AI便可以生(shēng)成對應風格的音文行樂。該開(kāi)源項目由Seth Forsgren 和在筆 Hayk Martiros推出,Riffusion的背後原理是基暗快于Stable Diffusion(文本生(shēng)成圖像模型)微還動調頻(pín)譜圖,頻(pín)譜圖是音頻(pín)近熱的視覺表示,顯示不同頻(pín)率随時間的振幅,而後再将高保真度的頻(pí紅技n)譜圖圖像轉換爲音頻(pín)。