Riffusion 是一(yī)個免費(fèi)開雪水(kāi)源的具有穩定擴散的實時音樂和音頻(pín鐵制)生(shēng)成庫,用戶隻需輸入音樂描述,AI便可以生(sh城道ēng)成對應風格的音樂。該開(kāi)源項目由S弟讀eth Forsgren 和 Hayk Martiros推歌見出,Riffusion的背後原理是基于Stable Diff綠件usion(文本生(shēng)成圖像模型)微調頻(pín生坐)譜圖,頻(pín)譜圖是音頻(pín)的視覺表示,顯示不木關同頻(pín)率随時間的振幅,而後再将高保真度師制的頻(pín)譜圖圖像轉換爲音頻(pín)。