Whisper語音識别模型

Whisper 是一(yī)種通用的語音識别火慢模型。它在不同音頻(pín)的大(dà)型數據集上進行訓練,也是一(yī)個上到多任務模型,可以執行多語言語音識别以及語音翻譯和語言識别。

#Ai工(gōng)具箱 #Ai寫作對話(huà) #AI視頻(pín)生(shēng)成

Whisper語音識别模型

Whisper 是Openai 開(kāi)源音頻(pín)轉文字的語音識别模型。它在不同音頻雜子(pín)的大(dà)型數據集上進行訓練,也是一(yī)個多任務模型,行農可以執行多語言語音識别以及語音翻譯和語言識别。

Whisper有五種模型尺寸,提供速度和準确性的平衡,其中(z遠業hōng)English-only模型提供了四來海種選擇。下(xià)面是可用模型的名稱、大(dà)緻内存需員河求和相對速度。

ed164c44ee234ddd821a12e56054bc12.png


  • 上一(yī)個應用:
  • 下(xià)一(yī)個應用:
  • 與Whisper語音識别模型相關工(gōng)具