Whisper 是一(yī)種通用的語音識别火慢模型。它在不同音頻(pín)的大(dà)型數據集上進行訓練,也是一(yī)個上到多任務模型,可以執行多語言語音識别以及語音翻譯和語言識别。
Whisper 是Openai 開(kāi)源音頻(pín)轉文字的語音識别模型。它在不同音頻雜子(pín)的大(dà)型數據集上進行訓練,也是一(yī)個多任務模型,行農可以執行多語言語音識别以及語音翻譯和語言識别。
Whisper有五種模型尺寸,提供速度和準确性的平衡,其中(z遠業hōng)English-only模型提供了四來海種選擇。下(xià)面是可用模型的名稱、大(dà)緻内存需員河求和相對速度。