勵志

勵志人生知識庫

wenet是什麼

WeNet是一個開源的端到端自動語音識別(ASR)工具包,旨在簡化從訓練到部署的整個過程。

它是首個專門為產品和工業界設計的端到端語音識別開源工具,也是目前使用最廣泛的端到端語音識別開源工具之一。WeNet的主要特點包括使用Conformer網路結構和CTC/attention loss聯合最佳化方法,提供統一的流式/非流式語音識別方案,具有業界一流的識別效果。它還提供了雲上和端上的直接部署方案,旨在最小化模型訓練和產品落地之間的工程工作。WeNet的框架簡潔,模型訓練部分完全基於PyTorch生態,不依賴於如Kaldi之類的複雜工具。此外,它還提供詳細的注釋和文檔,非常適合用於學習端到端語音識別的基礎知識和實現細節。