勵志

勵志人生知識庫

mms模型

MMS模型是由Meta公司開發的一種先進的人工智慧模型,它具有以下特點和套用:

語言覆蓋範圍:MMS模型能夠識別超過4000種口語,這是以往任何已知技術的40倍。它還擴展了文本語音互轉技術,支持的語言數量從100多種增加到1100多種。

數據收集方法:為了實現這一突破,Meta公司採用了一種非傳統的方法來收集音頻數據。他們利用了翻譯完成的宗教文本的錄音,如《聖經》等,這些文本已被翻譯成多種語言,並且這些譯本也已被用於廣泛的語言研究中。通過這種方法,Meta創建了一個超過1100種語言的「《新約》閱讀數據集」,平均每種語言有32小時的數據。此外,考慮到其他宗教類讀物的未標記錄音,他們將可提供的語言數量增加到4000多種。

技術優勢:MMS模型使用的連線主義時間分類(CTC)方法,與大型語言模型(LLM)或語音識別的序列到序列模型相比,受到的約束要大得多。這確保了模型不會因為內容是宗教的而偏向於產生宗教語言。

開源貢獻:Meta選擇將MMS模型開源,以幫助保護語言多樣性,並鼓勵研究人員在其基礎上進行進一步開發。這一舉措是為了讓全世界的研究人員都可以在MMS模型的基礎上繼續發展,為保護全世界令人驚嘆的語言多樣性做出貢獻。

通過這些努力,Meta希望扭轉世界語言逐漸減少的趨勢,使每個人都能用自己的第一語言來獲取信息或使用技術,從而促進全球範圍內的語言多樣性和技術普及。