Meta 於週二宣佈推出 Seamless M4T AI 模型,展示其通用語言翻譯方向的成果。此模型能快速、有效地理解多達 100 種語言的語音或文字,並生成翻譯,甚至從文字生成語音。
- 近 100 種語言的語音辨識
- 近 100 種輸入和輸出語言的語音轉文字翻譯
- 支援近 100 種輸入語言和 36 種(包括英文)輸出語言的語音轉語音翻譯
- 近 100 種語言的文字轉文字翻譯
- 支援近 100 種輸入語言和 35 種(包括英文)輸出語言的文字轉語音翻譯
近 100 種不同語言進行語音識別
Meta 於網誌文章中描述其新的翻譯系統為「第一個集多模態和多語言 AI 翻譯模型於一身」的系統,能夠為近 100 種不同語言進行語音識別和語音至文字的翻譯。Seamless M4T 亦能理解用戶在句子中間更換語言,這對於翻譯那些在講話時混合使用不同語言部分的人來說,可能有所幫助。與過去的翻譯模型不同,SeamlessM4T 使用一個單一系統,Meta 相信這最終將減少錯誤和延遲,提高質量。
Creative Commons 授權釋出
Meta 將 Seamless M4T 以 Creative Commons 授權釋出,以便其他翻譯人員和 AI 研究人員可以研發。該公司還將發佈 SeamlessAlign 的元數據,其中包含超過 270,000 小時的挖掘語音和文字。Meta 聲稱這是此類數據集中最大的一個。
整合 WhatsApp/Messenger
Meta CEO 朱克伯格表示,未來公司會將這些 AI 翻譯技術整合在旗下的 Facebook、Instagram、WhatsApp、Messenger 及 Threads 產品之中。外界估計,WhatsApp 及 Messenger 將可加入「語音訊息」變成「文字」功能。