Meta已開發(fā)閩南語AI翻譯,解決非文字語言翻譯難題
近日,Meta宣布推出口語翻譯系統(tǒng),Meta CEO扎克伯格在facebook上發(fā)布demo影片,首次在線上通過該翻譯系統(tǒng)和員工對話。
在demo影片中,扎克伯克說英文,來自臺灣的Meta工程師用閩南語,通過該口語翻譯系統(tǒng),兩人無障礙交流,且翻譯都非常地道。
Meta稱,將閩南語翻譯成英語的這套系統(tǒng),是第一個由AI驅(qū)動的“為非文字語言開發(fā)的語音翻譯系統(tǒng)”。
在全球范圍內(nèi),有許多語言和閩南語一樣,有人使用,但沒有標準化的書寫方式,而AI翻譯系統(tǒng)需依靠大量的可標簽范例,像是口語標簽或字符,才能把資料“喂”給機器學習。
Meta的研究團隊稱:“我們利用普通話作為中間語言來建立偽標簽,我們首先將英語(或閩南語)語音翻譯成普通話文本,然后我們再翻譯成閩南語(或英語),并將其加入訓練數(shù)據(jù)!
目前,該系統(tǒng)允許講閩南語的人與講英語的人交談,盡管很生硬。該模型一次只能翻譯一個完整的句子,但扎克伯格相信,這項技術(shù)最終可以應(yīng)用于更多語言,并將改進到提供實時翻譯的程度。
Meta宣布,他們將開放大型語料庫,讓研究人員可以為更多“無法書寫的語音”建立翻譯系統(tǒng)。業(yè)內(nèi)人士認為,良好的翻譯工具對于元宇宙的開發(fā)不可或缺。
【開源AI模型,精準翻譯超200種語言】
今年7月,Meta公司宣布將免費開源旗下AI系統(tǒng)NLLB-200 ,該系統(tǒng)是全球第一個能翻譯200種不同語言的單一AI模型,將為超過10億人提供高品質(zhì)翻譯內(nèi)容。
Meta公司稱,將會把NLLB-200對外開源,同時向非營利機構(gòu)提供20萬美元的資助,以開發(fā)該技術(shù)應(yīng)用于更多應(yīng)用程式上。
德國慕尼黑大學計算機語言學家Alexander Fraser認為,該模型的主要貢獻在于數(shù)據(jù),包含了100種全新語言。
目前,市面上很多翻譯工具并不支持冷門的語言,也就是少于百萬人口使用的語言,而NLLB-200解決了這個問題。
【"不遺漏任何語言"】
全球有數(shù)十億人,但一直以來卻沒有可以翻譯上百種語言的高品質(zhì)翻譯工具,他們無法通過自己慣用的語言或母語瀏覽網(wǎng)絡(luò)上的內(nèi)容,或在網(wǎng)絡(luò)社群上參與討論,尤其是對于非洲、亞洲等地區(qū)有高達數(shù)億人使用不同種類的語言。
為了突破網(wǎng)絡(luò)上的語言障礙,并促進元宇宙發(fā)展,Meta的AI研究人員早年已成立NLLB專案,開發(fā)AI模型為全世界提供高品質(zhì)的翻譯功能。
據(jù)悉,NLLB是“No Language Left Behind(不遺漏任何語言)”的縮寫,該AI系統(tǒng)可以高質(zhì)量翻譯世界上多達200種語言,除了主流語言外,其中還包含多達55種非洲系語言及其他少數(shù)語言。
在多項指標中,相較現(xiàn)有的其他翻譯工具,NLLB-200的翻譯品質(zhì)平均高出44%。在部分非洲和印度語言中,提升幅度相較最新的翻譯系統(tǒng)更提升了70%。
此外,Meta也與維基基金會合作,希望NLLB-200之后可以提供維基百科翻譯的服務(wù),改善維基百科的翻譯系統(tǒng)。通過雙方的合作,NLLB-200持續(xù)學習其他翻譯器中無法翻譯的語言,AI模型可以自己學習語言中的文字系統(tǒng),得到更準確的翻譯結(jié)果。
可以想象的是,“通用語音翻譯系統(tǒng)”一旦在元宇宙中實現(xiàn),可以讓全世界不同語種的用戶,在元宇宙虛擬空間里溝通、開會、玩游戲,將會比在現(xiàn)實中更加方便,也將更進一步實現(xiàn)Meta對發(fā)展元宇宙的野心。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機器人領(lǐng)域,聯(lián)通、海爾、美的等紛紛入局