百度全面解析機(jī)器同傳挑戰(zhàn)、前沿與展望
百度翻譯AI同傳:多項(xiàng)創(chuàng)新技術(shù)取得突破進(jìn)展
百度翻譯AI同傳集成了百度在同傳上的最新技術(shù),在語(yǔ)音容錯(cuò)、可控時(shí)延、篇章翻譯、端到端模型等方面都提出了創(chuàng)新的解決方案。
在語(yǔ)音容錯(cuò)方面,為提高翻譯的準(zhǔn)確度和魯棒性,百度提出了“聯(lián)合文本和拼音編碼”的語(yǔ)音翻譯模型(Robust Neural Machine Translation with Joint Textual and Phonetic Embedding)。這一模型的創(chuàng)新之處在于對(duì)文本和拼音進(jìn)行聯(lián)合編碼,緩解語(yǔ)音識(shí)別帶來(lái)的錯(cuò)誤。比如,發(fā)音都是“datang”的“大堂”和“大唐”很容易令語(yǔ)音識(shí)別系統(tǒng)混淆。傳統(tǒng)的翻譯模型只使用了文本信息進(jìn)行編碼,百度提出的模型在編碼端加入了音節(jié)信息,使得模型具有容錯(cuò)能力。
在實(shí)時(shí)性方面,人工同傳可以很好的處理質(zhì)量與時(shí)延的平衡。從人類(lèi)譯員那里獲得靈感,百度提出了具有預(yù)測(cè)和可控時(shí)延的翻譯模型(STACL: Simultaneous Translation with Integrated Anticipation and Controllable Latency)。在這個(gè)模型中,在等待講話者開(kāi)始后的第K個(gè)詞,就開(kāi)始翻譯。模型在每個(gè)步驟使用源語(yǔ)句的可用前綴,以及到目前為止的翻譯來(lái)決定翻譯中的下一個(gè)單詞。該模型一個(gè)顯著的優(yōu)點(diǎn)是其具有可調(diào)節(jié)性,實(shí)際使用中可以根據(jù)需要調(diào)節(jié)K值,以平衡翻譯質(zhì)量和時(shí)間延遲。
在語(yǔ)篇翻譯方面,百度提出了基于多輪解碼校對(duì)網(wǎng)絡(luò)的篇章翻譯模型(Modeling Coherence for Discourse Neural Machine Translation),用于解決篇章翻譯過(guò)程中的一致性和連貫性問(wèn)題。該模型首先進(jìn)行第一輪解碼根據(jù)單個(gè)句子生成初步的翻譯結(jié)果,其后根據(jù)已經(jīng)生成的上下文信息,對(duì)翻譯結(jié)果進(jìn)行第二次解碼,重新調(diào)整翻譯內(nèi)容。并且利用深度增強(qiáng)學(xué)習(xí)的技術(shù),調(diào)整當(dāng)前句子的譯文和已經(jīng)生成的譯文保證良好的連貫性和一致性,在譯文的整體流暢性上取得顯著提高。
在端到端機(jī)器同傳模型方面,百度提出基于知識(shí)蒸餾的同傳模型(End-to-End Speech Translation with Knowledge Distillation)。首先利用大規(guī)模文本翻譯語(yǔ)料訓(xùn)練一個(gè)教師模型,然后利用端到端語(yǔ)音翻譯訓(xùn)練語(yǔ)料中的源語(yǔ)言轉(zhuǎn)錄文本和目標(biāo)語(yǔ)言翻譯文本對(duì)教師模型進(jìn)行微調(diào)(fine-tune)。在微調(diào)的過(guò)程中,利用知識(shí)蒸餾技術(shù)(Knowledge Distillation)對(duì)端到端語(yǔ)音翻譯的學(xué)生模型(Student Model)進(jìn)行預(yù)測(cè)分布修正。該模型可以有效克服數(shù)據(jù)稀疏問(wèn)題,顯著提升翻譯質(zhì)量。
“未來(lái),機(jī)器同傳可以從以下三個(gè)方面開(kāi)展工作,在模型方面,研究高魯棒、低時(shí)延的同傳模型;在數(shù)據(jù)方面,建設(shè)大規(guī)模面向真實(shí)場(chǎng)景的同傳數(shù)據(jù);在評(píng)價(jià)方面,建立面向同傳的評(píng)價(jià)體系和標(biāo)準(zhǔn)! 何中軍表示。
層出不窮的網(wǎng)絡(luò)新詞,難以理解的語(yǔ)境,讓機(jī)器翻譯還不能做到“信達(dá)雅”,但隨著技術(shù)的發(fā)展,機(jī)器翻譯也在不斷進(jìn)化。為推動(dòng)機(jī)器同傳技術(shù)發(fā)展,百度翻譯聯(lián)合CCMT2019(全國(guó)機(jī)器翻譯研討會(huì))推出全球首個(gè)面向真實(shí)場(chǎng)景的中英同傳評(píng)測(cè)任務(wù)(http://ccmt2019.jxnu.edu.cn/page/main1923/pctz.htm),同時(shí)發(fā)布了首個(gè)真實(shí)演講場(chǎng)景的中英同傳數(shù)據(jù)集CCMT2019-BSTC(http://ai.baidu.com/broad),兩項(xiàng)工作都將極大地推動(dòng)同聲傳譯的相關(guān)研究和發(fā)展。
“有一天,當(dāng)你在北京人民大會(huì)堂和世界各國(guó)友人聚會(huì)的時(shí)候,你會(huì)發(fā)現(xiàn),無(wú)論哪個(gè)國(guó)家的人在臺(tái)上講話,與會(huì)者都能從耳機(jī)里聽(tīng)到自己國(guó)家的語(yǔ)言……” 這是54年前,劉涌泉、高祖舜、劉倬合著的《機(jī)器翻譯淺說(shuō)》里對(duì)未來(lái)的機(jī)器翻譯發(fā)展和應(yīng)用的暢想和展望。而今天,隨著技術(shù)的進(jìn)步,暢想正在逐步走向現(xiàn)實(shí)。百度翻譯AI同傳解決方案的提出,提供了一種更方便、成本更低的服務(wù)選擇,而未來(lái),隨時(shí)隨地自由溝通的夢(mèng)想也將離我們?cè)絹?lái)越近。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書(shū)】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專(zhuān)題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 5 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 6 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷(xiāo)中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單