技術(shù)解讀思必馳DUI標(biāo)注訓(xùn)練一體化平臺(tái),語(yǔ)音識(shí)別全場(chǎng)景覆蓋
坊間總會(huì)流傳些他們的段子
格子衫、雙肩包、沉默且不茍言笑
當(dāng)然,還有岌岌可危的發(fā)量(沒(méi)有,不是我說(shuō)的)
那只能說(shuō),這些都是表象
堪稱新時(shí)代的中流砥柱
每天家住回龍觀,征戰(zhàn)新中關(guān)
渾身散發(fā)出高級(jí)又內(nèi)斂的氣質(zhì)
究竟是什么塑造的?
(一切為了工作 掙錢(qián))
小馳捕捉到一位思必馳程序員小哥哥
今天去看看
他日常的那些“封神級(jí)”操作!
Q:一句話形容你正在做的事情?
A:人類之光…在宇宙中心呼喚AI…反正很Cool就對(duì)了
Q:最近有什么新成果嗎?
A:你光顧著關(guān)注我們發(fā)際線,不關(guān)注我們的精神成果,扣雞腿…
最近發(fā)布了DUI標(biāo)注訓(xùn)練一體化平臺(tái),具體干啥的,來(lái)補(bǔ)課!↓↓↓
DUI標(biāo)注訓(xùn)練一體化平臺(tái)全場(chǎng)景應(yīng)用,識(shí)別體驗(yàn)持續(xù)提升!
思必馳DUI標(biāo)注訓(xùn)練一體化平臺(tái),讓服務(wù)賦能走向能力賦能:
Q:如果我中英文摻著說(shuō),語(yǔ)音識(shí)別TA能聽(tīng)懂嗎?
A:不同場(chǎng)景、環(huán)境下的語(yǔ)音識(shí)別效果多少會(huì)受噪聲、專業(yè)術(shù)語(yǔ)、多語(yǔ)言混合影響。契合場(chǎng)景來(lái)提升語(yǔ)音識(shí)別率,自然就能準(zhǔn)確許多。
Q:讓場(chǎng)景識(shí)別率能持續(xù)提升,你們有什么“神技”傍身?
A:我們?nèi)谶M(jìn)了最新的「端到端識(shí)別技術(shù)」來(lái)提升識(shí)別準(zhǔn)確率,通過(guò)大規(guī)模預(yù)訓(xùn)練模型技術(shù)提升語(yǔ)音識(shí)別后處理效果。結(jié)合「增量學(xué)習(xí)」、「主動(dòng)學(xué)習(xí)」、「聯(lián)邦學(xué)習(xí)」和「小樣本遷移」等技術(shù)手段,提升用戶體驗(yàn)。同時(shí)開(kāi)放「端點(diǎn)檢測(cè)模型自訓(xùn)練」、「標(biāo)點(diǎn)斷句自訓(xùn)練」等功能,讓用戶自己擁有自主權(quán),來(lái)解決實(shí)際問(wèn)題。
Q:呃…
A:好,說(shuō)點(diǎn)你能聽(tīng)懂的
高能,劃重點(diǎn)!
第一,關(guān)于端到端識(shí)別技術(shù)。
過(guò)往嚴(yán)格意義上的端到端識(shí)別技術(shù),如基于LAS的端到端系統(tǒng),雖然可以較明顯地提升通用語(yǔ)音識(shí)別的準(zhǔn)確率,但受限于計(jì)算復(fù)雜、自定制語(yǔ)言模型技術(shù)不成熟等原因,不能大規(guī)模的商用。思必馳去年推出新一代端到端語(yǔ)音識(shí)別建模技術(shù),在實(shí)現(xiàn)通用識(shí)別準(zhǔn)確率相對(duì)提升10%-15% 的同時(shí),也提升了模型計(jì)算速度,更可以滿足快速有效的語(yǔ)言模型自定制。
第二,關(guān)于大規(guī)模預(yù)訓(xùn)練模型技術(shù)。
要知道,語(yǔ)音識(shí)別系統(tǒng)中除了核心的語(yǔ)音識(shí)別(ASR)模型部分,語(yǔ)音識(shí)別的后處理模型也是十分重要的,它直接影響到識(shí)別結(jié)果的可讀性。思必馳語(yǔ)音識(shí)別系統(tǒng)支持「智能糾錯(cuò)」、「智能標(biāo)點(diǎn)斷句」、「智能口語(yǔ)順滑」、「智能語(yǔ)義分段」、「智能語(yǔ)義糾錯(cuò)」等語(yǔ)音識(shí)別后處理技術(shù),能進(jìn)一步提升語(yǔ)音識(shí)別的效果與可懂度。模型采用大規(guī)模預(yù)訓(xùn)練模型,結(jié)合多任務(wù)學(xué)習(xí)(Multi-Task Learning)和知識(shí)蒸餾(Knowledge Distillation)方法。在降低70%以上模型規(guī)模的條件下,提升了模型效果,運(yùn)算效率大幅提升同時(shí)降低了內(nèi)存開(kāi)銷(xiāo)。
例如在智能會(huì)議場(chǎng)景中,通常轉(zhuǎn)寫(xiě)結(jié)果是篇章段落,且多含有口語(yǔ)化的表達(dá),通過(guò)我們的識(shí)別后處理功能,可以將會(huì)議轉(zhuǎn)寫(xiě)結(jié)果整理成格式化,易讀易懂的會(huì)議記錄。
第三,增量學(xué)習(xí)。
受限于深度神經(jīng)網(wǎng)絡(luò)技術(shù)中的災(zāi)難性遺忘問(wèn)題,采用深度學(xué)習(xí)方法的ASR建模在權(quán)衡“既要保障模型原有識(shí)別效果,又要提升新的目標(biāo)場(chǎng)景識(shí)別效果”時(shí),通常采用基于新舊數(shù)據(jù)混合訓(xùn)練的方法。弊端是,該方法增長(zhǎng)了模型優(yōu)化的周期,又會(huì)帶來(lái)數(shù)據(jù)安全隱患。基于思必馳自研的KDF-IL增量學(xué)習(xí)方法,在語(yǔ)音識(shí)別優(yōu)化時(shí),可以僅用新增數(shù)據(jù)進(jìn)行模型訓(xùn)練,縮短開(kāi)發(fā)周期同時(shí),也有效保障數(shù)據(jù)安全。 第四,小樣本學(xué)習(xí)。
自研的小樣本遷移學(xué)習(xí)技術(shù),使用少量數(shù)據(jù)就可快速實(shí)現(xiàn)場(chǎng)景體驗(yàn)優(yōu)化。例如使用少量帶標(biāo)注的文本數(shù)據(jù),即可對(duì)標(biāo)點(diǎn)斷句模型進(jìn)行優(yōu)化,相對(duì)傳統(tǒng)模式調(diào)優(yōu),節(jié)省了83%的數(shù)據(jù)量。例如,在真實(shí)的航空質(zhì)檢場(chǎng)景中,通用的標(biāo)點(diǎn)斷句模型面對(duì)特殊的專業(yè)術(shù)語(yǔ)和斷句方式,一定會(huì)水土不服。得益于小樣本遷移學(xué)習(xí)技術(shù),在使用少量的標(biāo)注文本情況下,即可實(shí)現(xiàn)F值40%左右的絕對(duì)值提升,完成體驗(yàn)效果從不可用到可用的轉(zhuǎn)變。 最后,咳咳….(這個(gè)氛圍是不是該升華了)在功能層面,我們深知不同用戶的使用場(chǎng)景復(fù)雜多樣,單靠賦能用戶自主訓(xùn)練ASR模型不能滿足需求。
我們。ㄉA來(lái)了)秉承以解決用戶實(shí)際問(wèn)題為核心的產(chǎn)品理念,開(kāi)放端點(diǎn)檢測(cè)模型自訓(xùn)練、標(biāo)點(diǎn)斷句自訓(xùn)練等功能,使得用戶可以通過(guò)我們的產(chǎn)品,完成識(shí)別系統(tǒng)中幾乎所有模塊功能的自訓(xùn)練,最大程度優(yōu)化用戶體驗(yàn)。
Q:啊,真不愧是“人類之光”。求問(wèn),沒(méi)經(jīng)驗(yàn)可以用嗎?
A:平臺(tái)建立的出發(fā)點(diǎn)就是降低 AI 使用門(mén)檻,只要企業(yè)有數(shù)智化轉(zhuǎn)型的需求,我們就能匹配提供高可用定制的模型。平臺(tái)的私有化部署能力,也能將自主權(quán)交給企業(yè)自己,非AI專家都能使用,”零“學(xué)習(xí)成本。
Q:怎么合作呢?
A:平臺(tái)同時(shí)滿足「模塊化輸出」+「支持 UI可視化界面 /API輸出」這兩點(diǎn),可以根據(jù)業(yè)務(wù)需求靈活配置,選擇使用一體化平臺(tái)的全部功能,或者只使用其中幾個(gè)模塊的功能。
Q:可以拓展使用嗎?
A:當(dāng)然可以,「全場(chǎng)景覆蓋」是平臺(tái)的一大優(yōu)點(diǎn)。適用于各類行業(yè)場(chǎng)景,如會(huì)議辦公、航空通訊、智慧醫(yī)療、城市交通、數(shù)字化門(mén)店、智慧園區(qū)、線下質(zhì)檢、政務(wù)、庭審等等,可以快速?gòu)漠?dāng)前項(xiàng)目復(fù)用到新項(xiàng)目中,形成規(guī);a(chǎn)定制,滿足多樣化的業(yè)務(wù)需求。
Q:怎么聯(lián)系你們呢?
如有合作意向,請(qǐng)發(fā)郵件
Q: 好,不愧是氣質(zhì)不凡的你們!今天收獲頗豐!
A:總結(jié)下,就是我們?cè)谝粋(gè)科技開(kāi)放和包容的時(shí)代,和一群特別Cool的人,做了些特別Cool的產(chǎn)品和事情。如果你想更了解我們,歡迎隨時(shí)交流。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書(shū)】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷(xiāo)中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單