聲音定制三天交付,深聲科技如何在語音AI賽道彎道超車?
自2015年開始,中國人工智能市場規(guī)模逐年攀升,2018年中國人工智能市場規(guī)模約為238.2億元,增長率達(dá)到56.6%,據(jù)預(yù)測,到2020年,中國在人工智能的市場規(guī)模將接近500億元。
“語音是AI智能時(shí)代的重要入口,”深聲科技創(chuàng)始人周俊明說。他的底氣來自多年的行業(yè)積累和互聯(lián)網(wǎng)產(chǎn)品開發(fā)經(jīng)驗(yàn)。
2012年,周俊明從中科院計(jì)算所博士畢業(yè),順利進(jìn)入廣電行業(yè)龍頭企業(yè)北京永新視博擔(dān)任高級(jí)算法工程師,主要負(fù)責(zé)音視頻算法工作;2013年,他憑借音視頻算法技術(shù)能力,被騰訊選中,故任職于此,繼續(xù)從事在線音視頻算法技術(shù)研發(fā)工作;2016年,他加入了歡聚時(shí)代,擔(dān)任音視頻技術(shù)總負(fù)責(zé)人,帶領(lǐng)國內(nèi)頂級(jí)音視頻團(tuán)隊(duì),為YY提供核心技術(shù)服務(wù)和技術(shù)創(chuàng)新方案。
2018年,周俊明和核心團(tuán)隊(duì)成員共同創(chuàng)辦了“深聲科技”,一家智能語音技術(shù)服務(wù)商,主要通過基于深度學(xué)習(xí)的文字轉(zhuǎn)語音整體解決方案服務(wù)B端客戶,提高客戶在行業(yè)內(nèi)的競爭壁壘,幫助客戶形成獨(dú)有的競爭優(yōu)勢。據(jù)悉,成立不到半年,深聲科技就獲得了來自小米科技的數(shù)千萬元天使輪融資。
AI行業(yè)從不缺競爭對手,BAT等頭部大企業(yè)有強(qiáng)者的打法,初創(chuàng)企業(yè)也有自己彎道超車的策略。深聲科技在多年的實(shí)踐摸索發(fā)現(xiàn),以往客戶在語音合成中最關(guān)心的是信息的傳遞。但隨著物質(zhì)生活的不斷提高,客戶對于語音轉(zhuǎn)化真實(shí)感的需求也日益劇增,催生了擬人聲智能營銷、擬人互動(dòng)、擬人陪伴等大規(guī)模商業(yè)化應(yīng)用場景和價(jià)值。基于此邏輯,深聲科技在商業(yè)模式方面主打三大場景:語音內(nèi)容輸出、智能語音交互、智能客服營銷。
其中,內(nèi)容輸出業(yè)務(wù)是深聲科技重點(diǎn)推進(jìn)的主線業(yè)務(wù),團(tuán)隊(duì)主要通過與有版權(quán)IP的企業(yè)合作,以有聲閱讀的方式將深聲語音呈現(xiàn)給消費(fèi)者,內(nèi)容涵蓋文學(xué)、動(dòng)漫、新聞資訊等多種題材和類型。根據(jù)深聲科技提供的數(shù)據(jù)顯示,深聲目前已與十余家行業(yè)頭部的內(nèi)容版權(quán)企業(yè)達(dá)成合作,一方面為企業(yè)提供文字語言轉(zhuǎn)化工具,按字?jǐn)?shù)收費(fèi);另一方面,提供語音合成整體解決方案,共同開發(fā)版權(quán)IP的語音形式。
在語音交互業(yè)務(wù)中,團(tuán)隊(duì)依托投資方小米的資源及產(chǎn)品,重點(diǎn)服務(wù)智能語音音箱和車聯(lián)網(wǎng)企業(yè),為其提供語音合成、數(shù)據(jù)制作和人機(jī)交互等服務(wù),協(xié)助客戶在產(chǎn)品開發(fā)過程中精準(zhǔn)感知用戶需求,增強(qiáng)行業(yè)競爭優(yōu)勢。
智能客服營銷業(yè)務(wù)是深聲科技正在嘗試的場景,深聲科技主要幫助運(yùn)營商和金融客戶定制聲音并合成聲音,使其在營銷過程中提高通話時(shí)長和營銷轉(zhuǎn)化率。談及看好語音交互和智能客服營銷這兩類客戶群體的原因時(shí),周俊明告訴創(chuàng)業(yè)邦,這兩類客戶對于語音音質(zhì)的要求更高,通過深聲科技自身語音合成技術(shù)的優(yōu)勢能很快產(chǎn)生規(guī);(yīng),且這兩類客戶群體的長期付費(fèi)能力更強(qiáng)。
從時(shí)間的維度上看,深聲科技相比科大訊飛、商湯科技等AI企業(yè)入局較晚,但團(tuán)隊(duì)正在加緊業(yè)務(wù)布局,構(gòu)建自身技術(shù)壁壘。首先,基于端到端的語音合成技術(shù)邏輯,深聲科技會(huì)對采集到的原始語音進(jìn)行自動(dòng)標(biāo)注,再由聲學(xué)模型算法對語言和語音進(jìn)行音素級(jí)特征對齊,可以實(shí)現(xiàn)完全擬人發(fā)聲,將語氣、語調(diào)、語速、抑揚(yáng)頓挫等語音特點(diǎn)完美呈現(xiàn)。在Blizzard Challenge 2019 國際語音合成大賽中,該技術(shù)在PER(拼音-不包含聲調(diào)-錯(cuò)誤率)和PTER(拼音-包含聲調(diào)-錯(cuò)誤率)兩個(gè)指標(biāo)上優(yōu)于科大訊飛。此外,團(tuán)隊(duì)在聲音定制合成方面的交付能力突出,三天內(nèi)便可完成,而行業(yè)一般需要3~6個(gè)月。
成立不到兩年,團(tuán)隊(duì)已有50多人規(guī)模,其中80%為技術(shù)研發(fā)人員。團(tuán)隊(duì)主要成員擁有中科院、中山大學(xué)、華南理工、日本早稻田大學(xué)等名校碩博教育背景和騰訊、網(wǎng)易、YY等名企工作經(jīng)歷。聯(lián)合創(chuàng)始人黃博賢擁有12年的互聯(lián)網(wǎng)語音和音頻技術(shù)積累,先后在酷狗和YY主導(dǎo)語音和音頻技術(shù)的開發(fā)。
接下來,團(tuán)隊(duì)會(huì)重點(diǎn)在效果、性能、數(shù)據(jù)三個(gè)維度優(yōu)化算法技術(shù),為各行各業(yè)提供更多標(biāo)準(zhǔn)化解決方案,加速技術(shù)落地,同時(shí)完善智能語音交互全鏈路技術(shù)。2020年,團(tuán)隊(duì)還將推出面向C端用戶的語音克隆產(chǎn)品,在陪伴、親子互動(dòng)、泛娛樂等交互場景全面發(fā)力。
目前,該項(xiàng)目已啟動(dòng)A輪融資,資金將全部用于團(tuán)隊(duì)建設(shè)及業(yè)務(wù)拓展。
本文相關(guān)的文章列表頁頭圖圖片來源于攝圖網(wǎng),經(jīng)授權(quán)使用。本文為創(chuàng)業(yè)邦原創(chuàng),未經(jīng)授權(quán)不得轉(zhuǎn)載,否則創(chuàng)業(yè)邦將保留向其追究法律責(zé)任的權(quán)利。如需轉(zhuǎn)載或有任何疑問,請聯(lián)系。
作者:王涵

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報(bào)告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 一文看懂視覺語言動(dòng)作模型(VLA)及其應(yīng)用
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡單