語(yǔ)音控制:企業(yè)計(jì)算的下一個(gè)重大突破
如果說(shuō)2007年 iPhone 的發(fā)布開啟了近十年來(lái)消費(fèi)者信息傳達(dá)被屏幕和視覺統(tǒng)治的時(shí)代,那么,語(yǔ)音將成為繼智能手機(jī)之后企業(yè)科技界下一個(gè)最大的顛覆。
蘋果Siri、谷歌助手、微軟小娜、三星Bixby和亞馬遜Alexa等各類設(shè)備和語(yǔ)音助手如雨后春筍般地出現(xiàn),便折射出了一種趨勢(shì)的變化:越來(lái)越多的用戶,開始從屏幕靠視覺傳達(dá),轉(zhuǎn)向用聲音來(lái)傳遞和接受信息。
據(jù) Strategy Analytics 的分析師透露,智能音箱已經(jīng)成為了近年來(lái)發(fā)展最快的新硬件市場(chǎng)。到 2023 年,63% 的美國(guó)家庭至少保有一臺(tái)智能音箱,而這個(gè)數(shù)字在 2014 年是 0.03%,2017 年是 16%。
語(yǔ)音技術(shù)在企業(yè)市場(chǎng)的應(yīng)用潛力巨大
在過去的幾十年里,隨著技術(shù)的不斷成熟,從穿孔卡片到鍵盤再到電腦鼠標(biāo)設(shè)備的緩慢發(fā)展,計(jì)算機(jī)交互已經(jīng)慢慢變得更加自然。
目前,觸控界面幾乎成了從相機(jī)到汽車在內(nèi)的任何帶有屏幕的設(shè)備的默認(rèn)標(biāo)準(zhǔn),F(xiàn)在也是時(shí)候邁出科技界的另一大步了:和公司的設(shè)備交談。至少在很多電影中,人類已經(jīng)實(shí)現(xiàn)了與電腦的交談,從《鋼鐵俠》中的賈維斯到《星際迷航4:暗黑無(wú)界》中的著名場(chǎng)景,斯科特試圖向一臺(tái)80年代的電腦發(fā)出指令。
盡管語(yǔ)音助手已經(jīng)在手機(jī)上使用多年了——蘋果的Siri在2011年問世。但迄今為止,它們對(duì)企業(yè)環(huán)境的影響仍然有限。
而現(xiàn)在,計(jì)算能力和機(jī)器學(xué)習(xí)的進(jìn)步使計(jì)算機(jī)在無(wú)需繁瑣的編碼情況下能夠比人類更好地轉(zhuǎn)錄語(yǔ)音,然后準(zhǔn)確地翻譯出來(lái)。并且,新系統(tǒng)可以更有效地自我更新,從錯(cuò)誤中吸取教訓(xùn),而非需要人為明確的指導(dǎo)。
支持語(yǔ)音的設(shè)備數(shù)量也在持續(xù)飆升,預(yù)計(jì)今年將售出超過5000萬(wàn)臺(tái),到2023年,全球語(yǔ)音技術(shù)產(chǎn)業(yè)預(yù)計(jì)將達(dá)到1265億美元。
對(duì)于工作人員來(lái)說(shuō),語(yǔ)音界面能夠帶來(lái)很多實(shí)際的好處,尤其是與繁瑣的移動(dòng)鍵盤相比。今年早些時(shí)候,斯坦福大學(xué)、華盛頓大學(xué)和美國(guó)百度大學(xué)進(jìn)行的一項(xiàng)研究發(fā)現(xiàn),移動(dòng)設(shè)備的語(yǔ)音輸入速度幾乎是打字速度的三倍,兩種輸入方式的錯(cuò)誤率差別不大。
語(yǔ)音接口的最大好處之一是可以為企業(yè)業(yè)務(wù)系統(tǒng)提供“通用遠(yuǎn)程控制”。谷歌已經(jīng)證明,語(yǔ)音可用于將計(jì)算機(jī)連接到基于人的系統(tǒng),例如在美發(fā)沙龍?jiān)O(shè)置預(yù)約。
這種連接在企業(yè)界甚至更有意義。因?yàn)槊總(gè)大型組織都有許多不同的應(yīng)用程序,倘若想要在它們之間提供一致的工作流,通常需要進(jìn)行編碼,這可能很慢,而且代價(jià)昂貴。但如果所有系統(tǒng)都支持語(yǔ)音,工作人員可以很容易地從一個(gè)系統(tǒng)切換到另一個(gè)系統(tǒng),而不需要任何顯式集成。
此外,企業(yè)系統(tǒng)之間很可能會(huì)開始相互通信。在計(jì)算中實(shí)現(xiàn)通用標(biāo)準(zhǔn)是非常困難的,而使用語(yǔ)音(盡管明顯效率低下)可能是實(shí)現(xiàn)系統(tǒng)集成的一個(gè)非常實(shí)用的短期解決方案。其實(shí),在消費(fèi)級(jí)市場(chǎng)已經(jīng)看到了這一點(diǎn),最近有消息稱,亞馬遜的Alexa現(xiàn)在可以與微軟的Cortana“對(duì)話”,反之亦然。
所有這些進(jìn)步都意味著,那些為企業(yè)的各種業(yè)務(wù)活動(dòng)提供聊天和語(yǔ)音接口的企業(yè)數(shù)字助理正在成為主流。
語(yǔ)音也成為創(chuàng)新服務(wù)方式的一部分。例如,Workheld提供創(chuàng)新的現(xiàn)場(chǎng)管理系統(tǒng),以提高施工和服務(wù)流程的生產(chǎn)率。該公司使用機(jī)器學(xué)習(xí)和文本分析技術(shù)自動(dòng)將客戶工作與最合適的技術(shù)人員匹配,并提供免提語(yǔ)音接口,幫助員工完成維護(hù)步驟。
威脅問題不容忽視
當(dāng)然,目前語(yǔ)音接口仍然存在一些問題,例如,在有大量背景噪音的繁忙辦公室中使用它可能很難。對(duì)此,科技公司正致力于尋求解決方案:例如,使用人工智能進(jìn)行更先進(jìn)的降噪,在人群中挑選出你的聲音,進(jìn)行唇語(yǔ)識(shí)別,甚至直接通過你的下巴檢測(cè)你的話語(yǔ),而不需要你大聲說(shuō)出來(lái)。
不過,這也帶來(lái)了一些潛在危險(xiǎn)。例如,所有這些麥克風(fēng)都為非法竊聽和個(gè)人跟蹤提供了充足的機(jī)會(huì)。正如喬治?奧威爾的《1984》中寫道的那樣:“隱藏的麥克風(fēng)總是有危險(xiǎn)的,通過它,你的聲音可能會(huì)被接收和識(shí)別”。
當(dāng)算法能夠創(chuàng)造出非常精確的合成語(yǔ)音時(shí),公司的安全又將如何通過語(yǔ)音接口來(lái)執(zhí)行呢?現(xiàn)在很多公司的“語(yǔ)音詐騙”已經(jīng)凸顯出該問題了:如果企業(yè)首席執(zhí)行官獨(dú)特的(但虛假的)聲音被連接到系統(tǒng)上,要求銀行進(jìn)行非正常的電匯,會(huì)發(fā)生什么?或者更貼近實(shí)際一點(diǎn),如果你十幾歲的女兒(假的,但聽起來(lái)聲音是一樣的)打電話給你說(shuō)她有麻煩了,需要錢,又該怎么辦?!
總的來(lái)說(shuō),今年企業(yè)中的語(yǔ)音應(yīng)用應(yīng)該會(huì)有巨大的飛躍,主要是通過與聊天機(jī)器人接口的可選語(yǔ)音進(jìn)行交互。
編輯與翻譯:張?zhí)K月

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 一文看懂視覺語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡(jiǎn)單