小度音箱背后的下一代操作系統(tǒng)
文|吳俊宇
美國(guó)科技媒體CHROMEUNBOXED在今年5月Google I/O大會(huì)結(jié)束之后曾發(fā)表一篇名為《Next Generation Google Assistant Set To Revolutionize How We Talk To Devices》(下一代谷歌助手將徹底改變我們與設(shè)備的對(duì)話方式)的文章。
這篇文章提到,“我們的聲音與我們的設(shè)備將在交互方面進(jìn)行一場(chǎng)革命”。
也就是說,語音交互可能會(huì)帶來新一代操作系統(tǒng)——它可能和“桌面+鍵鼠”、“屏幕+觸控”一樣,成為我們?cè)谥悄軙r(shí)代的新選擇。
CHROMEUNBOXED這個(gè)判斷并非虛言。隨著自然語言處理NLP技術(shù)的日趨進(jìn)步,智能語音能夠理解的事物越來越多,我們和語音之間的交互也將越來越深。
這一次百度AI開發(fā)者大會(huì)上,新發(fā)布的小度助手5.0,恰恰展現(xiàn)了成為“第三代操作系統(tǒng)”的潛力。
一、語音何以成為系統(tǒng)
在我看來,互聯(lián)網(wǎng)的發(fā)展歷經(jīng)了兩個(gè)階段,現(xiàn)在正在進(jìn)入第三個(gè)階段。
第一代操作系統(tǒng)是“桌面+鍵鼠”,桌面時(shí)代的思路,是“搶入口”,比如搜索引擎、社交工具、殺毒軟件。
第一個(gè)階段的代表諸如桌面瀏覽器、桌面QQ、360衛(wèi)士這些產(chǎn)品。人們對(duì)這些工具型產(chǎn)品有著超乎尋常的依賴,往往可以形成“三級(jí)火箭”的商業(yè)邏輯。比如“殺毒軟件—瀏覽器-搜索”就是典型的三級(jí)火箭模式。
不過,這個(gè)模式到了移動(dòng)時(shí)代就失效了,隨著APP入口日趨分散,“平臺(tái)+生態(tài)”成了通用邏輯。
第二代操作系統(tǒng)是“屏幕+觸控”,移動(dòng)時(shí)代的思路,是“造平臺(tái)”。
第二階段的代表就是微信,微信無論是最開始做微信公眾號(hào),還是后來的九宮格,以及當(dāng)下的小程序,微信都在希望逐步加深自己操作系統(tǒng)的屬性。
但限于微信移動(dòng)產(chǎn)品形態(tài)的限制,它只能是騰訊尋找下一個(gè)操作系統(tǒng)產(chǎn)品的過渡期產(chǎn)品,將第二階段的紅利盡量延長(zhǎng),為自己爭(zhēng)取更多時(shí)間。
第三代操作系統(tǒng)是“智能+語音”,智能時(shí)代的思路是入口無形化,服務(wù)語音調(diào)動(dòng)、無所不在,服務(wù)生態(tài)在系統(tǒng)內(nèi)實(shí)現(xiàn)自然閉環(huán)。
也就是說,語音成為了交互的工具。過去人們是通過“桌面+鍵鼠”、“屏幕+觸控”調(diào)取各式各樣的服務(wù)。但是在第三代操作系統(tǒng)這里,隨著自然語音處理技術(shù)的逐漸成熟,人們可以直接通過語音去調(diào)取服務(wù)。
在微軟Build2016開發(fā)者大會(huì)上,微軟CEO納德拉首先提出了Conversations as a Platform,也就是對(duì)話即平臺(tái)的人工智能發(fā)展方向。
這個(gè)概念在后來也被稱為是對(duì)話式人工智能。
所謂對(duì)話式人工智能指的是,對(duì)話本身就是一個(gè)平臺(tái),各種知識(shí)、信息與服務(wù)都運(yùn)行在對(duì)話器上,可以形成生態(tài)環(huán)境的基礎(chǔ)平臺(tái)。人和人工智能之間的對(duì)話,即是解決各種問題的一種路徑和方式。
美國(guó)科技媒體Towards Data Science在今年4月刊載的一篇名為《A Voice Based Operating System》(《基于聲音的操作系統(tǒng)》)一文中提到了這樣一句話:
Voice interfaces are the future of human computer interaction.
語音接口是人機(jī)交互的未來。
這篇文章認(rèn)為,語音想要成為操作系統(tǒng),必須滿足這幾個(gè)條件。
1、巨大的研究實(shí)驗(yàn)室作為人工智能的技術(shù)先驅(qū)。
2、巨大的計(jì)算資源,幾乎不受限制地訪問數(shù)據(jù)。
3、一個(gè)可以從基于語音的界面中獲益匪淺的應(yīng)用程序生態(tài)系統(tǒng)。
在我看來,一個(gè)真正可能“上位”的語音操作系統(tǒng),還需要有著硬件生態(tài)規(guī)模作為支撐——讓它真正無處不在。
二、小度助手悄然崛起
7月3日,在“Baidu Create 2019”百度AI開發(fā)者大會(huì)上,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏演示了小度行業(yè)領(lǐng)先的全雙工免喚醒能力,小度現(xiàn)場(chǎng)展示的“連續(xù)對(duì)話”和“拒絕反應(yīng)”能力讓人看到了“操作系統(tǒng)級(jí)別”的體驗(yàn)。
某種意義上看,今天的小度助手,其實(shí)就符合這三個(gè)條件。
百度本身就是國(guó)內(nèi)AI技術(shù)最領(lǐng)先的企業(yè),在計(jì)算資源、算力規(guī)模方面,也無需多言;谶@些基礎(chǔ)條件,百度開發(fā)者大會(huì),作為國(guó)內(nèi)乃至全球開發(fā)者們的頂級(jí)盛會(huì),勾勒了一個(gè)未來操作系統(tǒng)的影子——小度助手5.0。
1、技術(shù)基礎(chǔ)
語音操作系統(tǒng)最重要的技術(shù)基礎(chǔ)在于自然語言處理能力。這個(gè)素來都是百度的優(yōu)勢(shì)。
在自然語言處理之外,百度還具備小度開放平臺(tái),專門為個(gè)人及企業(yè)開發(fā)者提供專業(yè)的對(duì)話式AI技能開發(fā)工具。其中包括智能設(shè)備開放平臺(tái)和技能開放平臺(tái)。
這使得小度助手可以不斷演化出新的技能,技術(shù)更新速度也更快。要知道,一款操作系統(tǒng)最重要的基礎(chǔ)就是應(yīng)用和硬件,百度在這方面已經(jīng)打通了軟硬件上下游的生態(tài)。
另一個(gè)重要的技術(shù)突破在于,小度助手5.0的全雙工免喚醒能力讓語音交互體驗(yàn)邁出了一大步,用戶不僅能在無需多次喚醒的情況下和機(jī)器順暢交流,還能在與他人對(duì)話的同時(shí)互不干擾地實(shí)現(xiàn)人機(jī)交互。
2、用戶規(guī)模
任何操作系統(tǒng),必不可少的就是用戶規(guī)模。語音操作系統(tǒng),其用戶規(guī)模的支撐又離不開硬件規(guī)模。因?yàn)橹挥杏布?guī)模(如智能音箱、智能手機(jī)、智能電視等)足夠龐大,能夠覆蓋足夠多的場(chǎng)景,才能覆蓋足夠多的用戶。
百度副總裁、百度智能生活事業(yè)群組(SLG)總經(jīng)理景鯤在大會(huì)上提到的一組數(shù)據(jù)頗為驚人:
截至2019年6月,搭載小度助手的智能設(shè)備激活數(shù)量已經(jīng)達(dá)到4億(不包含百度系A(chǔ)PP內(nèi)置小度助手?jǐn)?shù)量),小度的月交互次數(shù)超過36億(不包含百度系A(chǔ)PP內(nèi)置小度助手?jǐn)?shù)量)。
支撐如此龐大數(shù)據(jù)規(guī)模的,其實(shí)是龐大的合作伙伴生態(tài)。小度助手的合作伙伴數(shù)量已經(jīng)超過300家,內(nèi)置小度助手的主控設(shè)備超過160多款;小度助手的對(duì)話能力應(yīng)用到智能家居、智能穿戴、車載、移動(dòng)等多個(gè)場(chǎng)景,為用戶提供語音服務(wù)。
有趣的是,根據(jù)Canalys 發(fā)布的2019年Q1 全球智能音箱市場(chǎng)報(bào)告,百度2019年Q1 小度智能音箱出貨量達(dá)330萬臺(tái),僅次于谷歌的350萬臺(tái)及亞馬遜的460萬臺(tái),成為中國(guó)市場(chǎng)第一,全球市場(chǎng)第三。
不管是合作伙伴還是自有硬件,小度助手都形成了龐大的用戶規(guī)模。
3、生態(tài)規(guī)模
一個(gè)好的操作系統(tǒng),背后是一套完整的生態(tài),其中包括開發(fā)者、應(yīng)用層和硬件層。今天的小度助手其實(shí)就滿足這個(gè)條件。
小度技能開放平臺(tái)目前可提供包括游戲、效率工具、網(wǎng)絡(luò)電臺(tái)、直播、兒童教育、智能家居等2400多種技能支持;在小度技能開放平臺(tái)上的技能開發(fā)者數(shù)量已經(jīng)超過3.2萬人;小度助手可以控制的IOT智能家居設(shè)備已經(jīng)超過了七千萬。小度助手可以提供20余種跨場(chǎng)景、跨設(shè)備的解決方案。
小度助手5.0的發(fā)布,無論是所展現(xiàn)的技術(shù)能力還是智能語音技術(shù)所具備的天然優(yōu)勢(shì),都讓小度助手更有可能成為未來的操作系統(tǒng)。
更多的開發(fā)者接入,更多的技能得以實(shí)現(xiàn),更多硬件廠商的擁抱態(tài)度,都為小度助手提供了成為操作系統(tǒng)道路的動(dòng)力。
有技術(shù)、有用戶、有生態(tài),小度助手需要做的,僅僅只是等待東風(fēng)的到來。
三、下一個(gè)劇變的開始
國(guó)內(nèi)企業(yè)戰(zhàn)略及管理學(xué)研究者朱恒源有一個(gè)“變革動(dòng)態(tài)管理模型”。
在朱恒源看來,一個(gè)創(chuàng)新產(chǎn)品是不會(huì)馬上就被所有用戶接受的,在不同的階段,主流的新增用戶是不同的。隨著這些用戶的不斷累積,就會(huì)看到市場(chǎng)的成長(zhǎng)軌跡不是一條直線,而是一條“S”形曲線。
在這個(gè)“S”形的市場(chǎng)發(fā)展曲線上,我們可以看到四個(gè)清晰可識(shí)別的階段:小眾市場(chǎng)、大眾市場(chǎng)、分眾市場(chǎng)和雜合市場(chǎng)。
在小眾市場(chǎng)的時(shí)候,它是一個(gè)漸變的過程,規(guī)模小、增長(zhǎng)慢而且不穩(wěn)定,需求多樣性很高。由小眾市場(chǎng)向大眾市場(chǎng)過渡就是突變,接受某個(gè)產(chǎn)品的人數(shù)突然呈指數(shù)式增長(zhǎng),市場(chǎng)在極短的時(shí)間內(nèi)極速擴(kuò)大,并且達(dá)到了一個(gè)非常大的規(guī)模。
某種意義上看,當(dāng)下發(fā)展階段就是圖中所示的智能手機(jī)和智能語音這兩條動(dòng)態(tài)曲線的重疊區(qū)間。
今天的智能語音,正處于下一個(gè)劇變的前夜。目前使用智能語音的用戶主要還處在小眾市場(chǎng),但是隨著技術(shù)不斷成熟、用戶不斷擴(kuò)大,真正的劇變即將開始。
紐約時(shí)報(bào)在2017年曾經(jīng)針對(duì)智能語音發(fā)表過這樣一個(gè)觀點(diǎn):
人工智能時(shí)代利害攸關(guān)的不在于這些零零碎碎的創(chuàng)新,而是可能控制的一種全新的計(jì)算平臺(tái)。
如果說曾經(jīng)的微軟掌握了Windows從而獲取了PC時(shí)代的霸權(quán)地位,后來的谷歌和蘋果掌握了Android和iOS因此在移動(dòng)時(shí)代叱咤風(fēng)云。
那么今天的百度,可能會(huì)因?yàn)樾《戎诌@樣的第三代操作系統(tǒng),在智能時(shí)代搶占新的機(jī)會(huì)。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡(jiǎn)單
- 10 一文看懂視覺語言動(dòng)作模型(VLA)及其應(yīng)用