AI機器學(xué)習(xí)與智能硬件融合,小度智能音箱如何做到與天貓精靈并駕齊驅(qū)?
3月8日,阿里宣布自家的智能音箱銷量已經(jīng)超過千萬,成為中國第一,全球第三的智能手機廠商。
從Strategy Analytics最新發(fā)布的研究報告指出,智能音箱是的確是2018年最熱門的消費電子產(chǎn)品。
2018年第四季度,全球智能音箱出貨量增長了95%,達(dá)到3850萬臺。超過2017年的全年總出貨量,這種增長率堪比2012年前后的智能手機。
從市場份額看,國外的亞馬遜與谷歌還有明顯優(yōu)勢,2018年四季度,亞馬遜的銷量是1350萬,谷歌的銷量是1150萬,而中國的阿里、百度、小米銷量都在200萬左右。
有意思的是,如果我們把中國三家廠商每季度的銷量分開來看,就會發(fā)現(xiàn)中國智能音箱增長最快的并不是阿里,而是百度。
百度是全球前五中入場最晚的廠商,到了2018年二季度才開始發(fā)力,但是在短短幾個月,百度就成為智能音箱的世界級巨頭,這種增長速度是爆炸性的。
智能音箱這款產(chǎn)品始于2014年亞馬遜的Echo,國內(nèi)廠商紛紛仿效,經(jīng)過數(shù)年優(yōu)勝劣汰,阿里和小米到了2018年初已經(jīng)傲視所有國內(nèi)廠商。
百度真正發(fā)力智能音箱是在2018年中,“小度在家“這款全球首款帶屏智能音箱在2018年4月份才公開招募內(nèi)測。
而短短幾個月,百度的智能音箱就如核彈爆炸一般急速增長,到了2018年底,已經(jīng)是三巨頭之一,而且銷量幾乎與阿里和小米持平。
2019年一季度有春晚的加成,百度拿下一季度銷量第一應(yīng)該不是問題。
百度成立已經(jīng)很多年了,但是它最基本不做硬件,從互聯(lián)網(wǎng)跨界智能硬件,百度在幾個月內(nèi)就從“青銅“一躍成為“王者“,這個奇跡是如何創(chuàng)造出來的呢?
一、 厚積而薄發(fā)
智能硬件看似是一個硬件產(chǎn)品,而實際上它的核心技術(shù)并不是硬件,而是AI的語音識別與搜索。
語音識別技術(shù)已經(jīng)存在很久了,但是要讓智能音箱有優(yōu)秀的體驗,不僅僅是正確識別語音就夠了,而是要判別說話者的意圖,給予正確的回應(yīng)。
國內(nèi)很多所謂的智能音箱,只是買了科大訊飛的語音識別技術(shù),而百度的智能音箱核心技術(shù)是自己研發(fā)的。
百度對AI的研發(fā),可以追溯到多年之前。
人工智能科技發(fā)展很早,但是一度遇到瓶頸,難以突破;ヂ(lián)網(wǎng)發(fā)展起來之后,人們發(fā)現(xiàn)人工智能科技中深度學(xué)習(xí)技術(shù),可以依靠互聯(lián)網(wǎng)的大數(shù)據(jù)不斷進步,同時硬件的發(fā)展,特別是GPU通用計算的發(fā)展,讓計算能力不再是瓶頸,AI有了進一步發(fā)展的可能。
于是,百度在硅谷等地成立實驗室,投入重金,招募全球最好的AI專家,搭建百度大腦,開始AI的深度研發(fā)。
早在2014年(亞馬遜推出Echo之前),百度的研發(fā)團隊,就利用深度學(xué)習(xí)技術(shù),研發(fā)出Deep Speech系統(tǒng)。
到了2016年,百度的Deep Speech系統(tǒng)已經(jīng)進化到第三代。
傳統(tǒng)上,對語音識別的人工智能技術(shù)是RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))。RNN是在DNN(深度神經(jīng)網(wǎng)絡(luò))的基礎(chǔ)上發(fā)展出時間戳,發(fā)展出長短時記憶單元,可以有解決時間序列的應(yīng)用。語音識別是有時間序列的,所以業(yè)界對RNN用于語音識別的研究比較多。
而百度將深層卷積神經(jīng)網(wǎng)絡(luò)技術(shù)(Deep CNN)應(yīng)用于語音識別聲學(xué)建模中,將其與基于長短時記憶單元(LSTM)和連接時序分類(CTC)的端對端語音識別技術(shù)相結(jié)合,大幅度提升語音識別產(chǎn)品性能。這項技術(shù)借鑒了圖像識別在近些年的成果,以及語音與圖像在利用 CNN 模型訓(xùn)練的共通性,在語音識別技術(shù)上取得了革命性的進展。
《麻省理工科技評論》(MIT Technology Review)雜志在2016年度十大突破技術(shù)的榜單中把百度語音識別技術(shù)列為十大突破技術(shù)。
實際上早在2016年,百度已經(jīng)有了頂尖的語音識別技術(shù)。李彥宏在百度科技大會的上發(fā)言可以由AI同聲傳譯。李彥宏在Tech World大會上展示了AI與人的多輪對話。這些展示,遠(yuǎn)遠(yuǎn)超過市面上在售的智能音箱所擁有的水平,百度只是缺少一款轉(zhuǎn)化的產(chǎn)品。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 一文看懂視覺語言動作模型(VLA)及其應(yīng)用
- 5 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 6 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 10 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單