凌空手寫、方言識(shí)別?百度搞的是噱頭還是創(chuàng)新?
凌空手寫,實(shí)用價(jià)值究竟幾何?
許多科幻電影中,都有類似的裝置,只不過大多數(shù)的用途都不是寫字,而是進(jìn)行功能操作。
小黑能想到的最近的例子大概就是人間大炮,哦,不對(duì),上海堡壘了。
而小黑也在網(wǎng)上看到過不少宣傳文抓著這一點(diǎn)狂吹百度輸入法,比如下面這些。
不過,小黑始終堅(jiān)信一句話:是騾子是馬,還是要牽出來遛遛的。
所以小黑實(shí)際使用百度輸入法的凌空手寫功能,為大家錄了幾段視頻。
首先,小黑測試了幾個(gè)簡單的字:“人”和“入”,百度輸入法非常輕松地識(shí)別了出來。當(dāng)然,如果這兩個(gè)字都識(shí)別不出來,那它也就該狗帶了。
之后,小黑略微加大了難度,于是百度輸入法就懵逼了。小伙伴們也可以猜猜小黑究竟輸入的是什么字。
從上面的測試結(jié)果來看,凌空手寫功能對(duì)稍復(fù)雜的字幾乎沒有識(shí)別能力。
造成這種狀況的原因,小黑覺得主要有兩點(diǎn):首先,凌空手寫技術(shù)目前還無法判斷筆劃的轉(zhuǎn)換。例如上面的視頻中,百度輸入法并不能判斷出用戶收筆、落筆的時(shí)機(jī),手指劃過的每一個(gè)地方都被連在一起。
此外,物體追蹤的算法目前并不完善,即便是捕捉白墻前的手指,但只要手指動(dòng)的快一點(diǎn),就無法被即時(shí)追蹤到了。
不只是小黑的測試說明了這一點(diǎn),網(wǎng)上許多用戶也都覺得:這項(xiàng)技術(shù)目前更大的價(jià)值還是在娛樂上。
百度的野望不在輸入法,而在更廣闊的天地
根據(jù)小黑收集到的資料,凌空手寫技術(shù)其實(shí)早在2019年1月就已經(jīng)上線了。
不過,這次新版本的凌空手寫技術(shù)則是升級(jí)后的第二代。
據(jù)稱,第一代凌空手寫技術(shù)必須要具有深度/紅外攝像頭的設(shè)備才能追蹤、監(jiān)測指尖的運(yùn)動(dòng)軌跡。而升級(jí)后的凌空手寫技術(shù)則只需要有一個(gè)過得去的前置攝像頭就可以了,這也大大降低了技術(shù)的準(zhǔn)入門檻,讓更多的用戶能夠體驗(yàn)一番。
不過,如果要讓它實(shí)用、好用,卻并不簡單。正如上面的視頻所展示的一樣,凌空手寫功能目前的實(shí)用價(jià)值并不高,第一個(gè)難關(guān)就是在識(shí)別的準(zhǔn)確率方面。
由于降低了對(duì)攝像頭的要求,凌空手寫對(duì)算法本身的要求反而大大提高了。物體追蹤的算法還只是最基本的部分,更重要的是在文字識(shí)別時(shí),對(duì)用戶的書寫習(xí)慣的計(jì)算,這對(duì)任何一家公司來說,都是需要大量投入的事情。
不過,小黑倒并不覺得這只是百度的一個(gè)噱頭。
就像微博上的用戶反饋說的那樣,凌空手寫功能在目前主要還是為了好玩。無聊的時(shí)候玩?zhèn)類似“我畫百度猜”這樣的小游戲,似乎還是挺有樂趣的。
但小黑不禁聯(lián)想到,在Siri這一類語音助手剛出現(xiàn)時(shí),大家呼出它,都只是為了各種“調(diào)戲”。但隨著技術(shù)的不斷進(jìn)步,AI識(shí)別準(zhǔn)確性的進(jìn)一步提升,語音助手從原本的“陪聊”助手,也漸漸變成人們在生活中真正的助手,到現(xiàn)在更是成為了智能家居中的重要紐帶。
有了這樣的先例引導(dǎo),我們大可放下目前對(duì)其“實(shí)用性”的討論,來想象一下凌空手寫在未來的實(shí)際應(yīng)用。
事實(shí)上,小黑覺得,這項(xiàng)技術(shù)最大的用途并不是輸入文字。離開單個(gè)APP,放眼整個(gè)手機(jī)生態(tài),它可以實(shí)現(xiàn)更多的功能:例如,當(dāng)我們不方便拿起手機(jī)操作的時(shí)候,做一個(gè)手勢就可以點(diǎn)亮屏幕、操作手機(jī),這樣想來,是不是有一種科幻片的感覺。
我們甚至還可以離開手機(jī)來暢想一下:當(dāng)我們回到家里,做個(gè)手勢,客廳的燈光就都打開了,窗簾也隨之關(guān)閉。回到臥室,再用一個(gè)手勢,電視上便出現(xiàn)了歡迎界面。換臺(tái)、調(diào)整音量和亮度,這些都可以通過手勢來完成。甚至當(dāng)你想看哪一部電視的時(shí)候,也可以通過手勢輸入劇名完成搜索。
想到這里,小黑不禁開始期待這一天的快點(diǎn)到來。
相比外界對(duì)這一功能的吹捧,百度卻相當(dāng)清醒,只是將功能的入口放在快捷設(shè)置界面的倒數(shù)第二行。甚至在官網(wǎng)和微博上,關(guān)于這項(xiàng)功能的介紹也少之又少。
或許,在百度心中,原本就沒有將這一功能立即推廣的意思。正如小米透明電視等等現(xiàn)在看來“沒什么用”的功能一樣,這些目前看來花里胡哨的東西真正面向的,是未來。
我們沒有必要因?yàn)槿魏我豁?xiàng)技術(shù)現(xiàn)在的狀態(tài)就無腦吹捧或者肆意嘲諷。況且,無腦這個(gè)詞,不正說明了這些吹捧的和嘲諷的人都沒什么腦子么?我們真正該做的,是在自己熱愛的領(lǐng)域,發(fā)揮自己的能力,讓這些技術(shù)真正變得有實(shí)用價(jià)值。到那時(shí),我們自然會(huì)看到一個(gè)更美好的未來。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報(bào)告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 一文看懂視覺語言動(dòng)作模型(VLA)及其應(yīng)用
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡單