AI時代工具應(yīng)用如何轉(zhuǎn)型,或許百度輸入法AI探索版給出了答案
1、最直接的影響是,智能語音更準(zhǔn)了,還能離線語音輸入。
未來用戶不管是在輸入法、搜索引擎說出自己的語音,都會更準(zhǔn)確,甚至可以中英文方言混輸。即使處于地鐵、電梯、隧道或人流密集等離線場景中,依然可以借助百度輸入法進行精準(zhǔn)的語音輸入。
過去用戶往往是語音輸錯一個字就會花10秒鐘來修改,而且由于方言、口語、中英文混雜的語言習(xí)慣,語音輸入法是沒辦法適應(yīng)這樣相對復(fù)雜的熟人環(huán)境的。這種經(jīng)歷讓用戶很難建立長時間使用語音輸入法的習(xí)慣。所以雖然各家輸入法都說自己有97%以上的準(zhǔn)確率,但實際情況是,愿意使用語音輸入法的人寥寥無幾。
不過,無論是中英文夾雜,還是普通話家鄉(xiāng)話來回切換,百度輸入法都能準(zhǔn)確識別,是目前唯一實現(xiàn)了高精度中英文混合語音輸入、方言免切換語音輸入的輸入法產(chǎn)品。直接影響就是,用戶更愿意用語音輸入法了,用戶習(xí)慣會在技術(shù)提高的過程中一點一點普及。
2、AI能真正理解你的語音指令的含義。
所以你可以在輸入法中調(diào)用指令,發(fā)表情斗圖、發(fā)祝福語、發(fā)彈幕、發(fā)文件、OCR等等。滿足與輸入相關(guān)的周邊需求,實現(xiàn)全語音交互。
百度高級副總裁王海峰甚至認(rèn)為,輸入法本質(zhì)上是一款人機交互的工具,AI時代正在到來,人機交互的形態(tài)也將隨之革新。未來,百度輸入法將不僅基于手機端,還將致力于連通包括智能家居、車聯(lián)網(wǎng)等多種終端場景,集多種輸入方式為一體,幫助用戶在各種場景下高效、自如地傳遞信息。
3、在一些特殊場景實現(xiàn)更復(fù)雜的、具有邏輯層級的任務(wù)。
語音輸入法過去的使用場景是相對狹窄的,在一些邏輯復(fù)雜、場景復(fù)雜的環(huán)境中,往往很難勝任。
2017年年末,我在和一些智能音箱交互工程師探討的時候,他們提到語音交互因為缺乏屏幕顯示,層級邏輯很難展開,點外賣不太現(xiàn)實。但當(dāng)語音理解力更強甚至能和人類對話的時候,層級邏輯自然可以展開,點外賣甚至更復(fù)雜的操作都能實現(xiàn)。
當(dāng)語音調(diào)用的信息本身是具備可視性、劃分層級而且直觀易懂甚至縮短大量信息環(huán)節(jié)的時候。它本質(zhì)上就是一個更為合理的交互方式。
“流式多級的截斷Attention模型”未來如果能夠進一步提高對語音的理解能力,輸入法或許能像人一樣聰明。未來的語音不會像Siri一樣愚蠢,只能被人們調(diào)戲,隨便幾句話就會陷入邏輯矛盾,就是因為云端可以理解的語音的顆粒度足夠細(xì),速度也足夠快。
在未來,智能語音甚至可以理解人們每一句話、每一個情緒的意義,讓兩人產(chǎn)生真正意義上的“靈魂對話”。
三、工具的轉(zhuǎn)型
整個行業(yè)都正在從移動時代向AI時代過渡,移動時代產(chǎn)品未來破局真的全靠AI。
甚至已經(jīng)有人提到,AI時代的人機交互應(yīng)該忘掉機器,因為萬物皆界面。是的,AI賦能下的人機交互,將極大弱化人機交互中機器的概念。
你所接觸的一切物體都可能是一個隱藏的交互界面,你的動作狀態(tài)、情緒以及環(huán)境中發(fā)生的事件,以伴隨的各種變化屬性為橋梁,時時刻刻都在被分析被推理,最終的結(jié)果將反映到真實的物理環(huán)境中,從而更自然地輔助你的日常生活。
在這一過程中,我們之前無比依賴的手機和電腦,可能已經(jīng)退居二線,成為真正的計算工具,不再和我們直接互動了。
企業(yè)從移動向AI時代轉(zhuǎn)型過程中,在產(chǎn)品層面要想的問題大約就是三點:
1、如何把AI融入到移動時代的產(chǎn)品之中,和現(xiàn)有功能產(chǎn)生更自然的嵌入;
2、如何形成AI時代的人機交互,讓移動時代的產(chǎn)品在AI交互中形成合理的架構(gòu);
3、如何把移動時代的產(chǎn)品放置在AI的技術(shù)生態(tài)中,繼續(xù)發(fā)揮作用;
我們甚至可以大膽預(yù)測,未來所有的工具型產(chǎn)品,都離不開智能語音輸入法,因為以語音為核心的輸入法,就是重構(gòu)人機交互的最有效手段。因此百度高級副總裁王海峰提到:
作為百度AI能力應(yīng)用落地的重要產(chǎn)品之一,百度輸入法正在通過創(chuàng)新拓展大家的想象力邊界。這款A(yù)I輸入法,不僅是一款滿足用戶當(dāng)下需求的產(chǎn)品,也是為正在到來的AI時代所準(zhǔn)備的。百度輸入法將扮演好溝通橋梁的重要角色,讓人機交互進入一個全新的階段。
語音交互方式,甚至比鍵鼠、觸摸屏有更大的信息量。劉慈欣在《鄉(xiāng)村教師》的這段話很形象地點名了未來語音交互的信息量:
你是想告訴我們,一種沒有記憶遺傳,相互間用聲波進行信息交流,并且是以令人難以置信的每秒1至10比特的速率進行交流的物種,能創(chuàng)造出5B級文明?!而且這種文明是在沒有任何外部高級文明培植的情況下自行進化的?!
我們甚至可以這樣預(yù)測,走過了鍵盤、鼠標(biāo)、觸摸屏等一系列交互手段,在這100年的彎路之后,智能語音為代表的對話式人工智能將讓人類返璞歸真。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 一文看懂視覺語言動作模型(VLA)及其應(yīng)用
- 5 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 6 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 10 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單