意料之外的AI硬件巨頭
文:詩與星空(ID: SingingUnderStars)
很多年前,曾經(jīng)很流行一種網(wǎng)絡(luò)游戲,叫MUD(也叫玩泥巴,現(xiàn)在依然有很多MUD服務(wù)器,但玩家大多是上古遺留人士)。
這種游戲沒有圖形界面,人機交互靠的是文本,早期還都是英文,后來支持漢字。
比如,到了一個地方,輸入look,系統(tǒng)會告訴你,這是哪里,有什么,然后嗖對方一箭射過來,你就昏迷了過去。
最近一直高強度使用ChatGPT、Claude、文心一言等生成式通用人工智能,突然想到一件事:如果把這些AI工具,接入硬件設(shè)備會怎樣?
還真有人在這么干,一個是微軟,一個是谷歌。
01
微軟畫得大餅
2月20日,微軟發(fā)布了"ChatGPT for Robotics"的技術(shù)報告,為如何將ChatGPT 融入機器人領(lǐng)域提供了一種可能的視角。
與純文本的應(yīng)用不同,機器人系統(tǒng)需要對現(xiàn)實世界的物理、環(huán)境背景和物理動作的執(zhí)行能力有深入的了解。
而且所生成機器人模型需要具備相當?shù)某WR性知識和符合實際的物理模型,以及與用戶交互以解釋和執(zhí)行實際現(xiàn)實中可行的命令。
從報告來看,非常像玩MUD。
1.首先需要手工設(shè)計一系列的機器人功能庫函數(shù)來實現(xiàn)底層執(zhí)行器的命令,如,移動,停止,獲得目標的位置信息等等。
2.第二步是給ChatGPT 寫一個提示詞,用來描述需要讓ChatGPT 執(zhí)行的目標。
3.第三步是使用者評估ChatGPT 生成的代碼,并且給ChatGPT 提供反饋,讓ChatGPT 進行下一步改進。
4.通過提供反饋,將代碼進行不斷迭代改進,當測試通過之后,就可以部署到實際的系統(tǒng)中了。
經(jīng)過對ChatGPT特定訓(xùn)練后(其實是一種lora),形成穩(wěn)定的版本,ChatGPT在理解了“自然語言”后,把指令分解通知機器人,然后調(diào)取其傳感器,根據(jù)反饋結(jié)果進行下一步處理。
在ChatGPT出現(xiàn)之前,人和機器人(其他設(shè)備類似)交互是一種非常專業(yè)的事情,一般由設(shè)備廠件提供標準的交互軟件,如果可以定制,再給一個可以調(diào)用的SDK,所有操作幾乎都是提前寫死的,幾乎做不到全自動的運動。
像大疆能夠做到自主反饋,已經(jīng)是機械設(shè)備領(lǐng)域的巔峰了。
AI改變了這一切。
02
谷歌做的樣機
3月10日左右,谷歌發(fā)布了一段視頻,基于一個名叫PaLM-E的大模型。
通過這個大模型的驅(qū)動,機器人可以按照人類的指令去拿零食、拿可樂。
如果說微軟的技術(shù)報告還在PPT階段的話,谷歌已經(jīng)實現(xiàn)了工程樣機。
現(xiàn)在回過頭來再思考當年谷歌為什么收購波士頓動力,似乎恍然大悟。
可惜的是,在大模型方面谷歌沒能第一時間領(lǐng)先,波士頓動力也因成本過高出手。
比如給它一張圖片,然后讓它根據(jù)所看到的做出蛋糕。
模型能先判斷出圖像中都有什么,然后分成9步講了該如何制作蛋糕,從最初的磕雞蛋到最后洗碗都包括在內(nèi)。
03
大模型從NLP到CV
ChatGPT也好,文心一言也好,現(xiàn)在大模型的應(yīng)用主要用在NLP(自然語言處理)領(lǐng)域,實際應(yīng)用以交互對話為主。
而機器人的領(lǐng)域,是CV(機器視覺),這個領(lǐng)域的人工智能最領(lǐng)先的國家是誰?
中國。
2022 年,CVPR 大會的投稿量達到 8161 份,相比 2021 年度的 7093 份提交增長了 15%。其中 44.59% 的作者來自中國,排在第二名的是美國,占據(jù) 20.65%。
同濟研二在讀,達摩院研究型實習(xí)生獲得了最佳學(xué)生論文獎。
同濟、清華、阿里達摩院等學(xué)術(shù)機構(gòu)大獎拿到手軟,很多國內(nèi)企業(yè)也大放異彩,比如商湯有 66 篇論文入選,還拿到了 CVPR 2021 ActivityNet 時序動作檢測任務(wù)弱監(jiān)督學(xué)習(xí)賽道冠軍以及 CVPR 2021 NTIRE 視頻理解挑戰(zhàn)賽的三項冠軍;快手也有 14 篇論文被接收,涵蓋三維視覺、目標檢測、視頻目標分割、人臉偽造技術(shù)檢測等熱門研究領(lǐng)域
換言之,ChatGPT嘴皮子功夫再厲害,最終還是要喂給機器,這才是真正的生產(chǎn)力。
到了這個環(huán)節(jié),就是中國人的天下了。所以完全不用擔心AI領(lǐng)域中國會落后。
軟件的本質(zhì)是算法,算法的本質(zhì)是數(shù)學(xué)。
數(shù)學(xué)?嘿嘿嘿。中國人的數(shù)學(xué)已經(jīng)卷出地球了。
04
工業(yè)機器人,你知道我說的誰了嗎?
也就是說,高科技軟件的實質(zhì),要回到物理層面:機器、設(shè)備。
AI將要在一個領(lǐng)域掀起一場革命,那就是工業(yè)機器人。
中國最大的機器人上市公司是誰?
美的,因為它在2016年并購了庫卡集團,庫卡作為世界四大機器人巨頭之一,年銷售額已經(jīng)接近300億(2022年299億)。
2月,美的集團宣布成為百度文心一言(英文名:ERNIE Bot)首批生態(tài)合作伙伴,攜手百度推進智能家居領(lǐng)域人機對話能力的進一步升級,通過前沿的生成式AI技術(shù),用戶有望實現(xiàn)智能家居場景下自然流利的對話。
美的集團AI創(chuàng)新中心算法負責人介紹,接入百度文心一言能力后,美的智能家居、美的家庭服務(wù)機器人將可以優(yōu)先內(nèi)測和試用文心一言的諸多能力,這將明顯提升現(xiàn)有產(chǎn)品和服務(wù)的智能化水平。
整個流程,一下子打開了,豁然開朗。
一個人和機器和諧共存的未來,是不是很值得期待?
原文標題 : 意料之外的AI硬件巨頭

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 一文看懂視覺語言動作模型(VLA)及其應(yīng)用