Facebook研究機器人,是打的什么算盤?
這對Facebook有什么用呢?
Facebook在計算機視覺方面一直走在前列,正如我們在它的相機和圖像處理程序以及Portal等設備上看到的那樣,Potal會用它的“臉”跟著用戶在房間里轉來轉去。
雖然聽上去有些驚悚,但是好奇心對于這些需要了解他們所看到或感覺到的環(huán)境才能正常工作的應用程序來說都是至關重要的。
任何在應用程序或設備上運行的攝像頭,比如Facebook上的攝像頭,都在不斷地分析它所看到的圖像,以獲取有用的信息。
當一張臉進入畫面時,十幾個新的算法就會同時啟動并開始工作。如果有人舉起一個物體,攝像頭就會忙著分析:它有文字內容嗎?需要翻譯嗎?有二維碼嗎?背景有多遠?
如果設備要及時完成這些任務,就會產生CPU使用率峰值、可見延遲以及用戶或系統(tǒng)工程師不希望出現(xiàn)的種種情況。
相反,如果人工智能助理在對場景感到不確定性時,發(fā)揮它的好奇心去檢查這些東西,確定分析物體的優(yōu)先級,是個相當不錯的折衷辦法。
通過觸摸感知
盡管視覺很重要,但它不是我們或機器人感知世界的唯一方式。許多機器人都配備了運動、聲音和其他形式的傳感器,但對物體的實際接觸相對較少。我們可以把它歸因于缺乏良好的觸覺接口。
盡管如此,F(xiàn)acebook的研究人員還是想研究使用觸覺數(shù)據(jù)代替視覺數(shù)據(jù)的可能性。
仔細想想,這完全是正常的,就像有視覺障礙的人用觸覺來了解周圍的環(huán)境,獲取關于物體的細節(jié)。
因此,F(xiàn)acebook的研究人員部署了一個人工智能模型,機器人根據(jù)視頻來決定采取什么行動,但不是實際的視頻數(shù)據(jù),而是給它輸入高分辨率的觸摸數(shù)據(jù)。
結果表明,該算法并不真正關心它是否像我們平時觀察世界的圖像,只要數(shù)據(jù)是以視覺方式呈現(xiàn)的,例如作為觸覺傳感器上的壓力圖,它就可以像圖像一樣分析該模式。
這對Facebook有什么用呢?
雖然Facebook對用戶接觸并沒有多大興趣。但這不僅僅是接觸的問題,而是跨模式應用學習。
試想你第一次看到兩個不同的物體,閉上眼睛,單靠觸摸就可以很容易地分辨出來。為什么會這樣?
因為當你看到某個東西時,你不只是觀察到它的樣子,還構想了一個內部模型來表示它,包含了多種感官和視角。
類似地,人工智能助理可能需要將其學習的內容從一個領域轉移到另一個領域,比如說聽覺數(shù)據(jù)告訴握力傳感器如何握緊物體,或者視覺數(shù)據(jù)告訴麥克風如何分離聲音。
現(xiàn)實世界是一個復雜的環(huán)境,這里的數(shù)據(jù)更嘈雜,信息量更大。無論數(shù)據(jù)類型如何,都能夠利用這些數(shù)據(jù)對于可靠理解和與現(xiàn)實交互非常重要。
所以你會發(fā)現(xiàn),這些研究本有趣,而且事實上也很重要。正如描述這項研究的博客文章所言:“我們專注于使用機器人技術,這不僅會生產出更有能力的機器人,還將在未來數(shù)年或者數(shù)十年內挑戰(zhàn)人工智能的極限。如果我們想要更接近像人類那樣思考、計劃和推理的機器,那么我們需要構建人工智能系統(tǒng),使其能夠在多種場景中自主學習,不僅僅是在虛擬的數(shù)字世界。”
隨著各大網絡社交媒體不斷擴大其影響力,其應用程序和服務的的范圍涉及日常生活的方方面面,它對人工智能助力的要求也就越來越復雜。
雖然我們不會很快看到一個“Facebook機器人”,但未來可期。

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權
- 3 深度報告|中國AI產業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產元年誰在領跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 為何全球AI巨頭都在搶?MCP協(xié)議背后的暴富玄機大公開!