相較于特斯拉的自動駕駛技術,Waymo在訓練數據上處于明顯劣勢?
還有其它的表態(tài):
“每一次有人干預駕駛,即接管了自動駕駛系統(tǒng)之后,我們的自動駕駛系統(tǒng)便會保存這些信息并將其上傳到我們的系統(tǒng)里。我們真的開始變得非常擅長訓練系統(tǒng),甚至不需要人為輸入訓練數據、標記人工標簽了;旧,當一個駕駛員駛過一個交叉路口時,他就會訓練自動駕駛系統(tǒng)應該怎么做。”
當然你可以認為馬斯克的表態(tài)含糊不清,有多種可能的解釋。但是對于我來說,我認為模仿學習和馬斯克所說的東西最為吻合。
要進行模仿學習,特斯拉不需要上傳視頻等任何原始傳感器數據,它直接上傳感知型神經網絡對其所看到的場景和駕駛員行為的判斷。特斯拉一位名叫greentheonly的黑客可視化地展現了在特斯拉上運行的神經網絡所做出的這種感知判斷:
首先,表示“駕駛場景”的可視化信息包括車輛周圍的3D形式邊界、表示車輛類型和距離的文本標簽以及顯示可行車道的“綠色地毯”。
要進行模仿學習,需要將人類駕駛員對方向盤和踏板的動作數據和可視化的“駕駛場景”信息進行配對。這些狀態(tài)-動作配對不需要人類的注釋,人類進行標記實在是過于昂貴而且緩慢的學習過程。他們只需要上傳到特斯拉的服務器,然后就可以用來訓練神經網絡了。
除了Waymo對模仿學習技術的背書和特斯拉含混其詞的表述,我們還有什么理由相信模仿學習可以訓練神經網絡來執(zhí)行復雜的任務呢?對于我來說,成功實施了模仿學習的最典型案例是AlphaStar,這是由Alphabet的子公司DeepMind創(chuàng)建的一個神經網絡。DeepMind使用模仿學習來訓練AlphaStar玩一個有數百萬人類玩家的星際爭霸游戲。星際爭霸是一款相當復雜的游戲,里面設計長遠規(guī)劃、高級戰(zhàn)略部署和對軍事單位的實施戰(zhàn)術控制,這樣一個燒腦的游戲對于AI來說是一個相當艱難的挑戰(zhàn)。但是,AlphaStar僅使用了模仿學習技術,就通過在星際爭霸這個游戲的排名證明了相當于人類玩家的實力,達到了DeepMind估計的性能指標。換句話說,AlphaStar使用模仿學習技術,在星際爭霸中達到了中等人類技能水準。
和DeepMind使用模仿學習訓練其神經網絡玩星際爭霸游戲一樣,在自主駕駛的訓練中,特斯拉利用其車輛自主駕駛系統(tǒng)上傳的數百萬駕駛場景-駕駛行為配對數據訓練神經網絡,就可以達到中等水平人類駕駛員的水準。駕駛行為當然很復雜,但是星際爭霸游戲也很復雜。所以我不認為使用模仿學習達到的自主駕駛效果達不到AlphaStar玩星際爭霸的程度。
要想使模仿學習奏效,一個非常重要的條件就是感知必須正確。如果特斯拉的感知神經網絡出了錯,系統(tǒng)將無法識別駕駛環(huán)境的真實狀態(tài),也就無法獲得正確的駕駛場景-駕駛行為配對。舉個例子,如果感知神經網絡將紅色交通信號燈錯認成了綠色,它觀察人類停在了這樣一個信號燈前面,它就會得出一個汽車應該停在綠色交通燈處的錯誤結論。即使它學會了如何對一個環(huán)境進行正確反應,它也需要檢測出這些環(huán)境。因此,如果它知道紅燈停綠燈行,它還必須準確地識別出信號燈的顏色才能做出正確的響應。系統(tǒng)需要準確地感知環(huán)境以便學習要做什么動作,而且必須準確地感知環(huán)境才能應用學習成果做出這些動作。
特斯拉新的神經網絡計算機可以解決環(huán)境感知問題,被稱為Hardware 3。特斯拉人工智能主管Andrej Karpathy說,特斯拉已經“訓練了效果很好的大型神經網絡”,但是“由于計算性能的約束無法把它們部署到汽車中”,F在有了Hardware 3,特斯拉將能夠運行規(guī)模更大、更為準確的感知神經網絡。
對于Waymo這樣無法獲得大量行駛車輛數據的公司而言,很難在模擬學習上找到可以走下去的路來。由于沒有足夠的訓練樣例來完成整個駕駛任務的模仿學習,它不得不依賴手工編碼算法。在計算機視覺應用中,手工編碼算法這種方式早已被神經網絡完全淘汰,機器翻譯應用也是如此。對于像星際爭霸這樣復雜級別的游戲而言,手工編碼的機器人不可能接近AlphaStar這樣的神經網絡的性能。在自主駕駛上,神經網絡方法似乎也比手工編碼算法更有前途。
想推進模仿學習,Waymo必須將其訓練車隊的數量擴大好幾個數量級。一個可行的方法是,Waymo可以向汽車制造商出售高級駕駛輔助系統(tǒng),并通過它來收集數據,就像特斯拉現在的做法一樣。這就要求Waymo打造一個比自主駕駛的功能涵蓋范圍更小的精簡型新產品。這個新系統(tǒng)必須在沒有激光雷達的情況下能夠使用,或者至少不需要那種通常用于自主駕駛汽車的高范圍、高分辨率的激光雷達。因為這種激光雷達成本過高,不可能普及到消費級的車輛中。如果這種方式意味著Waymo可以獲取到所有的駕駛數據的話,汽車制造商可能不大愿意這么做。所以,Waymo可能需要以某種方式和汽車制造商分享成果,也許它可以同意汽車制造商合作伙伴分享未來的自主駕駛服務的收入,或者允許合作伙伴購買它的大量股權。
對于福特和通用這樣的巨頭來說,他們傾向于垂直整合,不大可能建立這種合作關系。我可以花10億美元小錢購買自己的“Waymo”,干嘛和谷歌的Waymo合作呢?從經濟學原理上來說,可以購買自主駕駛初創(chuàng)公司,這會讓Waymo處于艱難的談判地位。而且,這些汽車制造商似乎并沒有他們的汽車收集訓練數據。
兩相比較下來,特斯拉完全占了上風。出于這個原因,我認為特斯拉更有可能分走現在市場上分配給Waymo的1000多億美元估值。也許完全自主駕駛永遠不可能實現,那就不用說了。但是如果真的實現了,這個市場可能價值三萬億美金。據我所知,在這個賽道上,特斯拉比Waymo以及所有其他公司都處于更有利的位置上,特斯拉可以憑借在模仿學習上的優(yōu)勢分走很大很大一塊蛋糕。

請輸入評論內容...
請輸入評論/評論長度6~500個字