ICRA2019旗艦會議來襲 | 通過視覺信號預(yù)測駕駛員意圖
比較FC-LSTM、ConvLSTM、cn-clstm以及文章提出的方法,上述指標(biāo)如表1所示。FC-LSTM性能最弱;這可以解釋為全連通層在提取空間特征時效率低下,只有通過網(wǎng)絡(luò)的大容量來平衡,這使得它可以學(xué)習(xí)更復(fù)雜的功能。ConvLSTM通過利用門的卷積實現(xiàn)了稍好一點的效果,這使得它更適合于空間特征提取。然而,它的內(nèi)存效率低下阻止了使用更深層次的架構(gòu),因此限制了模型的容量。結(jié)合這兩種方法,得到了一個CNNLSTM,它既能利用CNNs豐富的空間特征提取,又能利用LSTMs的時間特征表示,取得了比之前基線更好的效果。我們提出的方法在LSTM和注意機制中進一步增加了卷積,得到了最好的結(jié)果。
混淆矩陣如表2所示。注意,OFF的檢測精度明顯較高,而FLASHERS的檢測精度較低,因為這兩個類在數(shù)據(jù)集中分別表示過多和過少,即使使用分層抽樣方案,圖4d(a)這種不平衡自然會影響測試性能。
網(wǎng)絡(luò)故障模式。(a)夜間明亮的燈光被錯誤地歸類為左轉(zhuǎn)。(b)遠(yuǎn)處車輛右側(cè)的明亮反光被誤列為右轉(zhuǎn)彎。(c)一輛不常見的車輛識別結(jié)果為沒有發(fā)出右轉(zhuǎn)信號。(d)姿態(tài)解碼錯誤,輸出翻轉(zhuǎn)。(e)在載有單車的車輛上作假性左轉(zhuǎn)。
結(jié)論
在自動駕駛領(lǐng)域,檢測駕駛員的意圖是一項必不可少的任務(wù),是預(yù)測諸如變道和停車等突發(fā)事件的必要手段。在本文中,研究人員解決了轉(zhuǎn)彎信號分類這一重要而尚未探索的問題。提出了一種能夠端到端的訓(xùn)練方法,能夠處理車輛的不同視點。提出的神經(jīng)網(wǎng)絡(luò)通過意圖、卷積和遞歸來推斷空間和時間特征,從而在幀級對一系列觀測信號的轉(zhuǎn)彎信號狀態(tài)進行分類。該實驗使用包含120多萬張實況圖像的數(shù)據(jù)集來訓(xùn)練和評估的方法。未來在這個問題上,研究領(lǐng)域?qū)䲠U展到緊急車輛信號,以及更多分類的功能(例如來自曝光不足的相機的圖像)的識別問題上。
參考:
[1] Frossard D, Kee E, Urtasun R.DeepSignals: Predicting Intent of Drivers Through Visual Signals[J]. arXivpreprint arXiv:1905.01333, 2019.
[2] icra2019.org

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
-
10 中東AI迷霧里的中美棋局
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 一文看懂視覺語言動作模型(VLA)及其應(yīng)用
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 2025,邊緣AI芯片架構(gòu)之王?