LaserNet:一種高效自動(dòng)駕駛概率三維目標(biāo)探測器
本文介紹了一種基于激光雷達(dá)數(shù)據(jù)的激光網(wǎng)絡(luò)自動(dòng)駕駛三維目標(biāo)檢測方法——LaserNet。高效的處理結(jié)果來自于在傳感器的自然距離視圖中處理激光雷達(dá)數(shù)據(jù)。在激光雷達(dá)視場范圍內(nèi)的操作有許多挑戰(zhàn),不僅包括遮擋和尺度變化,還有基于傳感器如何捕獲數(shù)據(jù)來提供全流程信息。
本文介紹的方法是使用一個(gè)全卷積網(wǎng)絡(luò)來預(yù)測每個(gè)點(diǎn)在三維物體上的多模態(tài)分布,然后有效地融合這些多模態(tài)分布來生成對(duì)每個(gè)對(duì)象的預(yù)測。實(shí)驗(yàn)表明,把每個(gè)檢測建模看作一個(gè)分布,能獲得更好的整體檢測性能。基準(zhǔn)測試結(jié)果表明,相比其他的檢測方法,本方法的運(yùn)行時(shí)間更少;在訓(xùn)練大量數(shù)據(jù)來克服視場范圍目標(biāo)檢測問題上,本方法獲得最佳性能。
LaserNet通過以下幾個(gè)步驟實(shí)現(xiàn)三維檢測:
使用傳感器的固有范圍視場來構(gòu)建一個(gè)密集的輸入圖像;
圖像通過全卷積網(wǎng)絡(luò)生成一組預(yù)測;
對(duì)于圖像中的每個(gè)激光雷達(dá)點(diǎn),預(yù)測一個(gè)類概率,并在俯視圖中對(duì)邊界框架進(jìn)行概率分布回歸;
每個(gè)激光雷達(dá)點(diǎn)分布通過均值漂移聚類進(jìn)行組合,以降低單個(gè)預(yù)測中的噪聲;
檢測器進(jìn)行端到端訓(xùn)練,在邊界框架上定義損失;
用一種新的自適應(yīng)非最大抑制(NMS)算法來消除重疊的邊框分布。
上圖為深層聚合網(wǎng)絡(luò)架構(gòu)。列表示不同的分辨率級(jí)別,行表示聚合階段。
上圖為特征提取模塊(左)和特征聚合模塊(右)。虛線表示對(duì)特征圖進(jìn)行了卷積。
上圖為自適應(yīng)NMS。在兩輛車并排放置的情況下,左邊的虛線描述了產(chǎn)生的一組可能的預(yù)測。為了確定邊界框是否封裝了唯一的對(duì)象,使用預(yù)測的方差(如中間所示)來估計(jì)最壞情況下的重疊(如右圖所示)。在本例中,由于實(shí)際重疊小于估計(jì)的最壞情況重疊,因此將保留這兩個(gè)邊界框。
上圖為在訓(xùn)練集和驗(yàn)證集上的邊界框上的預(yù)測分布的校準(zhǔn)的圖。結(jié)果表明,該模型不能學(xué)習(xí)KITTI上的概率分布,而能夠?qū)W習(xí)較大的ATG4D上的分布。
【實(shí)驗(yàn)結(jié)果】
上表顯示了與其他最先進(jìn)的方法相比,LaserNet在驗(yàn)證集上的結(jié)果。像KITTI基準(zhǔn)一樣,我們計(jì)算了汽車0.7 IoU和自行車及行人0:5 IoU的平均精度(AP)。在這個(gè)數(shù)據(jù)集上,LaserNet在0-70米范圍內(nèi)表現(xiàn)優(yōu)于現(xiàn)有的最先進(jìn)的方法。此外,LaserNet在所有距離上都優(yōu)于LiDAR-only方法,只有在附加圖像數(shù)據(jù)提供最大價(jià)值的長距離上,車輛和自行車上的LiDAR-RGB方法優(yōu)于LaserNet。
對(duì)ATG4D數(shù)據(jù)集進(jìn)行消融研究,結(jié)果如上表所示。
預(yù)測概率分布。預(yù)測概率分布最大的改進(jìn)是預(yù)測邊界框架的分布。當(dāng)僅預(yù)測平均邊界框時(shí),公式(6)為簡單平均,公式(9)為框角損失。此外,邊界框的得分在本例中是類概率。實(shí)驗(yàn)結(jié)果表明,性能上的損失是由于概率與邊界框架的準(zhǔn)確性沒有很好地相關(guān)性導(dǎo)致的。
圖像形成:Velodyne 64E激光雷達(dá)中的激光器并不是均勻間隔的。通過使用激光id將點(diǎn)映射到行,并在傳感器捕獲數(shù)據(jù)時(shí)直接處理數(shù)據(jù),可以獲得性能上的提高。
均值漂移聚類:每個(gè)點(diǎn)獨(dú)立地預(yù)測邊界框的分布,通過均值漂移聚類將獨(dú)立的預(yù)測組合起來實(shí)現(xiàn)降噪。
非極大值抑制:當(dāng)激光雷達(dá)的點(diǎn)稀疏時(shí),有多個(gè)邊界框的配置可以解釋觀測到的數(shù)據(jù)。通過預(yù)測各點(diǎn)的多模態(tài)分布,進(jìn)一步提高了該方法的查全率。在生成多模態(tài)分布時(shí),使用具有嚴(yán)格閾值的NMS是不合適的;蛘,我們可以使用軟NMS來重新評(píng)估置信度,但是這打破了對(duì)置信度的概率解釋。通過自適應(yīng)NMS算法,保持了概率解釋,并獲得了更好的性能。
對(duì)于自動(dòng)駕駛而言,運(yùn)行時(shí)性能同樣重要。上表比較了LaserNet(在NVIDIA 1080Ti GPU上測量)和KITTI上現(xiàn)有方法的運(yùn)行時(shí)的性能。Forward Pass是指運(yùn)行網(wǎng)絡(luò)所花費(fèi)的時(shí)間,除Forward Pass外,總時(shí)間還包括預(yù)處理和后處理。由于在一個(gè)小的密集的范圍視場內(nèi)處理,LaserNet比目前最先進(jìn)的方法快兩倍。
使用訓(xùn)練集中的5,985個(gè)掃描點(diǎn)訓(xùn)練網(wǎng)絡(luò),并保留其余的掃描以進(jìn)行驗(yàn)證。使用與之前相同的學(xué)習(xí)時(shí)間表對(duì)網(wǎng)絡(luò)進(jìn)行5萬次迭代訓(xùn)練,并在單個(gè)GPU上使用12個(gè)批處理。為了避免在這個(gè)小的訓(xùn)練集上過度擬合,采用數(shù)據(jù)增強(qiáng)手段隨機(jī)翻轉(zhuǎn)范圍圖像,并在水平維度上隨機(jī)像素移動(dòng)。在這樣一個(gè)小的數(shù)據(jù)集中,學(xué)習(xí)邊界框上的概率分布,特別是多模態(tài)分布是非常困難的。因此,訓(xùn)練網(wǎng)絡(luò)只檢測車輛并預(yù)測邊界框上的單峰概率分布。如上表所示,我們的方法在這個(gè)小數(shù)據(jù)集上的性能比當(dāng)前最先進(jìn)的鳥瞰圖檢測器差。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
圖片新聞
技術(shù)文庫
最新活動(dòng)更多
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 【在線研討會(huì)】普源精電--激光原理應(yīng)用與測試解決方案
-
精彩回顧立即查看>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
精彩回顧立即查看>> 【線上直播】新能源汽車熱管理行業(yè)應(yīng)用新進(jìn)展
-
精彩回顧立即查看>> 【線上直播】西門子電池行業(yè)研討會(huì)-P4B如何加速電池開發(fā)
-
精彩回顧立即查看>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
- 1 行業(yè)競爭加劇,汽車芯片卷向高算力?
- 2 中國第一輛無人駕駛汽車:從實(shí)驗(yàn)室到萬里長江的狂飆三十年
- 3 當(dāng)凱迪拉克只要15萬元,為什么還是沒人買豪華品牌
- 4 智能座艙:一塊屏幕的進(jìn)化史
- 5 重倉特斯拉的木頭姐,忽視了一個(gè)重磅玩家
- 6 比亞迪想當(dāng)兩輪電動(dòng)車“賣鏟人”
- 7 自動(dòng)駕駛科普十問:什么是自動(dòng)駕駛?將給我們帶來哪些影響?
- 8 百度盯上新“蛋糕”,蘿卜快跑要在歐洲快跑
- 9 無人快遞配送車的前景:快遞4月破500億件,無人車如何撕開萬億市場的口子?
- 10 固態(tài)激光雷達(dá)會(huì)是組合輔助駕駛的新寵嗎?