CVPR2020 | 基于點的3D單階段對象檢測器3DSSD
論文模型
融合采樣
3D 目標檢測有基于點和基于體素兩種框架,前者更加耗時,由候選生成與預測細化兩個階段組成。
在第一個階段,SA 用于降采樣以獲得更高的效率以及擴大感受野,F(xiàn)P 用來為降采樣過程中丟掉的點傳播特征。在第二階段,一個優(yōu)化模塊最優(yōu)化 RPN 的結(jié)果以獲得更準確的預測。SA 對于提取點的特征是必需的。但 FP 和優(yōu)化模塊會限制效率。
首先最容易想到的是直接用 SA 的采樣點進行預測,但如果用 D-FPS 的采樣方法會使得采樣點中有很多背景點,這是由于 D-FPS 是在歐式空間中進行最遠點采樣,并不會考慮到該點的任何屬性特征,從而極大的降低預測效果。
因此本文引入了 F-FPS,以達到保留更多前景點信息的目的,同時為了防止保留很多同一個目標的點導致精度下降,作者將 F-FPS 與 D-FPS 相結(jié)合,同時考慮歐式空間和特征空間的采樣信息,通過 F-FPS 和 D-FPS 各選擇一半的點的方法以保證分類的效果。
邊框預測網(wǎng)絡
已有的工作是在得到每個點的特征后接三層 SA 分別用于中心點選擇、周圍點特征的提取以及生成語義信息。本文為進一步降低計算成本,候選中心點的生成是直接在 F-FPS 采樣后進行的。F-FPS 采樣的點由于比 D-FPS 的點更加可能是前景點,所以候選點僅僅只是在 F-FPS 的點上生成。接著作者將這些候選中心點當作候選生成層的中心點。最后根據(jù)候選中心點領域選擇從 F-FPS 和 D-FPS 中采樣得到的代表點進行局部特征提取,采用 MLP 進行特征提取。
在 3D 目標檢測中,需要在場景中每隔一段距離就設置一個錨,這些錨有幾個不同的朝向,所以每增加一個類別需要線性的增加錨,為了降低計算量,本文的回歸頭是無錨的。由于沒有每個點的先驗方位,在方位角回歸中采用分類和回歸公式的混合表達式。
在訓練過程中,需要一種分配策略來為每個候選點打標簽。在 2D 但階段檢測中,IoU 閾值或 mask 可以用于標簽分配。在 3DLIDAR 數(shù)據(jù)上,由于點云數(shù)據(jù)都在物體的表面,因此他們的中心性非常接近的,這會導致不太可能從這些點得到好的預測。因此之前生成候選點的時候要選取采樣后再朝中心靠近的點而不是直接用原始采樣點。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領跑?
- 9 一文看懂視覺語言動作模型(VLA)及其應用
- 10 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單