目標(biāo)檢測二十年間那些事兒:加速與優(yōu)化
在上一章中我們簡短回顧了目標(biāo)檢測在過去的二十年中如何從傳統(tǒng)滑窗算法到基于深度神經(jīng)網(wǎng)絡(luò)的全新領(lǐng)域,點擊回顧。這次,我們來分享一些近年涌現(xiàn)的各類優(yōu)化技術(shù),正是這些技術(shù)讓目標(biāo)檢測一再提速,從而能在工程上應(yīng)用到各類設(shè)備中。
好快!比高鐵加速還快!
目標(biāo)檢測的加速技術(shù)
目標(biāo)檢測速度的提升一直是一個重要而又具有挑戰(zhàn)性的問題。在過去的20年里,目標(biāo)檢測領(lǐng)域已經(jīng)發(fā)展了許多復(fù)雜的加速技術(shù)。接下來我們簡要介紹“輕量化網(wǎng)絡(luò)設(shè)計”、“數(shù)值加速”、“特征檢測優(yōu)化”、“語義分割”等重要優(yōu)化方法。
輕量網(wǎng)絡(luò)設(shè)計
基于 CNN 檢測器的輕量化方法是直接設(shè)計一個輕量級的網(wǎng)絡(luò),而不是使用現(xiàn)成的檢測引擎。研究人員長期以來一直在探索網(wǎng)絡(luò)的正確配置,以便在有限的時間成本下獲得準(zhǔn)確性。一個通用的設(shè)計原則是“更少的通道,更多的層(fewer channels and more layers)”[1]。
此外,近年來也有一些新的技術(shù),見下圖:
分解卷積
群卷積
深度可分離卷積
瓶頸設(shè)計
神經(jīng)結(jié)構(gòu)搜索
分解卷積
分解卷積是構(gòu)建輕量級CNN模型最簡單、最直接的方法,有兩類分解方法。
第一類方法是將一個大的卷積濾波器分解成一組空間維數(shù)較小的卷積濾波器[2],如上圖(b)所示。例如,可以將一個7x7過濾器分解為三個3x3過濾器,它們共享相同的接收域,但是后者效率更高。另一個例子是將 k×k 濾波器分解為k×1濾波器和1×k濾波器,這對于非常大的濾波器來說可能更有效,比如15x15。該思想最近被用于目標(biāo)檢測。
第二類方法是將一大組卷積分解為信道維數(shù)較小的兩組[3],如上圖(c)所示。例如,可以用 d個濾波器近似卷積層,用d'個濾波器 + 一個非線性激活 + 另外d個濾波器 (d'<d)近似有c個通道的特征圖。在這種情況下,原始層的復(fù)雜度
可以降低到
。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 一文看懂視覺語言動作模型(VLA)及其應(yīng)用
- 6 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 10 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單