使用Python進(jìn)行SOTA:用于多目標(biāo)跟蹤的一鍵式跟蹤器
介紹
多目標(biāo)跟蹤是計(jì)算機(jī)視覺(jué)中的一個(gè)重要問(wèn)題,近年來(lái)一直受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。
MOT的目標(biāo)是在視頻序列中預(yù)測(cè)多個(gè)感興趣對(duì)象的單個(gè)軌跡。它有益于自動(dòng)駕駛、人機(jī)交互到智能視頻等重大應(yīng)用。
通過(guò)檢測(cè)范式進(jìn)行跟蹤
在大多數(shù)現(xiàn)代多目標(biāo)跟蹤系統(tǒng)中,主要的策略是通過(guò)檢測(cè)范式進(jìn)行跟蹤。通過(guò)檢測(cè)范式進(jìn)行跟蹤將MOT分解為以下步驟:
用于目標(biāo)定位的目標(biāo)檢測(cè)器
建立外觀模型為檢測(cè)到的目標(biāo)提取ReID特征。
深入研究 Person-ReID
運(yùn)動(dòng)模型和數(shù)據(jù)關(guān)聯(lián),在其中分配檢測(cè)到的目標(biāo)并將其連接到現(xiàn)有軌跡。
它旨在尋找與時(shí)空相匹配并形成軌跡的檢測(cè)。理想情況下,每個(gè)單獨(dú)的軌跡都應(yīng)具有唯一的跟蹤ID。
小提示:檢測(cè)總是不完美,我們將在“挑戰(zhàn)”部分中介紹。多年來(lái),我們目睹了目標(biāo)檢測(cè)和再識(shí)別方面的驚人進(jìn)步,這是多目標(biāo)跟蹤的關(guān)鍵組成部分。但是,如何在單一網(wǎng)絡(luò)中同時(shí)完成這兩項(xiàng)任務(wù),目前還很少有人關(guān)注。在此博客中,我們將分解MOT系統(tǒng),并研究FairMOT,該系統(tǒng)在檢測(cè)和跟蹤方面具有很高的準(zhǔn)確性,在幾個(gè)公共數(shù)據(jù)集上,它的性能大大超過(guò)了之前的SOTAs。我們還將介紹以前的單次方法失敗的原因。
挑戰(zhàn)
當(dāng)我們分解MOT系統(tǒng)時(shí),我們可以把握每個(gè)步驟可能面臨的挑戰(zhàn)。由于遮擋,視角/姿勢(shì)/模糊/照明變化和背景混亂等因素,目標(biāo)檢測(cè)可能會(huì)失敗。序列中可能存在相同對(duì)象類型的多個(gè)實(shí)例,這使得外觀通常非常相似,并且很難進(jìn)行唯一匹配。因此,擁有正確的指標(biāo)來(lái)評(píng)估MOT框架并進(jìn)一步優(yōu)化它是非常重要的。方法多目標(biāo)跟蹤系統(tǒng)可以放在兩個(gè)括號(hào)中:在線跟蹤:在線跟蹤會(huì)逐幀處理跟蹤ID,而無(wú)法查看將來(lái)的幀。非常適合實(shí)時(shí)應(yīng)用程序和流數(shù)據(jù)。但是它很容易漂移,因?yàn)楹茈y從錯(cuò)誤或遮擋中恢復(fù)。脫機(jī)跟蹤:脫機(jī)跟蹤按順序處理一批幀。這有助于從遮擋中恢復(fù)以及對(duì)動(dòng)態(tài)世界的推理。它不適用于實(shí)時(shí)應(yīng)用,但不適用于視頻分析。例如,通過(guò)顧客在商店中的移動(dòng)和互動(dòng)來(lái)分析顧客的行為。MOT神經(jīng)求解器 (https://arxiv.org/abs/1912.07515) 是這種方法的一個(gè)很好的例子,它探索了圖神經(jīng)網(wǎng)絡(luò)。數(shù)據(jù)MOTChallenge(https://motchallenge.net/)社區(qū)創(chuàng)建了一個(gè)通用框架來(lái)測(cè)試多目標(biāo)跟蹤器。他們添加的公共數(shù)據(jù)集序列,具有挑戰(zhàn)性,具有多種特征,包括不同的幀頻,擁擠的場(chǎng)景,視角或光照,可以模仿現(xiàn)實(shí)生活的場(chǎng)景,并挑戰(zhàn)研究人員和從業(yè)者開(kāi)發(fā)一個(gè)通用跟蹤器來(lái)處理這些序列。
MOT16 / 17數(shù)據(jù)集——來(lái)源
PapersWithCode:)MOT:)正如你所看到的FairMOT在多個(gè)公共數(shù)據(jù)集上處于領(lǐng)先地位。我們將很快在博客中討論他們的方法。指標(biāo)許多單獨(dú)的指標(biāo)用于評(píng)估MOT的不同方面。研究團(tuán)體主要在兩個(gè)復(fù)合指標(biāo)上進(jìn)行了優(yōu)化,即多目標(biāo)跟蹤精度(MOTA)和識(shí)別F1分?jǐn)?shù)(IDF1)。初始指標(biāo)側(cè)重于目標(biāo)覆蓋范圍,跟蹤識(shí)別性能由后者衡量。多目標(biāo)跟蹤精度(MOTA) 在單一性能指標(biāo)下考慮三種誤差:
MOTA :其中t是視頻序列中的幀索引,而GT是真實(shí)目標(biāo)的數(shù)量。其中FN為假陰性,即系統(tǒng)未檢測(cè)到的真實(shí)目標(biāo)的數(shù)量。FP是誤報(bào),即系統(tǒng)錯(cuò)誤檢測(cè)但在真實(shí)目標(biāo)中不存在的數(shù)量。IDSW是識(shí)別轉(zhuǎn)換的數(shù)量,即給定軌跡從一個(gè)真實(shí)目標(biāo)變?yōu)榱硪粋(gè)目標(biāo)的次數(shù)。**多目標(biāo)跟蹤精度(MOTP)**是所有真實(shí)正值與其對(duì)應(yīng)的真實(shí)目標(biāo)之間的平均差異。對(duì)于邊界框重疊,其計(jì)算公式如下:
其中ct表示幀t和dt中的匹配數(shù)目,i是目標(biāo)i與幀t中指定的真實(shí)目標(biāo)的邊界框重疊。然后,將IDF1表示為正確識(shí)別的檢測(cè)數(shù)與平均真實(shí)目標(biāo)和計(jì)算的檢測(cè)數(shù)之比,并通過(guò)其諧波均值來(lái)平衡識(shí)別精度和召回率:
IDF1-來(lái)源高階跟蹤準(zhǔn)確性(HOTA)是去年末(2020)發(fā)布的一項(xiàng)指標(biāo)。它可以將執(zhí)行準(zhǔn)確的檢測(cè),關(guān)聯(lián)和定位的效果平衡到用于跟蹤器比較的單個(gè)統(tǒng)一指標(biāo)中。測(cè)量多目標(biāo)跟蹤器的性能需要仔細(xì)設(shè)計(jì),因?yàn)榭赡軙?huì)出現(xiàn)多個(gè)對(duì)應(yīng)星座。
圖片由Bernardin,Keni和Rainer Stiefelhagen提供-來(lái)源py-motmetrics是一個(gè)很棒的庫(kù),它為多目標(biāo)跟蹤器(MOT)的基準(zhǔn)測(cè)試提供了一個(gè)度量的Python實(shí)現(xiàn)。通過(guò)提交日期、時(shí)間和模型類別來(lái)衡量跟蹤器性能的概述。
FairMOT:多目標(biāo)跟蹤中檢測(cè)和再識(shí)別的公平性作者的貢獻(xiàn)和他們?cè)噲D解決的挑戰(zhàn):他們演示并討論了以前的一次性跟蹤框架所面臨的挑戰(zhàn),這些框架已被忽視,但嚴(yán)重限制了它們的性能。他們?cè)谥T如點(diǎn)對(duì)象(CenterNet)之類的無(wú)錨OD方法之上,引入了一個(gè)框架來(lái)公平地平衡檢測(cè)和Re-ID任務(wù)。他們提出了一種自我監(jiān)督的學(xué)習(xí)方法,以在大規(guī)模檢測(cè)數(shù)據(jù)集上訓(xùn)練FairMOT,從而提高了泛化能力。FairMOT概述
FairMOT概述—來(lái)源 順帶一提錨造成的不公平
解決目標(biāo)檢測(cè)任務(wù)有多種方法。1)兩階段檢測(cè)器,例如RCNN系列,它具有區(qū)域提議網(wǎng)絡(luò)和一個(gè)用于檢測(cè)的網(wǎng)絡(luò)。2)單級(jí)探測(cè)器,如YOLO系列,CenterNet,它沒(méi)有單獨(dú)的區(qū)域提議網(wǎng)絡(luò),可以進(jìn)一步分類為帶有錨定盒和無(wú)錨定點(diǎn)的探測(cè)器。忽略的ReID任務(wù)一個(gè)錨可以對(duì)應(yīng)多個(gè)身份;阱^的目標(biāo)檢測(cè)方法通常使用 ROI-Pool 或 ROI-Align 從每個(gè)提議中提取特征。ROI-Align的大多數(shù)采樣位置中都可能存在令人不安的干擾實(shí)例或背景。多個(gè)錨對(duì)應(yīng)一個(gè)身份
2. 特征引起的不公平使用多層特征聚合通過(guò)允許兩個(gè)分支從多層聚合特征中提取它們所需的必需特征,可以有效地解決這一矛盾。如果沒(méi)有多層融合,該模型將偏向主要檢測(cè)分支并生成低質(zhì)量的ReID特征。
3.特征維度引起的不公平盡管學(xué)習(xí)高維ReID特征可能會(huì)略微提高其區(qū)分對(duì)象的能力,但由于兩項(xiàng)任務(wù)的競(jìng)爭(zhēng),這會(huì)特別損害對(duì)象檢測(cè)的準(zhǔn)確性,這反過(guò)來(lái)又對(duì)最終的跟蹤精度產(chǎn)生負(fù)面影響。他們建議學(xué)習(xí)低維ReID功能以平衡兩個(gè)任務(wù)。當(dāng)訓(xùn)練數(shù)據(jù)較少時(shí),學(xué)習(xí)低維ReID特征可降低過(guò)擬合的風(fēng)險(xiǎn)。MOT中的數(shù)據(jù)集通常比ReID區(qū)域中的數(shù)據(jù)集小得多。因此有利于減小特征尺寸。低維ReID功能可提高推理速度。
4.重要指標(biāo)FairMOT在步幅為4的高分辨率特征圖上運(yùn)行,而以前的基于錨的方法在步幅為32的特征圖上運(yùn)行。消除錨點(diǎn)以及使用高分辨率特征,可以更好地將ReID特征與對(duì)象中心對(duì)齊,這大大提高了跟蹤精度。ReID功能的尺寸設(shè)置為僅64,這不僅減少了計(jì)算時(shí)間,而且還通過(guò)在檢測(cè)任務(wù)和ReID任務(wù)之間取得良好的平衡來(lái)提高跟蹤的魯棒性。他們?yōu)楣歉删W(wǎng)配備了Deep Layer Aggregation 運(yùn)算符,以融合多層特征,以容納分支并處理不同比例的對(duì)象。Deep Layer Aggregation:5.?dāng)?shù)據(jù)關(guān)聯(lián)
FairMOT中的數(shù)據(jù)關(guān)聯(lián)涉及三個(gè)實(shí)體,即邊界框IoU,ReID功能和卡爾曼過(guò)濾器。這些屬性用于計(jì)算每對(duì)檢測(cè)到的邊界框之間的相似度,然后使用諸如匈牙利算法的唯一匹配算法來(lái)解決分配問(wèn)題。僅使用邊界框IoU會(huì)導(dǎo)致很多ID switch,對(duì)于擁擠的場(chǎng)景和快速的攝像機(jī)運(yùn)動(dòng)尤其如此。單獨(dú)使用ReID似乎可以增加IDF1并減少ID switch的數(shù)量。添加卡爾曼濾波器有助于獲得平滑的小軌跡,從而進(jìn)一步減少ID switch的數(shù)量。重要的是要利用邊界框IoU,ReID特征和卡爾曼濾波器來(lái)獲得良好的跟蹤性能。結(jié)論作者嘗試了為什么以前的單一方法未能獲得與兩階段MOT方法可比的結(jié)果的原因,并發(fā)現(xiàn)使用基于錨點(diǎn)的目標(biāo)檢測(cè)模型和身份嵌入是導(dǎo)致結(jié)果降低的主要原因。本文還探討了以前的MOT框架中的檢測(cè)和ReID任務(wù)之間功能的不公平和沖突問(wèn)題,并提出了FairMOT(一種無(wú)錨的單發(fā)MOT框架)。MOT方面的研究正在朝“一擊跟蹤”邁進(jìn),我對(duì)即將在該領(lǐng)域進(jìn)行的研究感到非常興奮。在 Fynd Trak,我們度過(guò)了一段美好的時(shí)光,為視頻分析探索和實(shí)施多種多目標(biāo)跟蹤方法,以分析客戶的互動(dòng)和在商店中的參與度。它有助于將分析引入離線環(huán)境,以了解客戶并優(yōu)化商店轉(zhuǎn)換和銷售。
參考文獻(xiàn)[1] Zhang, Yifu and Wang, Chunyu and Wang, Xinggang and Zeng, Wenjun and Liu, Wenyu, FairMOT: On the Fairness of Detection and Re-Identification in Multiple Object Tracking (2020). Arxiv, abs/2004.01888[2] Wang, Zhongdao and Zheng, Liang and Liu, Yixuan and Wang, Shengjin, Towards Real-Time Multi-Object Tracking (2019). ArXiv preprint ArXiv:1909.12605[3] Zhou, Xingyi and Wang, Dequan and Kr{”a}henb{”u}hl, Philipp, Objects as Points (2019). Arxiv, abs/1904.07850[4] Patrick Dendorfer, Aljo?a O?ep, Anton Milan, Konrad Schindler, Daniel Cremers, Ian Reid, Stefan Roth, Laura Leal-Taixé, MOTChallenge: A Benchmark for Single-Camera Multiple Target Tracking (2020), Arxiv, abs/2010.07548[5] Keni Bernardin & Rainer Stiefelhagen, Evaluating Multiple Object Tracking Performance: The CLEAR MOT Metrics (2008), EURASIP Journal on Image and Video Processing[6] Milan, Anton, et al. “Mot16: A benchmark for multi-object tracking.” arXiv preprint arXiv:1603.00831 (2016).

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-6.16立即報(bào)名>> 【在線會(huì)議】Solution Talks |Computex 2025關(guān)鍵趨勢(shì)深讀
-
6月20日立即下載>> 【白皮書(shū)】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單
- 10 為何全球AI巨頭都在搶?MCP協(xié)議背后的暴富玄機(jī)大公開(kāi)!