2021精品久久,顶级毛片在线手机免费看

<table id="k0gnk"><legend id="k0gnk"></legend></table><table id="k0gnk"><input id="k0gnk"></input></table>

<ruby id="k0gnk"><th id="k0gnk"><input id="k0gnk"></input></th></ruby>

<style id="k0gnk"></style>

<del id="k0gnk"><th id="k0gnk"></th></del><table id="k0gnk"></table>

<style id="k0gnk"></style>
<ruby id="k0gnk"></ruby>

<ruby id="k0gnk"><th id="k0gnk"></th></ruby>

<del id="k0gnk"></del>

<fieldset id="k0gnk"><th id="k0gnk"><tr id="k0gnk"></tr></th></fieldset>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 機(jī)器學(xué)習(xí) > 正文

使用Python進(jìn)行SOTA：用于多目標(biāo)跟蹤的一鍵式跟蹤器

2021-02-10 09:55

磐創(chuàng)AI

介紹

多目標(biāo)跟蹤是計(jì)算機(jī)視覺(jué)中的一個(gè)重要問(wèn)題,近年來(lái)一直受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。

MOT的目標(biāo)是在視頻序列中預(yù)測(cè)多個(gè)感興趣對(duì)象的單個(gè)軌跡。它有益于自動(dòng)駕駛、人機(jī)交互到智能視頻等重大應(yīng)用。

通過(guò)檢測(cè)范式進(jìn)行跟蹤

在大多數(shù)現(xiàn)代多目標(biāo)跟蹤系統(tǒng)中,主要的策略是通過(guò)檢測(cè)范式進(jìn)行跟蹤。通過(guò)檢測(cè)范式進(jìn)行跟蹤將MOT分解為以下步驟:

用于目標(biāo)定位的目標(biāo)檢測(cè)器

建立外觀模型為檢測(cè)到的目標(biāo)提取ReID特征。

深入研究 Person-ReID

運(yùn)動(dòng)模型和數(shù)據(jù)關(guān)聯(lián),在其中分配檢測(cè)到的目標(biāo)并將其連接到現(xiàn)有軌跡。

它旨在尋找與時(shí)空相匹配并形成軌跡的檢測(cè)。理想情況下,每個(gè)單獨(dú)的軌跡都應(yīng)具有唯一的跟蹤ID。

小提示:檢測(cè)總是不完美,我們將在“挑戰(zhàn)”部分中介紹。多年來(lái),我們目睹了目標(biāo)檢測(cè)和再識(shí)別方面的驚人進(jìn)步,這是多目標(biāo)跟蹤的關(guān)鍵組成部分。但是,如何在單一網(wǎng)絡(luò)中同時(shí)完成這兩項(xiàng)任務(wù),目前還很少有人關(guān)注。在此博客中,我們將分解MOT系統(tǒng),并研究FairMOT,該系統(tǒng)在檢測(cè)和跟蹤方面具有很高的準(zhǔn)確性,在幾個(gè)公共數(shù)據(jù)集上,它的性能大大超過(guò)了之前的SOTAs。我們還將介紹以前的單次方法失敗的原因。

挑戰(zhàn)

當(dāng)我們分解MOT系統(tǒng)時(shí),我們可以把握每個(gè)步驟可能面臨的挑戰(zhàn)。由于遮擋,視角/姿勢(shì)/模糊/照明變化和背景混亂等因素,目標(biāo)檢測(cè)可能會(huì)失敗。序列中可能存在相同對(duì)象類型的多個(gè)實(shí)例,這使得外觀通常非常相似,并且很難進(jìn)行唯一匹配。因此,擁有正確的指標(biāo)來(lái)評(píng)估MOT框架并進(jìn)一步優(yōu)化它是非常重要的。方法多目標(biāo)跟蹤系統(tǒng)可以放在兩個(gè)括號(hào)中:在線跟蹤:在線跟蹤會(huì)逐幀處理跟蹤ID,而無(wú)法查看將來(lái)的幀。非常適合實(shí)時(shí)應(yīng)用程序和流數(shù)據(jù)。但是它很容易漂移,因?yàn)楹茈y從錯(cuò)誤或遮擋中恢復(fù)。脫機(jī)跟蹤:脫機(jī)跟蹤按順序處理一批幀。這有助于從遮擋中恢復(fù)以及對(duì)動(dòng)態(tài)世界的推理。它不適用于實(shí)時(shí)應(yīng)用,但不適用于視頻分析。例如,通過(guò)顧客在商店中的移動(dòng)和互動(dòng)來(lái)分析顧客的行為。MOT神經(jīng)求解器 (https://arxiv．org/abs/1912．07515) 是這種方法的一個(gè)很好的例子,它探索了圖神經(jīng)網(wǎng)絡(luò)。數(shù)據(jù)MOTChallenge(https://motchallenge．net/)社區(qū)創(chuàng)建了一個(gè)通用框架來(lái)測(cè)試多目標(biāo)跟蹤器。他們添加的公共數(shù)據(jù)集序列,具有挑戰(zhàn)性,具有多種特征,包括不同的幀頻,擁擠的場(chǎng)景,視角或光照,可以模仿現(xiàn)實(shí)生活的場(chǎng)景,并挑戰(zhàn)研究人員和從業(yè)者開(kāi)發(fā)一個(gè)通用跟蹤器來(lái)處理這些序列。

MOT16 / 17數(shù)據(jù)集——來(lái)源

PapersWithCode:)MOT:)正如你所看到的FairMOT在多個(gè)公共數(shù)據(jù)集上處于領(lǐng)先地位。我們將很快在博客中討論他們的方法。指標(biāo)許多單獨(dú)的指標(biāo)用于評(píng)估MOT的不同方面。研究團(tuán)體主要在兩個(gè)復(fù)合指標(biāo)上進(jìn)行了優(yōu)化,即多目標(biāo)跟蹤精度(MOTA)和識(shí)別F1分?jǐn)?shù)(IDF1)。初始指標(biāo)側(cè)重于目標(biāo)覆蓋范圍,跟蹤識(shí)別性能由后者衡量。多目標(biāo)跟蹤精度(MOTA) 在單一性能指標(biāo)下考慮三種誤差:

MOTA :其中t是視頻序列中的幀索引,而GT是真實(shí)目標(biāo)的數(shù)量。其中FN為假陰性,即系統(tǒng)未檢測(cè)到的真實(shí)目標(biāo)的數(shù)量。FP是誤報(bào),即系統(tǒng)錯(cuò)誤檢測(cè)但在真實(shí)目標(biāo)中不存在的數(shù)量。IDSW是識(shí)別轉(zhuǎn)換的數(shù)量,即給定軌跡從一個(gè)真實(shí)目標(biāo)變?yōu)榱硪粋€(gè)目標(biāo)的次數(shù)。**多目標(biāo)跟蹤精度(MOTP)**是所有真實(shí)正值與其對(duì)應(yīng)的真實(shí)目標(biāo)之間的平均差異。對(duì)于邊界框重疊,其計(jì)算公式如下:

其中ct表示幀t和dt中的匹配數(shù)目,i是目標(biāo)i與幀t中指定的真實(shí)目標(biāo)的邊界框重疊。然后,將IDF1表示為正確識(shí)別的檢測(cè)數(shù)與平均真實(shí)目標(biāo)和計(jì)算的檢測(cè)數(shù)之比,并通過(guò)其諧波均值來(lái)平衡識(shí)別精度和召回率:

IDF1-來(lái)源高階跟蹤準(zhǔn)確性(HOTA)是去年末(2020)發(fā)布的一項(xiàng)指標(biāo)。它可以將執(zhí)行準(zhǔn)確的檢測(cè),關(guān)聯(lián)和定位的效果平衡到用于跟蹤器比較的單個(gè)統(tǒng)一指標(biāo)中。測(cè)量多目標(biāo)跟蹤器的性能需要仔細(xì)設(shè)計(jì),因?yàn)榭赡軙?huì)出現(xiàn)多個(gè)對(duì)應(yīng)星座。

圖片由Bernardin,Keni和Rainer Stiefelhagen提供-來(lái)源py-motmetrics是一個(gè)很棒的庫(kù),它為多目標(biāo)跟蹤器(MOT)的基準(zhǔn)測(cè)試提供了一個(gè)度量的Python實(shí)現(xiàn)。通過(guò)提交日期、時(shí)間和模型類別來(lái)衡量跟蹤器性能的概述。

FairMOT:多目標(biāo)跟蹤中檢測(cè)和再識(shí)別的公平性作者的貢獻(xiàn)和他們?cè)噲D解決的挑戰(zhàn):他們演示并討論了以前的一次性跟蹤框架所面臨的挑戰(zhàn),這些框架已被忽視,但嚴(yán)重限制了它們的性能。他們?cè)谥T如點(diǎn)對(duì)象(CenterNet)之類的無(wú)錨OD方法之上,引入了一個(gè)框架來(lái)公平地平衡檢測(cè)和Re-ID任務(wù)。他們提出了一種自我監(jiān)督的學(xué)習(xí)方法,以在大規(guī)模檢測(cè)數(shù)據(jù)集上訓(xùn)練FairMOT,從而提高了泛化能力。FairMOT概述

FairMOT概述—來(lái)源順帶一提錨造成的不公平

解決目標(biāo)檢測(cè)任務(wù)有多種方法。1)兩階段檢測(cè)器,例如RCNN系列,它具有區(qū)域提議網(wǎng)絡(luò)和一個(gè)用于檢測(cè)的網(wǎng)絡(luò)。2)單級(jí)探測(cè)器,如YOLO系列,CenterNet,它沒(méi)有單獨(dú)的區(qū)域提議網(wǎng)絡(luò),可以進(jìn)一步分類為帶有錨定盒和無(wú)錨定點(diǎn)的探測(cè)器。忽略的ReID任務(wù)一個(gè)錨可以對(duì)應(yīng)多個(gè)身份�；阱^的目標(biāo)檢測(cè)方法通常使用 ROI-Pool 或 ROI-Align 從每個(gè)提議中提取特征。ROI-Align的大多數(shù)采樣位置中都可能存在令人不安的干擾實(shí)例或背景。多個(gè)錨對(duì)應(yīng)一個(gè)身份

2．特征引起的不公平使用多層特征聚合通過(guò)允許兩個(gè)分支從多層聚合特征中提取它們所需的必需特征,可以有效地解決這一矛盾。如果沒(méi)有多層融合,該模型將偏向主要檢測(cè)分支并生成低質(zhì)量的ReID特征。

3．特征維度引起的不公平盡管學(xué)習(xí)高維ReID特征可能會(huì)略微提高其區(qū)分對(duì)象的能力,但由于兩項(xiàng)任務(wù)的競(jìng)爭(zhēng),這會(huì)特別損害對(duì)象檢測(cè)的準(zhǔn)確性,這反過(guò)來(lái)又對(duì)最終的跟蹤精度產(chǎn)生負(fù)面影響。他們建議學(xué)習(xí)低維ReID功能以平衡兩個(gè)任務(wù)。當(dāng)訓(xùn)練數(shù)據(jù)較少時(shí),學(xué)習(xí)低維ReID特征可降低過(guò)擬合的風(fēng)險(xiǎn)。MOT中的數(shù)據(jù)集通常比ReID區(qū)域中的數(shù)據(jù)集小得多。因此有利于減小特征尺寸。低維ReID功能可提高推理速度。

4．重要指標(biāo)FairMOT在步幅為4的高分辨率特征圖上運(yùn)行,而以前的基于錨的方法在步幅為32的特征圖上運(yùn)行。消除錨點(diǎn)以及使用高分辨率特征,可以更好地將ReID特征與對(duì)象中心對(duì)齊,這大大提高了跟蹤精度。ReID功能的尺寸設(shè)置為僅64,這不僅減少了計(jì)算時(shí)間,而且還通過(guò)在檢測(cè)任務(wù)和ReID任務(wù)之間取得良好的平衡來(lái)提高跟蹤的魯棒性。他們?yōu)楣歉删W(wǎng)配備了Deep Layer Aggregation 運(yùn)算符,以融合多層特征,以容納分支并處理不同比例的對(duì)象。Deep Layer Aggregation:5．?dāng)?shù)據(jù)關(guān)聯(lián)

FairMOT中的數(shù)據(jù)關(guān)聯(lián)涉及三個(gè)實(shí)體,即邊界框IoU,ReID功能和卡爾曼過(guò)濾器。這些屬性用于計(jì)算每對(duì)檢測(cè)到的邊界框之間的相似度,然后使用諸如匈牙利算法的唯一匹配算法來(lái)解決分配問(wèn)題。僅使用邊界框IoU會(huì)導(dǎo)致很多ID switch,對(duì)于擁擠的場(chǎng)景和快速的攝像機(jī)運(yùn)動(dòng)尤其如此。單獨(dú)使用ReID似乎可以增加IDF1并減少ID switch的數(shù)量。添加卡爾曼濾波器有助于獲得平滑的小軌跡,從而進(jìn)一步減少ID switch的數(shù)量。重要的是要利用邊界框IoU,ReID特征和卡爾曼濾波器來(lái)獲得良好的跟蹤性能。結(jié)論作者嘗試了為什么以前的單一方法未能獲得與兩階段MOT方法可比的結(jié)果的原因,并發(fā)現(xiàn)使用基于錨點(diǎn)的目標(biāo)檢測(cè)模型和身份嵌入是導(dǎo)致結(jié)果降低的主要原因。本文還探討了以前的MOT框架中的檢測(cè)和ReID任務(wù)之間功能的不公平和沖突問(wèn)題,并提出了FairMOT(一種無(wú)錨的單發(fā)MOT框架)。MOT方面的研究正在朝“一擊跟蹤”邁進(jìn),我對(duì)即將在該領(lǐng)域進(jìn)行的研究感到非常興奮。在 Fynd Trak,我們度過(guò)了一段美好的時(shí)光,為視頻分析探索和實(shí)施多種多目標(biāo)跟蹤方法,以分析客戶的互動(dòng)和在商店中的參與度。它有助于將分析引入離線環(huán)境,以了解客戶并優(yōu)化商店轉(zhuǎn)換和銷售。

參考文獻(xiàn)[1] Zhang, Yifu and Wang, Chunyu and Wang, Xinggang and Zeng, Wenjun and Liu, Wenyu, FairMOT: On the Fairness of Detection and Re-Identification in Multiple Object Tracking (2020)． Arxiv, abs/2004．01888[2] Wang, Zhongdao and Zheng, Liang and Liu, Yixuan and Wang, Shengjin, Towards Real-Time Multi-Object Tracking (2019)． ArXiv preprint ArXiv:1909．12605[3] Zhou, Xingyi and Wang, Dequan and Kr{”a}henb{”u}hl, Philipp, Objects as Points (2019)． Arxiv, abs/1904．07850[4] Patrick Dendorfer, Aljo?a O?ep, Anton Milan, Konrad Schindler, Daniel Cremers, Ian Reid, Stefan Roth, Laura Leal-Taixé, MOTChallenge: A Benchmark for Single-Camera Multiple Target Tracking (2020), Arxiv, abs/2010．07548[5] Keni Bernardin & Rainer Stiefelhagen, Evaluating Multiple Object Tracking Performance: The CLEAR MOT Metrics (2008), EURASIP Journal on Image and Video Processing[6] Milan, Anton, et al． “Mot16: A benchmark for multi-object tracking．” arXiv preprint arXiv:1603．00831 (2016)．

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫(xiě)，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

登錄登錄即可訪問(wèn)所有OFweek服務(wù)

用戶名/郵箱/手機(jī)：
密碼：
忘記密碼？
用其他賬號(hào)登錄： QQ | 微信 | 新浪微博

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

暫無(wú)評(píng)論

暫無(wú)評(píng)論

圖片新聞

最新發(fā)布

最新活動(dòng)更多

即日-6.16
立即報(bào)名>> 【在線會(huì)議】Solution Talks |Computex 2025關(guān)鍵趨勢(shì)深讀
6月20日
立即下載>> 【白皮書(shū)】精準(zhǔn)測(cè)量安全高效——福祿克光伏行業(yè)解決方案
7月3日
立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
7月22-29日
立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
7.30-8.1
火熱報(bào)名中>> 全數(shù)會(huì)2025（第六屆）機(jī)器人及智能工廠展
7月31日
免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)

一周熱點(diǎn) 月點(diǎn)擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報(bào)告

人工智能獵頭職位更多

掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯(cuò)

x

_*文字標(biāo)題：

_*糾錯(cuò)內(nèi)容：

聯(lián)系郵箱：

_*驗(yàn) 證碼：

看不清，點(diǎn)擊換一張

粵公網(wǎng)安備 44030502002758號(hào)

感谢您访问我们的网站，您可能还对以下资源感兴趣：

99久久免费精品国产对白

中文字字幕在线中文乱码6互动交流久久久性爱视频性久久久久美女黄免费 97久久精品人人

<ruby id="i8cbt"><th id="i8cbt"><input id="i8cbt"></input></th></ruby>

^{<noframes id="i8cbt"></noframes>}