香港大學(xué)等機(jī)構(gòu)提出學(xué)習(xí)點(diǎn)云內(nèi)蘊(yùn)結(jié)構(gòu)表示的非監(jiān)督學(xué)習(xí)新方法
三維形狀的結(jié)構(gòu)分析一直是計(jì)算機(jī)圖像學(xué)和幾何處理中的基礎(chǔ)性關(guān)鍵問題,人們在形狀分割、形狀抽象和關(guān)鍵點(diǎn)提取和檢測等方面進(jìn)行了大量的研究。這些形狀分析任務(wù)需要有效學(xué)習(xí)不同形狀間的語義一致性特征或和一致性的結(jié)構(gòu)表示,從而提升幾何與形狀分析任務(wù)的性能。
為了有效表示點(diǎn)云的結(jié)構(gòu)信息,保證結(jié)構(gòu)間逐點(diǎn)的語義對應(yīng)關(guān)系,得到有效的形狀結(jié)構(gòu)表達(dá),來自香港大學(xué)、馬普研究所、Adobe和山東大學(xué)的研究人員們提出了一種以3D結(jié)構(gòu)點(diǎn)形式來表示形狀結(jié)構(gòu)的新方法。這種無監(jiān)督的學(xué)習(xí)方法不僅簡單還具有可解釋性,對于多種點(diǎn)云采樣和真實(shí)掃描數(shù)據(jù)都十分魯棒,在點(diǎn)云語義形狀對應(yīng)和語義分割標(biāo)簽遷移任務(wù)上都取得了優(yōu)異的結(jié)果。此外在一致性結(jié)構(gòu)點(diǎn)上基于PCA構(gòu)建的形狀嵌入對于形狀重建和補(bǔ)全等三維任務(wù)都具有廣泛的潛在應(yīng)用。
三維形狀結(jié)構(gòu)分析
三維結(jié)構(gòu)分析指三維形狀理解的關(guān)鍵所在,近年來研究人員針對三維形狀提出了中軸、曲率骨架和關(guān)鍵點(diǎn)等一系列結(jié)構(gòu)表示方法,但先前基于手工特征的工作只能針對特定任務(wù)進(jìn)行參數(shù)調(diào)優(yōu),缺乏泛化性和適應(yīng)性。而近年來深度學(xué)習(xí)的出現(xiàn)為三維形狀表示學(xué)習(xí)提供了新的思路和有力手段,這篇文章將基于深度學(xué)習(xí)構(gòu)建一種新的結(jié)構(gòu)表示學(xué)習(xí)方法,用于建立三維點(diǎn)云間的語義對應(yīng)關(guān)系。
在PointNet之后,三維點(diǎn)云領(lǐng)域涌現(xiàn)出了一系列開創(chuàng)性的工作,但絕大多數(shù)工作集中于點(diǎn)云的分類、分割和三維形狀的重建。重建的點(diǎn)云往往缺乏結(jié)構(gòu)性的信息,雖然有工作提出了生成結(jié)構(gòu)性點(diǎn)云的方法,但卻沒有保證逐點(diǎn)的對應(yīng)關(guān)系。
為了研究這些問題,研究人員提出新型的無監(jiān)督方法來學(xué)習(xí)同一類三維形狀中語義一致性的結(jié)構(gòu)點(diǎn),在給定點(diǎn)云的情況下本文的方法能夠生成具有形狀代表性的、很好地抽象和近似輸入點(diǎn)云的結(jié)構(gòu)點(diǎn)序列。雖然這種方法結(jié)構(gòu)簡單但是具有很強(qiáng)的可解釋性,針對不同的點(diǎn)云采樣和真實(shí)的點(diǎn)云都具有很強(qiáng)的魯棒性。
實(shí)驗(yàn)表明,這種方法在語義形狀對應(yīng)和分割標(biāo)簽遷移任務(wù)上都具有良好的表現(xiàn),利用高度一致性的結(jié)構(gòu)點(diǎn)與PCA方法結(jié)合還構(gòu)建起了可以較完整地保存形狀結(jié)構(gòu)信息的嵌入空間,將為形狀重建等三維任務(wù)提供強(qiáng)有力的支撐。
結(jié)構(gòu)點(diǎn)生成新方法
本文所聚焦的問題是從點(diǎn)云中學(xué)習(xí)出內(nèi)蘊(yùn)的結(jié)構(gòu)點(diǎn)表示。下圖顯示了模型的主要結(jié)構(gòu),其輸入為目標(biāo)的點(diǎn)云集合、輸出為一系列抽取出的可以表示點(diǎn)云輸入的結(jié)構(gòu)點(diǎn)。網(wǎng)絡(luò)通過非監(jiān)督的方法來對同一類的目標(biāo)進(jìn)行形狀分析學(xué)習(xí),它建立在PointNet++基礎(chǔ)上,添加了點(diǎn)云整合模塊,針對每一類形狀得到的結(jié)構(gòu)點(diǎn)具有非常好的語義連續(xù)性。
圖中顯示了模型的處理流程,在給定點(diǎn)云的情況下PointNet++首先用于抽取局域的上下文特征F,隨后與抽取的采樣點(diǎn)一起送入到共享的多層感知機(jī)中,得到針對l個點(diǎn)的m幅結(jié)構(gòu)點(diǎn)概率圖,最終模型將輸入可以有效表示點(diǎn)云形狀的m個結(jié)構(gòu)點(diǎn)。
在抽取局域點(diǎn)和特征的過程中使用的PointNet++編碼器,利用多層次的抽取層在多尺度上自適應(yīng)地融合特征。每一個級別由三個關(guān)鍵的層構(gòu)成,包括了采樣層、多尺度聚類層和PointNet層,它們通過層級的方式對輸入點(diǎn)云進(jìn)行抽象和處理。
隨后l個采樣點(diǎn)Q和對應(yīng)的局域特征F被組合送入到點(diǎn)集成模塊中。在給定特征和對應(yīng)點(diǎn)輸入后,利用共享的多層感知機(jī)模塊獲取每個點(diǎn)是第m個結(jié)構(gòu)點(diǎn)的概率圖,最終m個結(jié)構(gòu)點(diǎn)可以由每個采樣點(diǎn)與其對應(yīng)mi結(jié)構(gòu)點(diǎn)的概率加權(quán)而成:
下圖顯示了對應(yīng)不同結(jié)構(gòu)點(diǎn)學(xué)習(xí)到概率圖,第一列的灰色表示輸入點(diǎn)云,及其十六個彩色表示的結(jié)構(gòu)點(diǎn);第二和第三列則表示了框中的結(jié)構(gòu)點(diǎn)對應(yīng)的概率圖(顏色越深的概率越大)。值得注意的是,學(xué)習(xí)到的概率圖在沒有顯式的約束下能具有顯著的聚集效應(yīng)。
兩個結(jié)構(gòu)點(diǎn)對應(yīng)的概率圖(第一列方框內(nèi)),顏色越深概率越大(二三列)

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動力電池技術(shù)應(yīng)用大會
-
免費(fèi)參會立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報(bào)告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 一文看懂視覺語言動作模型(VLA)及其應(yīng)用
- 6 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡單