支付寶AI大幅提升細(xì)粒度圖像分類識別精度:一眼看穿萬物細(xì)微差異
近日,計(jì)算機(jī)視覺A類頂級會議CVPR 2020開幕在即, 由全球最大機(jī)器學(xué)習(xí)平臺Kaggle承辦的FGVC(Fine-Grained Visual Categorization,細(xì)粒度圖像分類)全球挑戰(zhàn)賽結(jié)果揭曉,支付寶天筭安全實(shí)驗(yàn)室奪冠,超越全球1316支頂尖計(jì)算機(jī)視覺團(tuán)隊(duì)。
Kaggle 2020-FGVC挑戰(zhàn)賽官方排名
作為人工智能核心能力,計(jì)算機(jī)視覺對細(xì)粒度圖像分類技術(shù)要求越來越高。只有讓機(jī)器「看得」更細(xì)更準(zhǔn),機(jī)器的判斷才能有所突破。細(xì)粒度圖像分類針對的是更微觀的物體類別,比如,不僅要識別出它是一只鳥,還要判斷具體屬于哪一類鳥,識別出車要判斷它的款式等。
細(xì)粒度圖像分類是計(jì)算機(jī)視覺領(lǐng)域極具挑戰(zhàn)的方向。今年,圍繞該方向Kaggle共發(fā)起六項(xiàng)任務(wù),支付寶參加其中的患病植物圖像分類。比賽考察AI視覺識別技術(shù)對蘋果樹葉子圖片進(jìn)行不同種類的疾病區(qū)分能力,在訓(xùn)練集1821張圖像和測試集1821張圖像中,完成高精確度的判別。
模型不僅可以準(zhǔn)確的分類,還能通過熱力圖的方式較為準(zhǔn)確地定位到患病區(qū)域
世界上有約37萬種植物,不同植物的病因完全不同,但多數(shù)植物的病態(tài)外觀和特征卻非常相似。另一方面,采集拍攝中存在姿態(tài)、視角、光照、遮擋、背景干擾等影響因素,使分類更加具有難度。
支付寶天筭安全實(shí)驗(yàn)室使用的原創(chuàng)模型,是基于數(shù)據(jù)增強(qiáng)、知識蒸餾方法,實(shí)現(xiàn)在大量信息干擾下進(jìn)行物體具像化特征識別,使細(xì)粒度識別精度大幅提升。支付寶是比賽中唯一使用知識蒸餾這種深度學(xué)習(xí)方法的團(tuán)隊(duì),在最終測試中,支付寶分?jǐn)?shù)達(dá)0.98445,排名第一。
例如,生了病的兩片樹葉,同樣出現(xiàn)了破損孔洞,在傳統(tǒng)模型訓(xùn)練下,AI最多可以識別出它們都是蘋果樹的樹葉,很難確定兩個孔洞之間的區(qū)別,進(jìn)而給出推斷樹葉究竟得的是哪兩種疾病。而支付寶的AI模型通過明確識別關(guān)鍵是孔洞大小、數(shù)量、位置,以及周邊是否有斑點(diǎn),最終快速給出樹葉由于化學(xué)藥品濫用造成損傷的判斷。
缺乏標(biāo)準(zhǔn)信息數(shù)據(jù)導(dǎo)致難以判別的核心痛點(diǎn),在醫(yī)療、金融、客服等領(lǐng)域大量存在,意味著這項(xiàng)技術(shù)擁有廣闊的應(yīng)用空間。在支付寶交易糾紛、資金盜用、醫(yī)療保險(xiǎn)報(bào)銷等場景中,AI團(tuán)隊(duì)已經(jīng)開始使用該技術(shù)方法,快速識別并進(jìn)行更準(zhǔn)確的風(fēng)險(xiǎn)預(yù)測,保障用戶需求在安全環(huán)境中被滿足。
人工智能是螞蟻集團(tuán)核心技術(shù)引擎之一,研究領(lǐng)域涵蓋NLP、計(jì)算機(jī)視覺、智能風(fēng)控、智能營銷等,并在大規(guī)模分布式機(jī)器學(xué)習(xí)、深度圖學(xué)習(xí)、多方安全與隱私計(jì)算、博弈與對抗智能、多智能體、強(qiáng)化學(xué)習(xí)等方向取得突破。螞蟻集團(tuán)首席科學(xué)家漆遠(yuǎn)帶領(lǐng)的全球化AI團(tuán)隊(duì),相繼在國際人工智能頂級會議NeurIPS、ICML 、AAAI等,發(fā)表近60篇高質(zhì)量論文成果,申報(bào)了超200個專利。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動力電池技術(shù)應(yīng)用大會
-
免費(fèi)參會立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報(bào)告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 一文看懂視覺語言動作模型(VLA)及其應(yīng)用
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡單