照片秒變icon?日本研究員提出基于生成對(duì)抗網(wǎng)絡(luò)的Iconify模型來(lái)幫忙!
AI圖標(biāo)化的新技能
為了驗(yàn)證這兩種模型是否可以對(duì)圖像進(jìn)行有效的圖標(biāo)化,研究人員分別對(duì)人體圖像、通用目標(biāo)和基于logo訓(xùn)練的圖標(biāo)化模型進(jìn)行了實(shí)驗(yàn)。
針對(duì)人體的圖標(biāo)化,研究人員僅僅利用了包含人體的圖像和對(duì)應(yīng)的圖標(biāo)進(jìn)行訓(xùn)練。通過分類限制訓(xùn)練樣本的多樣性可以看到GANs圖標(biāo)化的能力。在訓(xùn)練過程中僅僅使用了包含部分人體的圖像,同時(shí)去除了多人的圖標(biāo),最終利用從72張icon增強(qiáng)的1440張圖標(biāo)和1684張真實(shí)人體圖像進(jìn)行了訓(xùn)練。下圖顯示訓(xùn)練的數(shù)據(jù)樣本
下面分別比較了CycleGAN和UNIT模型對(duì)于人體圖標(biāo)化的結(jié)果,可以看到兩種模型都可以較好地圖標(biāo)化人體圖像,實(shí)現(xiàn)了對(duì)于人體的有效抽象。其中CycleGAN生成額結(jié)果更好,對(duì)于頭部和身體的形狀更為簡(jiǎn)化。但針對(duì)面部特征的圖標(biāo)化不太好主要是由于訓(xùn)練圖標(biāo)數(shù)據(jù)中缺乏有效的面部細(xì)節(jié)特征。
由于CycleGAN具有循環(huán)損失,所以研究人員還對(duì)圖標(biāo)化后的結(jié)果進(jìn)行了圖像化,下圖顯示了圖像到圖標(biāo)再到圖像的生成結(jié)果,以及圖標(biāo)到圖像再到圖標(biāo)的結(jié)果,顯示了模型對(duì)于圖像和圖標(biāo)抽象能力的理解。
隨后研究人員將圖標(biāo)化的過程拓展到了COCO中包含的通用物體上。由于物體的形狀各異、顏色紋理各不相同,模型需要處理的映射更為復(fù)雜。為此研究人員利用了由粗到精的策略來(lái)訓(xùn)練CycleGAN,依次在32x32,64x64,128x128,最終在256x256上進(jìn)行訓(xùn)練。
下圖顯示了最終訓(xùn)練后生成的結(jié)果,其中橘色框中顯示了未參與訓(xùn)練的測(cè)試圖像及其結(jié)果,很好地抽象并描述了圖像中的目標(biāo)。
盡管圖像為圖標(biāo)提供了較多的設(shè)計(jì)信息,但其結(jié)果與第一個(gè)任務(wù)中的圖標(biāo)相比還不夠抽象,與標(biāo)準(zhǔn)圖標(biāo)還有所差異。例如上圖中的鐘表圖像就抽象的不太好。由于沒有設(shè)計(jì)的通用準(zhǔn)則和標(biāo)準(zhǔn),針對(duì)常規(guī)物體的圖標(biāo)化顯示出了較大的差異性。
為了進(jìn)一步驗(yàn)證這種方法,研究人員還利用了彩色的logo數(shù)據(jù)集LLD對(duì)圖標(biāo)化任務(wù)進(jìn)行了訓(xùn)練,使得CycleGAN生成彩色的圖標(biāo)。與上一個(gè)任務(wù)相比,生成圖標(biāo)的質(zhì)量在色彩的幫助下有了很大的提升,例如下圖中的狗子圖標(biāo)化結(jié)果就比上圖中要好很多,雖然顏色可能與原始圖像有差異,但整體的配色與形狀和我們的審美協(xié)調(diào)。
不過上圖中藍(lán)色框內(nèi)也顯示了一些錯(cuò)誤圖標(biāo)化的例子,例如鐘表沒有太多變化,第二個(gè)過于抽象化,第三、四個(gè)生成了文字,第五個(gè)則沒有保留明顯了目標(biāo)信息。這主要是由于目標(biāo)的背景、噪聲以及LLD的logo數(shù)據(jù)帶來(lái)的文字信息造成了一定影響。
但不可否認(rèn)這種圖標(biāo)化的方法可以有效地對(duì)目標(biāo)圖像進(jìn)行抽象處理,為設(shè)計(jì)師提供了創(chuàng)意參考、也為沒有設(shè)計(jì)基礎(chǔ)的小伙伴們提供了快速生成高質(zhì)量圖標(biāo)的好辦法吧~

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 一文看懂視覺語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 6 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡(jiǎn)單