久久大香线综合网无码,高清乱码一区二区三区

<blockquote id="pylg0"></blockquote>

<blockquote id="pylg0"></blockquote>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 其他 > 正文

Meta猛攻CV，發(fā)布超強(qiáng)SAM摳圖模型，可拯救元宇宙？

2023-04-10 13:43

來源： OFweek人工智能網(wǎng)

巨頭們正在 AIGC 領(lǐng)域上激戰(zhàn)，Meta在“計(jì)算機(jī)視覺（Computer vision，CV）”領(lǐng)域有了大動(dòng)作。

本周三，Meta 研究部門發(fā)布了一篇名為其 “Segment Anything（分割一切）”的論文，文中介紹了一個(gè)全新的 Segment Anything Model（即SAM），可以用于識(shí)別圖像和視頻中的物體，甚至是從未被 AI 訓(xùn)練過的物品。

所謂的“圖像分割”，通俗來講就是摳圖。Meta此次所展示的 AI 摳圖能力，被認(rèn)為是計(jì)算機(jī)視覺的 “GPT－3 時(shí)刻”，強(qiáng)到 CV 工作者直呼：AI 來搶飯碗，準(zhǔn)備下崗了。

強(qiáng)在哪里？

如果你親自嘗試過摳圖，即使借助了市面上較為成熟的“智能摳圖”工具，你依然發(fā)現(xiàn)，想把照片摳得快、摳得準(zhǔn)、摳得自然是件費(fèi)時(shí)費(fèi)力的事。

Meta此次發(fā)布的 SAM 給出了近乎完美的解決方案。

SAM 的第一項(xiàng)重大突破在于“識(shí)別速度和精度”有了顯著提升，而速度和精度是計(jì)算機(jī)視覺領(lǐng)域的經(jīng)典且復(fù)雜的任務(wù)。

SAM 的另一驚艷點(diǎn)在于，它并不局限于訓(xùn)練過的數(shù)據(jù)集，在遇到從未見過的物品和形狀，SAM 也能將其準(zhǔn)確識(shí)別并分割出來。

此外，SAM 支持用戶使用交互性方式分離物體。比如經(jīng)鼠標(biāo)定位自動(dòng)識(shí)別物體輪廓。即使是顏色非常相近、甚至連人眼都難以快速分辨的倒影，SAM 都能非常準(zhǔn)確的找出輪廓邊線。

用戶還可通過“關(guān)鍵字查詢”，SAM 可監(jiān)測并標(biāo)記出這個(gè)圖片中的搜索對象。

還能支持對圖片上物品的編輯。比如，識(shí)別出一張圖片上模特的服飾，摳出來便可以改變顏色和尺碼大小。

SAM 不僅僅能處理靜態(tài)圖片，還可以對動(dòng)圖、視頻中的取片進(jìn)行準(zhǔn)確識(shí)別，并快速標(biāo)記、統(tǒng)計(jì)出品類、大小和顏色等信息。

從靜態(tài)圖片中“摳”出來的椅子，進(jìn)行3D渲染和編輯，讓它動(dòng)起來，還可以繼續(xù)改變形狀等創(chuàng)意操作。

未來，這一技術(shù)將和 Meta 的 AR／AR 頭顯進(jìn)行廣泛結(jié)合，助力元宇宙，將電影中的鋼鐵俠頭盔將推向生活場景。

將有更大應(yīng)用空間

SAM 發(fā)布之后，很多人第一時(shí)間進(jìn)行了實(shí)測，一些網(wǎng)友還結(jié)合自身的工作領(lǐng)域打開了 SAM 更廣的應(yīng)用想象空間。

自然科學(xué)研究者——將SAM和衛(wèi)星圖像結(jié)合在了一起，表示SAM能夠很好的識(shí)別和找到他標(biāo)記的風(fēng)貌類型。

神經(jīng)外科影像學(xué)從業(yè)者——將SAM用到了一個(gè)脊髓血管病的病例文件之中，認(rèn)為SAM在幫助判斷和分析病情上有很大幫助。

生物學(xué)家——輸入一張顯微鏡下的組織圖片，即使圖中形狀特征毫無規(guī)律，SAM也能夠自動(dòng)識(shí)別多細(xì)胞結(jié)構(gòu)中的腺體、導(dǎo)管、動(dòng)脈等，SAM 在未來能夠節(jié)省大量手動(dòng)注釋的時(shí)間。

騎行愛好者——將地圖和SAM結(jié)合起來，認(rèn)為能夠幫助自己未來更快更高效地給地圖做標(biāo)記。

農(nóng)場管理者——借助 SAM 監(jiān)管農(nóng)場動(dòng)物，進(jìn)行作物培植生產(chǎn)研究等。

AI研究專家——英偉達(dá)人工智能科學(xué)家 Jim Fan 表示 SAM 已經(jīng)基本能夠理解“物品”的一般概念，即使對于未知對象、不熟悉的場景（例如水下和顯微鏡里的細(xì)胞）。

SAM 之于計(jì)算機(jī)視覺，就像是 GPT 之于大語言模型。

論文解讀

在 Meta 的論文《Segment Anything》中，新模型全名為Segment Anything Model，圖像注釋集名為Segment Anything 1－Billion （SA－1B），據(jù)稱這是有史以來最大的分割數(shù)據(jù)集。

論文地址：https：／／arxiv．org／abs／2304．02643

此前解決分割問題大致有兩種方法。第一種是交互式分割，第二種是自動(dòng)分割。前者需要人通過迭代完善一個(gè)遮罩來指導(dǎo)模型，后者需要大量的手動(dòng)注釋對象來訓(xùn)練。兩種方法都無法實(shí)現(xiàn)全自動(dòng)的圖像分割。SAM 很好的概括了這兩種方法，可以輕松地執(zhí)行交互式分割和自動(dòng)分割。

本篇論文中，研發(fā)人員提到了SAM 的靈感來源于自然語言處理領(lǐng)域。在 NLP 領(lǐng)域，基礎(chǔ)模型可以使用prompting技術(shù)對新數(shù)據(jù)集和任務(wù)執(zhí)行零樣本和少樣本學(xué)習(xí)。

而在CV領(lǐng)域，具體到 SAM 中，研究人員訓(xùn)練的 SAM 可以針對任何提示返回有效的分割掩碼。提示可以是前景、背景點(diǎn)、粗框或掩碼、自由格式文本等等能指示圖像中要分割內(nèi)容的任何信息。

在Web瀏覽器中，SAM有效映射圖像特征和一組提示嵌入來生成分割掩碼

除了新模型 SAM，Meta還發(fā)布了迄今為止最大的分割數(shù)據(jù)集 SA－1B。

數(shù)據(jù)集由 SAM 收集，此數(shù)據(jù)集已是迄今為止最大的數(shù)據(jù)。注釋員使用 SAM 交互式地注釋圖像，然后新注釋的數(shù)據(jù)反過來更新 SAM，重復(fù)執(zhí)行此循環(huán)來改善模型和數(shù)據(jù)集。

SA－1B 圖像數(shù)據(jù)集包含超過11億個(gè)掩碼，這些掩碼是從1100萬張已經(jīng)獲得許可、并且保護(hù)隱私的高分辨率圖像中收集的，這些圖像的分辨率達(dá)到了1500×2250 pixels，平均每張圖像約有100個(gè)掩碼。甚至可以媲美以前規(guī)模小得多、完全手動(dòng)注釋的數(shù)據(jù)集中的掩碼。

Meta 官方稱，通過在業(yè)內(nèi)共享這項(xiàng)研究和數(shù)據(jù)集，進(jìn)一步加速對分割圖像視頻的研究，為AR／VR、內(nèi)容創(chuàng)作、科學(xué)領(lǐng)域和更普遍的 AI 系統(tǒng)等領(lǐng)域的強(qiáng)大組件，釋放出更加強(qiáng)大、通用的人工智能系統(tǒng)。

本地收藏打印推薦給朋友

聲明： 本網(wǎng)站所刊載信息，不代表OFweek觀點(diǎn)�？帽菊靖寮�，務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像，違者將依法追究法律責(zé)任。

發(fā)表評論

共0條評論，0人參與

登錄登錄即可訪問所有OFweek服務(wù)

用戶名/郵箱/手機(jī)：
密碼：
忘記密碼？
用其他賬號(hào)登錄： QQ | 微信 | 新浪微博

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

暫無評論

暫無評論

圖片新聞

最新發(fā)布

最新活動(dòng)更多

6月20日
立即下載>> 【白皮書】精準(zhǔn)測量安全高效——福祿克光伏行業(yè)解決方案
7月3日
立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
7月22-29日
立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
7.30-8.1
火熱報(bào)名中>> 全數(shù)會(huì)2025（第六屆）機(jī)器人及智能工廠展
7月31日
免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
免費(fèi)參會(huì)
立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展

一周熱點(diǎn) 月點(diǎn)擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報(bào)告

人工智能獵頭職位更多

掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯(cuò)

x

_*文字標(biāo)題：

_*糾錯(cuò)內(nèi)容：

聯(lián)系郵箱：

_*驗(yàn) 證碼：

看不清，點(diǎn)擊換一張

粵公網(wǎng)安備 44030502002758號(hào)

感谢您访问我们的网站，您可能还对以下资源感兴趣：

99久久免费精品国产对白

中文字字幕在线中文乱码6互动交流久久久性爱视频性久久久久美女黄免费 97久久精品人人

<blockquote id="0ouml"><delect id="0ouml"></delect></blockquote>

<option id="0ouml"><rp id="0ouml"><optgroup id="0ouml"></optgroup></rp></option>

<blockquote id="0ouml"><rp id="0ouml"><track id="0ouml"></track></rp></blockquote>