看見未來!Meta這項(xiàng)最新的AI技術(shù),讓我們離AI電影又近了一步
《復(fù)仇者聯(lián)盟》導(dǎo)演喬·羅素曾表示,他相信終有一天AI可以自己生成一部電影。
放在以前你可能覺得這是天方夜譚,因?yàn)橐徊坑捌闹谱魇且粋(gè)上百人的團(tuán)隊(duì)共同合作的結(jié)果。一個(gè)小小的AI怎么可能代替上百人,真要那樣的話大導(dǎo)演們都直接原地退休了!
但是經(jīng)過這段時(shí)間AI技術(shù)的沖擊,不少人已經(jīng)被刷新了認(rèn)知。AI能做的事,遠(yuǎn)遠(yuǎn)超過人們能想象的,包括制作一部電影。
社交巨頭Meta最新發(fā)布的AI技術(shù),讓我們離AI電影又近了一步。
Emu Video和Emu Edit
OpenAI之前發(fā)布的全新DALL-E 3文生圖引擎,已經(jīng)讓我們驚嘆。更別說后來的文本轉(zhuǎn)語音模型,以及能夠?qū)崟r(shí)語音對話的ChatGPT。
但是Meta最新發(fā)布的AI技術(shù),顛覆了我們對AI生成內(nèi)容的固有認(rèn)知。
Meta發(fā)布的新AI技術(shù)涉及內(nèi)容編輯和生成,并推出了兩款全新的AI模型——Emu Video和Emu Edit。Emu Video 采用的是Meta之前發(fā)布的Emu模型,能夠基于文本和圖像輸入生成視頻剪輯。而Emu Edit則主要用于圖像處理,用Meta自己的話來說,Emu Edit比之前的圖像編輯更精確,更好用。
雖然目前兩款模型仍在研究開發(fā)階段,但是Meta對其有著充足的信心,他們認(rèn)為這將對影視創(chuàng)作者、藝術(shù)家甚至是插畫師都有巨大的應(yīng)用潛力。
根據(jù)Meta官方描述,Emu Video 采用了“分解式”訓(xùn)練方法,將訓(xùn)練過程分為兩步,使模型能夠?qū)Σ煌斎胱龀鲰憫?yīng)。
AI模型將生成過程分成兩步:首先根據(jù)文本提示生成圖像,然后根據(jù)文本和生成的圖像生成視頻。這種“分解式”或分步的視頻生成方法讓模型能夠高效地訓(xùn)練視頻生成模型。
舉例來說,給定一個(gè)標(biāo)題(例如“一只狗跑過草地小丘”)、圖像或照片以及描述,Emu Video 可以生成一個(gè)四秒的動畫剪輯視頻。別看只有四秒,但是它是一段擁有512×512像素,每秒16幀的高質(zhì)量視頻。
來源:Meta
Emu Edit專注于圖像處理,用戶可以用它來去除或添加圖像背景、執(zhí)行色彩和幾何變換,以及對圖像進(jìn)行局部和全局編輯。Meta認(rèn)為,模型的主要目標(biāo)不應(yīng)僅僅是產(chǎn)生一個(gè)“可信”的圖像。相反,模型應(yīng)專注于精確地改變與編輯請求相關(guān)的像素。
據(jù)了解,Meta使用了計(jì)算機(jī)視覺任務(wù)來訓(xùn)練Emu Edit。訓(xùn)練用的數(shù)據(jù)集包括 1000 萬張合成圖像,每張圖像都有輸入圖像、任務(wù)描述以及目標(biāo)輸出圖像。用他們的話說,這是迄今為止同類中最大的數(shù)據(jù)集。
而在此之前,Meta的CEO馬克扎克伯格發(fā)布Emu模型時(shí)就談到,用來訓(xùn)練該模型的數(shù)據(jù)高達(dá)11億條,其中包括Facebook 和 Instagram 用戶分享的照片和標(biāo)題。
先進(jìn),但并不完美
不能否認(rèn),Emu Video和Emu Edit的出現(xiàn),確實(shí)是行業(yè)的一大進(jìn)步。但別看Meta把這兩個(gè)模型吹得神乎其神,他們也不是完美的,一些匪夷所思的現(xiàn)象仍然存在。
在生成的一些視頻里面,就有明顯奇怪的物理現(xiàn)象(例如平行于地面移動的滑板)和怪異的附肢(腳趾卷曲在腳后和腿相互融合)。物體的出現(xiàn)和消失也常常沒有太多邏輯,就像埃菲爾鐵塔片段中頭頂上的鳥兒一樣。
來源:Meta
其次,剪輯中的主題并沒有起多大的作用。據(jù)了解,這可能是模型基礎(chǔ)架構(gòu)的限制原因,導(dǎo)致了Emu Video 似乎對動作動詞沒有很強(qiáng)的把握。
例如,一只可愛的擬人化浣熊會拿著一把吉他,但它不會彈奏吉他 - 即使剪輯的標(biāo)題包含“彈奏”一詞;蛘邇芍华(dú)角獸會“下”國際象棋,但它們只是好奇地坐在棋盤前但卻不移動棋子。
來源:Meta
結(jié)語
說回漫威。AI生成視頻引發(fā)最大爭議的,是之前一部漫威的劇集——《秘密入侵》。這部劇集的片頭一出來,給人一種很怪異的感覺。當(dāng)時(shí)就有人稱,這個(gè)片頭使用AI生成的。隨著傳聞發(fā)酵,幕后工作室承認(rèn)他們在制作時(shí)用到了文生圖模型Midjourney。消息一經(jīng)發(fā)布,立刻引起了業(yè)內(nèi)人士和部分民眾的強(qiáng)烈抗議。
來源:網(wǎng)絡(luò)
就在這件事不久之后,好萊塢史上持續(xù)時(shí)間最長,規(guī)模最大的演員和編劇罷工潮開始。罷工的原因之一,就是生成式AI在影視工作中,威脅到了人類的地位。
來源:網(wǎng)絡(luò)
目前,好萊塢已經(jīng)同演員工會和編劇工會達(dá)成協(xié)議,罷工告一段落。但是照現(xiàn)在AI技術(shù)的速度,取代人工剪輯師,似乎并不是多么遙遠(yuǎn)的事。到時(shí),業(yè)界又會做出何種反應(yīng)?
如果一部電影,從劇本到制作,全都由AI來操作。你會選擇去電影院看嗎?

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動力電池技術(shù)應(yīng)用大會
-
免費(fèi)參會立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報(bào)告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機(jī)器人領(lǐng)域,聯(lián)通、海爾、美的等紛紛入局