把Sora拉下神壇,首個(gè)國(guó)產(chǎn)開源模型SkyReels-V1為短劇創(chuàng)作者披上“AI戰(zhàn)衣”
短劇作為熱度最高、用戶最廣的內(nèi)容形態(tài)之一,近年來(lái)進(jìn)入爆發(fā)階段。
不僅為影視創(chuàng)作者帶來(lái)豐厚的回報(bào),也成為科普作者、品牌們競(jìng)爭(zhēng)追逐的形式,以更有創(chuàng)意的手段來(lái)觸達(dá)用戶。而AI技術(shù),對(duì)于短劇創(chuàng)作模式的改變,以意想不到的速度發(fā)生了。
此前,Sora、Runway等視頻生成模型的誕生,能夠制作出質(zhì)量不算太差的AIGC視頻,提高了短劇的生產(chǎn)效率。但其主要是少數(shù)創(chuàng)作者的工具,廣大普通人很難解鎖。
2月18日,昆侖萬(wàn)維發(fā)布并開源SkyReels-V1視頻大模型,并同步開源了基于視頻基座模型的表情動(dòng)作可控算法SkyReels-A1。
作為中國(guó)首個(gè)面向AI短劇生成的開源模型,SkyReels-V1讓每一個(gè)普通人都能披上“AI戰(zhàn)衣”,化身短劇創(chuàng)作的超級(jí)戰(zhàn)士。
當(dāng)千千萬(wàn)萬(wàn)普通人向短劇市場(chǎng)奔赴而來(lái),那么AI短劇的新世界,也就被SkyReels-V1打開了。
大模型和AIGC的視頻生成能力,賦予了短劇創(chuàng)作無(wú)限的生機(jī)。
理論上講,只要有創(chuàng)意,有靈感,其他如劇本、人物、鏡頭等,都可以通過(guò)生成來(lái)實(shí)現(xiàn),極大地提升短劇的生產(chǎn)效率。
但現(xiàn)實(shí)中,此前視頻生成模型在短劇領(lǐng)域也存在不少桎梏,導(dǎo)致AI短劇未能爆發(fā):
1.用不到。Sora閉源模型的技術(shù)壟斷,許多短劇創(chuàng)作者無(wú)法通過(guò)先進(jìn)模型來(lái)進(jìn)行創(chuàng)作,生產(chǎn)效率不高。
2.不好用。受限于模型能力,此前AI短劇的人物,大多都存在“恐怖谷效應(yīng)”,即表情或肢體僵硬不自然,很接近人類又不夠逼真,讓觀眾無(wú)法代入。
比如我們希望某視頻生成模型讓林黛玉動(dòng)起來(lái),但表情從憂愁到笑容的過(guò)渡不夠細(xì)膩,細(xì)微的表情變化沒(méi)有體現(xiàn)出來(lái),手部活動(dòng)也顯得呆板,整體就不夠自然。
3.用不起。Sora等閉源模型的訂閱費(fèi)昂貴,ChatGPT Pro版高達(dá)200美元/月,而且調(diào)整畫面需要反復(fù)生成,tokens消耗巨大,成本和經(jīng)濟(jì)負(fù)擔(dān)也很高。
不難看到,AI短劇要爆發(fā),第一步是國(guó)產(chǎn)化,在視頻生成模型打破Sora等海外模型的壟斷;第二步是擬人化,讓AI演員走出“恐怖谷”,表演更加生動(dòng)自然、惟妙惟肖,才能確保AI短劇有比較好的內(nèi)容質(zhì)量;第三步則是開源,讓廣大普通人也能用得到、用得起。
中國(guó)首個(gè)面向AI短劇生成的開源模型SkyReels-V1,便完成了一次“走出恐怖谷”的技術(shù)跋涉。
很多觀眾吐槽內(nèi)娛演員的是“人機(jī)式演技”,一個(gè)主要問(wèn)題就是演員的表情讓人出戲,要么缺乏變化,無(wú)論高興、害怕、憤怒,都只會(huì)面無(wú)表情地瞪大雙眼,看起來(lái)十分僵硬呆板,要么五官亂飛,在一些情緒激烈的表演中控制不好表情。
對(duì)于豎屏為主的短劇,人物一般是畫面的焦點(diǎn)與核心,情緒主要是由微表情和肢體動(dòng)作來(lái)渲染的,因此更考驗(yàn)演技。所以,模型生成的AI演員人物,必須像老戲骨一樣,能夠?qū)δ槻课⒈砬,進(jìn)行精準(zhǔn)控制。
比如同樣是林黛玉,我們用SkyReels-V1生成的動(dòng)態(tài)視頻,表情更為豐富,過(guò)渡也更加自然,細(xì)節(jié)特征拉滿。
相比傳統(tǒng)視頻生成模型,SkyReels-V1能夠生成影帝級(jí)微表情,極大增強(qiáng)了視頻生成的可控性。進(jìn)一步深挖,會(huì)發(fā)現(xiàn)這得益于昆侖萬(wàn)維自研的表情動(dòng)作可控算法SkyReels-A1,讓AI演員的演技有了極大突破。
演好一個(gè)短劇角色,AI首先得有豐富的表達(dá)能力。SkyReels-A1可以實(shí)現(xiàn)11種人物表情理解,針對(duì)影視戲劇中的表情,如不屑、不耐煩、無(wú)助、厭惡等,能夠結(jié)合劇本情境做出各式各樣的表情。
接下來(lái),算法還得驅(qū)動(dòng)人物面部,高度還原出類似真人的微表情表演。相比runway act-one,SkyReels-A1實(shí)現(xiàn)了更大幅度的人物表情驅(qū)動(dòng),讓人物表演看起來(lái)更有感染力,完成電影級(jí)的表現(xiàn)。
下面這個(gè)片段中,男主角看到敵人的皺眉、戰(zhàn)斗時(shí)堅(jiān)毅的眼神、最后奔跑時(shí)腎上腺素飆升的緊張感……這些細(xì)節(jié)都精細(xì)地體現(xiàn)了出來(lái)。
此外,好演員的“聲臺(tái)行表”缺一不可,表情、情緒與人物動(dòng)作都要相得益彰。這種動(dòng)態(tài)過(guò)程很容易丟失細(xì)節(jié)、前后不一致,導(dǎo)致觀眾出戲。SkyReels-A1能夠深度還原表情變化、皮膚肌理、身體動(dòng)作跟隨等多維度細(xì)節(jié),并保持一致性。
下面女孩在手臂大幅度動(dòng)作時(shí),面部的表情沒(méi)有失真,另一側(cè)身體幾乎沒(méi)有任何運(yùn)動(dòng),看起來(lái)更像真人。
目前,SkyReels-A1已經(jīng)成為開源生態(tài)中最佳的圖生視頻模型,生成效果超越了Runway等模型。
SkyReels-A1的算法突破,助力AI演員的演技實(shí)現(xiàn)突破,告別“人機(jī)式”演戲。
當(dāng)AI走出“恐怖谷”,不但能傳遞喜怒哀樂(lè)等主要情緒,還能更精準(zhǔn)地表達(dá)出困惑、嫉妒、艷羨、焦慮等更深層的情緒,無(wú)疑會(huì)讓AI短劇更具備感染力,內(nèi)容制作和消費(fèi)都更上一層樓。
有了影帝級(jí)演員,是不是一部劇的質(zhì)量就有了保證呢?顯然不是。
要拍出一部高質(zhì)量AI短劇,創(chuàng)作者一個(gè)人要成為一支隊(duì)伍,從劇本創(chuàng)作、鏡頭調(diào)度、劇情銜接、演員站位等,樣樣手到擒來(lái)。聽(tīng)起來(lái)很有挑戰(zhàn),昆侖萬(wàn)維打造的中國(guó)首個(gè)面向短劇生成的模型SkyReels-V1,就像一件“全能戰(zhàn)衣”,可以賦予創(chuàng)作者強(qiáng)大的內(nèi)容戰(zhàn)力。具體來(lái)說(shuō):
首先,補(bǔ)齊了能力短板。
普通人缺少的專業(yè)影像能力,就被SkyReels-V1補(bǔ)齊了。基于好萊塢級(jí)的高質(zhì)量影視數(shù)據(jù)訓(xùn)練而成,SkyReels-V1生成的每一幀畫面,在構(gòu)圖、演員站位、相機(jī)角度等都具備電影級(jí)的質(zhì)感,并帶有14種工業(yè)化標(biāo)準(zhǔn)運(yùn)鏡模板,覆蓋推拉搖移等專業(yè)拍攝技法,哪怕沒(méi)有編導(dǎo)經(jīng)驗(yàn),普通人也可以借助模型中內(nèi)置的模版,輕松完成空鏡、特寫、人物占位等畫面的生成與銜接,拍出爽感十足的劇情。
其次,拆除了制作門檻。
SkyReels-V1支持文生視頻、圖生視頻等多種模式,創(chuàng)作者只需要出創(chuàng)意,一些制作難度大的置景、服裝等,可以全由SkyReels-V1一鍵生成。
我們讓SkyReels生成了一個(gè)“絲綢朋克”風(fēng)格的科幻世界,只需提示詞We travel through a cyberpunk world that interweaves retro and future……一鍵AI生成的畫面中,蒸汽竹械塔樓纏繞著蠶絲光纜,紅燈籠映照著青瓷動(dòng)力爐,還自帶運(yùn)鏡,科幻大片也是叫咱拿捏了。
如果擔(dān)心文字描述得不夠清楚,或者希望AI參考具體圖片來(lái)創(chuàng)作,可以直接把圖片交給SkyReels-V1。
另外值得一提的是,SkyReels-V1有效解決了困擾創(chuàng)作者的成本難題。
此次SkyReels-V1模型的成本優(yōu)勢(shì)進(jìn)一步優(yōu)化,借助自研的推理優(yōu)化框架,SkyReels-V1可以在4090計(jì)算硬件上只用75秒,完成512P分辨率的推理,還支持分布式多卡并行,采取fp8 quantization以及parameter-level offload,可以滿足低顯存用戶級(jí)顯卡運(yùn)行需求,進(jìn)一步降低了對(duì)創(chuàng)作者的硬件要求。
實(shí)測(cè)下來(lái),生成畫質(zhì)1080p視頻,常規(guī)配置的個(gè)人筆記本電腦就能輕松搞定。
目前,在同等分辨率下,SkyReels-V1的各項(xiàng)指標(biāo)達(dá)到SOTA級(jí)別,可以支撐AI短劇的工業(yè)級(jí)生產(chǎn)。
總體來(lái)說(shuō),披上SkyReels-V1的AI戰(zhàn)衣,普通人的內(nèi)容戰(zhàn)力得到全方位加強(qiáng),能夠打破AI短劇生產(chǎn)效率的桎梏,自由釋放創(chuàng)意,叱咤短劇宇宙。
AI短劇走出表演的“恐怖谷”,打破生產(chǎn)效率的桎梏,SkyReels-V1成為普通UGC用戶擁抱AI短劇的一條直達(dá)路。
更進(jìn)一步,我們發(fā)現(xiàn)在智能晨曦中探索的創(chuàng)作者,既有充沛的機(jī)遇和需求,也面臨大量的挑戰(zhàn)、困難與麻煩。接入昆侖萬(wàn)維的AI開源生態(tài),是距離最短、成本最低的選擇。
可以用三個(gè)詞,總結(jié)昆侖萬(wàn)維的開源特點(diǎn):
1.真開源。與“僅放出模型,不開源參數(shù)”等偽開源不同,昆侖萬(wàn)維對(duì)底層模型、關(guān)鍵算法、工具包等,都進(jìn)行了開源,切實(shí)普惠全球用戶和開發(fā)者。目前SkyReels-V1模型與SkyReels-A1的技術(shù)paper已經(jīng)在github開放。
2.最領(lǐng)先。昆侖萬(wàn)維的開源模型生態(tài),覆蓋多個(gè)模態(tài)、多種模型,除了此次開源的面向AI短劇生成的SkyReels-V1模型,早在2022年12月,ChatGPT和LLM大模型尚未爆火,「昆侖天工」AIGC全系列算法與模型,就宣布了開源。可以說(shuō),昆侖萬(wàn)維是目前國(guó)內(nèi)AIGC領(lǐng)域最全面、先進(jìn)的開源生態(tài)體系之一,降低了AIGC技術(shù)在各行各業(yè)的使用和學(xué)習(xí)門檻。
3.可持續(xù)。昆侖萬(wàn)維是國(guó)內(nèi)第一個(gè)全身心投入AIGC開源社區(qū)的公司。從2022年底開啟開源,至2023年10月,昆侖萬(wàn)維宣布開源百億級(jí)大語(yǔ)言模型「天工」Skywork-13B系列,并配套開源了600GB、150B Tokens的超大高質(zhì)量開源中文數(shù)據(jù)集。2024年開始,公司陸續(xù)開源了數(shù)字智能體全流程研發(fā)工具包AgentStudio、「天工大模型3.0」4000億參數(shù)MoE超級(jí)模型、2千億稀疏大模型Skywork-MoE、Skywork-o1-Open等模型。開源策略可預(yù)期,產(chǎn)品迭代有保障,才能成為AI開發(fā)者信任的伙伴,也讓昆侖萬(wàn)維的開源生態(tài)持續(xù)壯大。
開源精神的迷人之處,在于發(fā)揮“眾智”,這與昆侖萬(wàn)維的使命——“實(shí)現(xiàn)通用人工智能,讓每個(gè)人更好地塑造和表達(dá)自我”是高度一致的。昆侖萬(wàn)維董事長(zhǎng)兼CEO方漢曾公開表示,堅(jiān)信開源是推動(dòng)AIGC生態(tài)發(fā)展的土壤和重要力量。
當(dāng)大量開發(fā)者和普通人,都能在昆侖萬(wàn)維的開源生態(tài)中,以低門檻甚至零門檻來(lái)獲取最新AI技術(shù),充分釋放靈感與想象力,創(chuàng)新自然噴薄而出,內(nèi)容也將豐富多元。最終體現(xiàn)在基于開源的創(chuàng)新產(chǎn)品,在體量規(guī)模與質(zhì)量上,都遠(yuǎn)遠(yuǎn)超越了只能集中少數(shù)精英的閉源模式。同時(shí),也推動(dòng)了全球的技術(shù)平權(quán)和文化平權(quán)。
所以說(shuō),SkyReels-V1/SkyReels-V1-A1的開源,就像是一個(gè)超級(jí)英雄故事的開始,把強(qiáng)大的戰(zhàn)衣交給創(chuàng)作者,普通人也可以創(chuàng)造奇跡。
原文標(biāo)題 : 把Sora拉下神壇,首個(gè)國(guó)產(chǎn)開源模型SkyReels-V1為短劇創(chuàng)作者披上“AI戰(zhàn)衣”

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-6.16立即報(bào)名>> 【在線會(huì)議】olution Talks |Computex 2025關(guān)鍵趨勢(shì)深讀
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單
- 10 “搶灘”家用機(jī)器人領(lǐng)域,聯(lián)通、海爾、美的等紛紛入局