Stable Video Diffusion來了!普通人拍大片指日可待
作者:小巖
隨著技術(shù)的不斷進步,AI領域取得了巨大的突破。特別是在圖片生成這個賽道,AI目前能做到的成績超乎想象;蛟S就在1年以前,很多人,特別是一些專業(yè)從業(yè)者對AI繪畫的印象還停留在“元素要靠東拼西湊”“廢圖率太高”“成品無法直接使用”等方面,但如今,高質(zhì)量AI繪圖軟件的表現(xiàn)完全可以顛覆你的固有認知。
而Stable Diffusion便是其中的典型代表。用Stable Diffusion完成的AI繪圖,不僅能夠精準地呈現(xiàn)人體姿態(tài)和畫面層次感,還擁有復雜的三維結(jié)構(gòu),更支持用戶對圖片細節(jié)進行調(diào)整。
如今,Stable Diffusion的官方Stability AI走得更遠了。不僅在AI繪畫領域表現(xiàn)優(yōu)秀,還推出了Stable Video Diffusion,這款技術(shù)不僅具有強大的3D合成功能,更可以為視頻制作帶來巨大的變革。也就是說,它的出現(xiàn)大大降低了視頻拍攝的門檻,讓普通人也可以輕松拍大片。
什么是Stable Video Diffusion?
Stable Video Diffusion是一種先進的視頻合成技術(shù),它能夠?qū)⒄鎸崍鼍芭c虛擬物體完美地融合在一起,呈現(xiàn)出非常逼真的效果。這種技術(shù)可以應用于電影制作,游戲開發(fā),廣告創(chuàng)意等多個領域,從而為視頻制作帶來更多的可能性和創(chuàng)造性。
與傳統(tǒng)的視頻合成技術(shù)相比,Stable Video Diffusion最大的優(yōu)勢顯然是物美價廉。先說“物美”,因為AI軟件本身采用了深度學習的方法,對大量數(shù)據(jù)進行訓練,使得合成的視頻更加真實,自然。同時,這一AI技術(shù)還可以實現(xiàn)對細節(jié)的完美還原,例如物體的紋理、光線和陰影等等,可以說是十分逼真。再來說“價廉”,以前需要耗費大量人力物力來完成的視頻制作工作,如今可能只需要通過Stable Video Diffusion就可以了,這就大大降低了成本。
Stable Video Diffusion的另一個重要特點是能夠?qū)崿F(xiàn)3D合成。通過這項技術(shù),制作人員可以創(chuàng)建出各種神奇的場景和效果,例如將現(xiàn)實中的物體搬到虛擬場景中,或者將多個虛擬物體組合在一起。這為電影制作帶來了更多的創(chuàng)意空間和可能性。
除了電影制作和游戲開發(fā)外,Stable Video Diffusion還很有可能在廣告創(chuàng)意領域發(fā)揮重要的作用。廣告商可以利用這項技術(shù)創(chuàng)造出各種獨特的場景和效果,吸引消費者的注意力。
3D合成引發(fā)關(guān)注,網(wǎng)友紛紛表示:進步太快!
根據(jù)Stable Video Diffusion官方網(wǎng)站Stability AI顯示的信息,全新SVD(簡稱)支持文本到視頻,圖像到視頻的生成;支持物體從單一視角到多視角的轉(zhuǎn)化,也就是大家所期待的3D合成。
盡管Stable Video Diffusion目前只是發(fā)布了基礎模型,但已經(jīng)受到了外界的廣泛關(guān)注和好評,網(wǎng)友們普遍表示“進步太快”。官方透露,“正計劃繼續(xù)擴展,建立類似于Stable Diffusion的生態(tài)系統(tǒng)”。不過,對于官方發(fā)布的Demo,很多網(wǎng)友并不覺得有多驚艷,甚至認為其中存在缺陷,諸如光影不對;幀與幀之間有閃爍等等。
以下就是官方所發(fā)布的Demo,大家自行感受一下。
目前,Stable Video Diffusion的論文代碼權(quán)重已經(jīng)上線。根據(jù)介紹,SVD基于Stable Diffusion 2.1,使用了約6億個樣本的視頻數(shù)據(jù)集預訓練了基礎模型。它可以輕松適應各種下游任務,包括通過對多視圖數(shù)據(jù)集進行微調(diào)從單個圖像進行多視圖合成。
需要說明的是,Stability AI官方明確表示,Stable Video Diffusion僅限于研究,不適用于實際或商業(yè)應用。所以,它還不具備被大規(guī)模應用的條件。不過,官方已經(jīng)開放了用戶候補名單注冊,這意味著我們普通小白也可以使用上這項技術(shù),過一過“一鍵拍大片”的癮。?
視頻生成迎來大爆發(fā),誰會成為最后的贏家?
最近一段時間,視頻生成領域呈現(xiàn)出一種“混戰(zhàn)”的局面,各種優(yōu)秀產(chǎn)品冒頭,大有百家爭鳴的勢頭。
前有PikaLabs開發(fā)的文生視頻AI。
之后Moonvalley推出了自己的作品,它素有“史上最強大的視頻生成AI”。
最近Gen-2的推出了“運動筆刷”功能,輕松實現(xiàn)“指哪畫哪”。
再加上如今驚艷亮相的Stable Video Diffusion,我們可以預見,AI視頻生成領域競爭十分領域,大家卷的如火如荼,很難說誰會成為最后的贏家。
視頻生成領域隸屬于生成式AI技術(shù)的范疇。隨著AI技術(shù)的不斷發(fā)展,生成式AI行業(yè)正在逐漸崛起。目前,該行業(yè)處于高速發(fā)展的階段,市場規(guī)模不斷擴大,預計未來依舊會繼續(xù)保持快速增長的速度。根據(jù)市場研究機構(gòu)的數(shù)據(jù)顯示,預計到2029年,行業(yè)的市場規(guī)模將達到100億美元。
這會是一塊肉眼可見的,極其美味的大蛋糕。
原文標題 : 新火種AI | Stable Video Diffusion來了!普通人拍大片指日可待

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機器人領域,聯(lián)通、海爾、美的等紛紛入局