AI,開啟數字人3.0時代
作者|顧硯
2021年開始元宇宙概念火爆,數字人市場也持續(xù)升溫。
去年10月,虛擬美妝達人柳葉熙在抖音上傳了自己的第一條作品,一夜間漲粉百萬;年末,出道9年的洛天依登上春晚舞臺,與月亮姐姐、王源共同表演少兒歌舞《聽我說》;今年5月,虛擬偶像Vox宣布入駐B站,首日直播營收就破百萬……
根據《虛擬數字人深度產業(yè)報告》,預計到2030年我國虛擬人整體市場規(guī)模將達到2700億元。
虛擬數字人最早可追溯到2007年,彼時,以語音合成程序為基礎開發(fā)的音源庫“初音未來”,成為首個現象級虛擬偶像。
此后一段時間,虛擬數字人也多以二次元的形象出現。2D“紙片人”,是1.0階段的數字人代表。
2016年6月,人工智能絆愛“喚醒自我”,她是YouTube上一個虛擬主播。如今,虛擬主播熱潮已經席卷全球。
據艾媒咨詢發(fā)布的《2021中國虛擬偶像行業(yè)發(fā)展及網民調查研究報告》,2020年中國虛擬偶像核心產業(yè)規(guī)模為34.6億元,預計2021年將達到62.2億元。
“皮套人”,是2.0階段的數字人代表,他們依賴模型、動捕,也依賴“中之人”的表演,為數字人賦予靈魂。
去年6月,由小冰公司推出的華智冰亮相并進入清華大學計算機系知識工程實驗室。作為AI學生,華智冰的旁白、背景音樂、面容、詩詞以及繪畫作品,均基于AI技術生成。
今年6月7日,全網熱議高考作文《本手、妙手、俗手》難度之際,百度AI數字人度曉曉40秒創(chuàng)作了40多篇文章,平均1秒生成1篇,隨機抽取其中一篇,被語文名師申怡評為48分(滿分60分),其分數已趕超約75%高考考生。
由AI驅動,數字人進化到3.0時代。
AI數字人能做什么?
在商湯科技發(fā)布的《AI數字人:數字經濟發(fā)展新動能》白皮書中將數字人按照進化程度分為5類(L1-L5),并指出“L4 的AI數字人可以從大量的人類對話、面部表情和肢體語言中學習。它可以通過自然的面部表情和肢體動作來實現智能的類人交互”。
這意味著,AI數字人將不依賴“中之人”,完全由AI驅動。它不僅是具有數字化外形的虛擬人物,擁有人的外觀、人的行為之外,還擁有人的思想,具有識別外界環(huán)境、并能與人交流互動。
換言之,AI數字人才是元宇宙中的“原住民”。
完成這一轉變的核心在于對“深度學習能力”的重視。
深度學習能力即機器學習的一種,需要用大量的數據“喂養(yǎng)”白紙一樣的機器人,直到他們能聽懂并回答客戶的問題。
這是一個需要數據、算法、算力結合,不斷訓練、調整、打磨模型的長期過程,但一旦核心技術實現突破,AI數字人的優(yōu)勢和應用領域將更加多元。
比如度曉曉,除了能創(chuàng)作高考作文,還能AI繪畫、創(chuàng)作歌曲,還曾作為工人日報特派“AI記者”,采訪五一勞模等等。而另一百度AI數字人希加加,她同樣會作畫、寫詩、作曲、說多國語言、還能實時直播。
除了能“像人一樣”學習、溝通、工作,AI數字人將擁有超強的創(chuàng)造力,顛覆現有的內容生產模式。
AIGC,是指人工智能自動生成內容,這是AI領域目前的熱門概念之一,它將顛覆現有的內容生產模式。
基于這項技術,度曉曉在挑戰(zhàn)高考語文作文時,可以做到平均1秒1篇,畫一幅畫,只需要幾十秒。與人類生產效率相比,這是指數級的提升。
而這一切,源于百度搜索引擎海量數據的先天優(yōu)勢、產業(yè)級深度學習平臺飛槳和產業(yè)級“知識增強”大模型文心。
百度自2019年開始便深耕預訓練模型研發(fā),成功打造飛槳文心大模型家族。文心系列模型具備“知識增強”的核心特色,基于持續(xù)學習的語義理解框架,從大規(guī)模知識和海量數據中融合學習。
比如,數字人畫畫能力,使用的是文心大模型——跨模態(tài)圖文生成模型ERNIE-ViLG;而人對話能力,使用的是對話生成大模型——文心 PLATO,PLATO有接近真人水平的對話能力,對話效果已經達到世界領先水平。
另一方面,憑借深度學習能力,處于較高發(fā)展水平的數字人可以快速從各種場景中獲取知識,成為特定領域的“專家”。
AI數字人可以深入B端領域,實現降本增效。比如科大訊飛推出智醫(yī)助理;商湯科技AI數字人出現在醫(yī)院場景中,為患者進行分診導診;百度和浦發(fā)銀行打造的“數字員工”小浦,每月為46萬人提供金融服務。
頭部互聯網企業(yè)早已加入構建數字人技術的浪潮之下。目前,華為、百度、阿里、騰訊、字節(jié)跳動等,都已著手于數字人的開發(fā)應用。
“數字人自由”
未來,AI數字人可以承擔更多的工作和責任,但目前來看,AI數字人的大規(guī)模落地依然面臨各種挑戰(zhàn)。
首先,AI深度學習是一場長期且價格高昂的訓練。比如,一個簡單的模型調整,可能要增加百倍以上的計算資源。而谷歌子公司 DeepMind 訓練AlphaGo下圍棋時,估計耗資3500萬美元。
另外,如何優(yōu)化算法來提升效率與穩(wěn)定性,如何提高機器學習與深度神經網絡預測的準確度等,也是 AI 技術面臨的挑戰(zhàn)。而無法自主學習、無法互動的數字人,也就失去了AI的靈魂。
其次,AI數字人也會使用動作捕捉采集表情/動作數據、CG技術合成,這需要龐大的開發(fā)制作和設備運維成本。
36氪此前報道,一場全息虛擬演唱會的成本大概在 2000 萬上下。騰訊NExT Studios團隊也進一步印證該觀點,“一個超寫實虛擬數字人形象恐怕至少要投入100至200萬制作費用才能不至羞于見人,甚至即便投入了也未必能做出令人滿意的角色”。
另一方面,合格數字人的制作周期也非常長。數字人一分鐘視頻,可能需要2到3個月時間制作。
天風證券研報也指出虛擬數字人行業(yè)生存及運營成本高昂的發(fā)展難題,報告認為,未來很長一段時間,降本增效將會是企業(yè)的重點。
隨著技術的推進,AI數字人也在不斷突破。
5年前,百度在AI開發(fā)者大會上喊出“All in AI”的口號;如今,百度已經打造了一個“AI數字人家族”,度曉曉、希加加、文夭夭……這背后,正是百度智能云曦靈數字人平臺,通過全場景、平臺化的能力為企業(yè)和品牌提供數字人的制作和運營服務。
近日,度曉曉在《2022虛擬數字人商業(yè)價值潛力》榜單中排名第一;在第三方機構發(fā)布的榜單中,百度因為語音、視覺等AI能力的積累,在數字人綜合實力方面排名第一。
在日前“2022百度世界大會”媒體預溝通會上,百度集團副總裁袁佛玉介紹:“隨著百度AI算法的突破,我們能讓數字人制作成本十倍、百倍地下降,還能讓數字人生產周期,從動輒幾個月,縮短到小時級別!
降低AI應用門檻,驅動AI規(guī);涞貞茫前俣任男拇竽P偷暮诵膬r值。
今年4月,2021百度認知AI創(chuàng)意賽“AI創(chuàng)意派”決賽正式舉行,這是業(yè)內首次將先進的AI大模型能力開放給公眾使用。
“只有門檻低到了所有人都可方便地用起來,才能真正大規(guī)模爆發(fā)出各種創(chuàng)意!卑俣燃瘓F副總裁吳甜稱。
目前,文心大模型已大規(guī)模應用于搜索、信息流、智能音箱等互聯網產品,并通過飛槳開源開放平臺、百度智能云賦能工業(yè)、能源、金融、通信、媒體、教育等各行各業(yè)。
現在,我們可以在多個場景看見百度AI數字人的身影:
在2022年的北京冬奧會上,百度AI手語主播根據真人主播的聲音和畫面,實時轉換為手語,24小時無休;今年5月文博虛擬宣推官“文夭夭”正式持證上崗,為各大博物館提供講解、導覽、直播等服務;度曉曉不僅可以“陪聊”——接近真人水平的多輪流暢對話,并在對話中識別用戶的搜索、服務類需求。
早在2019年,李彥宏就預測,在旅游咨詢、醫(yī)療健康、移動通訊等領域,數字人都將大顯身手,“每個人都會有一個甚至多個專屬的數字人為你服務,相信這個時代很快就會到來”。
近期IDC發(fā)布的報告顯示,中國AI數字人市場規(guī)模呈現高速增長趨勢,預計到2026年將達102.4億元人民幣。
而這一切都源于百度對AI領域壓強式、馬拉松式的研發(fā)投入,公開數據顯示,在研發(fā)投入方面,2021年百度核心研發(fā)費用221億元,占百度核心收入比例達23%,研發(fā)投入強度位列中國民營企業(yè)500強第一位。
巨頭涌入、熱錢涌動,堅持長期主義的企業(yè),將會在數字人3.0時代,迎來回報期。
此內容為鞭牛士原創(chuàng),未經授權不得轉載
原文標題 : AI,開啟數字人3.0時代

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權
- 3 深度報告|中國AI產業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數據局局長劉烈宏調研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產元年誰在領跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機器人領域,聯通、海爾、美的等紛紛入局