DeepSeek的壓力給到華爾街,掀起蝴蝶效應(yīng)
前言:
傳統(tǒng)AI訓(xùn)練對(duì)算力的需求巨大,而英偉達(dá)的芯片作為算力的核心,其重要性不言而喻。
然而,DeepSeek的問(wèn)世使市場(chǎng)認(rèn)識(shí)到,AI對(duì)算力的需求并非如先前所預(yù)期的那樣龐大。
作者 | 方文三
圖片來(lái)源 | 網(wǎng) 絡(luò)
DeepSeek打開(kāi)大模型新思路
2024年1月20日,DeepSeek公司正式發(fā)布了其推理模型DeepSeek-R1的完整版本。
該模型以較低的訓(xùn)練成本實(shí)現(xiàn)了與OpenAI推理模型o1相媲美的性能,并且完全免費(fèi)開(kāi)源,這一舉措在業(yè)界引起了巨大反響。
眾多開(kāi)發(fā)者表示,他們正在考慮利用DeepSeek技術(shù)對(duì)現(xiàn)有系統(tǒng)進(jìn)行徹底的重構(gòu)。
在這一趨勢(shì)的推動(dòng)下,DeepSeek推出的移動(dòng)端應(yīng)用在一周內(nèi)迅速發(fā)酵,并在發(fā)布僅一個(gè)月后,躍升至美區(qū)蘋(píng)果應(yīng)用商店免費(fèi)應(yīng)用排行榜首位,不僅超越了ChatGPT,也超越了其他熱門(mén)應(yīng)用。
2025年1月28日,DeepSeek進(jìn)一步開(kāi)源了其多模態(tài)模型Janus-Pro-7B,并宣稱(chēng)在GenEval和DPG-Bench基準(zhǔn)測(cè)試中勝過(guò)了DALL-E 3(由OpenAI開(kāi)發(fā))和Stable Diffusion。
在本次DeepSeek Janus Pro與DALL-E 3的對(duì)比分析中,DALL-E 3的參數(shù)量先前公布為120億,而Janus Pro的大模型參數(shù)量?jī)H為70億。
R1的問(wèn)世不僅打破了科技巨頭獨(dú)占推動(dòng)旗艦開(kāi)源模型的傳統(tǒng)行業(yè)共識(shí),還顛覆了去年形成的另一個(gè)行業(yè)共識(shí),即通用大型模型正逐漸演變成大型企業(yè)間資本競(jìng)爭(zhēng)的領(lǐng)域。
硬件媒體Tom's Hardware發(fā)布了開(kāi)年最受關(guān)注的報(bào)道:DeepSeek甚至繞過(guò)了CUDA,轉(zhuǎn)而使用更為基礎(chǔ)的編程語(yǔ)言進(jìn)行優(yōu)化。
DeepSeek R1與OpenAI o1在技術(shù)上的關(guān)鍵區(qū)別在于其創(chuàng)新的訓(xùn)練方法,例如在數(shù)據(jù)訓(xùn)練階段采用的R1-Zero方法,直接將強(qiáng)化學(xué)習(xí)(RL)應(yīng)用于基礎(chǔ)模型,而無(wú)需依賴(lài)監(jiān)督微調(diào)(SFT)和已標(biāo)注數(shù)據(jù)。
根據(jù)DeepSeek官方技術(shù)文檔,R1模型利用數(shù)據(jù)蒸餾技術(shù)(Distillation)生成的高質(zhì)量數(shù)據(jù),提升了訓(xùn)練效率。
數(shù)據(jù)蒸餾是指通過(guò)一系列算法和策略,對(duì)原始、復(fù)雜的數(shù)據(jù)進(jìn)行去噪、降維、提煉等處理,從而得到更為精煉、有用的數(shù)據(jù)。
這也是DeepSeek能夠以更少的參數(shù)量實(shí)現(xiàn)與OpenAI o1模型性能相當(dāng)?shù)年P(guān)鍵所在。
DeepSeek并非傳統(tǒng)意義上的科技企業(yè),卻以遠(yuǎn)低于美國(guó)大型模型公司所使用的GPU資源和成本,成功研發(fā)出極具創(chuàng)新性的模型。
其R1模型的訓(xùn)練成本僅為560萬(wàn)美元,這一數(shù)額甚至不及Meta GenAI團(tuán)隊(duì)中任何一位高層管理人員的年薪。
背后幻方量化的投資布局考量
梁文鋒,作為兩家資產(chǎn)規(guī)模達(dá)百億的量化私募機(jī)構(gòu)——浙江九章資產(chǎn)管理有限公司和寧波幻方量化投資管理合伙企業(yè)(有限合伙)的實(shí)際控制人,同時(shí)也是DeepSeek的創(chuàng)始人。
梁文鋒自浙江大學(xué)電子工程系A(chǔ)I專(zhuān)業(yè)畢業(yè)后,曾涉足與專(zhuān)業(yè)不直接相關(guān)的金融科技行業(yè),專(zhuān)注于私募基金和量化投資領(lǐng)域多年。
作為量化投資領(lǐng)域的資深私募公司,幻方量化自2015年成立以來(lái)迅速崛起,成為行業(yè)的領(lǐng)頭羊,管理規(guī)模一度突破千億人民幣。
作為私募公司,幻方量化必須通過(guò)量化投資業(yè)務(wù)實(shí)現(xiàn)盈利,以保障公司的持續(xù)運(yùn)營(yíng)和發(fā)展,包括為DeepSeek的研發(fā)提供資金支持。
在量化投資領(lǐng)域,公司運(yùn)用先進(jìn)的量化策略,結(jié)合AI技術(shù)對(duì)大量金融數(shù)據(jù)進(jìn)行分析和建模,制定精確的投資決策,在過(guò)去的市場(chǎng)表現(xiàn)中取得了顯著的業(yè)績(jī)。
在2016年,幻方量化推出了首個(gè)基于深度學(xué)習(xí)的交易模型,并開(kāi)始將GPU引入計(jì)算交易倉(cāng)位。
此后,梁文峰不斷擴(kuò)大AI算法研究團(tuán)隊(duì),將AI技術(shù)深度融入金融投資量化策略中,逐步取代了所有傳統(tǒng)模型。
至2017年,幻方宣布其投資策略已全面AI化。
至2019年,幻方量化成為中國(guó)首家募資超過(guò)1000億元人民幣的量化基金。
幻方量化自2019年起開(kāi)始囤積GPU,至2021年,在中國(guó)擁有1萬(wàn)張GPU的企業(yè)寥寥無(wú)幾,而擁有1萬(wàn)張英偉達(dá)A100芯片的公司僅幻方量化一家。
隨著幻方量化囤積GPU規(guī)模的不斷擴(kuò)大,幻方開(kāi)始成立專(zhuān)門(mén)的AI研究公司。
2019年推出螢火一號(hào)AI集群,2021年又投資10億人民幣,研發(fā)螢火二號(hào)以提供算力支持,可見(jiàn)在技術(shù)層面,幻方量化把握住了市場(chǎng)機(jī)遇。
在美國(guó)于2022年對(duì)中共實(shí)施芯片制裁之前,幻方量化已大規(guī)模購(gòu)買(mǎi)英偉達(dá)芯片,為后續(xù)產(chǎn)品的面世奠定了重要基礎(chǔ)。
2023年7月,梁文峰宣布正式進(jìn)軍通用AIAPI領(lǐng)域,創(chuàng)辦了DeepSeek,僅用10個(gè)月時(shí)間,至2024年5月,DeepSeek推出了version2模型。
DeepSeek的成立標(biāo)志著幻方量化從量化投資向AI技術(shù)的深度轉(zhuǎn)型。
通過(guò)DeepSeek,梁文鋒不僅在A(yíng)I領(lǐng)域取得了顯著成就,還為幻方量化在量化投資領(lǐng)域提供了更強(qiáng)大的技術(shù)支持。
作為國(guó)內(nèi)領(lǐng)先的量化投資機(jī)構(gòu),幻方量化自成立以來(lái),一直致力于運(yùn)用機(jī)器學(xué)習(xí)和全自動(dòng)量化交易推動(dòng)國(guó)內(nèi)量化投資的發(fā)展。
隨著AI大模型在國(guó)內(nèi)的迅速崛起,業(yè)界流傳著一種說(shuō)法:在中國(guó),擁有最多高性能GPU的機(jī)構(gòu)并非AI公司,而是幻方量化。
資金雄厚、不吝嗇的幻方量化在背后支持DeepSeek進(jìn)行模型研究,其研究路線(xiàn)堅(jiān)持開(kāi)放源代碼,且并不急于將研究成果商業(yè)化應(yīng)用。
據(jù)接近DeepSeek管理層的內(nèi)部人士介紹,梁文鋒已個(gè)人投資于一些未來(lái)可能在DeepSeek模型基礎(chǔ)上發(fā)展起來(lái)的下游AI應(yīng)用企業(yè)項(xiàng)目。
這表明梁文鋒正在為DeepSeek未來(lái)構(gòu)建一個(gè)小型生態(tài)系統(tǒng)而提前進(jìn)行布局。
對(duì)英偉達(dá)等科技巨頭的潛在影響
美國(guó)財(cái)經(jīng)雜志《財(cái)富》發(fā)出警告,指出DeepSeek正對(duì)英偉達(dá)在A(yíng)I領(lǐng)域的主導(dǎo)地位構(gòu)成威脅。
正如先前所述,DeepSeek已經(jīng)推出了采用性能較低、成本更為經(jīng)濟(jì)的芯片的最新產(chǎn)品系列,此舉對(duì)英偉達(dá)施加了壓力。
有觀(guān)點(diǎn)認(rèn)為,這可能導(dǎo)致其他大型科技公司減少對(duì)英偉達(dá)更高端產(chǎn)品的采購(gòu)。
AvaTrade的首席市場(chǎng)分析師凱特·利曼在接受《財(cái)富》雜志采訪(fǎng)時(shí)指出:[投資者對(duì)DeepSeek利用性能較弱的AI芯片的能力表示擔(dān)憂(yōu),這可能會(huì)影響英偉達(dá)在A(yíng)I硬件市場(chǎng)的主導(dǎo)地位,尤其是考慮到其估值在很大程度上依賴(lài)于A(yíng)I領(lǐng)域的需求。]
值得注意的是,據(jù)tomshardware的報(bào)道,DeepSeek在A(yíng)I技術(shù)上的突破并未采用英偉達(dá)的CUDA平臺(tái),而是選擇了類(lèi)似匯編語(yǔ)言的PTX編程方式,這在一定程度上加劇了業(yè)界對(duì)英偉達(dá)未來(lái)發(fā)展的憂(yōu)慮。
由于受到DeepSeek的沖擊,美國(guó)芯片行業(yè)巨頭英偉達(dá)的股價(jià)在當(dāng)日暴跌約17%,博通公司的股價(jià)也下跌了17%,AMD的股價(jià)下跌了6%,微軟的股價(jià)下跌了2%。
美國(guó)聯(lián)合能源公司的股價(jià)下跌了21%,而Vistra的股價(jià)更是下跌了29%。
幻方量化,一家專(zhuān)注于量化投資的公司,早已洞察到AI算力需求的潛在泡沫。
傳統(tǒng)AI訓(xùn)練對(duì)算力的需求巨大,而英偉達(dá)的芯片作為算力的核心,其重要性不言而喻。
然而,DeepSeek的問(wèn)世使市場(chǎng)認(rèn)識(shí)到,AI對(duì)算力的需求并非如先前所預(yù)期的那樣龐大。
DeepSeek的開(kāi)源旨在向公眾證明,AI實(shí)際上僅需原先算力的十分之一。
這一舉措進(jìn)一步加劇了英偉達(dá)股價(jià)的下跌風(fēng)險(xiǎn)。
若DeepSeek未能達(dá)到預(yù)期效果,或市場(chǎng)反應(yīng)不及預(yù)期,英偉達(dá)的股價(jià)可能不會(huì)下跌,甚至可能上漲。
從技術(shù)競(jìng)爭(zhēng)角度看,DeepSeek的低成本、高效能技術(shù)路徑如果被廣泛應(yīng)用,可能會(huì)減少市場(chǎng)對(duì)英偉達(dá)高端GPU的依賴(lài),理論上存在促使幻方量化做空英偉達(dá)以獲取利益的動(dòng)機(jī)。
但幻方量化此前囤積了上萬(wàn)張英偉達(dá) A100 和 H800 芯片,這些芯片是其技術(shù)研發(fā)的重要基礎(chǔ),與英偉達(dá)也存在著一定的合作關(guān)系,這又使得其做空英偉達(dá)的行為存在諸多矛盾之處。
盡管目前缺乏明確證據(jù)證明幻方量化對(duì)英偉達(dá)進(jìn)行了做空操作,但DeepSeek在技術(shù)上的突破對(duì)英偉達(dá)市場(chǎng)地位可能產(chǎn)生的影響,無(wú)疑已經(jīng)引起了市場(chǎng)的廣泛關(guān)注。
根據(jù)券商中國(guó)的報(bào)道,摩根士丹利在其最新研究報(bào)告中宣布,將2025年英偉達(dá)GB200的預(yù)期出貨量從先前的3萬(wàn)至3.5萬(wàn)件大幅削減至2萬(wàn)至2.5萬(wàn)件,最悲觀(guān)的預(yù)測(cè)顯示出貨量可能不足2萬(wàn)件。
此次預(yù)期下調(diào)可能會(huì)對(duì)GB200供應(yīng)鏈?zhǔn)袌?chǎng)造成300億至350億美元的影響,給相關(guān)供應(yīng)鏈及半導(dǎo)體行業(yè)帶來(lái)沉重壓力。
摩根士丹利指出,市場(chǎng)對(duì)于大型語(yǔ)言模型(LLM)的效率存在爭(zhēng)議,例如DeepSeek與微軟之間的分歧,預(yù)計(jì)這些爭(zhēng)議在2025年仍將持續(xù),這將使得市場(chǎng)難以對(duì)這些股票的價(jià)值進(jìn)行重新評(píng)估。
此外,依據(jù)周期性規(guī)律,云計(jì)算行業(yè)的資本支出增長(zhǎng)速度可能在2025年第四季度減緩至個(gè)位數(shù)百分比。
盡管如此,摩根士丹利預(yù)測(cè),如果歷史周期性規(guī)律重演,這一增長(zhǎng)周期可能會(huì)持續(xù)至2025年上半年。
隨著市場(chǎng)逐漸接近周期頂峰,預(yù)計(jì)2025年第四季度,同比增長(zhǎng)速度將減緩至個(gè)位數(shù)。
投資者對(duì)GB200供應(yīng)鏈股票的預(yù)期增長(zhǎng)過(guò)高,可能會(huì)對(duì)高市盈率的云計(jì)算股票產(chǎn)生負(fù)面影響。
結(jié)尾:技術(shù)革新的路徑預(yù)計(jì)將產(chǎn)生影響
①AI初創(chuàng)企業(yè)的運(yùn)營(yíng)模式將經(jīng)歷轉(zhuǎn)變:那些依賴(lài)昂貴GPU集群的AI企業(yè)可能會(huì)因?yàn)槌杀旧系牟焕匚欢媾R破產(chǎn)風(fēng)險(xiǎn)。
這將導(dǎo)致二手市場(chǎng)GPU供應(yīng)量的大幅增加,而中小規(guī)模的AI企業(yè)則更可能傾向于采購(gòu)價(jià)格更為低廉的低端GPU。
②硬件需求也將經(jīng)歷結(jié)構(gòu)性的轉(zhuǎn)變:自去年以來(lái),以訓(xùn)練為主導(dǎo)的算力需求已經(jīng)開(kāi)始向推理側(cè)轉(zhuǎn)移。
未來(lái)這種趨勢(shì)預(yù)計(jì)將會(huì)持續(xù),眾多中小AI企業(yè)將不再致力于訓(xùn)練基礎(chǔ)模型,而是轉(zhuǎn)向采用DeepSeek這類(lèi)開(kāi)源模型。
此外,英偉達(dá)在訓(xùn)練市場(chǎng)的主導(dǎo)地位也將面臨重新評(píng)估。
部分資料參考:極客公園:《Deepseek又出連招:剛發(fā)布了超越DALL-E3的多模態(tài)模型》,字母榜:《DeepSeek推翻兩座大山》,量子位:《[DeepSeek甚至繞過(guò)了CUDA],工程師靈魂提問(wèn):英偉達(dá)護(hù)城河還在嗎?》,Meta財(cái)經(jīng):《關(guān)于幻方私募:當(dāng)AI算法走進(jìn)量化世界,無(wú)痛[躺贏(yíng)]?》,私募排排網(wǎng):《DeepSeek背后的百億私募大佬基金業(yè)績(jī)?nèi)绾?》,?jīng)濟(jì)觀(guān)察報(bào):《雷軍都來(lái)挖人,這家公司想把1%的AI天才藏起來(lái)》,半導(dǎo)體行業(yè)觀(guān)察:《成就DeepSeek奇跡的芯片,敲響英偉達(dá)警鐘》,貝殼財(cái)經(jīng):《DeepSeek崛起,英偉達(dá)暴跌》,華爾街見(jiàn)聞:《DeepSeek最強(qiáng)國(guó)產(chǎn)大殺器?英偉達(dá)一家就沒(méi)了近4.3萬(wàn)億》,甲子光年:《英偉達(dá)市值蒸發(fā)創(chuàng)紀(jì)錄,DeepSeek掀起AI算力革命意味著什么?》
原文標(biāo)題 : AI芯天下丨產(chǎn)業(yè)丨DeepSeek的壓力給到華爾街,掀起蝴蝶效應(yīng)

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書(shū)】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線(xiàn)會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線(xiàn)下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠(chǎng)展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專(zhuān)題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠(chǎng)紛紛入局,百度、阿里、字節(jié)搶奪Agent話(huà)語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠(chǎng)為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷(xiāo)中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單
- 10 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用