訂閱
糾錯(cuò)
加入自媒體

DeepSeek的壓力給到華爾街,掀起蝴蝶效應(yīng)

前言:

傳統(tǒng)AI訓(xùn)練對(duì)算力的需求巨大,而英偉達(dá)的芯片作為算力的核心,其重要性不言而喻。

然而,DeepSeek的問(wèn)世使市場(chǎng)認(rèn)識(shí)到,AI對(duì)算力的需求并非如先前所預(yù)期的那樣龐大。

作者 | 方文三

圖片來(lái)源 |  網(wǎng) 絡(luò) 

圖片

DeepSeek打開(kāi)大模型新思路

2024年1月20日,DeepSeek公司正式發(fā)布了其推理模型DeepSeek-R1的完整版本。

該模型以較低的訓(xùn)練成本實(shí)現(xiàn)了與OpenAI推理模型o1相媲美的性能,并且完全免費(fèi)開(kāi)源,這一舉措在業(yè)界引起了巨大反響。

眾多開(kāi)發(fā)者表示,他們正在考慮利用DeepSeek技術(shù)對(duì)現(xiàn)有系統(tǒng)進(jìn)行徹底的重構(gòu)。

在這一趨勢(shì)的推動(dòng)下,DeepSeek推出的移動(dòng)端應(yīng)用在一周內(nèi)迅速發(fā)酵,并在發(fā)布僅一個(gè)月后,躍升至美區(qū)蘋(píng)果應(yīng)用商店免費(fèi)應(yīng)用排行榜首位,不僅超越了ChatGPT,也超越了其他熱門(mén)應(yīng)用。

2025年1月28日,DeepSeek進(jìn)一步開(kāi)源了其多模態(tài)模型Janus-Pro-7B,并宣稱(chēng)在GenEval和DPG-Bench基準(zhǔn)測(cè)試中勝過(guò)了DALL-E 3(由OpenAI開(kāi)發(fā))和Stable Diffusion。

在本次DeepSeek Janus Pro與DALL-E 3的對(duì)比分析中,DALL-E 3的參數(shù)量先前公布為120億,而Janus Pro的大模型參數(shù)量?jī)H為70億。

R1的問(wèn)世不僅打破了科技巨頭獨(dú)占推動(dòng)旗艦開(kāi)源模型的傳統(tǒng)行業(yè)共識(shí),還顛覆了去年形成的另一個(gè)行業(yè)共識(shí),即通用大型模型正逐漸演變成大型企業(yè)間資本競(jìng)爭(zhēng)的領(lǐng)域。

圖片

硬件媒體Tom's Hardware發(fā)布了開(kāi)年最受關(guān)注的報(bào)道:DeepSeek甚至繞過(guò)了CUDA,轉(zhuǎn)而使用更為基礎(chǔ)的編程語(yǔ)言進(jìn)行優(yōu)化。

DeepSeek R1與OpenAI o1在技術(shù)上的關(guān)鍵區(qū)別在于其創(chuàng)新的訓(xùn)練方法,例如在數(shù)據(jù)訓(xùn)練階段采用的R1-Zero方法,直接將強(qiáng)化學(xué)習(xí)(RL)應(yīng)用于基礎(chǔ)模型,而無(wú)需依賴(lài)監(jiān)督微調(diào)(SFT)和已標(biāo)注數(shù)據(jù)。

根據(jù)DeepSeek官方技術(shù)文檔,R1模型利用數(shù)據(jù)蒸餾技術(shù)(Distillation)生成的高質(zhì)量數(shù)據(jù),提升了訓(xùn)練效率。

數(shù)據(jù)蒸餾是指通過(guò)一系列算法和策略,對(duì)原始、復(fù)雜的數(shù)據(jù)進(jìn)行去噪、降維、提煉等處理,從而得到更為精煉、有用的數(shù)據(jù)。

這也是DeepSeek能夠以更少的參數(shù)量實(shí)現(xiàn)與OpenAI o1模型性能相當(dāng)?shù)年P(guān)鍵所在。

DeepSeek并非傳統(tǒng)意義上的科技企業(yè),卻以遠(yuǎn)低于美國(guó)大型模型公司所使用的GPU資源和成本,成功研發(fā)出極具創(chuàng)新性的模型。

其R1模型的訓(xùn)練成本僅為560萬(wàn)美元,這一數(shù)額甚至不及Meta GenAI團(tuán)隊(duì)中任何一位高層管理人員的年薪。

圖片

背后幻方量化的投資布局考量

梁文鋒,作為兩家資產(chǎn)規(guī)模達(dá)百億的量化私募機(jī)構(gòu)——浙江九章資產(chǎn)管理有限公司和寧波幻方量化投資管理合伙企業(yè)(有限合伙)的實(shí)際控制人,同時(shí)也是DeepSeek的創(chuàng)始人。

梁文鋒自浙江大學(xué)電子工程系A(chǔ)I專(zhuān)業(yè)畢業(yè)后,曾涉足與專(zhuān)業(yè)不直接相關(guān)的金融科技行業(yè),專(zhuān)注于私募基金和量化投資領(lǐng)域多年。

作為量化投資領(lǐng)域的資深私募公司,幻方量化自2015年成立以來(lái)迅速崛起,成為行業(yè)的領(lǐng)頭羊,管理規(guī)模一度突破千億人民幣。

作為私募公司,幻方量化必須通過(guò)量化投資業(yè)務(wù)實(shí)現(xiàn)盈利,以保障公司的持續(xù)運(yùn)營(yíng)和發(fā)展,包括為DeepSeek的研發(fā)提供資金支持。

在量化投資領(lǐng)域,公司運(yùn)用先進(jìn)的量化策略,結(jié)合AI技術(shù)對(duì)大量金融數(shù)據(jù)進(jìn)行分析和建模,制定精確的投資決策,在過(guò)去的市場(chǎng)表現(xiàn)中取得了顯著的業(yè)績(jī)。

在2016年,幻方量化推出了首個(gè)基于深度學(xué)習(xí)的交易模型,并開(kāi)始將GPU引入計(jì)算交易倉(cāng)位。

此后,梁文峰不斷擴(kuò)大AI算法研究團(tuán)隊(duì),將AI技術(shù)深度融入金融投資量化策略中,逐步取代了所有傳統(tǒng)模型。

至2017年,幻方宣布其投資策略已全面AI化。

至2019年,幻方量化成為中國(guó)首家募資超過(guò)1000億元人民幣的量化基金。

幻方量化自2019年起開(kāi)始囤積GPU,至2021年,在中國(guó)擁有1萬(wàn)張GPU的企業(yè)寥寥無(wú)幾,而擁有1萬(wàn)張英偉達(dá)A100芯片的公司僅幻方量化一家。

隨著幻方量化囤積GPU規(guī)模的不斷擴(kuò)大,幻方開(kāi)始成立專(zhuān)門(mén)的AI研究公司。

2019年推出螢火一號(hào)AI集群,2021年又投資10億人民幣,研發(fā)螢火二號(hào)以提供算力支持,可見(jiàn)在技術(shù)層面,幻方量化把握住了市場(chǎng)機(jī)遇。

在美國(guó)于2022年對(duì)中共實(shí)施芯片制裁之前,幻方量化已大規(guī)模購(gòu)買(mǎi)英偉達(dá)芯片,為后續(xù)產(chǎn)品的面世奠定了重要基礎(chǔ)。

2023年7月,梁文峰宣布正式進(jìn)軍通用AIAPI領(lǐng)域,創(chuàng)辦了DeepSeek,僅用10個(gè)月時(shí)間,至2024年5月,DeepSeek推出了version2模型。

DeepSeek的成立標(biāo)志著幻方量化從量化投資向AI技術(shù)的深度轉(zhuǎn)型。

通過(guò)DeepSeek,梁文鋒不僅在A(yíng)I領(lǐng)域取得了顯著成就,還為幻方量化在量化投資領(lǐng)域提供了更強(qiáng)大的技術(shù)支持。

作為國(guó)內(nèi)領(lǐng)先的量化投資機(jī)構(gòu),幻方量化自成立以來(lái),一直致力于運(yùn)用機(jī)器學(xué)習(xí)和全自動(dòng)量化交易推動(dòng)國(guó)內(nèi)量化投資的發(fā)展。

隨著AI大模型在國(guó)內(nèi)的迅速崛起,業(yè)界流傳著一種說(shuō)法:在中國(guó),擁有最多高性能GPU的機(jī)構(gòu)并非AI公司,而是幻方量化。

資金雄厚、不吝嗇的幻方量化在背后支持DeepSeek進(jìn)行模型研究,其研究路線(xiàn)堅(jiān)持開(kāi)放源代碼,且并不急于將研究成果商業(yè)化應(yīng)用。

據(jù)接近DeepSeek管理層的內(nèi)部人士介紹,梁文鋒已個(gè)人投資于一些未來(lái)可能在DeepSeek模型基礎(chǔ)上發(fā)展起來(lái)的下游AI應(yīng)用企業(yè)項(xiàng)目。

這表明梁文鋒正在為DeepSeek未來(lái)構(gòu)建一個(gè)小型生態(tài)系統(tǒng)而提前進(jìn)行布局。

圖片

對(duì)英偉達(dá)等科技巨頭的潛在影響

美國(guó)財(cái)經(jīng)雜志《財(cái)富》發(fā)出警告,指出DeepSeek正對(duì)英偉達(dá)在A(yíng)I領(lǐng)域的主導(dǎo)地位構(gòu)成威脅。

正如先前所述,DeepSeek已經(jīng)推出了采用性能較低、成本更為經(jīng)濟(jì)的芯片的最新產(chǎn)品系列,此舉對(duì)英偉達(dá)施加了壓力。

有觀(guān)點(diǎn)認(rèn)為,這可能導(dǎo)致其他大型科技公司減少對(duì)英偉達(dá)更高端產(chǎn)品的采購(gòu)。

AvaTrade的首席市場(chǎng)分析師凱特·利曼在接受《財(cái)富》雜志采訪(fǎng)時(shí)指出:[投資者對(duì)DeepSeek利用性能較弱的AI芯片的能力表示擔(dān)憂(yōu),這可能會(huì)影響英偉達(dá)在A(yíng)I硬件市場(chǎng)的主導(dǎo)地位,尤其是考慮到其估值在很大程度上依賴(lài)于A(yíng)I領(lǐng)域的需求。]

值得注意的是,據(jù)tomshardware的報(bào)道,DeepSeek在A(yíng)I技術(shù)上的突破并未采用英偉達(dá)的CUDA平臺(tái),而是選擇了類(lèi)似匯編語(yǔ)言的PTX編程方式,這在一定程度上加劇了業(yè)界對(duì)英偉達(dá)未來(lái)發(fā)展的憂(yōu)慮。

由于受到DeepSeek的沖擊,美國(guó)芯片行業(yè)巨頭英偉達(dá)的股價(jià)在當(dāng)日暴跌約17%,博通公司的股價(jià)也下跌了17%,AMD的股價(jià)下跌了6%,微軟的股價(jià)下跌了2%。

美國(guó)聯(lián)合能源公司的股價(jià)下跌了21%,而Vistra的股價(jià)更是下跌了29%。

幻方量化,一家專(zhuān)注于量化投資的公司,早已洞察到AI算力需求的潛在泡沫。

傳統(tǒng)AI訓(xùn)練對(duì)算力的需求巨大,而英偉達(dá)的芯片作為算力的核心,其重要性不言而喻。

然而,DeepSeek的問(wèn)世使市場(chǎng)認(rèn)識(shí)到,AI對(duì)算力的需求并非如先前所預(yù)期的那樣龐大。

DeepSeek的開(kāi)源旨在向公眾證明,AI實(shí)際上僅需原先算力的十分之一。

這一舉措進(jìn)一步加劇了英偉達(dá)股價(jià)的下跌風(fēng)險(xiǎn)。

圖片

若DeepSeek未能達(dá)到預(yù)期效果,或市場(chǎng)反應(yīng)不及預(yù)期,英偉達(dá)的股價(jià)可能不會(huì)下跌,甚至可能上漲。

從技術(shù)競(jìng)爭(zhēng)角度看,DeepSeek的低成本、高效能技術(shù)路徑如果被廣泛應(yīng)用,可能會(huì)減少市場(chǎng)對(duì)英偉達(dá)高端GPU的依賴(lài),理論上存在促使幻方量化做空英偉達(dá)以獲取利益的動(dòng)機(jī)。

但幻方量化此前囤積了上萬(wàn)張英偉達(dá) A100 和 H800 芯片,這些芯片是其技術(shù)研發(fā)的重要基礎(chǔ),與英偉達(dá)也存在著一定的合作關(guān)系,這又使得其做空英偉達(dá)的行為存在諸多矛盾之處。

盡管目前缺乏明確證據(jù)證明幻方量化對(duì)英偉達(dá)進(jìn)行了做空操作,但DeepSeek在技術(shù)上的突破對(duì)英偉達(dá)市場(chǎng)地位可能產(chǎn)生的影響,無(wú)疑已經(jīng)引起了市場(chǎng)的廣泛關(guān)注。

根據(jù)券商中國(guó)的報(bào)道,摩根士丹利在其最新研究報(bào)告中宣布,將2025年英偉達(dá)GB200的預(yù)期出貨量從先前的3萬(wàn)至3.5萬(wàn)件大幅削減至2萬(wàn)至2.5萬(wàn)件,最悲觀(guān)的預(yù)測(cè)顯示出貨量可能不足2萬(wàn)件。

此次預(yù)期下調(diào)可能會(huì)對(duì)GB200供應(yīng)鏈?zhǔn)袌?chǎng)造成300億至350億美元的影響,給相關(guān)供應(yīng)鏈及半導(dǎo)體行業(yè)帶來(lái)沉重壓力。

摩根士丹利指出,市場(chǎng)對(duì)于大型語(yǔ)言模型(LLM)的效率存在爭(zhēng)議,例如DeepSeek與微軟之間的分歧,預(yù)計(jì)這些爭(zhēng)議在2025年仍將持續(xù),這將使得市場(chǎng)難以對(duì)這些股票的價(jià)值進(jìn)行重新評(píng)估。

此外,依據(jù)周期性規(guī)律,云計(jì)算行業(yè)的資本支出增長(zhǎng)速度可能在2025年第四季度減緩至個(gè)位數(shù)百分比。

盡管如此,摩根士丹利預(yù)測(cè),如果歷史周期性規(guī)律重演,這一增長(zhǎng)周期可能會(huì)持續(xù)至2025年上半年。

隨著市場(chǎng)逐漸接近周期頂峰,預(yù)計(jì)2025年第四季度,同比增長(zhǎng)速度將減緩至個(gè)位數(shù)。

投資者對(duì)GB200供應(yīng)鏈股票的預(yù)期增長(zhǎng)過(guò)高,可能會(huì)對(duì)高市盈率的云計(jì)算股票產(chǎn)生負(fù)面影響。

圖片

結(jié)尾:技術(shù)革新的路徑預(yù)計(jì)將產(chǎn)生影響

①AI初創(chuàng)企業(yè)的運(yùn)營(yíng)模式將經(jīng)歷轉(zhuǎn)變:那些依賴(lài)昂貴GPU集群的AI企業(yè)可能會(huì)因?yàn)槌杀旧系牟焕匚欢媾R破產(chǎn)風(fēng)險(xiǎn)。

這將導(dǎo)致二手市場(chǎng)GPU供應(yīng)量的大幅增加,而中小規(guī)模的AI企業(yè)則更可能傾向于采購(gòu)價(jià)格更為低廉的低端GPU。

②硬件需求也將經(jīng)歷結(jié)構(gòu)性的轉(zhuǎn)變:自去年以來(lái),以訓(xùn)練為主導(dǎo)的算力需求已經(jīng)開(kāi)始向推理側(cè)轉(zhuǎn)移。

未來(lái)這種趨勢(shì)預(yù)計(jì)將會(huì)持續(xù),眾多中小AI企業(yè)將不再致力于訓(xùn)練基礎(chǔ)模型,而是轉(zhuǎn)向采用DeepSeek這類(lèi)開(kāi)源模型。

此外,英偉達(dá)在訓(xùn)練市場(chǎng)的主導(dǎo)地位也將面臨重新評(píng)估。

部分資料參考:極客公園:《Deepseek又出連招:剛發(fā)布了超越DALL-E3的多模態(tài)模型》,字母榜:《DeepSeek推翻兩座大山》,量子位:《[DeepSeek甚至繞過(guò)了CUDA],工程師靈魂提問(wèn):英偉達(dá)護(hù)城河還在嗎?》,Meta財(cái)經(jīng):《關(guān)于幻方私募:當(dāng)AI算法走進(jìn)量化世界,無(wú)痛[躺贏(yíng)]?》,私募排排網(wǎng):《DeepSeek背后的百億私募大佬基金業(yè)績(jī)?nèi)绾?》,?jīng)濟(jì)觀(guān)察報(bào):《雷軍都來(lái)挖人,這家公司想把1%的AI天才藏起來(lái)》,半導(dǎo)體行業(yè)觀(guān)察:《成就DeepSeek奇跡的芯片,敲響英偉達(dá)警鐘》,貝殼財(cái)經(jīng):《DeepSeek崛起,英偉達(dá)暴跌》,華爾街見(jiàn)聞:《DeepSeek最強(qiáng)國(guó)產(chǎn)大殺器?英偉達(dá)一家就沒(méi)了近4.3萬(wàn)億》,甲子光年:《英偉達(dá)市值蒸發(fā)創(chuàng)紀(jì)錄,DeepSeek掀起AI算力革命意味著什么?》

       原文標(biāo)題 : AI芯天下丨產(chǎn)業(yè)丨DeepSeek的壓力給到華爾街,掀起蝴蝶效應(yīng)

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀(guān)點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)