訂閱
糾錯
加入自媒體

DeepSeek——中國大模型產業(yè)的“春雷”,A股市場的“驚蟄”

2025-02-10 09:11
西澤研究院
關注

本文為西京研究院發(fā)表的第808篇文章,根據研傳會旬度直播內容整理,有刪節(jié)。

春節(jié)期間,杭州的80后小伙突然打破了世界科技舞臺上沉默許久的平靜,也同步給全球資本市場帶來了巨大擾動,特別是對以英偉達為代表的美股巨頭造成了直接沖擊。這對靠AI產業(yè)支撐的美股來說,無疑是一只黑天鵝。雖然這幾天英偉達股價有所修復,但巨大的跳空缺口及被打擊的信心何時能夠完全修復仍需更多時間觀察。對于投資而言,我們需要了解的是,這到底是一次短暫的技術沖擊,還是一次具有深遠意義的技術相變。

我們之前強調過924是一次政策相變——貨幣大放水,顯示了頂層經濟思路的改變也彰顯了維護資本市場的信心,推動了一次估值水平的整體修復。新的政策看跌期權保證了指數在3200點左右的新中樞開始運行,即使再有波動也不會輕易打破那一次的低點。從924相變后,科技板塊已經取得非常明顯的上漲,科技股估值中樞已大幅上移。目前,我們需要考慮的是科技端是否也存在趨勢性提升的可能,Deepseek是否正在促發(fā)一場革命性、顛覆性的科技領域相變。

一、一次重大的工程創(chuàng)新

當前我們首先需要思考的是Deepseek的影響該如何定義?要拋開自媒體“國運論”與“鬧劇論”簡單的極端論述,客觀的從技術研究本身對其進行思考。首先,先談我的結論,通過這些天較為深入的調研、研究,我想說的是目前我對Deepseek的最新認知與我前些天那篇《DeepSeek是國運崛起還是一個奇跡》的觀點仍保持一致。雖然不能說Deepseek是一次偉大的技術革命,但它確實是一次里程碑式的工程創(chuàng)新,是中國工程師文化內核優(yōu)勢的再一次完美體現。

我們可以把技術革命分為科學革命和工業(yè)革命兩個過程去看。人工智能的發(fā)展也一樣,人工智能其實早已有著很長的研究與發(fā)展歷史,差不多從上世紀60年代就已經正式開始。如果從圖靈提出的相關概念開始算起,那時間會更早。而真正讓Ai被大家所認知的則是微軟的阿爾法Go,與GPT相似他們都采用了強化學習(RL)方式,通過大量實際交互在與高手過招的過程中進行學習。阿爾法Go的厲害之處在于它并非完全基于過去的預訓練,而是依靠記憶能力不斷地學習和強化,是人工智能革命中一次重要的技術里程碑。

汽車不是中國發(fā)明的,但今天的中國是汽車第一生產大國,新能源汽車的核心技術也不是中國發(fā)明的,但中國現在的新能源車可以橫掃全球。要知道,歐洲中世紀的圣經抄寫工作非常昂貴,而中國的活字印刷術傳到歐洲后,使得圣經變得非常便宜且迅速流行,讓每個人都可以閱讀圣經。知識不再被壟斷,人的價值就被凸顯出來,這直接導致了歐洲的宗教革命、科學革命和文藝啟蒙等一系列變革,也就是所謂的啟蒙運動。真正讓美國人能開得起汽車的是福特流水線的功勞,它是流程優(yōu)化,是成本降低。究竟是發(fā)明汽車的科學家偉大,還是讓每個人都開上汽車的工程師偉大?

人工智能也是如此,如果沒有Deepseek的出現,那我們這個世界距離大模型應用的平民化就還有很長一段距離。許多海外公司,包括硅谷的工程師甚至一些海外傳統(tǒng)的不友好媒體,對Deepseek的評價其實是很高的,有的甚至贊不絕口。可以說這是一次重大的工程改造,甚至可以認為是人工智能領域的一次工業(yè)革命。

二、從deepseek的崛起看Ai的發(fā)展路徑與趨勢

2017年,Google推出了一個專門從事機器翻譯的架構模型,它引入了自注意力機制,能夠更高效地捕捉序列數據中的長距離依賴關系,而且支持并行計算,大大提高了訓練和推理的速度,這就是Transformer架構。依靠這一優(yōu)勢特點,Transformer迅速擴展到自然語言處理的其他領域,并逐漸成為大語言模型處理的主流架構,從實質上推動了生成式人工智能的發(fā)展。

人工智能的本質是數學與物理的運用問題,是在電力革命和芯片革命等物理學革命的基礎上逐漸實現的,而模型的工作原理其實并不難,是非常典型的數學應用問題,主要運用三個數學理論,即線性代數,統(tǒng)計學與微積分。首先運用線性代數將文字轉化為數字向量,之后使用語言統(tǒng)計學將文字形成一串數字編碼,并進行回歸運算。人工智能通過海量的數據運算,利用空間的廣度實現無限可能,如果時間足夠長,空間足夠大,就可能演化出各種運算結果。

硅谷的數學家和物理學家是一批有理想的知識精英,他們引領了這場技術革命。然而,他們往往忽視工程學問題,比如如何節(jié)約成本和提高效率。Deepseek的厲害之處就在于它用Fp8,也就是8位二進制數值的浮點計算能力,解決了國外Fp32運算能力所能實現的工作,讓硅谷高傲的精英模型突然變成了拼多多,讓更多普通大眾能夠用的起Ai。但在旨在追求星辰大海的硅谷科學家來看,對比先進的 Fp32 浮點格式,使用Fp8 是一種倒退,即使 Fp8 可以大幅降低成本,可以說方法都是逼出來的。DeepSeek在訓練端和推理端都進行了重大的工程優(yōu)化,特別是蒸餾技術的應用。

硅谷的科學家們往往專注于前沿技術的開發(fā),在要錢有錢,要芯片有芯片的優(yōu)渥環(huán)境中,他們容易忽視成本的問題。但高端芯片價格高昂,大模型訓練成本巨大,普通人難以參與。這種分化導致了技術的門檻越來越高,而且未來可能會更加嚴重,只有少數人能夠引領技術的發(fā)展。而且隨著歷史可用數據的不斷消耗,以及訓練成本越來越高,模型預訓練效果難以持續(xù)提升,預訓練時代也可能即將結束。所以有的公司開始探索新的訓練方法,比如強化學習和監(jiān)督微調,以減少對預訓練的依賴,從而在降低成本的同時提高模型的效率。此外,還有一些公司還采用了混合專家模式和多頭注意力機制,進一步優(yōu)化了推理過程。通過這種方式,模型可以在推理時只調用必要的參數,從而節(jié)省大量算力。新技術的應用可能會帶來一場新的工業(yè)革命,推動全球技術生態(tài)的發(fā)展。

我認為這場技術革命不僅會改變科技行業(yè),還會對整個社會產生深遠影響。成本的降低可能會使更多人能夠使用這些技術,推動工業(yè)化制造能力的提升和人類認知平權事業(yè)的發(fā)展。同時,這也可能會引發(fā)一系列社會和經濟問題,需要我們密切關注。

最后,我再次做個提示供大家思考,就是這次deepseek引發(fā)的大模型工程創(chuàng)新,會不會蓄力2024年924以來的A股牛市,從“貨幣牛”轉換到“科技牛”,類似2022年11月chatgpt橫空出世以后的美股。當然,美股的“科技牛”七成靠七巨頭,中國的“科技牛”有沒有這樣的七巨頭支撐呢?我保持著一定程度的樂觀。

       原文標題 : 趙建:DeepSeek——中國大模型產業(yè)的“春雷”,A股市場的“驚蟄”

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號