劍指英偉達(dá),硅谷大廠發(fā)力自研AI芯片
美國(guó)當(dāng)?shù)貢r(shí)間11月15日,微軟Ignite技術(shù)大會(huì)在西雅圖揭幕。
集團(tuán)CEO納德拉帶來(lái)了長(zhǎng)達(dá)一個(gè)小時(shí)的揭幕演講,介紹微軟在ESG、新一代空芯光纖、Azure Boost數(shù)據(jù)中心等項(xiàng)目的新動(dòng)態(tài)。而整場(chǎng)演講的重頭戲,非AI莫屬——尤其是首款自研AI芯片Azure Maia 100的亮相,成為場(chǎng)內(nèi)場(chǎng)外無(wú)數(shù)聚光燈下的焦點(diǎn)。
微軟重視AI人所共知,發(fā)力自研芯片也不是什么秘密。Maia 100的亮相,則是微軟的第一張階段性答卷,向外界表明自己的野心與實(shí)力。
有趣的是,英偉達(dá)CEO黃仁勛也來(lái)到現(xiàn)場(chǎng),為Azure和英偉達(dá)合作的AI foundry service站臺(tái)。納德拉當(dāng)著黃仁勛的面發(fā)布自研AI芯片,難免讓人浮想聯(lián)翩。
英偉達(dá)對(duì)高算力芯片的壟斷,早已成為硅谷眾大廠的心病。它們一方面離不開(kāi)英偉達(dá),另一方面又不想永遠(yuǎn)被英偉達(dá)掣肘。當(dāng)自研芯片成為潮流,微軟、Meta、谷歌、亞馬遜先后亮出壓箱底的寶貝,誰(shuí)能真正掙脫枷鎖?
(圖片來(lái)自Pixabay)
微軟首款A(yù)I芯片來(lái)襲,Maia 100成色幾何?
首款芯片的命名從此前盛傳的Athena改成Maia,靈感大概是參考了NGC 2336星系。Maia可以譯為“明亮的藍(lán)色恒星”,根據(jù)NASA的觀測(cè),NGC 2336星系近似螺旋形態(tài),直徑約20萬(wàn)光年,也以旋臂中的藍(lán)色恒星聞名。以此命名自己的首顆AI芯片,微軟或許是想以深邃的太空借喻充滿想象力的AI世界,以及對(duì)算力的高追求。
Maia 100的亮相也不算突然,早在10月初就有媒體劇透微軟將在開(kāi)發(fā)者大會(huì)上發(fā)布首款自研AI芯片,并將向Azure云客戶供應(yīng)。不過(guò)微軟對(duì)自研芯片計(jì)劃的保密工作做得很好,直到正式發(fā)布后,外界才能真正了解其設(shè)計(jì)、算力和應(yīng)用場(chǎng)景等詳細(xì)情況。
根據(jù)納德拉的介紹,Maia 100是一款A(yù)I加速芯片,基于Arm架構(gòu)設(shè)計(jì),主要用于云端訓(xùn)練、推理以及Azure的高負(fù)載云端運(yùn)算。不過(guò)納德拉否認(rèn)了將向云計(jì)算客戶供貨的傳聞,這款自研芯片將優(yōu)先滿足微軟自身的需求,并在合適的時(shí)機(jī)向合作伙伴和客戶開(kāi)放。
Azure芯片部門負(fù)責(zé)人、微軟副總裁拉尼·博卡爾則補(bǔ)充道,Maia 100已經(jīng)在Bing和office的人工智能套件上測(cè)試。合作伙伴openAI也開(kāi)始使用這款芯片進(jìn)行測(cè)試部分產(chǎn)品和功能,比如GPT 3.5 Turbo。
(圖片來(lái)自Azure官網(wǎng))
至于測(cè)試的效果如何,微軟暫時(shí)還沒(méi)有給出具體報(bào)告。但納德拉和博卡爾強(qiáng)調(diào)Maia 100可以加快數(shù)據(jù)處理速度,尤其是在語(yǔ)音和圖像識(shí)別方面。
提速的關(guān)鍵,自然是算力。為了提升算力,微軟也是下了血本:采用臺(tái)積電的5nm制程工藝,晶體管數(shù)量達(dá)到1050億個(gè)。和今年4月被曝光的信息相比,Maia的制程工藝、設(shè)計(jì)架構(gòu)都沒(méi)有太多出入,性能表現(xiàn)或許還需在應(yīng)用數(shù)據(jù)來(lái)檢驗(yàn)。
不過(guò)橫向?qū)Ρ鹊脑,Maia 100和英偉達(dá)、AMD等大廠的產(chǎn)品在參數(shù)上還有很大差距。AMD在今年發(fā)布的專用于AI加速的MI 300X芯片晶體管數(shù)量達(dá)到1530億,更不用說(shuō)算力超強(qiáng)的英偉達(dá)了。
以最近發(fā)布的H200為例,GPU核心和H100相同,但CUDA核數(shù)達(dá)到16896個(gè),加速頻率1.83GHz,顯存具備更大的容量和更高帶寬,可以支持超大參數(shù)的大模型訓(xùn)練與推理。官方給出的參數(shù)顯示,H200相較上一代產(chǎn)品在Llama2和ChatGPT的訓(xùn)練速度分別能提升40%和60%。
可以看出,從MI 300X到H200,再到Maia 100,大廠對(duì)訓(xùn)練參數(shù)量、訓(xùn)練速度和芯片算力的追求是沒(méi)有上限的。大模型的迭代速度也在加快,只因各家大廠都想跑得比對(duì)手更快一步。
芯片是這場(chǎng)算力競(jìng)賽里最關(guān)鍵的一環(huán),沒(méi)有人想在這上面掉鏈子。而為了擺脫對(duì)英偉達(dá)的依賴,自研就是最好的出路。
當(dāng)自研AI芯片成為必選項(xiàng)
英偉達(dá)的芯片不是不好,反倒是太好了,好到直接滋生了兩個(gè)難以解決的問(wèn)題:一是供不應(yīng)求,二是價(jià)格高不可攀。
英偉達(dá)沒(méi)有正面回應(yīng)H100和A100兩款最熱門產(chǎn)品的產(chǎn)能和需求,但據(jù)外媒報(bào)道,今年內(nèi)H100加速卡的產(chǎn)能至少同比增長(zhǎng)了3倍,且仍有許多產(chǎn)能瓶頸無(wú)法解決。比如臺(tái)積電5nm生產(chǎn)線產(chǎn)能,英偉達(dá)的GPU必須使用臺(tái)積電的CoWoS封裝技術(shù),市面上完全找不到別的替代品。
供不應(yīng)求,市場(chǎng)杠桿就會(huì)自動(dòng)生效,調(diào)高價(jià)格、篩選客戶。從去年下半年開(kāi)始,搶購(gòu)GPU就成為硅谷大廠最重要的任務(wù)之一。大廠為了搶時(shí)間、保供應(yīng),囤的貨一個(gè)比一個(gè)多,階段產(chǎn)能愈發(fā)吃緊,繼而再次推高價(jià)格,形成一個(gè)死循環(huán)。
微軟在2019年投資openAI后算過(guò)一筆賬,為了支撐歷代ChatGPT的訓(xùn)練,微軟每年光是采購(gòu)A100的資金就在數(shù)億美元以上。而稍晚啟動(dòng)的自研芯片計(jì)劃,每年開(kāi)銷只需1億美元左右。白紙黑字?jǐn)[在面前,大廠也不傻。本就有一定技術(shù),也有足夠流動(dòng)資金的微軟、谷歌、亞馬遜、Meta們,紛紛加速擁抱自研芯片。
這當(dāng)中,谷歌和亞馬遜是起步最早、成績(jī)也最突出的。單論研發(fā)實(shí)力,微軟甚至夠不著硅谷的第一梯隊(duì)。
得益于在手機(jī)領(lǐng)域的長(zhǎng)期布局,谷歌積累了大量芯片技術(shù),除了美國(guó)本土之外,還在印度設(shè)置了大規(guī)模的芯片研發(fā)中心。2021年推出的自研芯片Tensor使用三星5nm先進(jìn)制程,GPU性能較上一代產(chǎn)品大幅提升370%,狠狠秀了一把肌肉。
這幾年,谷歌從高通、蘋(píng)果、英偉達(dá)、博通挖來(lái)大量人才。最新消息顯示,谷歌計(jì)劃在2027年將博通剔除出AI芯片供應(yīng)商的行列,每年將節(jié)省數(shù)十億美元的采購(gòu)費(fèi)用。而對(duì)標(biāo)博通的TPU,就成為了谷歌AI芯片計(jì)劃的重點(diǎn)發(fā)力方向。
事實(shí)上,谷歌的TPU自研計(jì)劃也是由來(lái)已久。2021年,時(shí)任谷歌研究部門主管Cliff Young就透露,谷歌有長(zhǎng)期的計(jì)劃,會(huì)在數(shù)據(jù)中心部署大量自研TPU,以加強(qiáng)云端運(yùn)算速度,未來(lái)不排除將對(duì)外出售。
亞馬遜也是自研芯片的老玩家,其強(qiáng)大在于,建立了完整的自研芯片產(chǎn)業(yè)鏈,形成網(wǎng)絡(luò)芯片、服務(wù)器芯片、AI芯片三條產(chǎn)品線。在AI 芯片領(lǐng)域,亞馬遜的自研產(chǎn)品就通用計(jì)算芯片、機(jī)器學(xué)習(xí)訓(xùn)練芯片、學(xué)習(xí)推理芯片等。
滿打滿算,從2013年推出首款自研芯片Nitro 1以來(lái),亞馬遜已經(jīng)推出了超過(guò)10款自研芯片,無(wú)論數(shù)量還是覆蓋的領(lǐng)域,都遠(yuǎn)超其他硅谷大廠。AWS在2020年便發(fā)布了用于訓(xùn)練大模型的自研芯片Trainium,也是最早發(fā)力AI專用芯片的大廠之一,為AWS征服全球立下汗馬功勞。
就連落后一截的Meta,也在今年高調(diào)提出造芯計(jì)劃,推出定制芯片MTIA v1,并牽手高通、重組研發(fā)團(tuán)隊(duì)。為了奪回主動(dòng)權(quán)、節(jié)省開(kāi)銷,大廠肯定會(huì)拼盡全力。接下來(lái),不知道英偉達(dá)將如何接招?
取代英偉達(dá)談何容易,在博弈中合作將成為主題
硅谷大廠的反抗之心,黃仁勛當(dāng)然了然于胸。與其說(shuō)英偉達(dá)對(duì)微軟、亞馬遜、谷歌們的進(jìn)攻無(wú)動(dòng)于衷,倒不如說(shuō)是有恃無(wú)恐——硅谷大廠的自研芯片算力遠(yuǎn)不比上英偉達(dá),也缺乏配套的AI軟硬件。想自供自給乃至取英偉達(dá)而代之,在現(xiàn)階段并不現(xiàn)實(shí)。
算力上的差距前文已有介紹,此處不再贅述。在芯片算力之外,英偉達(dá)還強(qiáng)在擁有Base Command(AI訓(xùn)練端到端軟件服務(wù))、AI Enterprise(提供平臺(tái)支持的企業(yè)級(jí)軟件)等大量配套設(shè)施。
(圖片來(lái)自英偉達(dá)官網(wǎng))
微軟等大廠自研AI芯片,是為了降低采購(gòu)成本。但大模型從訓(xùn)練到落地應(yīng)用,需要的絕不止一顆芯片。當(dāng)參數(shù)級(jí)別變得原來(lái)越高,開(kāi)源程度不斷提升,需要使用的配套軟硬件也會(huì)越來(lái)越多,這時(shí)候大廠們就不得不重新算一下自己的賬本了。
高調(diào)發(fā)布自研芯片的微軟,就很清楚自己短時(shí)間內(nèi)離不開(kāi)英偉達(dá)和AMD。納德拉之所以請(qǐng)黃仁勛到場(chǎng)助陣當(dāng)然不是為了示威,而是示好。展望未來(lái),大廠之間的暗中角力當(dāng)然少不了,但合作還是主旋律。
黃仁勛出席微軟Ignite全球技術(shù)大會(huì),是為了宣傳針對(duì)英偉達(dá)H100設(shè)計(jì)的NC H100 v5虛擬機(jī),這是一項(xiàng)類似于AI代工的服務(wù),可以幫助Azure的客戶和合作企業(yè)開(kāi)發(fā)大語(yǔ)言模型。此外,微軟Azure仍在使用AMD的 MI300X加速虛擬機(jī)和最新的GPU提高AI模型訓(xùn)練和推理速度。
值得一提的是,微軟在15日的技術(shù)大會(huì)上還宣布推出MaaS模型即服務(wù),向用戶開(kāi)放API接口,以便在云端部署自己的開(kāi)源大模型。Meta等大廠據(jù)悉也將加入開(kāi)源行列,Llama 2等知名大模型都會(huì)在英偉達(dá)的算力支撐下,陸續(xù)向第三方開(kāi)放調(diào)用。
納德拉和黃仁勛心底盤算什么,外人看不見(jiàn),也猜不透。但至少在明面上,兩人會(huì)繼續(xù)維持良好的合作關(guān)系,有錢一起賺。真正感到壓力山大的,其實(shí)是那些艱難求存的初創(chuàng)企業(yè)——畢竟大部分芯片企業(yè)都要依賴投資人和大廠的資金搞研發(fā),大廠發(fā)力自研后必然會(huì)削減外部投資,甚至還會(huì)擠壓前者的生存空間。
從2020年的Wave Computing開(kāi)始,這幾年時(shí)不時(shí)有AI芯片獨(dú)角獸裁員、賣身甚至直接倒閉。不久歐倩,英國(guó)GPU芯片公司Imagination也被爆將進(jìn)行裁員,比例在20%左右。
Wave Computing也算得上紅極一時(shí),當(dāng)初曾聲稱要追趕英偉達(dá),自家的DPU產(chǎn)品在加速神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度上要超過(guò)英偉達(dá)的GPU1000倍,基于DataFlow架構(gòu)設(shè)計(jì)的產(chǎn)品也算得上特立獨(dú)行。
不過(guò)之后的故事大家都清楚了,Wave Computing的DPU在某些參數(shù)上確實(shí)超過(guò)了英偉達(dá)的GPU,但不具備推廣意義。因?yàn)榍罢呷狈νㄓ糜?jì)算架構(gòu),也無(wú)法針對(duì)不同應(yīng)用場(chǎng)景進(jìn)行定制化改造,更沒(méi)有足夠數(shù)量的開(kāi)發(fā)者。在燒光了投資人的資金后,最終只能走向破產(chǎn)清算的地步。
無(wú)獨(dú)有偶,openAI在日前悄悄更新,也讓部分AI初創(chuàng)企業(yè)感到“末日將至”,更有外媒表示openAI“正在殺死生成式人工智能初創(chuàng)公司”。由此可以看出,做AI大模型和做AI芯片的公司生存壓力巨大,研發(fā)難度和高企的經(jīng)營(yíng)成本隨時(shí)都可能將它們壓垮。
大公司和初創(chuàng)企業(yè)之間的矛盾由來(lái)已久,大廠發(fā)力自研AI芯片只不過(guò)是一劑催化劑。想在巨頭的夾縫謀得一絲生存空間,初創(chuàng)企業(yè)要拿出更多真本事。
來(lái)源:雷科技
原文標(biāo)題 : 劍指英偉達(dá),硅谷大廠發(fā)力自研AI芯片

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-6.16立即報(bào)名>> 【在線會(huì)議】Solution Talks |Computex 2025關(guān)鍵趨勢(shì)深讀
-
6月20日立即下載>> 【白皮書(shū)】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單
- 10 為何全球AI巨頭都在搶?MCP協(xié)議背后的暴富玄機(jī)大公開(kāi)!