誰率先摘到了大模型的果實?
來源 | 伯虎財經(jīng)(bohuFN)
作者 | 陳平安
2022年底,OpenAI用chatGPT再度點燃了人工智能的狼煙,一場名為大模型的競賽瞬間席卷了全球。
但到了今天,大家討論最多的不再是規(guī)模、算力。即便當下AGI已經(jīng)成為了一種共識,行業(yè)大佬們言之鑿鑿:AGI很有可能在5年內(nèi)成為現(xiàn)實,但隨著大模型混戰(zhàn)進入下半場,無論是投資人還是大廠,更關心的是如何率先讓大模型商業(yè)化成為可能。
3月26日,商湯集團(下簡稱“商湯”)發(fā)布截至 12 月 31 日的 2023 財年業(yè)績報告。其中一個值得注意的地方是,2023 年,商湯生成式 AI 業(yè)務收入達 12 億元。這也是商湯成立十年以來,最快達到10億收入體量的新業(yè)務。
作為此前國內(nèi)最炙手可熱的AI公司,商湯在生成式 AI 業(yè)務上的進展,不僅僅意味著其本身正在走入新時代,對于正在尋求商業(yè)化的同行們來說,或許也能提供一些借鑒意義:
商湯是怎么做到的?
01 商業(yè)化閉環(huán)
和2022年相比,2023年商湯生成式 AI 業(yè)務的收入爆發(fā)式增長200%,整體占比也從10% 增長到 35%。
這得益于商湯對于生成式AI的戰(zhàn)略重視。
2023年,商湯把自身業(yè)務明確劃分為生成式 AI、傳統(tǒng) AI 和智能汽車,而此前的智慧城市、智慧商業(yè)和智慧生活中的非生成式AI業(yè)務,則被并入到傳統(tǒng)AI業(yè)務內(nèi)。商湯的愿景和戰(zhàn)略目標也轉(zhuǎn)變?yōu)?ldquo;將 AGI 作為核心戰(zhàn)略目標,以期在未來幾年內(nèi)實現(xiàn) AGI 技術的重大突破”。
這么做的原因是,生成式 AI 業(yè)務需要足夠聚焦的投入。在Scaling Law(尺度定律)的指引下,大量的投入是最基礎的事情。根據(jù)紐約時報援引對OpenAI創(chuàng)始人山姆.奧特曼的采訪,ChatGPT每天要消耗的電量就高達50萬度。
OpenAI發(fā)布chatGPT后,商湯是反應最迅速最持續(xù)的廠商之一。去年4月10日,商湯正式公布“日日新 SenseNova”大模型體系。到今年2月,日日新大模型已經(jīng)迭代了四個版本,來到了日日新 V4.0。據(jù)報道,日日新 V4.0在代碼編寫、數(shù)據(jù)分析、醫(yī)療問答等多個場景中達到與 GPT-4 相匹配的能力。
如果說對于大模型的持續(xù)投入是基礎,那么對于現(xiàn)實需求的準確判斷則是商湯生成式 AI 業(yè)務迅猛發(fā)展的點金手。
目前包括手機、電腦、社交、醫(yī)療、金融等在內(nèi)的多個領域,AI都是行業(yè)發(fā)展和競爭的重要比拼維度。比如智能手機行業(yè),一個能夠聽取用戶的指令,并調(diào)用手機上的各類應用程序完成復雜任務的智能終端模型已經(jīng)被放到了重要賣點。
但由于訓練通用大模型的成本太高,更多的廠商們更傾向于通過直接調(diào)取API的方式來獲得生成式AI的能力。
商湯新的「模型即服務」(MaaS)的商業(yè)模式正好適配這股暴漲的需求。通過在大裝置微調(diào)和調(diào)用各類生成式 AI 能力,客戶不需要自己去搭建基礎設施,大大降低了成本。
一般來說,場景有三個:一是公有云標準,調(diào)用 API;二是私有云,對于安全需求客戶提供專屬模型和模型授權服務;三是模型定制服務。
比如包括招商銀行、中國銀行等在內(nèi)的多家知名銀行已經(jīng)采用日日新大模型去構(gòu)建數(shù)字客服系統(tǒng);鄭州大學第一附屬醫(yī)院、上海交通大學醫(yī)學院附屬新華醫(yī)院、上海交通大學醫(yī)學院附屬瑞金醫(yī)院等,選擇運用“大醫(yī)”賦能用藥咨詢、患者隨訪、臨床輔助決策等眾多醫(yī)院真實業(yè)務場景。
財報提到,在企業(yè)端,生成式 AI 業(yè)務中超過 70% 的客戶是商湯在過去一年內(nèi)的新增客戶,而剩下 30% 的存量客戶的客單價也錄得了約 50% 的增速。在C端,日日新大模型賦能 C 端的調(diào)用量更是在半年內(nèi)增長近120倍。
生成式 AI 業(yè)務的發(fā)展也推動了傳統(tǒng)AI業(yè)務和智能汽車業(yè)務的變革。以智能汽車業(yè)務為例,作為AI技術和傳統(tǒng)制造結(jié)合的最大落地場景,大模型的影響力也在持續(xù)。隨著特斯拉在美國推送智能駕駛軟件FSD v12 Beta版,基于大模型架構(gòu)的端到端技術方案成為了下一代自動駕駛的最優(yōu)解。
得益于自家大模型的基礎能力,商湯的“絕影”智能汽車業(yè)務迎來了迅速增長:量產(chǎn)交付同比大幅增長163%,營收同比增長31%。
不過無論是大模型能力的訓練,還是端側(cè)大模型的部署,都是一個長期且困難的事,商湯大舉投入的底氣在哪?
02 AI2.0的賽點
在科技行業(yè)的語境里,AI并不是一個新詞。
以2017年Transformer算法的誕生為分界線,AI被劃分為兩個時期。前者多聚焦于參數(shù)量較小的小模型,針對特定場景獲得特定能力,后者則更通用,更基礎。
但這并不意味著,過去企業(yè)在AI1.0時代的積累和經(jīng)驗,無法在AI2.0時代發(fā)揮作用。恰恰相反,商湯過去在感知智能、決策智能等方面的積累,是其生成式AI業(yè)務得以快速發(fā)展的關鍵之一。
一方面,AI1.0時代,商湯不僅在計算機視覺方面積累了大量算法模型,覆蓋從視覺信號的分析理解到實現(xiàn)數(shù)字內(nèi)容的生成等各方面;也自研并具備了包括語音識別(ASR)、語義理解(NLP/ 知識圖譜)、語音合成(TTS)以及語音動畫合成(STA)等多項技術能力。這些都能有效強化其基礎模型對物理世界的理解和多模態(tài)能力。
比如在智能終端領域,得益于商湯在小模型上的積累,同樣是7B模型,商湯的性能領先于Meta的Llama2和谷歌的Gemma。2023年,高通、MTK在發(fā)布會上展示了商湯子公司慧鯉生成式AI端側(cè)模型在其旗艦芯片上的應用成果:商湯的7B級小型模型在高通最新款芯片上,實現(xiàn)了業(yè)界領先的16tokens/秒的推理速度。
另一方面,在大力發(fā)展生成式AI業(yè)務之前,商湯的AI能力就賦能了不少垂直行業(yè):包括智慧城市、智慧商業(yè)、智能汽車和智慧生活等在內(nèi)的四大板塊,涉及了20多個落地場景,其中不乏我們熟悉的手機、金融、醫(yī)療等。這讓商湯更能洞察當下各行各業(yè)對于生成式AI的需求到底在何處,如何針對需求去做供給。
更重要的是,過去商湯在基礎設施上的前瞻布局,正在發(fā)揮巨大作用。
如果說工業(yè)革命時代的基礎設施是電力、鐵路、運河、港口,那么大模型時代的基礎設施則是以GPU為代表的算力。OpenAI首席執(zhí)行官奧特曼曾表示,“算力是這個時代最重要的貨幣”。這既關乎成本,也關乎效率。
早在2018年,商湯就著手自建算力中心,并在此基礎上打造了SenseCore AI大裝置。2022年,商湯在上海臨港的智算中心AIDC正式運營,是亞洲最大的人工智能計算中心之一,并在2023年擴展了上海、深圳、廣州、福州、濟南、重慶等新的計算節(jié)點。
業(yè)績公告顯示,商湯大裝置總算力達到12000petaFLOPS,相較于2023年初提高了一倍,GPU數(shù)量達到45000卡,實現(xiàn)了萬卡萬參的大模型訓練能力。
算力只是商湯大裝置的計算基礎設施,在此之上還包括模型層、深度學習層兩個架構(gòu),分別對應算法模型生成和算法模型訓練。
為了提高算力的供給效率,商湯聯(lián)合開發(fā)了DeepLink開放計算體系;诖,各類國產(chǎn)芯片可以輕松適配主流的大模型訓練框架和算法庫。今年,商湯還增加了對華為昇騰、寒武紀等主流國產(chǎn)芯片的適配,支持大模型的訓練、微調(diào)和推理服務,從而通過提供規(guī);、高效率、集約化的算力基礎設施服務,大幅提高算力的利用能力。
簡單來說,就是降本增效。
根據(jù)報道,目前商湯大裝置在大模型訓練服務上可以保持90%的加速效率,提供30天穩(wěn)定訓練不間斷的服務,并將出現(xiàn)訓練間斷時的診斷恢復時長也優(yōu)化到了半小時。
同時,商湯大裝置還支持20個億參數(shù)量超大模型(以千卡并行)并行訓練,并新增了對多模態(tài)模型和混合專家模型的支持。
這也是為什么商湯可以頂住壓力,成為少數(shù)可以高速迭代大模型的企業(yè)之一。自 2023 年發(fā)布以來,商湯“日日新”大模型的能力每隔三個月都會有顯著提升。根據(jù)弗若斯特沙利文發(fā)布的《AI大模型市場研究報告(2023)》,商湯的AI大模型在產(chǎn)品技術、戰(zhàn)略愿景、生態(tài)開放構(gòu)建等綜合競爭力,在2023年位列國內(nèi)第一。
03 共創(chuàng)的未來
IDC最新發(fā)布的2024年V1版《全球人工智能和生成式人工智能支出指南》顯示,無論是投資規(guī)模還是市場規(guī)模,AI行業(yè)都處于高速增長當中。
2022年全球人工智能(AI)的IT總投資規(guī)模為1324.9億美元。預計到2027年,這一數(shù)字將增至5124.2億美元,年復合增長率為31.1%。特別是生成式AI技術,預計到2027年將占據(jù)33.0%的中國AI市場投資份額。
IDC還特別提及了生成式AI市場的年復合增長率可能達到85.7%,到2027年,全球生成式AI市場規(guī)模將接近1500億美元。
但正如紅杉中國去年發(fā)布的一篇文章所預測,當下AI浪潮的重心是如何利用新技術端到端地解決現(xiàn)實社會中的問題:模型能力和商業(yè)化路徑本就是一體兩面的關系。這既有賴于共創(chuàng),也需要自身的努力。
這恰是商湯潛力的體現(xiàn)。
根據(jù)財報,商湯大裝置的降本增效能力已賦能多個領域頭部企業(yè)機構(gòu),其中既包括小米、閱文等行業(yè)“燈塔”,也有上海交大等頂尖機構(gòu)。
“大裝置+大模型”的深度協(xié)同優(yōu)勢也讓商湯可以在保持技術優(yōu)勢的同時,把技術賦能到其他行業(yè)。根據(jù)官方透露,商湯將于今年4月的技術交流日上,推出“日日新”大模型5.0版本,預期其多模態(tài)能力將對標GPT4V。
簡單來說,當下商湯既是“電”的提供人,也是“鐵路”的鋪設者。
正如商湯董事長兼 CEO 徐立所言,“生成式 AI 對商湯來說已不僅僅是技術領域的變革性創(chuàng)新,更成為公司的核心業(yè)務。商湯生成式 AI 業(yè)務的增長,得益于各行各業(yè)對大模型的訓練和推理的廣泛需求,這預示著中國硬科技投資的新周期正式開啟。商湯通過在各業(yè)務層面深入融合生成式 AI 能力,正在贏得新客戶,并推動效率和生產(chǎn)力的全面提升。”
商湯唯一需要做的,就是把當下的路堅持下去。
*文章封面首圖及配圖,版權歸版權所有人所有。若版權者認為其作品不宜供大家瀏覽或不應無償使用,請及時聯(lián)系我們,本平臺將立即更正。
原文標題 : 誰率先摘到了大模型的果實?

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 一文看懂視覺語言動作模型(VLA)及其應用
- 6 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領跑?
- 10 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單