2024年大模型行業(yè)研究報告
第一章 行業(yè)概況
1.1 簡介
大模型是指具有大規(guī)模參數(shù)和復雜計算結構的機器學習模型。這些模型通常由深度神經(jīng)網(wǎng)絡構建而成,擁有數(shù)十億甚至數(shù)千億個參數(shù)。大模型的設計目的是為了提高模型的表達能力和預測性能,能夠處理更加復雜的任務和數(shù)據(jù)。大模型在各種領域都有廣泛的應用,包括自然語言處理、計算機視覺、語音識別和推薦系統(tǒng)等。大模型通過訓練海量數(shù)據(jù)來學習復雜的模式和特征,具有更強大的泛化能力,可以對未見過的數(shù)據(jù)做出準確的預測。
圖 大模型產(chǎn)業(yè)圖譜
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
1.2 分類
按輸入數(shù)據(jù)類型的不同:語言大模型(NLP),視覺大模型(CV)和多模態(tài)大模型。NLP通常用來處理文本數(shù)據(jù)和理解自然語言,例如GPT系列,文心一言等。CV通常用于圖像處理和分析,例如VIT系列,文心UFO等。多模態(tài)大模型能夠處理多種不同類型數(shù)據(jù),例如DingoDB多模向量數(shù)據(jù)庫等。
按應用領域的不同:三個層次,通用大模型L0,行業(yè)大模型L1和垂直大模型L2。通用大模型L0是指可以在多個領域和任務上通用的大模型。行業(yè)大模型L1是指針對特定行業(yè)或領域的大模型。垂直大模型L2是指針對特定任務或場景的大模型。
大模型市場容量及規(guī)模巨大,預計2028年將達到1179億元。
圖 我國大模型產(chǎn)業(yè)市場規(guī)模
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
第二章 產(chǎn)業(yè)鏈、商業(yè)模式及政策監(jiān)管2.1 產(chǎn)業(yè)鏈
大模型指參數(shù)規(guī)模較大的預訓練模型。這些模型通常具有數(shù)十億甚至數(shù)千億個參數(shù),需要在大量硬件資源上進行訓練。大模型通過對數(shù)據(jù)進行分布式表示,能夠捕捉到數(shù)據(jù)中的復雜關系,提高模型在各類任務中的泛化能力。
從大模型行業(yè)產(chǎn)業(yè)鏈來看,上游主要包括硬件和軟件,硬件又包括芯片、服務器、通信網(wǎng)絡等;軟件又包括云計算、數(shù)據(jù)庫、中間件等。中游是指大模型行業(yè);下游是指大模型的應用領域,包括游戲、辦公、傳媒影視、醫(yī)療、金融、電商、工業(yè)等,這些領域的多樣化需求將推動大模型不斷進行技術創(chuàng)新和優(yōu)化,提升模型的準確性和效率。
圖 大模型產(chǎn)業(yè)鏈
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
通用大模型
如GPT、BERT等,能夠處理多種類型的任務,如文本生成、文本分類、機器翻譯等。
圖 國內通用大模型布局
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
多模態(tài)大模型
能夠處理多種模態(tài)的數(shù)據(jù),如圖像、文本、語音等,如CLIP、DALL-E等。
圖 2022-2023年主流多模態(tài)大模型
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
AI大模型
指具有巨大參數(shù)規(guī)模的人工智能模型。這些模型通過機器學習和深度學習的技術來學習和理解龐大的數(shù)據(jù)量。AI大模型的發(fā)展推動了人工智能領域的快速發(fā)展,并在各個領域中展現(xiàn)出驚人的應用潛力。
圖 AI大模型譜系圖
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
金融和投資大模型
2024年4月10日,在2024數(shù)字產(chǎn)業(yè)鏈金融行業(yè)峰會上,網(wǎng)商銀行宣布旗下的供應鏈金融解決方案大雁系統(tǒng)升級,AI大模型首次應用于產(chǎn)業(yè)鏈金融場景,提升小微企業(yè)金融服務的覆蓋率和便捷性。
在該領域上,大模型系統(tǒng)幫助金融和投資機構構建更全面的企業(yè)圖譜。同時,大模型有語義理解、生成能力,與大模型驅動的Agent實時反饋能力疊加,能夠更好地刻畫小微企業(yè)的經(jīng)營狀況和信用情況。
圖 金融大模型的價值與作用
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
2.2 商業(yè)模式
目前大模型商業(yè)應用尚處早期,以 API、PaaS、MaaS 三種模式為主。當前全球大模型產(chǎn)業(yè)落地仍處于 早期探索階段,需要與下游場景企業(yè)合作建立大模型商業(yè)模式,但下游企業(yè)目前對于大模型的理解相對 有限,所需要的資源支撐比較薄弱?偟膩碚f,大模型落地可以通過 API 接口調用付費、或者大廠提供 落地所需的開發(fā)工具、云平臺、服務等的 PaaS 模式,更進一步是直接提供相關定制好的模型調用的 MaaS 模式。
應用程序編程接口(Application Programming Interface,簡稱:API),是一些預先定義的函數(shù),目的是提供應用程序與開發(fā)人員基于某軟件或硬件得以訪問一組例程的能力,而又無需訪問源碼,或理解內部工作機制的細節(jié)。
近年來軟件的規(guī)模日益龐大,常常需要把復雜的系統(tǒng)劃分成小的組成部分,編程接口的設計十分重要。程序設計的實踐中,編程接口的設計首先要使軟件系統(tǒng)的職責得到合理劃分。良好的接口設計可以降低系統(tǒng)各部分的相互依賴,提高組成單元的內聚性,降低組成單元間的耦合程度,從而提高系統(tǒng)的維護性和擴展性。
圖 通用大模型的主要商業(yè)模式
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
PaaS模式(Platform as a Service)是指平臺即服務。把服務器平臺作為一種服務提供的商業(yè)模式,通過網(wǎng)絡進行程序提供的服務稱之為SaaS(Software as a Service),是云計算三種服務模式之一,而云計算時代相應的服務器平臺或者開發(fā)環(huán)境作為服務進行提供就成為了PaaS。
所謂PaaS實際上是指將軟件研發(fā)的平臺作為一種服務,以SaaS的模式提交給用戶。因此,PaaS也是SaaS模式的一種應用。但是,PaaS的出現(xiàn)可以加快SaaS的發(fā)展,尤其是加快SaaS應用的開發(fā)速度。在2007年國內外SaaS廠商先后推出自己的PAAS平臺。
圖 未來PaaS市場增長驅動力強勁
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
SaaS軟件運營服務是(Software as a Service,簡稱SaaS)讓用戶能夠通過互聯(lián)網(wǎng)連接來使用基于云的應用程序。常見示例有電子郵件、日歷和辦公工具。它不需要用戶將軟件產(chǎn)品安裝在自己的電腦或服務器上。
SaaS提供完整的軟件解決方案,用戶可以從云服務提供商處以即用即付方式進行購買。為組織租用應用,組織用戶即可通過互聯(lián)網(wǎng)連接到該應用(通常使用 Web瀏覽器)。所有基礎結構、中間件、應用軟件和應用數(shù)據(jù)都位于服務提供商的數(shù)據(jù)中心內。服務提供商負責管理硬件和軟件,并根據(jù)適當?shù)姆⻊諈f(xié)議確保應用和數(shù)據(jù)的可用性和安全性。SaaS讓組織能夠通過最低前期成本的應用快速建成投產(chǎn)。
圖 2021 年全球公有云 SaaS 市場份額
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
大模型產(chǎn)業(yè)市場規(guī)模持續(xù)增長,市場前景廣闊。預計2028年市場規(guī)模將達到1179億元。2022~2028年復合增長率約為60.11%,市場規(guī)?焖俪砷L。
圖 我國大模型產(chǎn)業(yè)市場規(guī)模
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
2.3 技術發(fā)展
大模型的起源可以追溯到20世紀90年代,當時人工智能領域還處于初創(chuàng)期,研究人員主要關注的是基于規(guī)則的專家和知識表示系統(tǒng)。數(shù)據(jù)資源的不斷增加和計算機性能的不斷提升,人們開始意識到基于數(shù)據(jù)驅動的機器學習方法在人工智能領域具有更大的潛力。大模型的概念逐漸浮出水面。
近十余年間,人工智能技術泛化能力、創(chuàng)新能力及應用效能不斷提升,成為了推動經(jīng)濟及社會發(fā)展的重要引擎。
2015年前后,人臉識別算法達到接近人眼的識別能力,被視為人工智能技術工業(yè)級應用水平的代表性事件。
2022年,以ChatGPT為代表的大模型為用戶帶來了全新交互體驗。通過其在內容生成、文本轉化和邏輯推理等任務下的高效、易操作表現(xiàn),大模型正逐步成為當前主流應用程序的重要組成部分。
圖 大模型技術發(fā)展各時期
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
2023年7月,OpenAI向用戶正式開放了代碼解析插件Code Interpreter,使得ChatGPT和GPT-4可以根據(jù)用戶問題來編寫和執(zhí)行代碼,從而拓展了模型在數(shù)據(jù)分析、復雜計算與功能調用方面的能力。
圖 全球大模型技術發(fā)展脈絡
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
2023年,大語言模型及其在人工智能領域的應用已成為全球科技研究的熱點,其在規(guī)模上的增長尤為引人注目,參數(shù)量已從最初的十幾億躍升到如今的一萬億。參數(shù)量的提升使得模型能夠更加精細地捕捉人類語言微妙之處,更加深入地理解人類語言的復雜性。在過去的一年里,大語言模型在吸納新知識、分解復雜任務以及圖文對齊等多方面都有顯著提升。隨著技術的不斷成熟,它將不斷拓展其應用范圍,為人類提供更加智能化和個性化的服務,進一步改善人們的生活和生產(chǎn)方式。
圖 大模型帶來語音技術發(fā)展的全新機會
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
2023年被視為中國大模型的發(fā)展元年。3月16日,百度正式推出了基于百度新一代大語言模型的生成式AI產(chǎn)品“文心一言”,成為了率先“跑出來”的國內大模型廠商。文心一言的問世,也拉開了國內“百模大戰(zhàn)”的帷幕。此后,阿里、華為、騰訊、京東、科大訊飛、360、字節(jié)跳動等科技公司紛紛發(fā)布了自家的大模型。文心一言發(fā)布8個月后的11月15日,李彥宏在深圳西麗湖論壇上表示,國內目前已經(jīng)發(fā)布了238個大模型。這意味著,在這兩百多天里,平均每天都有一個大模型問世。
圖 國內大模型技術路線圖
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
2.4 政策監(jiān)管
大模型在快速發(fā)展的同時也帶來了一系列潛在的風險和挑戰(zhàn)。
一方面,大模型所需的海量數(shù)據(jù)、復雜參數(shù)以及工程難度放大了人工智能固有的技術風險,如數(shù)據(jù)竊取、泄露等安全問題,模型黑盒導致決策結果難預測和難解釋問題,以及模型面對隨機擾動和惡意攻擊的魯棒性問題。
另一方面,大模型的多場景通用性也放大了隱私風險、歧視風險和濫用風險等應用風險。這些問題引發(fā)了全球范圍的關注,對人工智能治理能力與治理水平提出了新的挑戰(zhàn)。
目前,全球大模型治理正處于探索階段,從人工智能倫理準則等基本共識出發(fā),逐步深入推動大模型監(jiān)管政策法規(guī)和企業(yè)治理落地實踐。國際組織積極制定人工智能治理原則及倡議,重點關注大模型的治理和監(jiān)管問題。
圖 2023年以來國內大模型相關政策梳理
來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD
在政策方面,2021年11月,聯(lián)合國教科文組織通過了《人工智能倫理問題建議書》,旨在促使人工智能系統(tǒng)造福人類、社會、環(huán)境和生態(tài)系統(tǒng)、防止危害,同時促進和平利用人工智能系統(tǒng)。
2023年11月,在英國人工智能安全峰會期間,包括中國、美國、英國等 28 個國家和歐盟共同簽署了《布萊切利宣言》,確保人工智能以人為本、值得信賴并負責任,通過國際倫理和其他相關倡議促進合作,應用人工智能帶來的廣泛風險。
同年11月,世界互聯(lián)網(wǎng)大會發(fā)布了《發(fā)展負責任的生成式人工智能研究報告及共識文件》,就發(fā)展負責任的生成式人工智能提出十條共識。
在標準方面,ISO/IEC JTC1 /SC42人工智能分委會正在開展人工智能可信賴國際標準研制工作,為指導利益相關方研發(fā)、使用可信賴人工智能相關技術和系統(tǒng)提供參考,主要標準包括 ISO/IEC TR 24028:2020《人工智能的可信賴概述》、ISO/IEC 38507:2022《組織使用人工智能的治理影響》等。
全球主要經(jīng)濟體加快推進大模型治理和監(jiān)管相關政策制定步伐。中國在人工智能監(jiān)管方面主張“包容審慎的分類分級監(jiān)管”原則,國家網(wǎng)信辦已于2023年7月10日頒布了首部面向大模型監(jiān)管的《生成式人工智能服務管理暫行辦法》,后續(xù)將進一步針對生成式人工智能技術特點及其在有關行業(yè)和領域的服務應用,制定相應的分類分級監(jiān)管規(guī)則或指引。
2023年10月8日,中國科技部發(fā)布《科技倫理審查辦法(試行)》,提出從事人工智能科技活動的單位,研究內容涉及科技倫理敏感領域的,應設立科技倫理(審查)委員會,并建立倫理高風險科技活動的清單制度,對可能產(chǎn)生較大倫理風險挑戰(zhàn)的新興科技活動實施清單管理。
2023年10月18日,國家網(wǎng)信辦發(fā)布《全球人工智能治理倡議》,提出發(fā)展人工智能應堅持相互尊重、平等互利的原則,各國無論大小、強弱,無論社會制度如何,都有平等發(fā)展和利用人工智能的權利。
在標準方面,中國信息通信研究院已經(jīng)啟動《大規(guī)模預訓練模型技術和應用評估方法》系列標準研制的工作,全面覆蓋大模型的開發(fā)、部署和應用環(huán)節(jié),其中第四部分可信要求是目前國內首項針對大模型領域的可信賴標準。
與此同時,全國信息安全標準化技術委員會已經(jīng)啟動包括《信息安全技術 生成式人工智能服務安全基本要求》在內的三項生成式人工智能安全國家標準編制工作,以支撐大模型的監(jiān)管落地。
歐盟現(xiàn)行人工智能立法仍主要集中在傳統(tǒng)人工智能,但已經(jīng)開始關注通用人工智能以及生成式人工智能的問題,主張尊重人格尊嚴、個人自由和保護數(shù)據(jù)及隱私安全。
2023年6月14日,歐洲議會投票通過《人工智能法案》,該法案基于風險等級將人工智能系統(tǒng)分成四類,并制定了不同程度的監(jiān)管要求。
2023年5月13日,美國白宮總統(tǒng)科技顧問委員會(PCAST)成立生成式人工智能工作組,以幫助評估關鍵機遇和風險,并就如何更好地確保這些技術的開發(fā)和部署盡可能公平、負責任和安全提供意見。
2023年10月30日,美國總統(tǒng)拜登簽署人工智能行政令,旨在加強對人工智能潛在風險的監(jiān)管,發(fā)展安全、可靠和值得信賴的人工智能,促進人工智能創(chuàng)新,確保美國在人工智能領域繼續(xù)領跑全球。
同時行政令在標準方面,提出美國國家標準與技術研究所(NIST)將制定嚴格的人工智能安全測試標準,人工智能系統(tǒng)在公開發(fā)布前需根據(jù)這些標準進行廣泛的測試以確保安全。

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機器人領域,聯(lián)通、海爾、美的等紛紛入局