2025年,AI大模型在企業(yè)場景走到哪了?
企業(yè)部署 AI 不再是試驗項目,而是戰(zhàn)略行動。預(yù)算已經(jīng)常態(tài)化、模型選擇多元化、采購流程標(biāo)準(zhǔn)化、AI 應(yīng)用開始系統(tǒng)落地。盡管產(chǎn)業(yè)需求和企業(yè)需求碎片化,但這正是企業(yè)擁抱的方向。一些關(guān)鍵廠商正在脫穎而出,企業(yè)也越來越多選擇成品應(yīng)用以加速落地。
市場形態(tài)愈加接近傳統(tǒng)軟件,但變化節(jié)奏與復(fù)雜性卻完全不同——這是 AI 的特有節(jié)奏。
來源:A16Z
轉(zhuǎn)譯:產(chǎn)業(yè)家
2025年,AI大模型在企業(yè)場景的落地走到哪了?
過去一年,AI在企業(yè)中的地位發(fā)生了根本性轉(zhuǎn)變。它不再是創(chuàng)新實驗室里一場場孤立的試驗,也不僅是技術(shù)部門熱衷的“新玩具”,而是真正走入了核心業(yè)務(wù)系統(tǒng),成為IT和經(jīng)營預(yù)算中不可或缺的一部分。
這是一場靜悄悄卻迅猛的演進(jìn):AI模型變得更多樣,采購流程愈發(fā)嚴(yán)謹(jǐn),企業(yè)不再“自己造輪子”,而是開始像采購傳統(tǒng)軟件那樣,有條不紊地選擇、部署、評估人工智能服務(wù)。技術(shù)領(lǐng)導(dǎo)者們正變得越來越成熟——他們明白,不同模型適配不同任務(wù),用例碎片化是常態(tài),而高質(zhì)量的AI原生應(yīng)用,正在快速超越傳統(tǒng)軟件廠商。
近日,A16z發(fā)布了一份主題為《AI技術(shù)在企業(yè)場景落地》的調(diào)研報告,報告基于與20多位企業(yè)買家的深度訪談和100位CIO的調(diào)研,全面回顧了企業(yè)在2025年如何部署、采購、集成和規(guī)劃AI。
這份報告背后對應(yīng)的是一個新的觀點,即:AI不再是“是否值得嘗試”的問題,而是“如何規(guī);涞”的現(xiàn)實挑戰(zhàn)。
AI落地到底如何?又或者說,AI在企業(yè)場景中到底該如何落地?怎樣更好的落地?可以說,它是一份調(diào)查,也更是一面全球企業(yè)落地AI的鏡子。
讓我們一起來走進(jìn)這份報告。
以下為報告原文(部分語句做可讀性調(diào)整):
一年前,我們總結(jié)了企業(yè)在構(gòu)建與采購生成式 AI(Gen AI)方面面臨的 16 項變革。時至今日,形勢已然大變。為此,我們重訪了 20 多位企業(yè)買家,并調(diào)研了橫跨 15 個行業(yè)的 100 位 CIO,試圖幫助創(chuàng)業(yè)者了解企業(yè)客戶在 2025 年及未來如何使用、采購與規(guī)劃 AI。
盡管 AI 世界瞬息萬變,過去一年市場格局的演進(jìn)仍然超出了我們的預(yù)期:
1、企業(yè) AI 預(yù)算持續(xù)超標(biāo)增長,從試點項目躍升為 IT 和業(yè)務(wù)核心預(yù)算的一部分。
2、企業(yè)在“多模型組合”上的運用日益成熟,開始注重性能與成本的平衡。OpenAI、谷歌和 Anthropic 是閉源市場的主力,而 Meta 與 Mistral 成為開源陣營的熱門選擇。
3、AI 模型采購流程日趨接近傳統(tǒng)軟件采購:評估更嚴(yán)、托管更講究、標(biāo)準(zhǔn)化測試更受重視。與此同時,更復(fù)雜的 AI 工作流也在推高模型替換成本。
4、AI 應(yīng)用生態(tài)逐漸成型:標(biāo)準(zhǔn)化應(yīng)用開始取代定制開發(fā),AI 原生的第三方應(yīng)用迎來爆發(fā)增長。
本報告將圍繞企業(yè)在預(yù)算分配、模型選擇、采購流程與應(yīng)用使用四大維度的最新趨勢,幫助創(chuàng)業(yè)者更細(xì)致地理解企業(yè)客戶真正關(guān)注的重點。
一、預(yù)算:AI 支出超出預(yù)期,并持續(xù)增長
1. AI 預(yù)算增長遠(yuǎn)超預(yù)期,且毫無放緩跡象
企業(yè)對大語言模型(LLM)的投入已大幅超出去年原本就很高的預(yù)算預(yù)期,且預(yù)計未來一年將繼續(xù)增長,平均增幅約為 75%。正如一位 CIO 所說:“我 2023 年一整年的支出,現(xiàn)在一周就能用完。”
預(yù)算上升的原因有二:一方面,企業(yè)持續(xù)發(fā)掘更多內(nèi)部用例,推動員工廣泛采用;另一方面,越來越多的企業(yè)開始部署面向客戶的 AI 應(yīng)用,尤其是科技創(chuàng)新型企業(yè),這些場景的投入呈指數(shù)級擴展。一家大型科技公司表示:“去年我們主要專注于內(nèi)部效率提升,今年的重點將轉(zhuǎn)向面向客戶的 Gen AI,投入會大大增加。”
2. AI 正式納入核心預(yù)算,結(jié)束“試驗期”
一年前,企業(yè)在 LLM 上的支出中仍有約 25% 來自創(chuàng)新專項預(yù)算;如今,這一比例降至 7%。企業(yè)普遍將 AI 模型和應(yīng)用的費用納入常規(guī) IT 與業(yè)務(wù)部門預(yù)算,體現(xiàn)出 AI 不再是探索性項目,而是業(yè)務(wù)運轉(zhuǎn)的“基礎(chǔ)設(shè)施”。
一位 CTO 指出:“我們的產(chǎn)品正在陸續(xù)集成 AI 功能,相關(guān)支出也自然水漲船高。”這意味著,AI 融入主流預(yù)算的趨勢還將進(jìn)一步加速。
二、模型:多模型策略成為主流,
三大廠商初步確立領(lǐng)先地位
3. 多模型時代已成常態(tài),“差異化”而非“同質(zhì)化”成驅(qū)動力
當(dāng)前市面上已存在多個性能出色的 LLM,企業(yè)開始在實際生產(chǎn)中部署多種模型。雖然避免供應(yīng)商綁定是一個重要原因,但更根本的動因是:不同模型在不同用例中的表現(xiàn)差異越來越顯著。
本年度調(diào)查中,37% 的企業(yè)正在使用五種及以上的模型,較去年的 29% 明顯增長。
雖然模型在某些通用評估中得分相近,但企業(yè)用戶發(fā)現(xiàn),其實際效果差異不容忽視。例如,Anthropic 的 Claude 更擅長細(xì)粒度代碼補全,而 Gemini 更適用于系統(tǒng)設(shè)計和架構(gòu)。在基于文本的任務(wù)中,用戶反饋 Anthropic的語言流暢性和內(nèi)容生成更強,而 OpenAI 的模型更適合復(fù)雜問答任務(wù)。
這種差異促使企業(yè)采用“多模型最佳實踐”,既保障性能優(yōu)化,又降低對單一廠商的依賴。我們預(yù)判這種策略將在未來繼續(xù)主導(dǎo)企業(yè)的模型部署路徑。
4. 模型格局仍激烈,但三大廠商初顯優(yōu)勢
雖然企業(yè)在實驗和生產(chǎn)中持續(xù)試用多個模型,但市場上已出現(xiàn)三個領(lǐng)先者:OpenAI 保持市場份額領(lǐng)先,谷歌和 Anthropic 則在過去一年迅速追趕。
具體來看:
(1)OpenAI:其模型組合被廣泛應(yīng)用,GPT-4o 是最常部署到生產(chǎn)環(huán)境中的模型,推理模型 o3 也引發(fā)高度關(guān)注。67% 的OpenAI 用戶在生產(chǎn)中部署了非前沿模型,這一比例遠(yuǎn)高于谷歌(41%)和 Anthropic(27%)。
(2)谷歌:在大型企業(yè)中表現(xiàn)更突出,得益于 GCP 客戶基礎(chǔ)和品牌信任。Gemini 2.5 不僅具備頂級上下文窗口,在性價比上也具明顯優(yōu)勢——Gemini 2.5 Flash 每百萬 Token 成本為 0.26 美元,遠(yuǎn)低于 GPT-4.1 mini 的 0.70 美元。
(3)Anthropic:在技術(shù)前沿型企業(yè)(如軟件公司與初創(chuàng)企業(yè))中受到高度青睞。其在代碼相關(guān)任務(wù)中的表現(xiàn)尤為突出,是增長最快的 AI 編碼應(yīng)用背后的核心引擎。
此外,開源模型如Llama 與 Mistral 更受大型企業(yè)青睞,主要出于數(shù)據(jù)安全、合規(guī)和可定制性考慮。新玩家 xAI 的 Grok 模型也開始受到廣泛關(guān)注,市場仍充滿變數(shù)。
5. 對于中小型模型而言,閉源模型的性價比優(yōu)勢愈發(fā)明顯
如前所述,模型成本正以每年一個數(shù)量級的速度下降。在這一趨勢下,閉源模型(尤其是中小型模型)的性能/成本比正變得越來越有吸引力。
目前在這一領(lǐng)域表現(xiàn)領(lǐng)先的是 xAI 的 Grok 3 mini 和谷歌的 Gemini 2.5 Flash。例如,一些客戶表示,出于成本考量及生態(tài)系統(tǒng)集成便利,他們更傾向選擇閉源模型。
正如一位客戶坦言:“現(xiàn)在的定價已經(jīng)非常誘人,而我們已經(jīng)深度嵌入谷歌生態(tài),從 G Suite 到數(shù)據(jù)庫都在使用,他們的企業(yè)服務(wù)經(jīng)驗對我們來說很有價值。”另一位客戶則更直白地總結(jié)道:“Gemini 很便宜。”
這反映出閉源模型在中低成本場景中正逐步贏得市場。
6. 隨著模型能力增強,微調(diào)的重要性正在下降
隨著模型智能水平和上下文窗口顯著提升,企業(yè)發(fā)現(xiàn),實現(xiàn)優(yōu)異性能已不再依賴微調(diào),而是更多依靠高效的 Prompt 工程。
某家企業(yè)觀察道:“我們不再需要提取訓(xùn)練數(shù)據(jù)去微調(diào)模型,只要把它放進(jìn)一個足夠長的上下文窗口,結(jié)果幾乎一樣好。”
這一轉(zhuǎn)變帶來兩個重要影響:
(1)降低使用成本:Prompt 工程成本遠(yuǎn)低于微調(diào);
(2)降低供應(yīng)商綁定風(fēng)險:Prompt 可輕松遷移至其他模型,而微調(diào)后的模型往往存在遷移困難和高前期投入。
不過,在某些超特定用例中,微調(diào)仍不可或缺。比如,一家流媒體公司就針對視頻搜索中的查詢增強,對開源模型進(jìn)行了微調(diào),以適應(yīng)領(lǐng)域語言。
此外,若強化微調(diào)(Reinforcement Fine-tuning)等新方法在實驗室外得到廣泛應(yīng)用,微調(diào)在未來也可能迎來新一輪增長。
總體而言,大多數(shù)企業(yè)在常規(guī)場景中對微調(diào)的 ROI 預(yù)期已經(jīng)下降,且更傾向于在成本敏感型場景中選用開源模型。
7. 企業(yè)對“推理模型”前景樂觀,正積極準(zhǔn)備規(guī);渴
推理模型(Reasoning Models)能夠讓大語言模型更準(zhǔn)確地完成更復(fù)雜的任務(wù),從而顯著擴大 LLM 的可用場景。盡管目前多數(shù)企業(yè)仍處于測試階段,尚未正式上線部署,但對于其潛力普遍持樂觀態(tài)度。
一位高管表示:“推理模型能幫助我們解決更多新型、復(fù)雜的任務(wù)場景,我預(yù)計它的使用量很快會出現(xiàn)大幅增長。只是目前我們還處于早期測試階段。”
在早期使用者中,OpenAI的推理模型表現(xiàn)最為突出。盡管 DeepSeek 在行業(yè)中也有不少關(guān)注,但在生產(chǎn)部署方面,OpenAI 的優(yōu)勢非常明顯:本次調(diào)研顯示,有 23% 的企業(yè)已在生產(chǎn)中使用 OpenAI 的 o3 模型,而使用DeepSeek 的僅為 3%。不過,DeepSeek 在初創(chuàng)企業(yè)中的采用率相對更高,企業(yè)市場滲透仍較低。
隨著推理能力逐步融合進(jìn)企業(yè)應(yīng)用主流程,其影響力有望迅速放大。
三、采購:企業(yè)AI 采購流程趨于成熟,
正全面借鑒傳統(tǒng)軟件采購機制
8. 模型采購流程日趨規(guī)范,成本敏感度提升
當(dāng)前,企業(yè)在選擇模型時已普遍采用系統(tǒng)性的評估框架。在我們訪談中,安全性和成本與準(zhǔn)確性、可靠性一樣,成為模型采購的核心考量。正如一位企業(yè)負(fù)責(zé)人所言:“現(xiàn)在大多數(shù)模型的基礎(chǔ)能力都夠用,價格反而成了更重要的因素。”
此外,企業(yè)在“用例-模型”匹配上也日益專業(yè)化:
(1)對于關(guān)鍵場景或?qū)π阅芤蟾叩娜蝿?wù),企業(yè)更傾向于選擇具有強品牌背書的頂級模型;
(2)對于內(nèi)部或低風(fēng)險任務(wù),企業(yè)更多以“成本導(dǎo)向”作決策。
9. 企業(yè)對模型廠商信任度顯著提升,托管策略更加多元
過去一年,企業(yè)與模型廠商之間的信任明顯提升。雖然仍有一部分企業(yè)偏好通過現(xiàn)有云服務(wù)關(guān)系托管模型(如通過 AWS 使用 OpenAI),但越來越多的企業(yè)選擇直接與模型提供方合作,或通過 Databricks 等平臺托管,尤其是在模型并未由主力云廠商托管時。
正如一位受訪者所說:“我們想第一時間用上最新最強的模型,預(yù)覽版本也很關(guān)鍵。”相較去年“盡可能繞回主云廠商”的策略,這種直接托管趨勢是一個顯著轉(zhuǎn)變。
10. 隨著任務(wù)復(fù)雜性上升,模型切換成本也在快速上漲
去年,不少企業(yè)在設(shè)計AI 應(yīng)用時刻意降低切換成本,希望模型“來去自如”。但隨著“代理式工作流”的興起,這一策略開始失效。
代理工作流通常涉及多步驟協(xié)作,模型之間的替換將牽一發(fā)而動全身。企業(yè)在構(gòu)建提示語、設(shè)計護(hù)欄、驗證質(zhì)量方面投入大量資源后,更不愿意輕易更換模型。
一位 CIO 總結(jié)得非常直接:“我們所有提示都為 OpenAI 優(yōu)化過了,每個 prompt 都有特定的結(jié)構(gòu)和細(xì)節(jié)。要切到另一個模型,不僅要重新調(diào)教所有提示,還可能影響整個工作流的穩(wěn)定性。”
11. 外部評估基準(zhǔn)日漸成為“模型采購的第一道篩選”
隨著模型數(shù)量激增,企業(yè)采購者也越來越依賴類似 Gartner 魔力象限那樣的外部評價體系,如 LM Arena。這類評估為模型采購提供了初篩參考。
盡管企業(yè)仍高度重視內(nèi)部基準(zhǔn)測試、金標(biāo)數(shù)據(jù)集和開發(fā)者反饋,但外部指標(biāo)正在成為“第一道門檻”。不過,企業(yè)普遍強調(diào):外部 benchmark 只是評估的一部分,真正決定性因素仍然來自實際試用和員工反饋。
四、應(yīng)用:AI 應(yīng)用加速落地,
企業(yè)從“自建”轉(zhuǎn)向“采購”
12. 企業(yè)從“自己開發(fā)”向“購買成品”大幅轉(zhuǎn)變
AI 應(yīng)用生態(tài)正在迅速成熟。過去一年,企業(yè)從“自己構(gòu)建”向“采購專業(yè)第三方應(yīng)用”的轉(zhuǎn)變非常明顯。
原因主要有兩個:
(1)性能與成本的動態(tài)差異使持續(xù)評估和調(diào)優(yōu)成為必要,而這通常更適合由專業(yè)團隊而非內(nèi)部團隊執(zhí)行;
(2)AI 領(lǐng)域演進(jìn)迅速,內(nèi)部自研工具難以長期維護(hù),且未必構(gòu)成競爭優(yōu)勢,反而降低了“自建”的性價比。
例如,在客戶支持場景中,超過 90% 的受訪 CIO 表示正在測試第三方應(yīng)用。一家上市金融科技企業(yè)曾嘗試自研客戶服務(wù)系統(tǒng),但最終決定轉(zhuǎn)向采購成熟方案。這一趨勢在醫(yī)療等高風(fēng)險行業(yè)尚未完全展開,因數(shù)據(jù)隱私與合規(guī)仍是首要考量。
13. “按結(jié)果計費”仍不被 CIO 廣泛接受
盡管“按效果付費”被廣泛討論,但企業(yè)在實踐中仍有諸多顧慮——例如結(jié)果定義模糊、歸因困難、成本不可控等。多數(shù) CIO 表示:他們更傾向于按使用量計費的方式,因為這更直觀、可預(yù)測、可控。
14. 軟件開發(fā)成為首個“殺手級”AI 應(yīng)用場景
雖然 AI 已在內(nèi)部搜索、數(shù)據(jù)分析、客戶服務(wù)等多個領(lǐng)域落地,但軟件開發(fā)的應(yīng)用爆發(fā)最為顯著。這得益于三重利好:
(1)模型能力顯著提升;
(2)現(xiàn)成工具質(zhì)量極高;
(3)投資回報率直接可見,適用行業(yè)廣泛。
一家高增長 SaaS 公司 CTO 表示,他們現(xiàn)在近 90% 的代碼由 Cursor 和 Claude Code 生成——而一年前使用 GitHub Copilot 時,僅占比 10-15%。這種躍遷式采用雖仍屬于前沿現(xiàn)象,但可能正是企業(yè)界未來的風(fēng)向標(biāo)。
15. Prosumer 市場(生產(chǎn)者消費者融合)拉動應(yīng)用早期增長
強消費品牌帶動企業(yè)采購決策的現(xiàn)象再次上演。
ChatGPT 是典型案例:許多 CIO 表示購買企業(yè)版 ChatGPT 是因為“員工用得慣、喜歡、信得過”。從生產(chǎn)者市場向企業(yè)端的自然延伸,加速了新一代 AI 應(yīng)用的增長。
16. AI 原生應(yīng)用的速度與質(zhì)量正在超越傳統(tǒng)巨頭
雖然傳統(tǒng)廠商擁有渠道優(yōu)勢和品牌信任,但在產(chǎn)品質(zhì)量與迭代速度上,AI 原生公司已開始超越。例如在編碼工具領(lǐng)域,Cursor 這類專為 AI 場景構(gòu)建的工具,讓用戶對傳統(tǒng)的 GitHub Copilot 明顯“不再滿意”。
一位公共安全行業(yè) CIO點出:“第一代和第二代 AI 編碼工具差異極大。新一代原生產(chǎn)品更智能,也更實用。”
展望未來:企業(yè)級AI 的“試驗時代”已經(jīng)結(jié)束
企業(yè)部署 AI 不再是試驗項目,而是戰(zhàn)略行動。預(yù)算已經(jīng)常態(tài)化、模型選擇多元化、采購流程標(biāo)準(zhǔn)化、AI 應(yīng)用開始系統(tǒng)落地。盡管用例碎片化,但這正是企業(yè)擁抱的方向。一些關(guān)鍵廠商正在脫穎而出,企業(yè)也越來越多選擇成品應(yīng)用以加速落地。
市場形態(tài)愈加接近傳統(tǒng)軟件,但變化節(jié)奏與復(fù)雜性卻完全不同——這是 AI 的特有節(jié)奏。
原文標(biāo)題 : 2025年,AI大模型在企業(yè)場景走到哪了?

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月3日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7月31日免費預(yù)約>> OFweek 2025具身機器人動力電池技術(shù)應(yīng)用大會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
免費參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 一文看懂視覺語言動作模型(VLA)及其應(yīng)用
- 3 “支付+”時代,支付即生態(tài) | 2025中國跨境支付十大趨勢
- 4 中國最具實力AI公司TOP10
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 AI的夏天:第四范式VS云從科技VS地平線機器人
- 7 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 8 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 10 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?