訂閱
糾錯
加入自媒體

GPT-4.5發(fā)布,號稱OpenAI最好的聊天模型

2025-03-07 09:56
Ai芯天下
關注

前言:GPT-4.5的發(fā)布被OpenAI視為[非思維鏈模型的最后一代],此后將轉(zhuǎn)向需要長時間思考的推理模型。

這一轉(zhuǎn)變與行業(yè)趨勢緊密相連——自從DeepSeekR1開源引發(fā)推理熱潮后,AI競爭的焦點已經(jīng)從數(shù)據(jù)規(guī)模轉(zhuǎn)向邏輯深度。

作者| 方文三圖片來源|網(wǎng) 絡

OpenAI正式發(fā)布GPT-4.5

在2月27日,OpenAI通過一段時長為13分鐘的視頻,正式發(fā)布了其迄今為止最為龐大的最新模型——GPT-4.5。

在介紹該模型時,OpenAI的研究副總裁MiaGlaese指出,GPT-4.5模型的顯著特點是其能夠進行充滿熱情、直觀且自然流暢的對話,并且在理解用戶需求方面展現(xiàn)出更為強大的能力。

GPT-4.5與o1在回答同一問題時的表現(xiàn)有所不同。

值得注意的是,GPT-4.5并非一個推理模型,而是迄今為止OpenAI所構(gòu)建的規(guī)模最大、知識儲備最為豐富的模型。

據(jù)透露,GPT-4.5的訓練過程消耗了相當于GPT-4o十倍的計算資源,其性能的提升充分展示了預訓練規(guī)模擴展所帶來的顯著效果。

在多項基準測試中,GPT-4.5的表現(xiàn)超越了GPT-4o,特別是在數(shù)學能力上提高了27%,在編碼能力上提升了7%至10%。GPT-4.5在某些特定指標上甚至超越了o3-mini。

GPT-4.5的核心進步體現(xiàn)在無監(jiān)督學習能力的增強。

通過增強計算資源和數(shù)據(jù)規(guī)模,該模型在執(zhí)行復雜任務時表現(xiàn)出更高的精確度,特別是在降低[幻覺]現(xiàn)象(即錯誤生成信息)方面取得了顯著成效。

這使得GPT-4.5在處理事實性問題時更為可靠,適用范圍也更為廣泛。

在減少幻覺和提高準確率方面,早期測試顯示GPT-4.5具有較高的情感智能(EQ),能夠根據(jù)對話情境調(diào)整其回應,尤其在處理與用戶情感相關的交流時,展現(xiàn)了較高的同理心。

盡管其更高的[情商]、審美直覺和創(chuàng)造力主要依賴于無監(jiān)督學習,GPT-4.5在推理能力方面也顯示出強勁的實力。

GPT-4.5的顯著升級體現(xiàn)在其對人類情感的深刻理解。

OpenAI的研究副總裁MiaGlaese強調(diào),GPT-4.5的回應更加溫馨、自然,并且能夠通過語言調(diào)整用戶的情緒狀態(tài)。

更通用和更自然智能的模型

OpenAI明確指出,GPT-4.5在作出反應之前并不進行思考,這使得其優(yōu)勢與推理模型如o1等截然不同。

因此,與o1、o3-mini相比,GPT-4.5被認為是一種更通用、更自然智能的模型。

OpenAI堅信推理將成為未來模型的核心能力,而預訓練和推理這兩種擴展方法將相互補充。

隨著GPT-4.5等模型通過預訓練變得更加智能和知識淵博,它們將成為推理和使用工具的代理的更強大的基礎。

在GPQA(科學)、AIME’24(數(shù)學)、SWE-BenchVerfied(編碼)等數(shù)據(jù)集上,GPT-4.5全面領先于GPT-4o,但在數(shù)學和真實編程能力方面,仍略遜于o3-mini。

OpenAI已經(jīng)開發(fā)出一系列先進的可擴展技術,這些技術使得GPT-4.5能夠利用較小模型的數(shù)據(jù)集來訓練更為龐大和強大的模型。

這些技術的引入顯著提升了GPT-4.5的操作性、對細節(jié)的敏感度以及自然對話能力。

定價高于市面主力大模型

目前,GPT-4.5僅對ChatGPTPro用戶開放,其訂閱費用高達每月200美元,API使用成本則為輸入75美元/百萬token、輸出150美元/百萬token,是GPT-4o的30倍。

OpenAI坦承,模型訓練消耗了大量GPU資源,因此迫切需要擴充數(shù)萬張顯卡以滿足需求。

以輸入數(shù)據(jù)緩存未命中為例,GPT-4.5的API費用是GPT-4o的三十倍,較之DeepSeek-V3(美元定價)則為二百七十七倍,與DeepSeek-R1(美元定價)相比則為一百三十六倍。

進一步比較,即便是在DeepSeek的優(yōu)惠時段,GPT-4.5的費用也達到了前者的五百五十五倍。

GPT-4.5的API定價出乎意料地高,不僅高于自家主力大模型,甚至比新推出的全球首個混合推理模型Claude-3.7-Sonnet高出二十五倍,更不用說與剛剛宣布錯峰定價的[價格屠夫]DeepSeek相比了。

GPT-4.5的計算效率相較于GPT-4實現(xiàn)了超過十倍的提升。

在API層面,ChatCompletionsAPI、AssistantsAPI和BatchAPI將向所有付費開發(fā)者提供預覽,支持函數(shù)調(diào)用等關鍵功能及圖像輸入視覺功能,適用于寫作輔助等應用場景。

然而,由于模型龐大且計算密集,成本較高,官方正在評估是否長期在API中提供該服務。

將與kimi、DeepSeek展開競爭

目前,OpenAI的市值已超過1570億美元(約合人民幣1.1萬億元)。

最近,奧爾特曼公開透露,OpenAI正在考慮根據(jù)使用量來設定價格策略。

至于何時能夠?qū)崿F(xiàn)通用人工智能(AGI),他指出,當一個AI系統(tǒng)能夠執(zhí)行一個熟練人士在關鍵工作中所能完成的任務時,即可稱之為AGI。

值得注意的是,在今天凌晨,月之暗面kimi再次發(fā)布最版本的Kimi-K1.6-IOI-high模型,該模型在LiveCodeBench基準測試中排名第一,超越了GPT和Claude系列模型。

同時,DeepSeek的開源周活動持續(xù)吸引公眾關注,包括發(fā)布了專為英偉達HopperGPU設計的MLA解碼內(nèi)核FlashMLA、EP通信庫DeepEP、FP8GEMM(通用矩陣乘法)計算庫DeepGEMM等。

據(jù)公開資料,2024年全年,OpenAI的銷售收入約為37億美元,同比增長超過1700%。

預計到2025年,OpenAI的年化收入將增長至116億美元,其中75%的收入來源于用戶對ChatGPTPlus服務的訂閱。

內(nèi)部預估,到2029年全年,OpenAI的營收將達到1000億美元,相當于目前雀巢公司的年銷售額。

GPT-4.5象征著一個時代的終結(jié)

OpenAI宣布,GPT-4.5將是其聊天機器人系統(tǒng)中最后一個不包含[思維鏈推理]功能的版本。

繼GPT-4.5之后,OpenAI的模型將可能模仿人類的思考方式,花費更多時間深入思考問題后再給出回答,而不是立即作出反應。

GPT-4.5代表了OpenAI最后一個[非思維鏈]模型。

基于GPT-4.5,OpenAI計劃優(yōu)化其產(chǎn)品線,為GPT-5的重大創(chuàng)新做好準備,并奠定采用新方法的基礎。

山姆·奧特曼指出,過多的模型會使用戶感到困惑,而未來的GPT-5將成為一個重要里程碑,它將整合OpenAI的所有技術進步。

其中最大的創(chuàng)新在于它與之前獨立的o系列模型的融合。

OpenAI表示,它將把o3模型中的大部分技術整合進GPT-5,這實際上意味著o3模型將不再作為一個獨立的產(chǎn)品存在。

換言之,GPT-5將融合兩個并行發(fā)展的[AI大腦]的優(yōu)勢。

業(yè)界推測,GPT-5可能會扮演[路由器模型]的角色,根據(jù)需要協(xié)調(diào)各種內(nèi)部組件或子模型。

用戶只需與GPT-5交互,而GPT-5將利用不同的工具和知識資源來尋找最佳解決方案,這可能包括訪問搜索引擎、執(zhí)行計算或使用代碼解釋工具,具體取決于任務需求。

結(jié)尾:在收購OpenAI未果后計劃

GPT-4.5的發(fā)布不僅是技術上的進步,更是AI人性化的重要里程碑。

它用情商重新定義了人機交互,用知識的廣度賦能實際應用場景,同時也因高昂的成本引發(fā)了爭議。

隨著推理模型的到來,AI有望真正融入人類生活,成為工作與情感的[雙重助手]。

對于普通用戶而言,如何在性能與成本之間找到平衡,將是接下來最實際的挑戰(zhàn)。

部分資料參考:鳳凰網(wǎng)科技:《史上最貴AI模型上線,主打情商高,奧特曼竟因"帶娃"缺席發(fā)布會?》,網(wǎng)站知識:《OpenAI發(fā)布GPT-4.5:高情商AI引發(fā)全網(wǎng)熱議》,機器之心:《OpenAI迄今最大、最貴模型,API價格飛漲30倍,不拼推理拼情商》,DeepTech深科技:《OpenAI發(fā)布號稱[情商最高]的AI模型,奧特曼稱GPU已用完》,雷科技:《價格是DeepSeek277倍!GPT-4.5還是太自信了》,鈦媒體AGI:《6年來最強模型GPT-4.5登場:更貴、更高情商、更少幻覺》

       原文標題 : AI芯天下丨熱點丨GPT-4.5正式發(fā)布,號稱OpenAI最好的聊天模型

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號