OpenAI發(fā)布最強(qiáng)AI模型!
沒等來GPT-5,卻等來了OpenAI悄悄發(fā)布的「o3-pro」。
我們一起看看這個聲稱 “最強(qiáng)AI模型” 的o3-pro,有哪些亮點(diǎn)?適合哪些人使用?
1 什么是o3-pro?
簡單來說,o3-pro是o3推理模型的加強(qiáng)版。官方介紹它是目前推理能力最強(qiáng)的一代。
具體來說,o3-pro是專門為復(fù)雜問題設(shè)計的:它不追求快,而是強(qiáng)調(diào)“想得清楚”。像數(shù)學(xué)、科學(xué)、編程、寫作、教育類任務(wù),它處理得更有條理,輸出內(nèi)容更準(zhǔn)確、結(jié)構(gòu)更清晰。
2 性能表現(xiàn)亮眼
先來上成績單。
在專家評估中,o3-pro比o3得到了更多認(rèn)可。
在OpenAI內(nèi)部的測試數(shù)據(jù)中,o3-pro表現(xiàn)相當(dāng)亮眼:
在數(shù)學(xué)測試AIME 2024中,超過了谷歌的 Gemini 2.5 Pro。
在GPQA Diamond(博士級科學(xué)知識評測)中,勝過了Anthropic家的 Claude 4 Opus。
在編程測試Codeforces中,也比前代模型有了不小的提升。
這些測試都是針對邏輯嚴(yán)謹(jǐn)性和知識深度的高難度評估。能在這里脫穎而出,確實(shí)說明了OpenAI在思考推理能力上的進(jìn)步。
此外,OpenAI還用 “4/4可靠性評估” 來證明了o3-pro的可靠性(4次回答全部正確才被視為成功)。
3 價格如何?
來看下API調(diào)用的價格:
輸入:$20/百萬token
輸出:$80/百萬token
相較于普通o3,價格貴了10倍......
4 最強(qiáng)也有局限性
再強(qiáng)的模型,也不是十全十美。
OpenAI列出了目前o3-pro存在的一些局限:
速度比前代慢,輸出時間更長;
暫不支持圖像生成;
暫時不兼容Canvas功能;
ChatGPT中無法使用“臨時對話”功能。
不過這些問題對大多數(shù)文字為主的使用場景來說,影響不大。但如果你要的是深度和準(zhǔn)確性,那就得接受慢工出細(xì)活兒。
目前,o3-pro已經(jīng)面向ChatGPT Pro和Team用戶開放,企業(yè)和教育用戶下周可用。
如果你日常對AI回答的質(zhì)量、準(zhǔn)確率有較高要求,不妨試試看。
原文標(biāo)題 : OpenAI發(fā)布最強(qiáng)AI模型!

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-6.16立即報名>> 【在線會議】olution Talks |Computex 2025關(guān)鍵趨勢深讀
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動力電池技術(shù)應(yīng)用大會
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機(jī)器人領(lǐng)域,聯(lián)通、海爾、美的等紛紛入局