大數(shù)據(jù)文摘出品
剛剛!OpenAI發(fā)布了它自稱“迄今為止最強大”的模型:o3-pro。
——這是此前發(fā)布的推理模型o3的“加強版”。
o3-pro屬于“推理模型”,它可以一步步拆解問題、邏輯嚴(yán)密地得出結(jié)論。這種能力使它在物理、數(shù)學(xué)、編程等嚴(yán)謹(jǐn)性要求較高的領(lǐng)域表現(xiàn)更為穩(wěn)定可靠。
OpenAI宣稱,在評估中,o3-pro在所有測試領(lǐng)域都優(yōu)于基礎(chǔ)版o3,尤其在科學(xué)、教育、寫作輔助、商業(yè)分析和編程等領(lǐng)域,獲得了評審的一致好評。它不僅在準(zhǔn)確性、清晰度、全面性上表現(xiàn)更強,還更擅長理解復(fù)雜指令。
目前,o3-pro已經(jīng)上線:
ChatGPT Pro 和 Team 用戶已可使用(取代舊版 o1-pro);
企業(yè)和教育用戶將在下周獲得權(quán)限;
開發(fā)者API也已經(jīng)接入,價格為每百萬輸入tokens 20美元,輸出tokens 80美元。
順便說一句,百萬輸入tokens大約等于75萬字——比《戰(zhàn)爭與和平》還要長一點。
除了基礎(chǔ)對話能力,o3-pro還擁有多項高級功能:聯(lián)網(wǎng)搜索、視覺識別、Python工具調(diào)用、文件分析、甚至可以基于記憶進(jìn)行個性化響應(yīng)。但也并非完美無缺:
例如,暫時不支持圖片生成;Canvas 工作區(qū)功能不兼容;臨時對話功能暫時關(guān)閉;響應(yīng)速度相比o1-pro略慢。
不過在一系列專業(yè)基準(zhǔn)測試中,o3-pro打敗了Google的Gemini 2.5 Pro和Anthropic的Claude 4 Opus,尤其是在AIME 2024(高難數(shù)學(xué)測試)和GPQA Diamond(博士級科學(xué)測試)中斬獲佳績。
而這場替換來的悄無聲息。沒有發(fā)布會,也沒有 demo 視頻。OpenAI 用慣常方式在 changelog 中寫道:“評審一致認(rèn)為 o3-pro 在科學(xué)、教育、編程、商業(yè)和寫作幫助等關(guān)鍵領(lǐng)域優(yōu)于 o3。”評價中,“清晰度”“全面性”“指令執(zhí)行力”“準(zhǔn)確性”成為關(guān)鍵詞。
One more thing
除了新模型,還有另一個消息:
OpenAI 原計劃在 6 月發(fā)布的開源模型——推遲了。
6 月 10 日,Sam Altman 在 X 上發(fā)文宣布:開源模型將延遲至“夏末”上線。他寫道:“我們的研究團(tuán)隊做了一些意想不到又非常驚艷的事情,我們相信這非常值得等待,但還需要一點時間。”
這本應(yīng)是 OpenAI 多年來首個真正意義上的開源權(quán)重模型。據(jù)稱,它將具備與 o 系列相似的“推理能力”,目標(biāo)是超越當(dāng)前最強開源推理模型,如 DeepSeek 的 R1。而在這條時間線上,OpenAI 已落后一步——就在同一天,Mistral 發(fā)布了自家首個推理模型家族 Magistral;更早之前, Qwen 推出了一套支持推理與快速切換的混合模型。
據(jù) TechCrunch 報道,OpenAI 此前內(nèi)部也在討論給開源模型接入云端能力,例如復(fù)雜問題時自動請求 OpenAI 云模型協(xié)助。但這些功能最終是否會出現(xiàn)在首發(fā)版本中,尚未可知。
Altman 曾公開承認(rèn),OpenAI 在“開源與封閉”的爭議中站到了“歷史錯誤的一邊”。這次推遲,某種意義上,是技術(shù)節(jié)奏的調(diào)整,也可能是一次產(chǎn)品路線的重新權(quán)衡。
推理模型顯然是今年 AI 賽道的新焦點:更像人類思維、更少幻覺、更適用于復(fù)雜任務(wù)。但當(dāng)商業(yè)化模型搶占企業(yè)市場,開源模型搶占開發(fā)者生態(tài),OpenAI 是否還能兩頭通吃?
真正的問題是:它還來得及奪回“開源”的主動權(quán)嗎?
作者長期關(guān)注 AI 產(chǎn)業(yè)落地與學(xué)術(shù)動態(tài)、以及具身智能、汽車科技等前沿領(lǐng)域,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業(yè)動態(tài)與技術(shù)趨勢!
GPU算力按需租用
A100/H100 GPU算力按需租用,
秒級計費,平均節(jié)省開支30%以上!
掃碼了解詳情?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.