99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

OpenAI并未讓DeepSeek驚出一身冷汗

0
分享至


出品 | 虎嗅科技組

作者 | 房曉楠

編輯 | 苗正卿

頭圖 | 視覺中國

“OpenAI的創(chuàng)新好像到瓶頸期了。”一位業(yè)界人士這樣說道。

今日凌晨,預熱了很久的OpenAI o3模型完整版終于面世,且與以往直播“擠牙膏”式的依次、慢吞發(fā)布方式不同的是,這次o3和o4-mini是同時發(fā)布。

在OpenAI官方的陳述中,o3和o4-mini的亮點主要在于可以組合調用ChatGPT中的各個工具,像是網絡搜索、Python、圖像分析、文件解釋和圖像生成等。這可以看作是OpenAI開始后發(fā)補足自身在Agent能力上的探索。

其中,o3作為推理模型,在編程、數學、科學、視覺感知等多個維度的基準測試中都刷新了紀錄。比如在Codeforces、SWE-bench、MMMU基準測試中,視覺任務準確率高達87.5%,而MathVista達到75.4%。

其實分數、榜單,這些都是常規(guī)操作。相較于以往,這次的最大不同在于,o3和o4-mini將上傳的圖像直接集中到思維鏈中,這就意味著,圖像不僅僅是被看到,還能被用來作為思考過程中的一部分。

從OpenAI團隊成員、中科大校友Jiahui Yu發(fā)布的帖文來看,“用圖像思考”應該是OpenAI去年9月發(fā)布o系列模型以來,就在研發(fā)計劃中,之前還悄悄推出了o1 Vision并進行了初步預覽,但并沒有取得很好的效果,也沒有引起關注,直到這次在o3和o4-mini上實現了這一能力。

根據外部專家評估,o3作為o1系列模型的繼任者,其在復雜問題上的錯誤率要比后者低20%,適合在生物學、數學和工程領域的復雜問題查詢。

針對這一點,國外一位醫(yī)學博士在測評后發(fā)帖表示,這一點確實有很大進步,當他向o3來提問一些頗具挑戰(zhàn)性的臨床或醫(yī)學問題時,回答精準、全面,符合對一位該領域真正專家的期望。

對于那些想親自測評、體驗的用戶來說,OpenAI官方已經表示,目前ChatGPT的Plus、Pro會員以及Team用戶,即日起就可以直接體驗o3、o4-mini,以及o4-mini-high,而之前的o1、o3-mini和o3-mini-high已默默退出舞臺。這一操作也被有些網友戲稱為“內部賽馬”,新的產品出來后,之前的通通讓路。

到目前為止,之前預告要發(fā)布的GPT?4.1全家桶系列、o3、o4-mini模型就已經全部亮相展示了。據Sam Altman表示,o3和o4-mini可能是ChatGPT在GPT-5發(fā)布之前的最后獨立AI推理模型了,期間大概率是不會再有其他新款模型出來了,另外他也說了,預計將在幾周內將o3-pro升級到專業(yè)版。

在OpenAI官方的宣傳口徑中,o3和o4-mini是OpenAI所有模型中最為強大、智能的模型,一些開發(fā)者、用戶在使用時,也感受到了進步。但是,創(chuàng)新能力似乎并沒有達到預期。

“OpenAI的步調已經不再挺胸闊步了,更不知所措。”在看完OpenAI這次發(fā)布的新品后,一位業(yè)內人士這樣感嘆道。

雖然o3、o4-mini模型作為新產品,效果不錯,但相較于OpenAI以往的激進和高舉旗幟式前進,如今在創(chuàng)新上面呈現出明顯的心有余而力不足。

其實前兩天在GPT4.1系列套餐發(fā)布后,不少業(yè)內人士就向虎嗅表示,“暫時還沒看到有什么特別亮眼的突破。”“對o3期待值沒有那么高。”

或者這種“失望”要來得更早一點。

去年12月,o3在OpenAI的系列直播尾聲亮相,Sam Altman稱其為“一個非常、非常聰明的模型”,完全將O1甩在身后,更是在ARC-AGI測試這一旨在評估AI系統(tǒng)適應新任務和展示流動智力能力的測試中,獲得87.5%的成績,也是首次超越人類平均水平(85%),令業(yè)界感到震驚,被認為是在通往AGI的道路上迎來了新突破。但在業(yè)界開發(fā)者看來,似乎并不是這樣。

“這就好比高考成績不能代表工作業(yè)務能力。”一位開源領域人士銳評道。而且,如今的行業(yè)趨勢已經進入到對數據高要求、對Agent全適配方向中,這就意味著私有化和混合模型推理為主的時代到來了。但是OpenAI對于開源的態(tài)度,眾所周知。

尤其是在年初,當DeepSeek-R1憑借著超低的訓練成本和性能媲美o1精彩亮相時,無疑是給了OpenAI一記響亮的耳光,而DeepSeek的全方位、無死角開源,像是又給了OpenAI再一記更響亮的耳光。

之后,這兩記耳光不僅打得OpenAI黯然失色,還亂了它的陣腳和節(jié)奏,模型命名混亂、功能創(chuàng)新不足、嘗試開源但態(tài)度曖昧不明,再加上內部人員高頻流失,等等,無疑正在讓它慢慢失去競爭優(yōu)勢,再不復一年之前被視為通往AGI的正確的、領先的道路引領者角色……

而官方也說了,此次發(fā)布的GPT4.1系列、o3,以及o4-mini是GPT-5正式發(fā)布前的最后一次模型發(fā)布了,也被視為GPT-5時刻的關鍵一步,可以理解為是GPT-5的前菜,主打“量大管飽”。但是,在技術的攀登道路上,量變能夠引起質變并非唯一真理,更何況,這個量還遠遠不足。

“GPT-5應該是多個GPT4.1組成的吧。”一位業(yè)內人士這樣戲謔道,一直傳GPT-5或將在5月發(fā)布,到底OpenAI還能不能重回巔峰,只有到時候揭曉了。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4248481.html?f=wyxwapp

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
網傳這個女孩在餐廳里用雙語要求黑人回她的老家!

網傳這個女孩在餐廳里用雙語要求黑人回她的老家!

去非
2025-05-04 09:18:21
這下可給加州州長樂壞了,咱也是見證歷史了!

這下可給加州州長樂壞了,咱也是見證歷史了!

火山雜談
2025-05-06 00:05:16
醫(yī)院院長被妻子舉報,醫(yī)學院是他的后花園,329名情人創(chuàng)下紀錄

醫(yī)院院長被妻子舉報,醫(yī)學院是他的后花園,329名情人創(chuàng)下紀錄

七月故事會
2025-04-29 02:45:27
當年舉報畢福劍的那位告密者張清:眾叛親離,過得好慘

當年舉報畢福劍的那位告密者張清:眾叛親離,過得好慘

新興網評
2024-12-11 21:02:46
前CBA外援致敬波波維奇:你和馬刺隊改變了我的一生

前CBA外援致敬波波維奇:你和馬刺隊改變了我的一生

雷速體育
2025-05-05 11:12:19
曼聯(lián)夏季大甩賣!全隊僅4名非賣品 B費馬奎爾在列

曼聯(lián)夏季大甩賣!全隊僅4名非賣品 B費馬奎爾在列

球事百科吖
2025-05-06 05:10:07
醫(yī)院人妻通奸后續(xù):開房幾十次,多次用咬,人妻美照曝光

醫(yī)院人妻通奸后續(xù):開房幾十次,多次用咬,人妻美照曝光

蜉蝣說
2024-10-24 16:07:30
前場籃板聯(lián)盟第2!Sam:湖人今夏引援重點目標,依舊是新西蘭巨塔

前場籃板聯(lián)盟第2!Sam:湖人今夏引援重點目標,依舊是新西蘭巨塔

雞丁侃球
2025-05-05 21:11:59
5-0!6-0!中國足球殺瘋了,一場慘敗后迎爆發(fā)取兩連勝,未來可期

5-0!6-0!中國足球殺瘋了,一場慘敗后迎爆發(fā)取兩連勝,未來可期

球盲百小易
2025-05-06 01:30:49
上千游客深夜滯留張家界大喊退票?當地通報:表示歉意,將切實提升旅游管理和接待服務水平

上千游客深夜滯留張家界大喊退票?當地通報:表示歉意,將切實提升旅游管理和接待服務水平

界面新聞
2025-05-04 17:05:03
"野模"孫怡人設崩塌,知三當三成為豪門棄婦,難怪王京花看不上她

"野模"孫怡人設崩塌,知三當三成為豪門棄婦,難怪王京花看不上她

小晨同學啊
2025-05-05 17:50:42
馬筱梅懶理照片風波,用食物逗菲寶!網友:汪家唯一沒被黑的成員

馬筱梅懶理照片風波,用食物逗菲寶!網友:汪家唯一沒被黑的成員

史書無明
2025-05-05 20:47:47
和楊鈺瑩分手27年后,賴文峰開始直播帶貨,評論區(qū)都喊“大哥好”

和楊鈺瑩分手27年后,賴文峰開始直播帶貨,評論區(qū)都喊“大哥好”

喜歡歷史的阿繁
2025-05-06 01:46:57
油價大降0.36元/升,25年最大下跌后重新下降,調價時間確定

油價大降0.36元/升,25年最大下跌后重新下降,調價時間確定

豬友巴巴
2025-05-05 14:55:03
吉吉·哈迪德與布萊德利·庫珀公開戀情

吉吉·哈迪德與布萊德利·庫珀公開戀情

東方不敗然多多
2025-05-05 11:35:26
中國客機在澎湖海域墜毀,225人遇難,一周后遇難者神秘錄音現世

中國客機在澎湖海域墜毀,225人遇難,一周后遇難者神秘錄音現世

談史論天地
2025-05-05 11:55:03
白人女性是不是很美,為什么?看網友:俄羅斯和中東易出極品美女

白人女性是不是很美,為什么?看網友:俄羅斯和中東易出極品美女

美好客棧大掌柜
2024-12-24 00:15:02
沒想到最先破防的是張雪峰!為什么富養(yǎng)出來的女兒,都去當三兒?

沒想到最先破防的是張雪峰!為什么富養(yǎng)出來的女兒,都去當三兒?

清游說娛
2025-05-04 10:32:31
美國立國249年,被美國媒體唱衰了249年

美國立國249年,被美國媒體唱衰了249年

高博新視野
2025-05-04 12:32:08
19球4助攻!25歲鋒線萬金油抉擇:切爾西報價3000萬,巴薩要雙倍

19球4助攻!25歲鋒線萬金油抉擇:切爾西報價3000萬,巴薩要雙倍

叁炮體育
2025-05-05 20:16:16
2025-05-06 06:28:49
虎嗅APP incentive-icons
虎嗅APP
個性化商業(yè)資訊與觀點交流平臺
24056文章數 686126關注度
往期回顧 全部

科技要聞

這3款新 iPhone,可能會改變蘋果的未來

頭條要聞

敦煌"五一"突現12級狂風 強沙塵暴襲城近萬名游客被困

頭條要聞

敦煌"五一"突現12級狂風 強沙塵暴襲城近萬名游客被困

體育要聞

當年的阿森納小球童,要踢歐冠決賽了

娛樂要聞

馬麗崩潰哭訴上熱搜,評論區(qū)罵聲一片

財經要聞

人民幣暴漲近900點!發(fā)生了什么?

汽車要聞

小米SU7的真實續(xù)航到底有多少?

態(tài)度原創(chuàng)

本地
時尚
家居
教育
公開課

本地新聞

春色滿城關不住 | 花漾千陽!塬上秘境藏幾重詩意?

“襯衫+短褲”今年最火穿搭,這樣穿太高級了!

家居要聞

黑白紋理 簡約低調空間

教育要聞

計算量其實不大的,你發(fā)現這種方法了么?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 衡南县| 军事| 罗甸县| 三门峡市| 丰原市| 沅陵县| 万宁市| 景德镇市| 通渭县| 囊谦县| 沙田区| 南阳市| 通州市| 嵊泗县| 凉城县| 兴城市| 忻州市| 会泽县| 黎川县| 白城市| 乌鲁木齐市| 凭祥市| 乐清市| 丽水市| 普兰县| 石首市| 阿尔山市| 静安区| 综艺| 吉首市| 缙云县| 巩义市| 常州市| 吴忠市| 镇平县| 扬中市| 芜湖县| 怀安县| 江西省| 林甸县| 平邑县|