網易首頁 > 網易號 > 正文申請入駐

GPT-4.5震撼發布！智商高情商高，價格更高

2025-02-28 11:19:35　來源: 直面派

北京舉報

分享至

　　這才是OpenAI對抗DeepSeek壓力的一記還擊。

　　之前將推理模型下放給免費用戶只是小打小鬧，北京時間2月28日凌晨4點，OpenAI震撼發布GPT-4.5。

　　OpenAI CEO山姆·奧特曼（Sam Altman）在X上直呼坐不穩了：“這是我第一次覺得，和AI對話就像是面對一個深思熟慮的人。有好幾次，我坐在椅子里感嘆從AI那里得到了真心實意的建議。”

　　一句話概括：這個模型很大、很聰明、很有“人味”。

　　如果過去的ChatGPT像是冷面學霸，聰明是聰明，就是愛炫技；那選擇GPT-4.5，你將喜提一個溫柔學霸，其實比冷面學霸更聰明，能為你更好地答疑解惑，與此同時還能提供情緒價值。

　　為了這個模型，OpenAI投入巨大，甚至由于需要的計算資源太大而跨數據中心同時預訓練模型。奧特曼宣布GPU不夠用了，目前GPT-4.5只提供給ChatGPT Pro用戶，下周加幾萬個GPU之后再逐步下放。而且其API價格比GPT-4o高出30倍。

　　OpenAI就是為了證明一件事：“大力出奇跡”的敘事沒有被打破，推理模型不代表一切。

　　這樣的態度，在奧特曼的官宣X信息中展露無遺：

　　“提醒一下：這不是一個推理模型，不能輕松打破基準測試。它是一種不同類型的智能，里面有一種我以前從未感覺過的魔力。”

　　在GPT-4.5發布之后，奧特曼還懟了Meta。在“Meta計劃推出獨立AI應用，以與OpenAI競爭”的新聞下開麥：“好啊那我們會做一個社交應用。”

　　這樣的直拳，并非以“城府”著稱的奧特曼的風格。看來GPT-4.5真的點燃了奧特曼心里的斗志。

　　比起前代模型GPT-4o，GPT-4.5的“智商”更高了，而這靠的是無監督學習。

　　在介紹文檔中，OpenAI表示，有兩個提升人工智能能力的互補范式。

　　一個是拓展推理，它能教會模型在反應之前先進行思考并產生思維鏈，從而解決復雜的STEM（Science科學、Technology技術、Engineering編程、Mathmatics數學）問題或邏輯問題。

　　另一個是無監督學習，它能提高世界模型的準確性和直覺性。

　　在OpenAI的模型中，o1和o3-mini等模型代表的就是推理范式，而GPT-4.5則是無監督學習的例子。

　　無監督學習，簡單來說可以理解為讓模型自己去知識的海洋里徜徉，自己學習到更多，從而變得更聰明，而非依賴人工標注。

　　在過去依賴人工標注的做法中，模型會結合人類反饋來改善響應與交互方式。彭博社援引知情人士稱，去年OpenAI推出的Orion模型并未達到公司期望，在嘗試回答未經訓練的編碼問題時就表現不佳。

　　OpenAI介紹，通過監督學習，GPT-4.5提高了其識別、建立聯系和創造性洞察的能力，而無需推理。

　　具體來說，GPT-4.5有更廣泛的知識和對世界的更深理解，回答更準確，幻覺也更少。

　　根據OpenAI官方文檔，GPT-4.5在SimpleQA中表現頗為亮眼。

　　SimpleQA是包含4000個事實性問題的數據集，用于測量模型在回答問題時的準確率。其中包含準確率（越高越好）和幻覺率（越低越好）兩個維度。

　　GPT-4.5的準確率達到62.5%，是GPT-4o（38.2%）、o1（47%）、o3-mini（15%）中最高的；幻覺率降至37.1%，也是GPT-4o（61.8%）、o1（44%）、o3-mini（80.3%）中最低的。

　　此外，在標準基準測試中，GPT-4.5也獲得了高分。

　　如在 SWE-Lancer Diamond 數據集上，GPT-4.5獲得了32.6%的通過率，獲得了186125美元（前不久Anthropic發布的擅長編程的Claude 3.5 Sonnet這個通過率為26.2%），比GPT-4o和o3-mini-high都高。

　　此外，GPT-4.5明顯強于GPT-4o和o3-mini-high的還有在MMMLU（多語言）測試中的表現。

　　而在科學領域GPQA、數學基準AIME24、代碼生成評估基準SWE-Bench Verified中，GPT-4.5的表現都顯著強于GPT-4o，弱于o3-mini-high。

　　不僅“智商”更高，GPT-4.5還被注入了“情商”，而且這兩點相輔相成。

　　在官方介紹中，OpenAI表示，對于GPT-4.5，他們開發了新的、可擴展的技術，利用來自較小模型的數據來訓練更強大的模型。

　　而這些技術提高了GPT-4.5的可控性、對細微差別的理解以及自然對話的能力。

　　翻譯一下就是：ChatGPT對話“更像人了”，更能洞察想法、體察情緒，并在回應中體現，而非一個無情的對話機器。

　　OpenAI也拿出了測試的結果證明GPT-4.5的使用感受會好很多：人類測試者的盲測中，GPT-4.5的偏好度遠高于GPT-4o，不管是在日常問題、專業問題還是創意性問題的互動中都是如此。

　　關于這一點，最生動的例子出現在演示視頻中。

　　OpenAI的研究人員用很情緒化的措辭向ChatGPT求助：“啊啊啊！！我朋友又放我鴿子了！！！寫一條短信告訴他們我恨他們！！！”

　　老模型GPT-4o二話不說就返回了短信內容：“知道嗎？我受夠了。你放我太多次鴿子了，我討厭你這么做——很明顯你就是這么對待我們的友情的。別再聯系了。”

　　但GPT-4.5“感受”到了用戶此時正在氣頭上，非常情緒化：“聽起來你很沮喪。”并且建議說興許可以試試清晰且平和地表達出感受，隨機給了兩條短信內容：“嗨，計劃又泡湯了讓我很沮喪，我原本真的很期待今天的。能聊聊到底怎么回事嗎？”

　　這是一種自發的、感覺很自然的反饋，更像“人”而不是只會執行任務的工具。演示人員也補充道，當然，你如果繼續要求要表達憤怒的短信，它也不會再堅持，而是會乖乖聽話。

　　實際上，OpenAI專門提到了“EQ（情商）”這個詞，負責演示的研究員甚至調侃稱，過去的ChatGPT聰明是聰明，但總有種“讓我來給你開開眼我有多聰明”的炫技感。

　　這種“情商”也不僅僅體現在“會安慰人”這種淺表的層面，實際上，這種能力和“高智商”相結合，可以讓同樣在嚴肅回答某個問題時，GPT-4.5更能切中要害、給出用戶需要的答案。

　　比如“海水為什么是咸的”這個問題，GPT-1完全是胡言亂語、傾倒一些八竿子打不著的詞語；GPT-2說了完整的句子了，而且回答切題，但只說因為海水里有鹽，不算回答了問題；GPT-3.5 Turbo進一步說了鹽是氯化鈉，但是這也無助于解決這個問題。

　　而GPT-4 Turbo就厲害了，不僅給出了答案，而且就像我們熟悉的“ChatGPT風格”一樣，還詳細列舉了過程。但是用戶拿到這個答案，仍然需要仔細閱讀、努力理解。

　　但GPT-4.5的回答和GPT-4T類似的詳細，但非常好理解，而且很易于記憶，基本上掃一眼就能明白它在說什么。

　　OpenAI還給出了三個示例，我們讓ChatGPT翻譯成了中文：

　　還是那句話，智商和情商俱在，更像“人”了。

　　“大力出奇跡”的敘事并沒有被打破，OpenAI想要證明的就是這一點。

　　換句話說，推理模型固然好，但這不意味著投入巨大資源造模型就沒有意義。

　　“每一次計算能力的增長都伴隨著新能力的誕生。GPT-4.5 是無監督學習領域中最前沿的模型之一。”

　　OpenAI介紹，GPT-4.5在回應時并不會先進行推理，這使得它的優勢與推理模型有很大不同。

　　與OpenAI o1和OpenAI o3-mini相比，GPT-4.5 是一個更為通用、天生更聰明的模型。OpenAI相信推理將是未來模型的核心能力，且擴展的兩種方法——預訓練和推理——將互為補充。

　　隨著像 GPT-4.5 這樣的模型通過預訓練變得更加聰明和知識更豐富，它們將成為推理和工具型代理的更強基礎。

　　雖然具體的資源投入具體有多大尚未透露，但在官宣視頻中，OpenAI的研究人員透露，為了最大化地利用資源，他們在預訓練模型時同時啟用了多個數據中心，因為他們需要的計算資源超過了單一高帶寬網絡架構所能提供的上限。

　　此外，OpenAI也不是沒有省著用，表示使用了低精度訓練（Low Precision Training）充分利用GPU性能。團隊還開發出了新的訓練機制，能夠在后訓練過程中使用更小的計算資源來微調如此大型的模型，最終才開發出了可以部署的模型。

　　在GPT-4.5發布之前，OpenAI首席研究官馬克·陳（Mark Chen）在采訪中談及與推理模型相比，GPT-4.5可以做什么：

　　“我認為這是根本不同的權衡。你有一個模型，它會立即給你回復，不需要做太多思考且會給出更好的答案，而另一個模型會思考一段時間然后給出答案。我們發現，在創意寫作等領域，這種模型（前者）比推理模型更出色。”

　　更重要的是，他談到了“縮放定律（Scaling Law）是否失效”的問題。OpenAI是否發現了所謂的“擴展瓶頸”？是否已經看到擴展帶來的收益遞減？

　　Chen稱，模型不能盲目地從頭開始學習推理，推理和擴展的范式是互補的，相互之間存在反饋循環。

　　對于外界敏感的成本問題，Chen也代表OpenAI表達降本的態度，稱贊DeepSeek做得非常好，OpenAI也關心以低廉的成本提供模型：“自從GPT-4首次推出以來，成本已經下降了幾個數量級。”

　　不過，就目前來看，OpenAI用“大力”砸出的“奇跡”非常昂貴。

　　OpenAI話也說得敞亮，稱GPT-4.5是一個非常龐大且計算稠密的模型，因此它比GPT-4o更昂貴，不是替代關系。

　　有多貴呢？GPT-4.5的API價格達到75美元/百萬tokens輸入、150美元/tokens輸出，是GPT-4o的30倍。后者的API價格為2.5美元/百萬tokens輸入、10美元/百萬tokens輸出。

　　有意思的是，OpenAI的GPU又不夠用了。奧特曼在X上官宣GPT-4.5時，專門說了壞消息：“我們真的很想同時向Plus和Pro用戶推出它，但我們的用戶增長非常迅速，現在GPU已經不夠用了。”

　　繼而，奧特曼承諾，下周“會增加數萬個GPU，然后將其（GPT-4.5）推廣到Plus用戶層”。

　　GPT-4.5很大、很強、很有“人味”，OpenAI無疑再一次證明了自己的實力，但其為此投入的成本也有點太高了。至于值不值——OpenAI能不能扛得住，以及客戶是否買賬——就得讓時間來驗證了。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

這屆出題太難了！新基準讓多模態模型集體自閉，GPT-4o都是零分

機器之心Pro 2025-02-18 14:02:59
0 跟貼 0
首次系統評估Qwen3在量化下的魯棒性：8bit下仍保持近乎無損性能

量子位 2025-05-09 15:23:51
0 跟貼 0

本科學歷但創造出GPT，奧特曼盛贊為「愛因斯坦級」天才

量子位 2025-01-01 14:17:10
29 跟貼 29

「ChatGPT+GitHub」，OpenAI搞了個大聯合

機器之心Pro 2025-05-09 14:34:34
3 跟貼 3
類比的長河，為何流到大模型就被截流？

鈦媒體APP 2025-04-30 16:09:25
0 跟貼 0

ChatGPT再進化：deep research接入GitHub代碼庫

智東西 2025-05-09 19:49:20
3 跟貼 3

AI輔助編碼帶來思維方式轉變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0
宇樹機器人復雜環境穩定起立，速度不亞于人類

量子位 2025-04-09 10:10:32
279 跟貼 279

一個「always」站在大模型技術C位的傳奇男子

量子位 2025-05-10 11:04:04
3 跟貼 3
垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0
谷歌發76頁智能體白皮書！你的「AI替身」已上線

新智元 2025-05-11 12:37:21
0 跟貼 0
AI正大大降低動漫等虛擬內容制作門檻

量子位 2025-04-25 14:16:10
0 跟貼 0
宇樹科技王興興：人類更喜歡長得像人的機器人

經濟觀察報 2025-05-11 15:28:07
38 跟貼 38
單圖生成14秒吉卜力動畫，分享制作過程

量子位 2025-04-08 18:23:02
0 跟貼 0
研發自動化的初衷是讓每一個研究員都有Agent助理

量子位 2025-04-23 08:05:00
0 跟貼 0
大模型正在打破教育領域的“不可能三角〞

量子位 2025-04-17 19:02:09
0 跟貼 0
AI逼瘋七巨頭，馬斯克們深陷中年危機！

新智元 2025-05-11 12:39:14
3 跟貼 3
視頻生成模型無損加速兩倍，秘訣是「抓住attention時空稀疏性」

機器之心Pro 2025-05-07 19:05:34
2 跟貼 2
o3/o4-mini實測太炸裂：看照片反推定位

量子位 2025-04-17 22:23:17
0 跟貼 0
人人都能做開發者！連小學生都能輕松上手的0代碼開發平臺來了

量子位 2025-04-15 11:59:12
0 跟貼 0
老板想本地跑AI，只給10萬還想體驗滿血DS，我該咋辦？

量子位 2025-04-14 15:31:01
0 跟貼 0
Claude腦回路被開盒：AI會撒謊和暗中計劃

量子位 2025-04-04 12:20:26
0 跟貼 0
黃仁勛放話：英偉達全員擁抱智能體！

新智元 2025-05-11 12:36:17
2 跟貼 2
這一刻他的智商堪比愛因斯坦

嘟嘟剪影 2025-05-10 08:29:31
4 跟貼 4
包拯辦案途中被義犬吼叫，頓時斷定此地有大案，精彩推理驚艷全場

十三聊古劇 2025-05-10 21:07:13
3 跟貼 3
就你這智商還想套路我

開心的青 2025-05-11 07:07:30
0 跟貼 0
智商最高的四大生肖，看看有沒有你？

清醒一嚇 2025-05-08 02:44:47
1 跟貼 1
身高不夠智商來湊

農村搞笑青姐 2025-05-10 10:33:18
0 跟貼 0
口條結巴就算了，智商還不行，完蛋了

優美酷小新 2025-05-10 06:20:23
4 跟貼 4
農民大哥廢墻上寫字，十秒鐘連續侮辱智商三次，但找不到證據！

歡樂笑作坊 2025-05-10 11:06:14
1 跟貼 1
還好是用反了，用對了我怕把她自己打包了，這智商以后不好混！

故居生活 2025-05-10 08:51:48
0 跟貼 0
OpenAI重磅官宣：幫全球各國造星際之門！奧特曼親臨現場曬照

新智元 2025-05-08 16:43:07
24 跟貼 24
文生圖進入R1時刻：港中文MMLab發布T2I-R1

機器之心Pro 2025-05-09 11:51:55
9 跟貼 9
CMU華人團隊研發LegoGPT，打造包含47000個樂高結構數據集

DeepTech深科技 2025-05-10 17:44:13
10 跟貼 10
俄羅斯外長拉夫羅夫的智商挺高

船長旅行秀 2025-05-09 16:41:27
0 跟貼 0
男子扔垃圾沒投中，后面操作讓人迷惑不解，該去看看智商了！

周周很難哄 2025-05-10 11:17:06
1 跟貼 1
這狗子幸虧智商在線啊

影視嗨人 2025-05-10 13:24:33
1 跟貼 1
腦子轉的這么快，小伙肯定智商很高，當飛行員沒問題！

榻榻米搞笑 2025-05-11 09:10:53
1 跟貼 1
小丑高智商搶銀行，面對重重包圍卻絲毫不慌

二驢侃劇 2025-05-11 09:07:05
1 跟貼 1
情商很高，從不得罪人的三大屬相，今年運勢爆棚，創造更多財富！

毅談生肖 2025-05-09 09:25:47
0 跟貼 0

直面派

講述值得講述的真實故事

148文章數 217關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

時尚

手機

房產

軍事航空

手機 / 數碼

房產 / 家居

GPT-4.5震撼發布！智商高情商高，價格更高

首款折疊屏iPhone，有新消息！

媒體:印度被巴方打回原形 被迫接受"地區大國"的現實

媒體:印度被巴方打回原形 被迫接受"地區大國"的現實

分手7年之后，漢堡終于原諒了德甲

陳曉東吐槽權志龍演唱會 說實話遭圍攻

重慶一家人把755億巨債留給了股民

態度原創

孩子說的有道理嗎

女人過了40歲就該像她們一樣打扮！簡約又得體，美得優雅自然

OPPO Reno14 系列手機支持 4K 視頻轉實況照片，5 月 15 日發布

海口頂級名校官宣增擴！南海大道、金盤的業主們要沸騰了！

印巴停火后互稱擊落對方無人機

媒體:印度被巴方打回原形被迫接受"地區大國"的現實

媒體:印度被巴方打回原形被迫接受"地區大國"的現實

陳曉東吐槽權志龍演唱會說實話遭圍攻