99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

GPT-4.5震撼發布!智商高情商高,價格更高

0
分享至

  

  這才是OpenAI對抗DeepSeek壓力的一記還擊。

  之前將推理模型下放給免費用戶只是小打小鬧,北京時間2月28日凌晨4點,OpenAI震撼發布GPT-4.5。

  OpenAI CEO山姆·奧特曼(Sam Altman)在X上直呼坐不穩了:“這是我第一次覺得,和AI對話就像是面對一個深思熟慮的人。有好幾次,我坐在椅子里感嘆從AI那里得到了真心實意的建議。”

  

  一句話概括:這個模型很大、很聰明、很有“人味”。

  如果過去的ChatGPT像是冷面學霸,聰明是聰明,就是愛炫技;那選擇GPT-4.5,你將喜提一個溫柔學霸,其實比冷面學霸更聰明,能為你更好地答疑解惑,與此同時還能提供情緒價值。

  為了這個模型,OpenAI投入巨大,甚至由于需要的計算資源太大而跨數據中心同時預訓練模型。奧特曼宣布GPU不夠用了,目前GPT-4.5只提供給ChatGPT Pro用戶,下周加幾萬個GPU之后再逐步下放。而且其API價格比GPT-4o高出30倍。

  OpenAI就是為了證明一件事:“大力出奇跡”的敘事沒有被打破,推理模型不代表一切。

  這樣的態度,在奧特曼的官宣X信息中展露無遺:

  “提醒一下:這不是一個推理模型,不能輕松打破基準測試。它是一種不同類型的智能,里面有一種我以前從未感覺過的魔力。”

  在GPT-4.5發布之后,奧特曼還懟了Meta。在“Meta計劃推出獨立AI應用,以與OpenAI競爭”的新聞下開麥:“好啊那我們會做一個社交應用。”

  

  這樣的直拳,并非以“城府”著稱的奧特曼的風格。看來GPT-4.5真的點燃了奧特曼心里的斗志。

  

  比起前代模型GPT-4o,GPT-4.5的“智商”更高了,而這靠的是無監督學習。

  在介紹文檔中,OpenAI表示,有兩個提升人工智能能力的互補范式。

  一個是拓展推理,它能教會模型在反應之前先進行思考并產生思維鏈,從而解決復雜的STEM(Science科學、Technology技術、Engineering編程、Mathmatics數學)問題或邏輯問題。

  另一個是無監督學習,它能提高世界模型的準確性和直覺性。

  

  在OpenAI的模型中,o1和o3-mini等模型代表的就是推理范式,而GPT-4.5則是無監督學習的例子。

  無監督學習,簡單來說可以理解為讓模型自己去知識的海洋里徜徉,自己學習到更多,從而變得更聰明,而非依賴人工標注。

  在過去依賴人工標注的做法中,模型會結合人類反饋來改善響應與交互方式。彭博社援引知情人士稱,去年OpenAI推出的Orion模型并未達到公司期望,在嘗試回答未經訓練的編碼問題時就表現不佳。

  OpenAI介紹,通過監督學習,GPT-4.5提高了其識別、建立聯系和創造性洞察的能力,而無需推理。

  具體來說,GPT-4.5有更廣泛的知識和對世界的更深理解,回答更準確,幻覺也更少。

  根據OpenAI官方文檔,GPT-4.5在SimpleQA中表現頗為亮眼。

  SimpleQA是包含4000個事實性問題的數據集,用于測量模型在回答問題時的準確率。其中包含準確率(越高越好)和幻覺率(越低越好)兩個維度。

  GPT-4.5的準確率達到62.5%,是GPT-4o(38.2%)、o1(47%)、o3-mini(15%)中最高的;幻覺率降至37.1%,也是GPT-4o(61.8%)、o1(44%)、o3-mini(80.3%)中最低的。

  

  此外,在標準基準測試中,GPT-4.5也獲得了高分。

  如在 SWE-Lancer Diamond 數據集上,GPT-4.5獲得了32.6%的通過率,獲得了186125美元(前不久Anthropic發布的擅長編程的Claude 3.5 Sonnet這個通過率為26.2%),比GPT-4o和o3-mini-high都高。

  

  此外,GPT-4.5明顯強于GPT-4o和o3-mini-high的還有在MMMLU(多語言)測試中的表現。

  而在科學領域GPQA、數學基準AIME24、代碼生成評估基準SWE-Bench Verified中,GPT-4.5的表現都顯著強于GPT-4o,弱于o3-mini-high。

  

  不僅“智商”更高,GPT-4.5還被注入了“情商”,而且這兩點相輔相成。

  在官方介紹中,OpenAI表示,對于GPT-4.5,他們開發了新的、可擴展的技術,利用來自較小模型的數據來訓練更強大的模型。

  而這些技術提高了GPT-4.5的可控性、對細微差別的理解以及自然對話的能力。

  翻譯一下就是:ChatGPT對話“更像人了”,更能洞察想法、體察情緒,并在回應中體現,而非一個無情的對話機器。

  OpenAI也拿出了測試的結果證明GPT-4.5的使用感受會好很多:人類測試者的盲測中,GPT-4.5的偏好度遠高于GPT-4o,不管是在日常問題、專業問題還是創意性問題的互動中都是如此。

  

  關于這一點,最生動的例子出現在演示視頻中。

  OpenAI的研究人員用很情緒化的措辭向ChatGPT求助:“啊啊啊!!我朋友又放我鴿子了!!!寫一條短信告訴他們我恨他們!!!”

  

  老模型GPT-4o二話不說就返回了短信內容:“知道嗎?我受夠了。你放我太多次鴿子了,我討厭你這么做——很明顯你就是這么對待我們的友情的。別再聯系了。”

  但GPT-4.5“感受”到了用戶此時正在氣頭上,非常情緒化:“聽起來你很沮喪。”并且建議說興許可以試試清晰且平和地表達出感受,隨機給了兩條短信內容:“嗨,計劃又泡湯了讓我很沮喪,我原本真的很期待今天的。能聊聊到底怎么回事嗎?”

  

  這是一種自發的、感覺很自然的反饋,更像“人”而不是只會執行任務的工具。演示人員也補充道,當然,你如果繼續要求要表達憤怒的短信,它也不會再堅持,而是會乖乖聽話。

  實際上,OpenAI專門提到了“EQ(情商)”這個詞,負責演示的研究員甚至調侃稱,過去的ChatGPT聰明是聰明,但總有種“讓我來給你開開眼我有多聰明”的炫技感。

  這種“情商”也不僅僅體現在“會安慰人”這種淺表的層面,實際上,這種能力和“高智商”相結合,可以讓同樣在嚴肅回答某個問題時,GPT-4.5更能切中要害、給出用戶需要的答案。

  比如“海水為什么是咸的”這個問題,GPT-1完全是胡言亂語、傾倒一些八竿子打不著的詞語;GPT-2說了完整的句子了,而且回答切題,但只說因為海水里有鹽,不算回答了問題;GPT-3.5 Turbo進一步說了鹽是氯化鈉,但是這也無助于解決這個問題。

  而GPT-4 Turbo就厲害了,不僅給出了答案,而且就像我們熟悉的“ChatGPT風格”一樣,還詳細列舉了過程。但是用戶拿到這個答案,仍然需要仔細閱讀、努力理解。

  但GPT-4.5的回答和GPT-4T類似的詳細,但非常好理解,而且很易于記憶,基本上掃一眼就能明白它在說什么。

  

  OpenAI還給出了三個示例,我們讓ChatGPT翻譯成了中文:

  

  

  

  還是那句話,智商和情商俱在,更像“人”了。

  

  “大力出奇跡”的敘事并沒有被打破,OpenAI想要證明的就是這一點。

  換句話說,推理模型固然好,但這不意味著投入巨大資源造模型就沒有意義。

  “每一次計算能力的增長都伴隨著新能力的誕生。GPT-4.5 是無監督學習領域中最前沿的模型之一。”

  OpenAI介紹,GPT-4.5在回應時并不會先進行推理,這使得它的優勢與推理模型有很大不同。

  與OpenAI o1和OpenAI o3-mini相比,GPT-4.5 是一個更為通用、天生更聰明的模型。OpenAI相信推理將是未來模型的核心能力,且擴展的兩種方法——預訓練和推理——將互為補充。

  隨著像 GPT-4.5 這樣的模型通過預訓練變得更加聰明和知識更豐富,它們將成為推理和工具型代理的更強基礎。

  雖然具體的資源投入具體有多大尚未透露,但在官宣視頻中,OpenAI的研究人員透露,為了最大化地利用資源,他們在預訓練模型時同時啟用了多個數據中心,因為他們需要的計算資源超過了單一高帶寬網絡架構所能提供的上限。

  此外,OpenAI也不是沒有省著用,表示使用了低精度訓練(Low Precision Training)充分利用GPU性能。團隊還開發出了新的訓練機制,能夠在后訓練過程中使用更小的計算資源來微調如此大型的模型,最終才開發出了可以部署的模型。

  在GPT-4.5發布之前,OpenAI首席研究官馬克·陳(Mark Chen)在采訪中談及與推理模型相比,GPT-4.5可以做什么:

  “我認為這是根本不同的權衡。你有一個模型,它會立即給你回復,不需要做太多思考且會給出更好的答案,而另一個模型會思考一段時間然后給出答案。我們發現,在創意寫作等領域,這種模型(前者)比推理模型更出色。”

  更重要的是,他談到了“縮放定律(Scaling Law)是否失效”的問題。OpenAI是否發現了所謂的“擴展瓶頸”?是否已經看到擴展帶來的收益遞減?

  Chen稱,模型不能盲目地從頭開始學習推理,推理和擴展的范式是互補的,相互之間存在反饋循環。

  對于外界敏感的成本問題,Chen也代表OpenAI表達降本的態度,稱贊DeepSeek做得非常好,OpenAI也關心以低廉的成本提供模型:“自從GPT-4首次推出以來,成本已經下降了幾個數量級。”

  不過,就目前來看,OpenAI用“大力”砸出的“奇跡”非常昂貴。

  OpenAI話也說得敞亮,稱GPT-4.5是一個非常龐大且計算稠密的模型,因此它比GPT-4o更昂貴,不是替代關系。

  有多貴呢?GPT-4.5的API價格達到75美元/百萬tokens輸入、150美元/tokens輸出,是GPT-4o的30倍。后者的API價格為2.5美元/百萬tokens輸入、10美元/百萬tokens輸出。

  

  有意思的是,OpenAI的GPU又不夠用了。奧特曼在X上官宣GPT-4.5時,專門說了壞消息:“我們真的很想同時向Plus和Pro用戶推出它,但我們的用戶增長非常迅速,現在GPU已經不夠用了。”

  繼而,奧特曼承諾,下周“會增加數萬個GPU,然后將其(GPT-4.5)推廣到Plus用戶層”。

  GPT-4.5很大、很強、很有“人味”,OpenAI無疑再一次證明了自己的實力,但其為此投入的成本也有點太高了。至于值不值——OpenAI能不能扛得住,以及客戶是否買賬——就得讓時間來驗證了。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
CBA總決賽G3戰還沒打!廣廈已提前開售G5戰門票:回主場奪冠嗎?

CBA總決賽G3戰還沒打!廣廈已提前開售G5戰門票:回主場奪冠嗎?

籃球快餐車
2025-05-11 04:20:13
傳前主持人王寧在日本做大血凈,61歲他臉色發黑像塊碳 疑患腎病

傳前主持人王寧在日本做大血凈,61歲他臉色發黑像塊碳 疑患腎病

曉風說
2025-05-11 13:33:26
西媒:阿隆索剛定新球隊就遭打擊,皇馬無法為他引進兩大心儀目標

西媒:阿隆索剛定新球隊就遭打擊,皇馬無法為他引進兩大心儀目標

雷速體育
2025-05-11 10:58:15
希爾德:我像努力填補庫里的空缺,但他是被上帝眷顧的人

希爾德:我像努力填補庫里的空缺,但他是被上帝眷顧的人

懂球帝
2025-05-11 12:33:23
剛從烏蘭巴托回來,告訴你真實的蒙古,已經被我們遠遠甩在后面了

剛從烏蘭巴托回來,告訴你真實的蒙古,已經被我們遠遠甩在后面了

侃侃兒談
2025-05-11 10:36:39
福建8歲男童爬山失蹤一周 搜救范圍還在進一步擴大

福建8歲男童爬山失蹤一周 搜救范圍還在進一步擴大

大象新聞
2025-05-11 14:11:17
本賽季預計收入超5億歐元!國米有望實現幾十年來首次盈利

本賽季預計收入超5億歐元!國米有望實現幾十年來首次盈利

直播吧
2025-05-11 15:33:08
為什么有錢人包養女大學生現象如此普遍?19歲女大學生說出內心話

為什么有錢人包養女大學生現象如此普遍?19歲女大學生說出內心話

說真話的小陳
2025-05-10 12:02:32
反轉了?苛刻檢測流程曝光,金店老板當場剪斷同款,網友評論不一

反轉了?苛刻檢測流程曝光,金店老板當場剪斷同款,網友評論不一

阿鳧愛吐槽
2025-05-10 09:04:11
溫州爬山失聯男后續:確認死亡!遺體泡在溪水中,知情人透露更多

溫州爬山失聯男后續:確認死亡!遺體泡在溪水中,知情人透露更多

快看張同學
2025-05-10 08:25:03
廣東暴雨今晚“發威”!粵西近百毫米雨,這些地方要警惕

廣東暴雨今晚“發威”!粵西近百毫米雨,這些地方要警惕

馬鈴薯椰
2025-05-11 05:55:18
學歷一路造假,環球小姐被判入獄240天!

學歷一路造假,環球小姐被判入獄240天!

新民周刊
2025-05-11 13:06:41
印軍官:當中國武力解放臺灣,印度不僅要奪取西藏,還要吞噬新疆

印軍官:當中國武力解放臺灣,印度不僅要奪取西藏,還要吞噬新疆

阿器談史
2025-03-16 10:34:30
達成協議!“全歐射手王”將正式加盟阿森納!欽點簽“意甲頭牌”

達成協議!“全歐射手王”將正式加盟阿森納!欽點簽“意甲頭牌”

頭狼追球
2025-05-11 09:55:30
阿隆索將改造皇馬:打造進攻3巨頭!1億邊鋒出局,曼城有意

阿隆索將改造皇馬:打造進攻3巨頭!1億邊鋒出局,曼城有意

葉青足球世界
2025-05-11 09:59:12
三對夫妻旅游途中互相發生性關系,判刑后仍不認罪!

三對夫妻旅游途中互相發生性關系,判刑后仍不認罪!

書畫藝術收藏
2025-04-26 19:30:03
I Do破產倒計時!河南造鉆太狠了,天然鉆1克拉暴跌至270元白菜價

I Do破產倒計時!河南造鉆太狠了,天然鉆1克拉暴跌至270元白菜價

小噎論事
2025-05-10 10:57:30
小米汽車又出事,涉嫌虛假宣傳?雷軍連遭四次重擊

小米汽車又出事,涉嫌虛假宣傳?雷軍連遭四次重擊

象視汽車
2025-05-09 07:00:05
美國沒想到,俄羅斯也沒想到,如今的中國,已經成為世界驕傲

美國沒想到,俄羅斯也沒想到,如今的中國,已經成為世界驕傲

混沌錄
2025-05-10 15:49:14
教育部大量撤銷的10個專業,今年高考千萬別亂報!

教育部大量撤銷的10個專業,今年高考千萬別亂報!

譚老師地理工作室
2025-05-08 15:00:02
2025-05-11 18:27:00
直面派 incentive-icons
直面派
講述值得講述的真實故事
148文章數 217關注度
往期回顧 全部

科技要聞

首款折疊屏iPhone,有新消息!

頭條要聞

媒體:印度被巴方打回原形 被迫接受"地區大國"的現實

頭條要聞

媒體:印度被巴方打回原形 被迫接受"地區大國"的現實

體育要聞

分手7年之后,漢堡終于原諒了德甲

娛樂要聞

陳曉東吐槽權志龍演唱會 說實話遭圍攻

財經要聞

重慶一家人把755億巨債留給了股民

汽車要聞

空間表現是優勢 極狐T1將于5月底正式亮相發布

態度原創

教育
時尚
手機
房產
軍事航空

教育要聞

孩子說的有道理嗎

女人過了40歲就該像她們一樣打扮!簡約又得體,美得優雅自然

手機要聞

OPPO Reno14 系列手機支持 4K 視頻轉實況照片,5 月 15 日發布

房產要聞

海口頂級名校官宣增擴!南海大道、金盤的業主們要沸騰了!

軍事要聞

印巴停火后互稱擊落對方無人機

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 平昌县| 福海县| 濉溪县| 和平区| 衡东县| 麦盖提县| 巨鹿县| 泰宁县| 新源县| 北辰区| 永泰县| 屏山县| 思茅市| 巩留县| 铜川市| 两当县| 称多县| 庆城县| 胶州市| 泰宁县| 西乌珠穆沁旗| 隆子县| 咸阳市| 张家界市| 荔波县| 康定县| 新泰市| 三门县| 霍林郭勒市| 农安县| 洪洞县| 旬邑县| 黔江区| 利辛县| 铜陵市| 贞丰县| 兴宁市| 阿城市| 隆回县| 监利县| 宁安市|