今天凌晨,OpenAI 毫無預(yù)兆地扔出一顆“技術(shù)炸彈”——GPT-4.5 研究預(yù)覽版正式上線。這個(gè)被官方稱為“最接近人類對話體驗(yàn)”的模型,究竟藏著哪些黑科技?它真的配得上“天價(jià)”標(biāo)簽嗎?我們一探究竟。
一、技術(shù)升級:情感與可靠性的雙重突破
作為 GPT 系列的最新迭代,GPT-4.5 延續(xù)了 OpenAI 的“暴力美學(xué)”——用更多數(shù)據(jù)和算力“喂”出更強(qiáng)的模型。然而,有跡象表明,通過擴(kuò)大數(shù)據(jù)和計(jì)算規(guī)模獲得的收益正在趨于平緩。
在多項(xiàng) AI 基準(zhǔn)測試中,GPT-4.5 的表現(xiàn)不及中國 AI 公司 DeepSeek、Anthropic 以及 OpenAI 自己開發(fā)的新型"推理"模型。OpenAI 這次的重點(diǎn)放在了人性化交互和可靠性上:
1. 情感共鳴能力
根據(jù)官方測試,當(dāng)用戶輸入“我考試失敗后很痛苦”時(shí),GPT-4.5 會(huì)優(yōu)先回應(yīng)情緒需求(“這聽起來真的很難”),再提供實(shí)用建議。相比之下,GPT-4o 和 o3-mini 的回復(fù)更偏向“工具人”風(fēng)格。
2. 幻覺率大幅降低
在生成事實(shí)性內(nèi)容時(shí),GPT-4.5 的“胡編亂造”概率從 GPT-4o 的61.8% 降至 37.1%。OpenAI 特別強(qiáng)調(diào),這一改進(jìn)對法律咨詢、醫(yī)療輔助等高風(fēng)險(xiǎn)場景意義重大。
3. 隱藏的創(chuàng)意天賦
在 SVG 代碼繪圖測試中,只有 GPT-4.5 成功生成了可識別的獨(dú)角獸圖像(見圖)。這種將抽象指令轉(zhuǎn)化為具象輸出的能力,讓設(shè)計(jì)師和文案工作者眼前一亮。
值得注意的是,GPT 4.5 并非"推理模型"——這類由 OpenAI、DeepSeek、Anthropic 等公司推出的新型模型能夠生成"思維鏈"或類似意識流的文本塊,通過反思自身假設(shè)和結(jié)論來嘗試在向用戶提供回應(yīng)前捕捉錯(cuò)誤。GPT-4.5 仍更類似于傳統(tǒng)的 LLM。
盡管如此,據(jù) OpenAI 聯(lián)合創(chuàng)始人兼 CEO Sam Altman 在社交平臺 X 上發(fā)文稱,GPT-4.5 是:"第一個(gè)讓我感覺像在與有思想的人交談的模型。有幾次我靠在椅背上,對從 AI 那里獲得真正有用的建議感到驚訝。"
二、價(jià)格爭議:企業(yè)級用戶的“甜蜜陷阱”?
盡管技術(shù)亮眼,GPT-4.5 的定價(jià)策略卻引發(fā)軒然大波:
-訂閱費(fèi)用:目前僅限 200 美元/月的 ChatGPT Pro 用戶使用,Plus 用戶需等待下周開放
-API 天價(jià):處理 100 萬字的文本,輸入/輸出成本高達(dá) 75/180 美元(對比 GPT-4o 僅需 2.5/10 美元)
OpenAI CEO Sam Altman 在社交平臺坦言:“我們被 GPU 短缺卡住了脖子。”為了緩解算力危機(jī),公司正在緊急部署數(shù)萬張顯卡,但短期內(nèi)高價(jià)策略難以改變。
對企業(yè)的影響:
- ? 客戶服務(wù)、內(nèi)容生成等高頻場景可能因準(zhǔn)確性提升而降低成本
- ? 中小開發(fā)者直言“用不起”,已有團(tuán)隊(duì)轉(zhuǎn)向性價(jià)比更高的 Claude 3.7 或 Gemini 2 Pro
三、行業(yè)測評:學(xué)霸人設(shè)不穩(wěn)?
在 GPT-4.5 之前的每一代 GPT 中,規(guī)模擴(kuò)張都帶來了數(shù)學(xué)、寫作和編程等多個(gè)領(lǐng)域性能的顯著飛躍。OpenAI 表示,GPT-4.5 的規(guī)模增長確實(shí)為其賦予了"更深厚的世界知識"和"更高的情感智能"。
第三方測試暴露了 GPT-4.5 的“偏科”現(xiàn)象:
有趣的是,OpenAI 自家員工疑似“手滑”——發(fā)布會(huì)前泄露的技術(shù)文檔刪除了“計(jì)算效率提升 10 倍”的關(guān)鍵描述,官方解釋為“表述不準(zhǔn)確”。這波操作讓網(wǎng)友調(diào)侃:“原來大廠也逃不過PPT翻車。”
四、實(shí)際應(yīng)用:誰該為它買單?
雖然價(jià)格勸退,但三類用戶可能值得考慮:
1. 內(nèi)容創(chuàng)作者
- 自動(dòng)生成品牌調(diào)性一致的文案
- 根據(jù)圖片素材快速產(chǎn)出營銷方案(支持多文件上傳)
2. 企業(yè)服務(wù)部門
- 7x24 小時(shí)情感化客服,降低客訴率
- 會(huì)議紀(jì)要自動(dòng)整理+重點(diǎn)提煉
3. 技術(shù)嘗鮮者
- 通過 API 開發(fā)定制化 AI 工具
- 體驗(yàn)?zāi)壳白罱咏叭祟悓υ挕钡慕换ピO(shè)計(jì)
五、專家觀點(diǎn):AI 進(jìn)化之路往哪走?
-支持派:“GPT-4.5 證明大模型還有潛力可挖,它的‘共情力’可能開啟心理咨詢、教育陪伴等新賽道。”(AI 分析師 Andrew Curran)
-質(zhì)疑派:“投入增加 1000 倍,MMLU 評分才漲 5 分?這性價(jià)比讓人懷疑技術(shù)天花板已到。”(匿名 AI 公司創(chuàng)始人)
-OpenAI 的野望:官方將本次發(fā)布定義為“研究預(yù)覽”,暗示未來可能通過用戶反饋優(yōu)化模型,甚至整合語音、視頻等多模態(tài)功能。
結(jié)語
GPT-4.5 像一位“情商突飛猛進(jìn)的文科生”——擅長聊天創(chuàng)作,卻在硬核領(lǐng)域略顯吃力。OpenAI 計(jì)劃從今年晚些時(shí)候推出的 GPT-5 開始,最終將其 GPT 系列模型與"o"推理系列相結(jié)合。
據(jù)報(bào)道,GPT-4.5 訓(xùn)練成本極其高昂,多次推遲發(fā)布,且未能達(dá)到內(nèi)部預(yù)期,它可能無法憑一己之力奪得 AI 基準(zhǔn)測試桂冠。但 OpenAI 很可能將其視為通往更強(qiáng)大技術(shù)的墊腳石。
(注:本文測試數(shù)據(jù)來自 OpenAI 官方及第三方公開報(bào)告,部分功能可能隨版本更新調(diào)整。)
? AI范兒
要進(jìn)“交流群”,請關(guān)注公眾號獲取進(jìn)群方式
投稿、需求合作或報(bào)道請?zhí)砑庸娞柅@取聯(lián)系方式
點(diǎn)這里關(guān)注我,記得標(biāo)星哦~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.