寄予厚望的ChatGPT 4.5差到無以復(fù)加,Scaling Law華麗麗的撞墻,AI故事講不下去了。
終于可以留言評論啦,歡迎大家向筆者拍磚
人心中的成見,果然是座大山。
26號英偉達發(fā)財報之前,筆者發(fā)文咒了一把英偉達和AI泡沫,后臺被無數(shù)人嘲諷。 然后今天 美國科技股就華麗麗的崩了。
當(dāng)然,美國人是絕對不會承認(rèn)AI敘事崩潰這個現(xiàn)實的,各路財經(jīng)媒體都把股市崩盤怪到了唐總的關(guān)稅變卦上,就好像給墨加中加稅是什么新鮮事物一樣。老唐上臺的時候就說了這事,美國科技股那時候可是高歌猛進不知疲倦。
然而,再怎么嘴硬,這棺材板還是要被釘死的。ChatGPT 4.5的發(fā)布,又在板上補了一顆釘子。這個新模型是如此拉胯,幾乎宣布了堆顯卡算力的路線終結(jié),scaling law撞墻失效。以至于英偉達發(fā)布了略超預(yù)期的財報,股價卻在財報日吃了個跌停。
2025年2月28日凌晨,OpenAI以一場13分鐘的“史上最短發(fā)布會”推出GPT-4.5。這是被冠以ChatGPT之名的模型,顯然其重要性非比尋常。OpenAI稱:“ChatGPT4.5是迄今為止最大、知識最豐富的聊天模型”
而且在發(fā)布的時候,OpenAI就開始了“哭窮”。GPT-4.5的訓(xùn)練算力是前代GPT-4o的數(shù)十倍,需“成千上萬塊GPU”支撐,“我們GPU資源已經(jīng)耗盡,只能分階段開放給Pro用戶,下周再給Plus用戶……這不是我們想要的運營方式,但實在沒辦法!”
而且這么牛,這么耗顯卡的模型,當(dāng)然價格也不菲。其定價是GPT-4o的30倍,月租費用達到了1500人民幣,那是相當(dāng)?shù)母吲什黄稹?/p>
然而這么高舉高打的行業(yè)標(biāo)桿,窮盡無數(shù)gpu與算力,訓(xùn)練參數(shù)天文數(shù)字的跨時代模型,性能卻沒跟身價一樣有所提升。
根據(jù)測試,往好了說是個語文及格數(shù)學(xué)掛科的偏科仔,往壞了說簡直就是價高質(zhì)次的海歸水碩廢柴留學(xué)生……
首先,在數(shù)學(xué)和科學(xué)測試中,Chatgpt4.5 對比一年多前的ChatGPT4o,只提升了20%左右,其能力甚至還不如早已經(jīng)發(fā)布的O3 mini(Deepseek發(fā)布之后,OpenAI閃電發(fā)布,推理過程經(jīng)常莫名其妙的使用中文的“可疑”模型)。AIME數(shù)學(xué)競賽題準(zhǔn)確率僅36.7%,被O3mini(87.3%)秒成渣。同樣的代碼生成任務(wù),比o3-mini的錯誤率高35%。
甚至那個被提問了萬年的問題:9.11和9.9那個數(shù)字大,ChatGPT4.5還是頭鐵的選擇9.11>9.9,后邊才回過神來改了答案。難怪第一時間就被評價為基本不適宜一般計算和科學(xué)推理。
而語言能力和多模態(tài)能力,僅比ChatGPT 4o提升了不到5%,沒比統(tǒng)計誤差搞多少
新模型另一個大賣點是AI幻覺少(也就是AI亂編答案)。結(jié)果測試中,發(fā)現(xiàn)ChatGPT4.5胡編的能力一點沒有降低。比如在問到2025年諾貝爾經(jīng)濟學(xué)獎得主的時候(今年獎項還沒評),人家直接虛空創(chuàng)造了歷史,讓阿西莫格魯來了一次史上唯一的諾獎蟬聯(lián)。
數(shù)十倍的投入、數(shù)十倍的GPU算力資源,一年多的研發(fā),結(jié)果語文提升了5%,數(shù)理化還不如同級生,尊貴的新模型可有點搞笑了。
做題寫作文都拉胯, OpenAI 只能夸一下 這個 新模型其他的優(yōu)點。正如相親廣告里強調(diào)女生氣質(zhì)好,一定是顏值欠奉一樣,ChatGPT4.5最大的賣點成了情商高。OpenAI表示:GPT-4.5通過無監(jiān)督學(xué)習(xí)+人類意圖對齊技術(shù),將“情商”提升到新高度。
在發(fā)布會中展示了一個例子,當(dāng)輸入“我又被朋友‘放鴿子’了,我要發(fā)一個‘恨他們’的短信”時,GPT-4.5秒變知心大姐:“先聊聊還是需要分散注意力?”對比舊版直接開罵的回復(fù),似乎真的“人情味”提升了。 不過 這種人情味真的有意義嗎 ? 怎么看都是德智體美勞都 不好的學(xué)生被夸 “性格還不 錯 ”的操作……
難怪這個ChatGPT4.5的重磅發(fā)布,奧特曼以要在醫(yī)院看孩子為名缺席,這臉真的丟不起。
原本ChatGPT 3到ChatGPT3.5的巨大飛躍,讓不少美國科技屆高呼AGI就在眼前,結(jié)果耗費數(shù)百倍數(shù)千倍的資金和GPU之后,ChatGPT4到ChatGPT4.5卻幾乎沒有什么長進。
不光OpenAI,馬斯克前幾天發(fā)布的使用史上最多顯卡,花費數(shù)億美元暴力訓(xùn)練出來的Grok3,性能比500萬美元費用的Deepseek,也不過提升了5%。
Grok3至少還有點提高,馬斯克的FSD自動駕駛,水平連國內(nèi)智駕及格線都沒做到,西方科技神話破滅的有點快。
正如離開OpenAI 的前首席科學(xué)家 Ilya Sutskever 所說的那樣“預(yù)訓(xùn)練時代終結(jié)了,算力堆砌路線破產(chǎn)”了。換句話說,scaling law撞墻了。
既然算力堆徹沒用了,scaling law也不靈了,那么天價的GPU還有意義嗎?
以前不敢對AI投說三道四的美國公司高管們似乎也鼓起了勇氣。AI妖股之一的saleforce的CEO,在最近的財報會議上,就公開放話,微軟花800億美元搞算力大躍進,是資源錯配,肯定收不回成本造成巨額虧損。
畢竟投了這么多錢,微軟家的AI助手copilot使用率極低,根本看不到什么變現(xiàn)的可能性。現(xiàn)在scaling law又撞了墻,這么多計算中心每年的折舊從哪里來?
微軟雖然還回了嘴,但是身體還是誠實的取消了1200兆瓦的計算中心租約。
投資人出這么多錢,是為了AGI(通用人工智能)的,不是燒幾百個小目標(biāo),讓你們提升5%的。堆顯卡沒用,那英偉達的超高利潤從哪來?英偉達都崩了,美國AI科技神話還怎么續(xù)寫?美股能不崩嗎?
屋漏偏逢連夜雨,AI需求搖搖欲墜,自家的50系新顯卡也傳染了Intel病,出現(xiàn)了嚴(yán)重質(zhì)量問題
美股七巨頭已經(jīng)跌了15%,即將進入熊市區(qū)間。現(xiàn)在還有人笑提前甩賣股票,囤大量現(xiàn)金的巴菲特不懂科技,不懂AI嗎?
你笑巴菲特不懂AI科技,巴菲特笑你不懂大嘴忽悠
AI敘事完蛋了,美國隊長怎么辦?
所以美國人突然對歐洲露出獠牙,不就好理解了?
風(fēng)大浪高,有些不方便說的,可以點擊下邊卡片移步可以留言的小號聊一聊,也可關(guān)注筆者微博賬號 @躺平學(xué)副教授
筆者的新書上市啦,錯愛筆者閑扯的讀者,可以點擊下邊的 閱讀原文 購買~~已購買的讀者,記得后臺聯(lián)系筆者,加入VIP讀者群
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.