2月28日,百度官宣文心大模型4.5將于3月16日發(fā)布。百度自信地表示,文心大模型4.5將在基礎(chǔ)模型能力上有大幅提升,且具備原生多模態(tài)、深度思考等能力。
國產(chǎn)大模型又將打出的一張牌。從1月底開始,國產(chǎn)大模型接連出牌,徹底打亂了美國科技公司的節(jié)奏。
為了搶時(shí)間,2月28日凌晨,OpenAI最新的大模型GPT-4.5發(fā)布。這場(chǎng)發(fā)布會(huì)僅僅十三分鐘,甚至連靈魂人物奧特曼都沒能到場(chǎng)。
OpenAI的倉促已經(jīng)躍然紙上,像極了兩年前的谷歌。
國產(chǎn)大模型用難以置信的速度,迅速趕超硅谷。
全面圍剿
ChatGPT 4.5與馬斯克的Grok-3一樣,陷入了“王婆賣瓜”的尷尬處境。
奧特曼在社交平臺(tái)上直呼“它讓我?guī)状慰吭谝巫由?,驚嘆于AI竟然能給出如此精彩的回答。”然而事實(shí)上,這一代模型并沒有3.5那般顛覆時(shí)代。
它的知識(shí)面更廣、對(duì)話中能更準(zhǔn)確地捕捉用戶意圖、輸出的多樣性和靈活性有所提升,但多模態(tài)功能尚未開放,復(fù)雜推理任務(wù)的表現(xiàn)仍弱于專用模型。OpenAI表示,當(dāng)前版本的核心目標(biāo)是優(yōu)化自然對(duì)話與知識(shí)整合效率,而非追求全能。探索推理能力的深度融合將在未來迭代。
ChatGPT 4.5顯得有些沒有準(zhǔn)備好,甚至OpenAI坦言這只是中間站。
回顧過去OpenAI的進(jìn)度,實(shí)際上一直躺在ChatGPT 3.5時(shí)代建造的功勞簿上,忽略了國產(chǎn)大模型的瘋狂追趕。
即便沒有DeepSeek的橫空出世,當(dāng)前時(shí)間段,國產(chǎn)大模型也能夠給出足夠的壓迫感。
百度官宣文心大模型4.5時(shí)表示,這一代模型將具備原生多模態(tài)、深度思考等能力。而在更早之前,百度強(qiáng)調(diào)的檢索增強(qiáng),其價(jià)值已經(jīng)成為業(yè)界共識(shí)。百度自研的檢索增強(qiáng)的文生圖技術(shù),已經(jīng)大幅降低圖片生成領(lǐng)域的幻覺。按照技術(shù)推演,文心大模型4.5將在幻覺方面降低到新水平。
更加讓OpenAI慌張的是,國產(chǎn)大模型的進(jìn)化還在加快。百度透露,將在今年內(nèi)發(fā)布5.0版本。據(jù)路透社報(bào)道,DeepSeek計(jì)劃提前發(fā)布其新一代AI模型R2。
ChatGPT 4.5和馬斯克的Grok-3模型,雖然在特定領(lǐng)域做到了領(lǐng)先,但本質(zhì)上沒能像ChatGPT 3.5那般具備代際領(lǐng)先優(yōu)勢(shì)。奧特曼曾坦誠,盡管他認(rèn)為OpenAI未來仍將開發(fā)出更好的模型,但其領(lǐng)先優(yōu)勢(shì)將比往年有所減少。
OpenAI的領(lǐng)先優(yōu)勢(shì)幾乎蕩然無存,倉促是不可避免的。
開源、免費(fèi),站到歷史的正確一邊
羅馬城并非一天建成,國產(chǎn)大模型的趕超已經(jīng)悄然醞釀了兩年。
成本競(jìng)爭在國內(nèi)早已經(jīng)打響。去年,大語言模型掀起價(jià)格戰(zhàn),主力模型已經(jīng)幾乎降到了免費(fèi)的價(jià)格。李彥宏曾表示,根據(jù)摩爾定律,每18個(gè)月,性能就會(huì)翻倍而價(jià)格減半。大模型12個(gè)月內(nèi)推理成本基本上可以降低90%以上。
面對(duì)歷史線路問題時(shí),國產(chǎn)大模型動(dòng)作極為迅速。當(dāng)奧特曼還在反思“我們?cè)陂_源方面一直站在了歷史的錯(cuò)誤一邊”,國產(chǎn)大模型已經(jīng)迅速打出組合拳。
2月13日,百度宣布文心一言將于4月1日0時(shí)起全面免費(fèi),同時(shí)上線深度搜索功能。2月14日,百度宣布在未來幾個(gè)月推出文心大模型4.5系列,并從6月30日正式開源。同時(shí),文心一言上線深度搜索功能,該功能具備更強(qiáng)大的思考規(guī)劃和工具調(diào)用能力,可為用戶提供專家級(jí)內(nèi)容回復(fù),并處理多場(chǎng)景任務(wù),實(shí)現(xiàn)多模態(tài)輸入與輸出。
接連打出“開源、免費(fèi)”組合拳,將進(jìn)一步促進(jìn)文心大模型的廣泛應(yīng)用,并在更多場(chǎng)景中擴(kuò)大其影響力。
而新發(fā)布的ChatGPT 4.5,非但沒能開源,價(jià)格還出現(xiàn)了增長。
GPT-4.5的API定價(jià)極高,輸入100萬token需75美元,而輸出100萬token高達(dá)150美元,價(jià)格是GPT-4o的15~30倍。我們無法對(duì)比免費(fèi)開源的文心大模型,可以作為對(duì)比的是,deepseek-chat正常時(shí)段每100萬tokens輸入的API調(diào)用價(jià)格為0.5美元,錯(cuò)峰時(shí)段價(jià)格為0.25美元。ChatGPT-4.5的價(jià)格是DeepSeek R1的300倍。
這意味著,即便具備更強(qiáng)的情商,GPT-4.5仍然不具備廣泛應(yīng)用的可能。
大模型下半場(chǎng)
中美目前競(jìng)爭局面的扭轉(zhuǎn),很大程度上是技術(shù)思路的巨大區(qū)別。
無論是Grok-3和ChatGPT-4.5,目前仍然沒有擺脫“大炮打蚊子”的技術(shù)路線。
ChatGPT-4.5仍然是一個(gè)規(guī)模龐大且成本高昂的模型。開發(fā)團(tuán)隊(duì)表示,之所以尚未開放多模態(tài)功能和復(fù)雜推理任務(wù),主要原因是算力不足。公司計(jì)劃逐步增加GPU資源以擴(kuò)展用戶覆蓋范圍。
AI基礎(chǔ)設(shè)施建設(shè)投入仍然重要,李彥宏強(qiáng)調(diào),“我們?nèi)孕鑼?duì)芯片、數(shù)據(jù)中心和云基礎(chǔ)設(shè)施進(jìn)行持續(xù)投入,來訓(xùn)練更好、更智能的下一代模型?!钡珖a(chǎn)大模型做到了更為出色的成本優(yōu)化能力。DeepSeek-R1模型的訓(xùn)練成本約為558萬美元,僅為OpenAI的o1模型估計(jì)成本的10%。
這讓國產(chǎn)大模型在應(yīng)用端有更多余力。目前,憑借更出色的成本優(yōu)化,以及“開源、免費(fèi)”組合拳,百度等頭部玩家已經(jīng)將行業(yè)拖入以“應(yīng)用落地”為主題的大模型競(jìng)賽下半場(chǎng)。
ChatGPT-4.5的變化已經(jīng)有所展現(xiàn),這款模型的主要優(yōu)化在于實(shí)用性上。這意味著,全球大模型巨頭們的競(jìng)爭,已經(jīng)進(jìn)入了全新的階段。
這是中美間的較量,而這一波競(jìng)爭重點(diǎn)的轉(zhuǎn)變,很大程度上意味著,中國大模型在不斷提升能力趕超美國。
大模型爆發(fā)已經(jīng)走完第二個(gè)年頭,OpenAI 、百度等頭部玩家吹響應(yīng)用競(jìng)賽新沖鋒號(hào)。但顯然這一次,國產(chǎn)大模型的位置已經(jīng)從追趕者變?yōu)橥桓?jìng)爭者,并且已經(jīng)占據(jù)了有利身位。中國大模型趕超美國正在全面提速,并有望成為現(xiàn)實(shí)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.