無論DeepSeek,還是文心大模型4.5,都已率先進(jìn)入第二戰(zhàn)場,掀起一場將大模型門檻拉低到極致,推動產(chǎn)業(yè)落地、應(yīng)用爆發(fā)的革命性探索。
作者|劉珊珊
編輯|Cindy
分隔在大洋彼岸的中美兩大AI企業(yè),同一天宣布了重磅消息。
2月28日,百度宣布,文心大模型4.5將于3月16日正式上線。根據(jù)百度方面介紹,最新版不僅在基礎(chǔ)模型能力上有大幅提升,且具備原生多模態(tài)、深度思考等能力。
“文心大模型4.5,將是百度有史以來最強(qiáng)大的大模型?!贝饲鞍俣?024年Q4及全年財(cái)報(bào)電話會上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏如此透露。
受來自DeepSeek、百度、阿里等中國大模型的挑戰(zhàn),OpenAI在北京時(shí)間周五凌晨發(fā)布博文,宣布GPT-4.5大模型正式登場。這款被OpenAI內(nèi)部代號為“Orion”的模型,被聲稱是其最大、最佳的聊天模型。
眾所周知,過去幾周全球AI產(chǎn)業(yè)界都正因DeepSeek而巨變。在全球AI競賽加劇之際,作為中美兩大領(lǐng)先AI企業(yè),百度和OpenAI的新動作,自然更受外界關(guān)注。
目前來看,百度將通過文心大模型4.5,打出“開源、免費(fèi)”組合拳,走向更加開放的策略。
相比之下,GPT-4.5的高情商和人性化表現(xiàn)也帶來了驚喜,但整體差強(qiáng)人意,因?yàn)椴⒉皇峭评硇湍P?,在性能上也與OpenAI前幾代模型有差距——更強(qiáng)大基礎(chǔ)大模型仍然是護(hù)城河邏輯不變下,中國大模型正加速占據(jù)以應(yīng)用落地為主題的大模型第二場主動權(quán)。
01
開源+免費(fèi)”,百度更為開放
進(jìn)入2月以來,百度已密集放出了多個(gè)重磅“AI炸彈”。
2月12日,CNBC一則關(guān)于百度文心大模型5.0版本將于下半年發(fā)布的消息,在AI行業(yè)引發(fā)震動。2月13日,OpenAI首席執(zhí)行官Sam Altman(山姆·奧特曼)宣布將在未來幾個(gè)月推出名為GPT-5,中美大模型競賽氛圍越來越濃。
最重磅消息來自百度。同一天,百度宣布文心一言將于4月1日0時(shí)起,全面免費(fèi),所有PC端和APP端用戶均可體驗(yàn)文心系列最新模型。同時(shí),上線深度搜索功能。
1天后(2月14日),百度宣布將在未來幾個(gè)月中陸續(xù)推出文心大模型4.5系列,并于6月30日起正式開源。
這意味著,文心大模型就此打出“免費(fèi)+開源”組合拳,百度AI策略更為開放。
百度轉(zhuǎn)變和DeepSeek橫空出世帶來的震動,有一定關(guān)系——但不止百度,OpenAI、騰訊、阿里等國內(nèi)外AI巨頭,無一不受影響。比如OpenAI,就在中國大模型壓力下,被迫加速模型發(fā)布和開源的腳步。
更客觀現(xiàn)實(shí)是,開源和閉源,其實(shí)并沒有絕對的優(yōu)劣之分。
作為中國大模型最早入局者,百度文心大模型是全球最早對標(biāo)GPT的LLM大模型,幾年時(shí)間里,文心大模型經(jīng)過了持續(xù)的迭代和進(jìn)化。比如,文心一言版本已經(jīng)迭代到了4.0,無論是日均超15億次的調(diào)用量,還是在各行業(yè)的賦能落地,都是推動中國大模型發(fā)展的重要組成部分。
同時(shí),在百度強(qiáng)大生態(tài)支撐下,百度搜索、百度地圖、百度文庫、百度智能云等,都早已在給普通用戶提供最完整的AI服務(wù)。
多位業(yè)內(nèi)人士就此認(rèn)為,百度走向“開源+免費(fèi)”,是大模型發(fā)展的“順勢而為”,其意義重大,可以更好地推動技術(shù)平權(quán)。它讓全球用戶能夠毫無門檻地運(yùn)用中國頂尖的大模型技術(shù),更是大模型從專業(yè)范疇,邁向大眾市場的關(guān)鍵轉(zhuǎn)折點(diǎn)。
李彥宏在多個(gè)場合的表態(tài),也表明了,百度如今對開源與閉源模型價(jià)值的思考邏輯。“我在過去幾個(gè)月中學(xué)到的是,開源可以幫助你獲得更多關(guān)注。我們正處于AI、生成AI創(chuàng)新的早期階段,更快的傳播將有助于提高采用率,但也有助于更多的人嘗試這項(xiàng)技術(shù)?!?/p>
這背后,體現(xiàn)的是百度組合拳,推動技術(shù)平權(quán)時(shí)的底氣和開放心態(tài)。
比如,百度系多款產(chǎn)品,百度搜索、百度文庫、百度網(wǎng)盤都全量接入了DeepSeek- R1滿血版。相比其他產(chǎn)品入口較深,任何普通網(wǎng)友,都可以在百度首頁搜索框下方,點(diǎn)擊“AI搜索DeepSeek滿血版”直接體驗(yàn)。
無論如何,自研大模型才是百度最強(qiáng)競爭力所在。如同李彥宏指出,基礎(chǔ)模型真正的價(jià)值,只有在能夠有效解決現(xiàn)實(shí)問題并廣泛應(yīng)用時(shí)才能得到體現(xiàn)。“即使是開源,如何確保其在實(shí)際應(yīng)用中展現(xiàn)出色的表現(xiàn),才是企業(yè)必須面對的挑戰(zhàn)?!?/strong>
至此,留給外界的疑問,無外這場普惠大眾的AI 變革浪潮,何時(shí)正式開啟。
2月27日,路透社爆料稱,百度將在3月中下旬發(fā)布文心大模型4.5 ?;蛟S是明顯感受到了來自中國AI的競爭壓力,OpenAI略顯倉促的在2月28日推出GPT-4.5——發(fā)布會僅持續(xù)不到14分鐘,OpenAI的CEO山姆·奧特曼正在醫(yī)院陪剛出生的孩子,并未現(xiàn)身。
02
史上最強(qiáng)文心大模型,有多強(qiáng)?
隨著文心大模型4.5正式登場日的官宣,接下來半個(gè)月中,業(yè)界都會有一個(gè)共同猜測:史上最強(qiáng)文心大模型,到底有多強(qiáng)?又有哪些能力值得期待?
可以肯定,和GPT-4.5不同,文心大模型4.5,將在基礎(chǔ)模型能力上有大幅提升,帶給用戶最明顯的感受,可能是RAG能力進(jìn)一步增強(qiáng),將在幻覺方面降低到新水平。
“幻覺”,是懸在AI發(fā)展之路上的達(dá)摩克利斯之劍。指的是大模型在試圖生成內(nèi)容或回答問題時(shí),輸出的結(jié)果不完全正確甚至錯誤,即通常所說的“一本正經(jīng)地胡說八道”。
在大模型領(lǐng)域,由于訓(xùn)練知識存在偏差、過度泛化地推理、理解存在局限性等,幻覺是每個(gè)模型與生俱來的缺陷。
大模型或多或少都有幻覺問題
例如OpenAI,多份研究此前指出,o3-mini大約只有10個(gè)簡單問題中答對1個(gè),兩年來幻覺問題都沒有得到改善。異軍突起的DeepSeek,也因在解答西安安定門繞行問題時(shí) “翻車” 而備受關(guān)注。
RAG(檢索增強(qiáng)型生成),在解決幻覺問題上扮演著至關(guān)重要的角色——在推理過程中,RAG 使用檢索到的數(shù)據(jù)作為參考來組織答案,從外部知識源中動態(tài)檢索信息,以此幫助大模型生成更豐富、更準(zhǔn)確、更可靠的內(nèi)容??梢哉f,RAG給大模型增加了一個(gè)可以快速查找的“知識外掛”。
毋庸置疑,在國內(nèi),百度擁有最豐富的實(shí)時(shí)與個(gè)性化的數(shù)據(jù)和知識,研發(fā)了“理解-檢索-生成”RAG能力。從各種RAG能力實(shí)測來看,國內(nèi)外主流大模型中,百度文心一言綜合表現(xiàn)最佳。
比如,在和OpenAI的直接PK中,即使是春節(jié)檔電影細(xì)節(jié)、春晚節(jié)目等內(nèi)容,文心都能準(zhǔn)確回答;相比之下,OpenAI雖能檢索到信源,卻無法生成準(zhǔn)確回答。
基于此,去年11月的百度世界2024大會上,百度發(fā)布了自研的檢索增強(qiáng)的文生圖技術(shù)(iRAG),將百度搜索的億級圖片資源跟強(qiáng)大的基礎(chǔ)模型能力相結(jié)合,大幅降低圖片生成領(lǐng)域的幻覺,大幅提高了文心的模型可用性。
可以預(yù)計(jì),在文心大模型4.5中,隨著大模型的訓(xùn)練數(shù)據(jù)得到進(jìn)一步擴(kuò)充,AI幻覺也會大幅降低,不僅讓百度自身AI應(yīng)用快速進(jìn)化,也能夠讓更多行業(yè)放心用上大模型。
近期,文心一言就上線了“深度搜索”功能,具備專家級問答能力,RAG能力突出,尤其是專業(yè)領(lǐng)域問答幻覺率低。
在OpenAI的GPT-4.5不具備推理能力,還是主打?qū)懽鞯任谋旧哨厔菹?,文心大模?.5究竟能呈現(xiàn)怎樣的原生多模態(tài)、深度思考能力?以及可以在哪些場景下落地應(yīng)用?顯然更值得期待。
可以推測,在DeepSeek掀起大模型降價(jià)浪潮后,文心大模型4.5也會加速推動性能升級與成本降低,有望催生新的商業(yè)模式和產(chǎn)業(yè)生態(tài)。
值得一提的是,得益于飛槳和文心的聯(lián)合優(yōu)化,文心大模型在推理性能提升同時(shí),推理成本也得到了有效降低——根據(jù)去年世界大會上的說法,其推理成本一年降低99%。
從李彥宏演示的個(gè)例來看,以前拍一組汽車在某場景的大片宣傳海報(bào)動輒需要一二十萬,甚至大幾十萬,使用iRAG后,創(chuàng)作成本接近于0。
推理成本降低速度還在加快。李彥宏在阿聯(lián)酋迪拜出席“世界政府峰會”上表示,“在過去,當(dāng)我們談?wù)撃柖蓵r(shí),每18個(gè)月,性能水平或價(jià)格都會減半。但是今天,當(dāng)我們談?wù)摯笮驼Z言模型時(shí),增加的成本基本上降低了,可以在12個(gè)月內(nèi)降低90%以上?!?/p>
所以,這也是眾多企業(yè)和開發(fā)者,對于文心大模型4.5的共同期待。一位開發(fā)者就說,基于文心大模型4.5,希望無論是開發(fā)原生應(yīng)用,還是做二次開發(fā),都能夠方便地體驗(yàn),擁有更低的推理成本和更高的訓(xùn)練效率。
03
第二場競速,
中國大模型趕超美國提速
上述開發(fā)者的期待,其實(shí)正是在百度接連打出“開源+免費(fèi)”組合拳后,李彥宏的表態(tài):“希望客戶和用戶能比之前更方便地體驗(yàn)這款模型?!?/p>
某種程度看,無論DeepSeek,還是文心大模型4.5,都已率先進(jìn)入第二戰(zhàn)場,掀起一場將大模型門檻拉低到極致,推動產(chǎn)業(yè)落地、應(yīng)用爆發(fā)的革命性探索。
中國是全球唯一擁有聯(lián)合國產(chǎn)業(yè)分類中所列全部工業(yè)門類的國家,不僅擁有全球最多的C端用戶,還有最廣闊的B端市場,對AI應(yīng)用落地來說,這是獨(dú)特的巨大優(yōu)勢。
如何讓大模型更好應(yīng)用于千行百業(yè),全面升級產(chǎn)業(yè)同時(shí),創(chuàng)造一個(gè)巨大商業(yè)市場,是自上而下的共識。權(quán)威媒體就在評論中認(rèn)為,大模型落地應(yīng)用,是中國AI當(dāng)下最重要的命題。
“作為生產(chǎn)力工具,以大模型為代表的AI技術(shù),不僅將與營銷、文娛、社交、電商等AI原生應(yīng)用深度融合,還會重構(gòu)、改造傳統(tǒng)制造、醫(yī)療、HR、教育、金融、法律等垂類應(yīng)用,推動千行百業(yè)向高質(zhì)量方向發(fā)展?!币晃挥^察人士說。
過去十余年來,美國或許一直在AI競賽中領(lǐng)先中國。但從DeepSeek到文心大模型4.5,這一切正在迅速改變:
盡管OpenAI等明顯感受到了來自中國的競爭壓力,也在想方設(shè)法提速,但GPT-4.5“最佳聊天的小家子氣”——GPT 4.5(研究預(yù)覽版)甚至輸出價(jià)格是每百萬token 150美金相比,依然讓更多美國AI人士相信,這標(biāo)志著在大模型第二場競速,也就是應(yīng)用落地比拼中,中國大模型正不斷趕超美國。
出品人:黃槍槍|直達(dá)熱線 13452396140
(請標(biāo)注公司、職位)
獨(dú)到觀點(diǎn)、獨(dú)立態(tài)度
見證中國商業(yè)生態(tài)進(jìn)化、重塑與未來
往期精品
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.