無論DeepSeek,還是文心大模型4.5,都已率先進入第二戰場,掀起一場將大模型門檻拉低到極致,推動產業落地、應用爆發的革命性探索。
作者|劉珊珊
編輯|Cindy
分隔在大洋彼岸的中美兩大AI企業,同一天宣布了重磅消息。
2月28日,百度宣布,文心大模型4.5將于3月16日正式上線。根據百度方面介紹,最新版不僅在基礎模型能力上有大幅提升,且具備原生多模態、深度思考等能力。
“文心大模型4.5,將是百度有史以來最強大的大模型?!贝饲鞍俣?024年Q4及全年財報電話會上,百度創始人、董事長兼首席執行官李彥宏如此透露。
受來自DeepSeek、百度、阿里等中國大模型的挑戰,OpenAI在北京時間周五凌晨發布博文,宣布GPT-4.5大模型正式登場。這款被OpenAI內部代號為“Orion”的模型,被聲稱是其最大、最佳的聊天模型。
眾所周知,過去幾周全球AI產業界都正因DeepSeek而巨變。在全球AI競賽加劇之際,作為中美兩大領先AI企業,百度和OpenAI的新動作,自然更受外界關注。
目前來看,百度將通過文心大模型4.5,打出“開源、免費”組合拳,走向更加開放的策略。
相比之下,GPT-4.5的高情商和人性化表現也帶來了驚喜,但整體差強人意,因為并不是推理型模型,在性能上也與OpenAI前幾代模型有差距——更強大基礎大模型仍然是護城河邏輯不變下,中國大模型正加速占據以應用落地為主題的大模型第二場主動權。
01
開源+免費”,百度更為開放
進入2月以來,百度已密集放出了多個重磅“AI炸彈”。
2月12日,CNBC一則關于百度文心大模型5.0版本將于下半年發布的消息,在AI行業引發震動。2月13日,OpenAI首席執行官Sam Altman(山姆·奧特曼)宣布將在未來幾個月推出名為GPT-5,中美大模型競賽氛圍越來越濃。
最重磅消息來自百度。同一天,百度宣布文心一言將于4月1日0時起,全面免費,所有PC端和APP端用戶均可體驗文心系列最新模型。同時,上線深度搜索功能。
1天后(2月14日),百度宣布將在未來幾個月中陸續推出文心大模型4.5系列,并于6月30日起正式開源。
這意味著,文心大模型就此打出“免費+開源”組合拳,百度AI策略更為開放。
百度轉變和DeepSeek橫空出世帶來的震動,有一定關系——但不止百度,OpenAI、騰訊、阿里等國內外AI巨頭,無一不受影響。比如OpenAI,就在中國大模型壓力下,被迫加速模型發布和開源的腳步。
更客觀現實是,開源和閉源,其實并沒有絕對的優劣之分。
作為中國大模型最早入局者,百度文心大模型是全球最早對標GPT的LLM大模型,幾年時間里,文心大模型經過了持續的迭代和進化。比如,文心一言版本已經迭代到了4.0,無論是日均超15億次的調用量,還是在各行業的賦能落地,都是推動中國大模型發展的重要組成部分。
同時,在百度強大生態支撐下,百度搜索、百度地圖、百度文庫、百度智能云等,都早已在給普通用戶提供最完整的AI服務。
多位業內人士就此認為,百度走向“開源+免費”,是大模型發展的“順勢而為”,其意義重大,可以更好地推動技術平權。它讓全球用戶能夠毫無門檻地運用中國頂尖的大模型技術,更是大模型從專業范疇,邁向大眾市場的關鍵轉折點。
李彥宏在多個場合的表態,也表明了,百度如今對開源與閉源模型價值的思考邏輯。“我在過去幾個月中學到的是,開源可以幫助你獲得更多關注。我們正處于AI、生成AI創新的早期階段,更快的傳播將有助于提高采用率,但也有助于更多的人嘗試這項技術?!?/p>
這背后,體現的是百度組合拳,推動技術平權時的底氣和開放心態。
比如,百度系多款產品,百度搜索、百度文庫、百度網盤都全量接入了DeepSeek- R1滿血版。相比其他產品入口較深,任何普通網友,都可以在百度首頁搜索框下方,點擊“AI搜索DeepSeek滿血版”直接體驗。
無論如何,自研大模型才是百度最強競爭力所在。如同李彥宏指出,基礎模型真正的價值,只有在能夠有效解決現實問題并廣泛應用時才能得到體現。“即使是開源,如何確保其在實際應用中展現出色的表現,才是企業必須面對的挑戰。”
至此,留給外界的疑問,無外這場普惠大眾的AI 變革浪潮,何時正式開啟。
2月27日,路透社爆料稱,百度將在3月中下旬發布文心大模型4.5 ?;蛟S是明顯感受到了來自中國AI的競爭壓力,OpenAI略顯倉促的在2月28日推出GPT-4.5——發布會僅持續不到14分鐘,OpenAI的CEO山姆·奧特曼正在醫院陪剛出生的孩子,并未現身。
02
史上最強文心大模型,有多強?
隨著文心大模型4.5正式登場日的官宣,接下來半個月中,業界都會有一個共同猜測:史上最強文心大模型,到底有多強?又有哪些能力值得期待?
可以肯定,和GPT-4.5不同,文心大模型4.5,將在基礎模型能力上有大幅提升,帶給用戶最明顯的感受,可能是RAG能力進一步增強,將在幻覺方面降低到新水平。
“幻覺”,是懸在AI發展之路上的達摩克利斯之劍。指的是大模型在試圖生成內容或回答問題時,輸出的結果不完全正確甚至錯誤,即通常所說的“一本正經地胡說八道”。
在大模型領域,由于訓練知識存在偏差、過度泛化地推理、理解存在局限性等,幻覺是每個模型與生俱來的缺陷。
大模型或多或少都有幻覺問題
例如OpenAI,多份研究此前指出,o3-mini大約只有10個簡單問題中答對1個,兩年來幻覺問題都沒有得到改善。異軍突起的DeepSeek,也因在解答西安安定門繞行問題時 “翻車” 而備受關注。
RAG(檢索增強型生成),在解決幻覺問題上扮演著至關重要的角色——在推理過程中,RAG 使用檢索到的數據作為參考來組織答案,從外部知識源中動態檢索信息,以此幫助大模型生成更豐富、更準確、更可靠的內容??梢哉f,RAG給大模型增加了一個可以快速查找的“知識外掛”。
毋庸置疑,在國內,百度擁有最豐富的實時與個性化的數據和知識,研發了“理解-檢索-生成”RAG能力。從各種RAG能力實測來看,國內外主流大模型中,百度文心一言綜合表現最佳。
比如,在和OpenAI的直接PK中,即使是春節檔電影細節、春晚節目等內容,文心都能準確回答;相比之下,OpenAI雖能檢索到信源,卻無法生成準確回答。
基于此,去年11月的百度世界2024大會上,百度發布了自研的檢索增強的文生圖技術(iRAG),將百度搜索的億級圖片資源跟強大的基礎模型能力相結合,大幅降低圖片生成領域的幻覺,大幅提高了文心的模型可用性。
可以預計,在文心大模型4.5中,隨著大模型的訓練數據得到進一步擴充,AI幻覺也會大幅降低,不僅讓百度自身AI應用快速進化,也能夠讓更多行業放心用上大模型。
近期,文心一言就上線了“深度搜索”功能,具備專家級問答能力,RAG能力突出,尤其是專業領域問答幻覺率低。
在OpenAI的GPT-4.5不具備推理能力,還是主打寫作等文本生成趨勢下,文心大模型4.5究竟能呈現怎樣的原生多模態、深度思考能力?以及可以在哪些場景下落地應用?顯然更值得期待。
可以推測,在DeepSeek掀起大模型降價浪潮后,文心大模型4.5也會加速推動性能升級與成本降低,有望催生新的商業模式和產業生態。
值得一提的是,得益于飛槳和文心的聯合優化,文心大模型在推理性能提升同時,推理成本也得到了有效降低——根據去年世界大會上的說法,其推理成本一年降低99%。
從李彥宏演示的個例來看,以前拍一組汽車在某場景的大片宣傳海報動輒需要一二十萬,甚至大幾十萬,使用iRAG后,創作成本接近于0。
推理成本降低速度還在加快。李彥宏在阿聯酋迪拜出席“世界政府峰會”上表示,“在過去,當我們談論摩爾定律時,每18個月,性能水平或價格都會減半。但是今天,當我們談論大型語言模型時,增加的成本基本上降低了,可以在12個月內降低90%以上?!?/p>
所以,這也是眾多企業和開發者,對于文心大模型4.5的共同期待。一位開發者就說,基于文心大模型4.5,希望無論是開發原生應用,還是做二次開發,都能夠方便地體驗,擁有更低的推理成本和更高的訓練效率。
03
第二場競速,
中國大模型趕超美國提速
上述開發者的期待,其實正是在百度接連打出“開源+免費”組合拳后,李彥宏的表態:“希望客戶和用戶能比之前更方便地體驗這款模型。”
某種程度看,無論DeepSeek,還是文心大模型4.5,都已率先進入第二戰場,掀起一場將大模型門檻拉低到極致,推動產業落地、應用爆發的革命性探索。
中國是全球唯一擁有聯合國產業分類中所列全部工業門類的國家,不僅擁有全球最多的C端用戶,還有最廣闊的B端市場,對AI應用落地來說,這是獨特的巨大優勢。
如何讓大模型更好應用于千行百業,全面升級產業同時,創造一個巨大商業市場,是自上而下的共識。權威媒體就在評論中認為,大模型落地應用,是中國AI當下最重要的命題。
“作為生產力工具,以大模型為代表的AI技術,不僅將與營銷、文娛、社交、電商等AI原生應用深度融合,還會重構、改造傳統制造、醫療、HR、教育、金融、法律等垂類應用,推動千行百業向高質量方向發展。”一位觀察人士說。
過去十余年來,美國或許一直在AI競賽中領先中國。但從DeepSeek到文心大模型4.5,這一切正在迅速改變:
盡管OpenAI等明顯感受到了來自中國的競爭壓力,也在想方設法提速,但GPT-4.5“最佳聊天的小家子氣”——GPT 4.5(研究預覽版)甚至輸出價格是每百萬token 150美金相比,依然讓更多美國AI人士相信,這標志著在大模型第二場競速,也就是應用落地比拼中,中國大模型正不斷趕超美國。
出品人:黃槍槍|直達熱線 13452396140
(請標注公司、職位)
獨到觀點、獨立態度
見證中國商業生態進化、重塑與未來
往期精品
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.