今年春節期間,DeepSeek爆火,掀起的大模型“沖擊波”影響了整個行業,一個直接的后果就是大模型的競賽提速了,最明顯的例證就是最近百度與OpenAI之間鉚足了勁比誰“跑得快”。
大模型“頭部效應”是競賽提速的原因,所謂大模型“頭部效應”是指在大模型領域,少數領先的大模型及其開發企業憑借技術、數據、資源、市場等多方面優勢,占據市場主導地位,并不斷鞏固和擴大這種優勢,從而拉開與其他競爭對手的差距。
2月28日,百度官方公眾號宣布,將于3月16日發布文心大模型4.5。此次百度文心大模型換擋提速,于行業來說顯得突然,于大模型的發展來說卻是必須:跑得快才能有資格做頭部,做了頭部才能有活下去的機會。
爭當頭部是百度發展過程中的實踐經驗:1999年百度成立,隨后行業內出現了上百家提供搜索引擎的創業公司,百度戰勝了所有對手,才有了后來在搜索行業的絕對領先地位,其中包括搜狐、北大天網、3721等實力派對手。
2023年3月16日,百度推出了全球大廠中首個生成式AI產品:文心一言。百度將在兩年過去后的同一天推出文心大模型4.5,傳達的信息很明顯:兩年過去了,到了決定勝負的時候了。
在大模型領域,百度對標的對手是OpenAI。2月28日凌晨,來自中新網等媒體報道,OpenAI宣布推出OpenAIGPT-4.5的研究預覽版,并稱其為OpenAI迄今為止規模最大、知識最豐富的模型。
百度28日宣布推出將文心大模型4.5,硬碰硬,行業內的人都聞到了兩家公司激烈角逐的火藥味。代表中國的百度文心大模型、DeepSeek與代表美國的OpenAIGPT、Grok相互角力將是未來一段時間內的大模型行業格局。
1
對標OpenAI,中美大模型角力
2月27日,據路透社爆料,百度將在3月中下旬發布文心大模型4.5。DeepSeek之后,中國大模型行業期待更多振奮的消息,文心大模型4.5恰逢其時。
2月14日,百度宣布在未來幾個月推出文心大模型4.5系列,對于即將推出的文心大模型4.5系列,市場期待文心大模型4.5。
2月18日晚,在百度2024年Q4及全年財報電話會上,百度創始人、董事長兼CEO李彥宏透露了文心大模型4.5系列的更多消息:4.5將是百度有史以來最強大的大模型,“希望客戶和用戶能比之前更方便地體驗這款模型”。
百度提供的資料顯示,文心大模型4.5將在基礎模型能力上有大幅提升,且具備原生多模態、深度思考等能力。
這將是百度最強的下一代大模型:文心大模型的RAG能力是目前國內最強的,去年百度還自研了iRAG等技術,大幅降低圖片生成領域的幻覺。還
據此推測文心大模型4.5將在幻覺方面降低到新水平。
百度的對手OpenAI也沒有閑著,2月13日凌晨,OpenAI首席執行官SamAltman公布了GPT-4.5和GPT-5的最新消息。免費版ChatGPT能在標準智能設置下無限制地使用GPT-5進行對話。
當地時間2月6日,OpenAI宣布ChatGPTSearch向所有人開放,無需注冊,來到OpenAI官網首頁就可以直接使用搜索功能。2月28日凌晨,OpenAI發布了GPT-4.5模型。
GPT-4.5性能被業內評價為“差強人意”。OpenAI的GPT4.5不具備推理能力,還是主打寫作等文本生成,在基準測試上的得分甚至不如OpenAI的前幾代模型。
有分析認為,OpenAI此次發布略顯倉促,來自中國競爭加劇的壓力可能是重要原因。畢竟,幾小時前,路透社剛爆料了百度文心4.5將在3月中旬發布的消息,還有春節期間火爆出圈的DeepSeek。文心大模型4.5比GPT4.5更值得期待的是多模態和深度思考能力。
百度文心大模型是全球最早對標GPT的LLM大模型,過去兩年,業內常將兩者放在一起分析對比。
文心大模型和GPT4.5前后腳發布,兩者的競爭還沒有結束,OpenAI首席執行官薩姆?奧爾特曼2025年2月13日透露,OpenAI將在未來幾個月內推出GPT-5,消息人士透露,百度將于年內推出文心大模型5.0。
2
開源、免費,百度的“開放”組合拳
應用、開源、免費,中美大模型角力,百度、OpenAI等公司在各個維度展開了角力。
2月13日,百度宣布文心一言將于4月1日0時起全面免費,同時上線深度搜索功能。所有PC端和APP端用戶均可體驗文心系列最新模型,以及超長文檔處理、專業檢索增強、高級AI繪畫、多語種對話等功能。
同時,文心一言上線深度搜索功能,該功能具備更強大的思考規劃和工具調用能力,可為用戶提供專家級內容回復,并處理多場景任務,實現多模態輸入與輸出。截至目前,文心一言用戶規模達到4.3億,文心大模型日均調用量超過16.5億次。
深度搜索針對專業咨詢類問題的解決能力(深度搜索)進行全面加強,以解決專業問題查詢門檻高、查詢渠道專精、查詢結果分析難度大等使用挑戰。在民生、創業、經濟分析等方面問題,能夠提供專家級的內容回復;除了搜索能力以外,文心一言具備全面的思考、規劃、反思能力,針對工具規劃及調用能力上進行全面加強,能夠更加“聰明”的使用多個工具解決各類復雜任務問題。
例如先搜索內容,再配合代碼解釋器,或者閱讀上傳文檔、再搜索分析,最后綜合給出結果等。
2月14日,百度宣布文心大模型從6月30日正式開源。2月18日,李彥宏在財報會上確認文心大模型4.5將開源。開源文心大模型4.5,讓開發者和用戶能夠更輕松地試用,為行業發展注入新活力,將推動其在更多領域的廣泛應用。
李彥宏表示:開源決策源自于對技術領先地位的信心,相信文心大模型4.5的技術優勢能夠在開源后經受住市場的檢驗,并進一步擴大其影響力。
李彥宏說“但我想強調的是,無論開源閉源,基礎模型只有在大規模解決現實問題時,才具備真實價值”。未來,百度將加速推動文心大模型的性能升級與成本降低。
百度的“開放”組合拳將行業拉進入“免費+開源”的新階段,將大模型的使用門檻拉到極致,無疑將助推大模型應用爆發。
能力建設是大模型平臺之間的第一場戰爭,應用、市場、用戶爭奪是第二場戰爭。接連打出“開源、免費”組合拳,百度要用更加開放的策略,去占據大模型第二場競爭中的主動權。
在中國的競爭壓力下,OpenAI也被卷加速了模型發布和開源的腳步。1月31日,OpenAI的CEO薩姆·奧爾特曼表示,OpenAI在開源AI軟件方面“一直站在歷史的錯誤一邊”。目前OpenAI內部正討論公開AI模型的權重等事宜。
同日有媒體透露,奧爾特曼的這一最新表態承認了OpenAI的“封閉策略”可能存在缺陷,同時表明,隨著來自中國的競爭加劇,高效的開放模型越來越受歡迎,OpenAI的戰略可能會發生重大轉變。
在大模型行業第二場戰爭中,百度、OpenAI等頭部玩家率先開啟了新玩法,中美大模型之戰進入了新階段。
3
更好的下一代模型
需要持續的AI基建投入
一般來說,新技術的普及與成本之間存在著緊密的關系,通常表現為成本降低有利于新技術的普及,而新技術的普及又可能進一步促使成本下降。
計算機行業的摩爾定律就是這一規律的最好例證:集成電路上可容納的晶體管數目,約每隔18-24個月便會增加一倍,性能也將提升一倍,而價格保持不變或下降。
摩爾定律由英特爾創始人之一戈登?摩爾提出,其意味著隨著時間推移,同樣價格能買到性能更強的芯片等電子產品,或者說實現相同功能的成本會不斷降低,推動了計算機、半導體等行業的快速發展和相關技術的普及。
在今年2月11日的迪拜世界政府峰會(WGS2025)上,李彥宏與阿聯酋AI部長奧馬爾?蘇丹?奧拉馬進行了對談的過程中提出大模型時代的摩爾定律:當我們談論大型語言模型時,12個月內推理成本基本上可以降低90%以上成本。
李彥宏說:不僅在AI領域或IT行業,回顧過去幾百年的歷史,大多數創新都與降低成本有關。如果成本降低一定比例,生產力也隨之提高同樣比例,這就是創新的本質。
李彥宏“開源+免費”的行業前瞻正是基于這一邏輯的判斷,算力成本越來越低,并且性能越來越好,應用普及的機會已經到來。任何行業都會用大模型重新做一遍,隨著各種應用的出現,類似PC互聯網、移動互聯網那樣的創新周期正在到來。
關于算力成本降低,DeepSeek是最好的例證,基于獨特的技術架構與算法,每個Token只需處理360億參數,遠低于Llama3.1的4050億參數,有效減少計算量。以文心大模型、DeepSeek為代表的模型廠商持續降低推理成本,降本進而促進普惠已成為行業普遍現象。
正如李彥宏在近日一次對談的過程中說:也許在某個時刻,你會找到一條捷徑,比如說只需600萬美元就能訓練出一個模型,但在此之前,你可能已經花費了數十億美元來探索,哪條路才是花費這600萬美元的正確途徑。
李彥宏認為即使算力成本降低,算力芯片需求仍有巨大的需求空間:當技術發展如此之快,你必須持續投入,以確保處于技術創新的最前沿。
李彥宏表示,百度仍需對芯片、數據中心和云基礎設施進行持續投入,來訓練更好、更智能的下一代模型。可以想見,即將跟大家見面的文心4.5,在性能創紀錄的同時,也將代表著百度AI基礎設施投入的新成效。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.