撰文 | 懂懂
編輯 | 秦言
來源:懂懂筆記
從春節到現在,有兩個熱點熱度一直延續。
一是電影《哪吒2》票房一路走高,叫好又叫座,最近全球票房已破百億;二是AI大模型,從餐桌到辦公室,從老人到孩童,或多或少都能聊幾句大模型。
這兩天,百度又給AI大模型添了一把柴——又是免費,又是開源,將AI大模型的火越燒越旺。
開年大戲
蛇年開工第二周,百度密集宣布了多項AI大模型的大動作:
2月13日,百度宣布文心一言將于4月1日0時起,全面免費,所有PC端和APP端用戶均可體驗文心系列最新模型。同時,文心一言上線深度搜索功能,該功能也將于4月1日起免費開放使用。
2月14日,百度官方微信公眾號宣布:“我們將在未來幾個月中陸續推出文心大模型4.5系列,并于6月30日起正式開源?!?/strong>
再加上市場傳言的百度將于今年下半年發布文心5.0,百度幾乎包圓了蛇年第二周的所有AI大事件。
有三個關鍵詞。一是免費,有人會納悶,文心一言不是一直都可以免費使用嗎?其實,目前所有用戶可免費使用主要是文心大模型3.5,可以滿足日常所需,但會思考、自主規劃、效果更全面的文心大模型4.0、4.0Turbo等版本仍需要收費。
此次百度官宣免費,是指1個多月以后,4.0、4.0Turbo等最新版本都將免費給用戶使用。這意味著,更多用戶可以使用到功能更強的文心一言產品,更深刻干感受大模型的力量。
二是開源,是與閉源對應。之前百度文心大模型是其自主開發、代碼不公開,他人無法共享、修改。這也是谷歌、OpenAI等大廠,一直堅持的路線,其優勢是大廠投入多、技術可控、性能通常更好。
從6月30起,百度將開源文心4.5等模型。所謂開源,即所有人都可看到其大模型代碼,知道其算法邏輯,知其然知其所以然。選擇在此刻開源,是百度對自身實力的自信。大模型度過了初步發展階段,進入AI應用爆發階段,開源有助于技術更快傳播,提高采用率,為好奇的人們做AI應用創新帶來更多機會。
過去幾年,百度文心一言雖然是閉源,但一直致力于大模型開放平臺和生態建設,飛槳平臺等,幫助不少企業0門檻研發適宜自身情況的大模型產品。而且,百度已經集結了國內規模最為龐大的AI大模型開發者。
而且,與OpenAI相比,更能看出百度開源的決心。百度宣布開源的同期,海外媒體傳出OpenAI內部正在討論開源模式,不過,相比百度開源最新系列模型產品,OpenAI考慮開源的還是舊版本的模型。
此次開源,毫無疑問將極大繁榮行業生態,已經聚集起來的開發者將參與文心一言產品的開發、完善,也能進一步推動文心一言的持續成長。
三是上新。官宣文心一言4.5未來幾個月推出以外,市場還傳出百度將于下半年推出文心一言5.0,這意味著今年又將是百度文心大模型的“高產年”。年初就宣布持續、高頻的迭代計劃,意味著百度對技術有充分信心和把握。
四層架構
從AI布道者到AI先生,李彥宏及創立的百度,過去十多年,是中國公司中相信AI、All in AI的幾乎唯一代表。
從飛漿開放平臺到編寫AI教材,再到組織開發者競賽。百度對于國內AI創新及生態建設的努力是持續的。此次開源和免費也是其情懷的延續。
對于百度文心大模型的開源、免費,市場持積極態度。13日官宣免費當天,百度股價一度上漲12%,當日收盤大漲10%。
市場積極看好其免費和開源策略的原因在于,此舉不僅能給百度帶來更多用戶,搶占更大市場份額,帶來業績層面的增長,更能反映百度技術實力和面向未來的持續競爭力。換句話說,市場不僅看重百度情況,更看重其技術實力。
用李彥宏的話來說,之所以能免費,在于百度在大模型領域的成本足夠低。“當我們談論大型語言模型時,12個月內推理成本基本上可以降低90%以上成本。”
而支撐百度大模型低成本的則是其獨特的四層AI技術全棧架構,具備了從芯片到應用的端到端的能力,這也是目前國內獨一份。
這里的全棧架構包含芯片、框架、模型、應用四層。懂懂拆開給大家講解。
芯片層是AI大模型的底層硬件。大模型離不開強大算力,而芯片就如同人的大腦,腦力越強,算力越充沛。百度自研了昆侖芯等AI芯片,專門服務高效處理AI模型的訓練和推理任務。
同時,百度還有強大計算資源。前不久,剛點亮昆侖芯三代萬卡集群。萬卡集群可將千億參數模型的訓練周期大幅降低,并支持多任務并發能力,通過動態資源切分,單集群可同時訓練多個輕量化模型,減少算力浪費,從而實現訓練成本指數級下降。
框架層主要是飛槳這樣的開發工具。百度將其開源給全行業的開發者使用,簡化了AI模型開發流程,使得開發者可以用它來構建、訓練和部署AI模型。
模型層主要是文心一言大模型產品,能夠處理復雜任務(自然語言處理、圖像識別等)。同時,百度還提供多個預訓練模型,開發者可以直接使用或基于這些模型進行二次開發。
應用層是指百度把AI大模型應用到使用使用端,目前百度搜索、百度文庫、百度地圖等產品,均實現了大模型改造,大量用戶日常使用,證明了AI大模型的落地能力,也推動其不斷學習、完善。
自研芯片和充沛計算資源,使得百度持續降低大模型訓練成本,而四層結合的技術架構,又使其推理成本不斷下降。在24年初的財報電話會上,李彥宏曾經透露,自發布以來,百度不斷降低文心大模型的推理成本,已降低至一年前的1%,意味著一年降低了99%的成本。
自研的四層技術架構,帶動百度AI大模型成本不斷降低,也是其開源、免費的底氣所在。
紅利釋放
過去幾年,大模型的關注點主要是從通用大模型向行業垂類大模型的遷徙。未來幾年,基于AI大模型的應用爆發將是行業競爭的焦點。
不論前者還是后者,底層邏輯都是大模型產業的創新和成本。
李彥宏認為,回顧過去幾百年的歷史,大多數創新都與降低成本有關。如果成本降低一定比例,生產力也隨之提高同樣比例,這就是創新的本質。在今天,創新速度比以往都快得多。
前面已經分析過,百度大模型降本的邏輯。更低的成本,也促使百度發布性能更強大的大模型產品。
據外媒報道,百度計劃在今年下半年發布下一代 AI 模型“文心 5.0”,其重點將在多模態能力上提升。
何為多模態?即可以處理文本、視頻、圖像和音頻等不同形態的數據,并進行轉換,比如將文本生成視頻,將文本生成圖像,并進行反向操作等。業界猜測,這將是百度對標OpenAI計劃今年發布的GPT-5的一款產品。
從2025年開始,低成本、免費、開源有望成為越來越多大模型廠商的選擇。尤其,百度、OpenAI等擁有龐大用戶體量的頭部廠商跟進,將進一步加速行業創新和成本降低。
而開源和免費將逐步釋放紅利。首先是帶動用戶規模更上一層樓。根據百度的數據,截至去年11月,百度文心一言用戶規模達到4.3億,調用量為日均15億次,是國內最高的。隨著4月1日更新版本的全面免費,文心一言的調用量將迎來新一輪爆發。
其次是行業生態完善及領導地位的鞏固。如前所述,百度一直在推動AI大模型的開放。目前,百度智能云的千帆大模型平臺,已經匯集近百個國內外大模型,以及語音、視覺等傳統小模型。春節期間走紅的DeepSeek R1和V3模型也接入千帆平臺,且最低僅為DeepSeek官方定價的30%。
千帆平臺已累計幫企業客戶精調了3萬個大模型,開發出超77萬個企業級應用。
開源之后,將有更多開發者和企業客戶應用文心大模型,無疑將為百度構建大模型生態提速。
在開源、免費這一大模型新趨勢面前,百度再次走在了行業前列。要想在新趨勢中持續領跑,百度將依賴對底層能力的持續建設。李彥宏表示:“當技術發展如此之快,你必須持續投入,以確保處于技術創新的最前沿。我們仍需對芯片、數據中心和云基礎設施進行持續投入,來訓練更好、更智能的下一代模型。”
冷眼旁觀 麻辣點評 深入分析
個人觀點,僅供參考
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.