“我們正處在一個開源的黃金時代。”在2025年4月底的首屆Llama Con開發者大會上,Meta首席產品官Chris Cox高調公布了Llama系列模型的成績,他表示其“開源”人工智能模型家族Llama的下載量已達到12億次,2025年3月中旬,該模型的下載量就已突破10億次。
然而,就在兩年前,開源還被多數科技巨頭視為“難以商業化的理想主義”。2022年,Chris Cox在接受《The Information》采訪時曾直言:“當你試圖將模型商業化時,開源會帶來巨大挑戰。”
彼時,Meta、谷歌等公司仍將AI模型視為核心壁壘,開源意味著技術優勢的流失。
轉折點發生在2023年,Meta率先拆掉圍墻,開源Llama 1,隨后在7月發布可商用的Llama 2。壓力傳導至整個行業。
隨后微軟2023年12月推出Phi系列,定位為高效替代方案;
谷歌在2024年2月開源輕量級模型Gemma,強調“開放協作”;
曾宣稱“開源模型是智商稅,永遠應該選擇閉源模型”的百度,也在2025年2月中旬宣布將在未來幾個月中陸續推出文心大模型4.5系列,并于6月30日起正式開源。
這場變革的本質并非技術共享,而是一場商業博弈。
開源從“邊緣”到“大勢”
在計算機技術的萌芽期,開源曾是行業默認模式。進入AI時代后,開源生態呈現出更復雜的博弈格局。
2022年8月,Stability AI開源的Stable Diffusion模型,自發布后,迅速點燃AI繪畫圈的熱情,大量開發者基于它進行創新。據GitHub年度報告顯示,其代碼倉庫在2023年被fork(系統調用)次數突破25萬次
與此同時,非營利組織Eleuther AI(美國最著名的數據開源組織之一)自2020年成立以來,通過發布GPT-J等系列開源大模型,建立了“開放預訓練+社區協作”的創新研究范式,其2022年發布的GPT-NeoX-20B模型在Apache 2.0許可下開放全部權重,成為當時參數規模最大的可商用開源模型。
商業公司的策略則呈現分化態勢,彼時的OpenAI、DeepMind則嚴守核心模型。
OpenAI創立之初期望實現AI民主化,但后續發展中戰略有所轉變。2019年馬斯克因戰略分歧退出后,公司結構改變,重心傾向商業化。從GPT-1的完全開源,到GPT-2部分開源后因擔憂被不良利用而未完全開源,再到GPT-3閉源并發布未公開的Beta版API。
DeepMind同樣對其核心模型采取較為封閉的策略,雖在某些研究成果上有影響力,但核心技術并未廣泛開源,不過在2024年5月14日,其研發人員宣布將在6個月內發布alphafold3(包括權重)模型以供學術界使用,其研究總監Pushmeet Kohli表示“這是為了加速生命科學領域的集體突破”。
中央財經大學數字經濟融合創新發展中心主任陳端曾表示,“開源模型的崛起改變了整個AI行業的競爭格局,巨頭們意識到,如果不參與開源,就可能會失去在開發者社區的話語權,進而影響到整個生態系統的構建。”
中國AI企業是跟進還是突圍?
中國企業正試圖通過差異化競爭實現突圍。在通用大模型競爭日益激烈的背景下,中國企業另辟蹊徑,選擇深耕垂直場景的發展路徑。
2025年1月28日,阿里巴巴達摩院宣布開源視覺理解模型Qwen2.5-VL,提供3B、7B和72B三個版本。據國際測評榜單Live Bench數據顯示,其旗艦模型Qwen2.5-VL-72B在13項視覺任務中超越GPT-4o與Claude3.5。
此前,通義實驗室負責人周靖人表示,開源生態對促進中國大模型的技術進步與應用落地至關重要,通義千問將持續投入開源,希望成為“AI時代最開放的大模型”,與伙伴們共同促進大模型生態建設。
5月6日,國際權威大模型測評榜Live Bench公布了最新一期排名,阿里巴巴開源的新一代通義千問模型Qwen3斬獲全球開源模型冠軍。
大模型“六小虎”之一的階躍星辰(StepAI)在不久前的2月18日,開源了兩款階躍Step系列多模態大模型,Step-Video-T2V視頻生成模型和Step-Audio語音模型。階躍星辰副總裁李璟對媒體表示,階躍Step-Audio是業內首款產品級的開源語音交互模型。
“開源是面向開發者和面向應用的一種方式。視頻生成模型(Step-Video-T2V)是目前開源社區參與量最大、效果最好的一類模型。大家對于文生圖、文生視頻的模型能力期待了很久,我們把這兩個亮點模型貢獻給開源社區,一起為全球開源社區貢獻來自中國的多模態力量。”李璟在2025全球開發者先鋒大會上說道。
開源的“陽謀論”
自媒體人盧克文在分析開源現象時指出,開源,是一個陽謀,它起到的是一個“強己”和“擊敵”的作用。既增強自身生態影響力,同時削弱競爭對手的市場主導地位。
開源AI模型往往與企業的云計算業務深度綁定。阿里巴巴在開源通義千問大模型的同時,推薦用戶使用阿里云的PAI(機器學習平臺)進行訓練和推理。
紅杉資本在2024年12月9日發布的報告《AI in 2025:Building Blocks Firmlyin Place》中提到,Meta通過開源的Llama模型以及強大的分發平臺Instagram、WhatsApp和Facebook,正在塑造一種全新的AI競爭模式,其開源戰略使其在AI技術的傳播與應用上占據獨特優勢。
開源策略的核心似乎不再是單純的技術共享,而是通過降低使用門檻,擴大自身生態的覆蓋范圍。
開源大模型的訓練和推理通常依賴高性能GPU集群,而Meta、微軟等公司在開源模型的同時,也間接推動了英偉達等芯片廠商的市場增長。Meta在發布Llama 3時強調,該模型針對英偉達H100和AMD MI300X等GPU進行了優化。
DIGITIMES研究中心于2024年發布報告顯示,2024年高端服務器GPU產值比重超過80%,預估將達到1022億美元;2024年高端服務器GPU出貨量將達到482萬片,其中英偉達占有率92.5%,AMD公司占有率為7.3%。開源模型的普及進一步加劇了對高性能計算硬件的需求,使得芯片廠商成為開源浪潮的隱形受益者。
盡管開源模型允許自由使用和修改,但科技巨頭仍通過技術標準和生態體系維持控制力。Llama 2采用一種慷慨的寬松式許可證,但禁止使用Llama來“改進其他任何大語言模型,Llama 2除外”,如果產品的月活躍用戶(MAU)超過7億,用戶必須申請特殊的商業許可證。這一條款被業內人士解讀為限制競爭對手直接使用其技術。
從種種跡象來看,開源潮的背后,似乎是一場關于生態控制權的暗戰。巨頭們“拆掉圍墻”的同時,正在構筑更隱蔽的護城河。
封面圖片來源:豆包生成
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.