網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

何寶宏：大模型開閉源之爭，到底在爭什么？

2025-04-08 16:40:04　來源: 商學院雜志

北京舉報

分享至

大模型競爭的下半場將是從閉源過渡到基于開源，如今優(yōu)秀的開源模型能力已達到全球領(lǐng)先閉源模型能力的80%甚至更高，但成本卻是閉源模型的1/20甚至更低，未來場景里或多或少會選擇基于開源的模型。

文｜趙建琳

ID | BMR2004

在人工智能領(lǐng)域越發(fā)激烈的競爭中，圍繞大模型開源還是閉源的討論，已成為各家企業(yè)博弈的一個縮影。

曾出于商業(yè)競爭和安全考慮選擇做閉源模型的OpenAI，在2025年2月初再次發(fā)生轉(zhuǎn)向，其CEO薩姆·奧爾特曼（Sam Altman）表示，公司的閉源策略“站在了歷史的錯誤一邊”。OpenAI曾經(jīng)是一家致力于開源人工智能技術(shù)的公司，但自2020年發(fā)布GPT-3模型以來，它開始轉(zhuǎn)向了閉源。同樣在2月，百度宣布文心一言于4月1日0時起全面免費，同時，3月16日推出的文心大模型4.5系列也將開源。而在2024年，百度CEO李彥宏一度堅持閉源模型在性能和成本上更具優(yōu)勢，如今他的想法也發(fā)生了改變。

近日，《商學院》雜志與中國信通院云計算與大數(shù)據(jù)研究所所長何寶宏進行了一場訪談，請他聊聊當前大模型開閉源之爭的本質(zhì)與規(guī)律。何寶宏的本碩博求學之路都在計算機相關(guān)專業(yè)學習中度過,但在專業(yè)研究之余，他愛讀歷史、哲學類書籍,這些人文社科書籍幫他豐富了看待問題的視角。何寶宏說：“研究技術(shù)不能只看技術(shù)本身，這樣會被局限住，要適當跳出來，從更廣的視野去看，一切就會豁然開朗。”

中國信通院云計算與大數(shù)據(jù)研究所所長何寶宏

“優(yōu)先變現(xiàn)還是優(yōu)先拓市場”？

提文：開源的商業(yè)模式與互聯(lián)網(wǎng)早期“燒錢”鋪市場的商業(yè)模式高度相似，歷史總是變換著外衣在“重復”。

研究技術(shù)多年，何寶宏深深體會到，任何事物的相似性與差異性都取決于我們從怎樣的視角去觀察它。“當你把鏡頭拉近，再相似的兩個事物都能從中發(fā)現(xiàn)差異；當你把鏡頭拉遠，再不同的兩個事物也能找出相似性，如果還有差異，那就再拉遠些。”

在何寶宏看來，開源與閉源之爭始終存在于科技發(fā)展史中，從操作系統(tǒng)到數(shù)據(jù)庫，再到如今的大模型，都歷經(jīng)過開源還是閉源的討論，也都誕生了不同策略下的巨頭企業(yè)。拿操作系統(tǒng)來說，ios系統(tǒng)是閉源的，安卓系統(tǒng)是開源的；拿數(shù)據(jù)庫來說，Oracle是閉源的，MariaDB是開源的。那么在大模型時代，也不會背離這一邏輯。

從科技史呈現(xiàn)出的規(guī)律來看，坐上某一技術(shù)領(lǐng)域“鐵王座”的企業(yè)通常都會選擇閉源。此時，排在“老大”后面的企業(yè)絕大多數(shù)的最佳抉擇就是基于主流的開源產(chǎn)品做二次開發(fā)，進一步增加功能或易用性，形成以開源為主導的態(tài)勢。伴隨著這種競爭，開源與閉源將在市場上長期并存。

就大模型賽道來說，目前仍處在大量企業(yè)入局的探索成長階段。因此，除了那些堅持開源或堅持閉源的企業(yè)外，還有相當一部分企業(yè)同時推出開源和閉源模型。在這種情況下，在某方面閉源的模型通常會比該企業(yè)推出的開源模型表現(xiàn)更好，它可能是性能、效果、成本等。

基于上述基本觀察，我們便不難明白,今天業(yè)內(nèi)圍繞開源還是閉源的討論，本質(zhì)上是一場技術(shù)優(yōu)勢與生態(tài)擴張之間的博弈。何寶宏用更通俗易懂的語言作了解釋：“本質(zhì)就是你想優(yōu)先掙錢，還是優(yōu)先擴大市場。”選擇閉源，更容易商業(yè)化，也能給用戶或客戶提供更穩(wěn)定的服務，但相對地，獲得反饋和拓展市場的速度會比開源慢；選擇開源，能廣泛吸收開發(fā)者的精華促進模型優(yōu)化迭代，快速擴大市場占有率，但商業(yè)化變現(xiàn)比閉源慢。值得注意的是，“開源并非沒有商業(yè)模式。”何寶宏強調(diào)，開源只是不以賣開源代碼為生，但可以在其他方面賺錢，比如推出訂閱服務，推出功能更強大或需要個性化定制的商業(yè)版。可以說，開源的商業(yè)模式與互聯(lián)網(wǎng)早期“燒錢”鋪市場的商業(yè)模式高度相似，歷史總是“變換著外衣”在重復。

總的來說，大模型開源還是閉源，在發(fā)展初期都是一個優(yōu)先級選擇的問題，這種選擇無關(guān)對錯，“適合你的，就是好的。”何寶宏在訪談中多次強調(diào)，不能將開源與閉源對立起來，選擇本身不能決定模型乃至企業(yè)的成功或失敗，任何一種選擇都有可能到達“羅馬”，其根本還是取決于模型的能力是否足夠領(lǐng)先和成本控制是否足夠優(yōu)秀；更不能將開閉源的選擇進行“道德綁架”，本質(zhì)上它只是一種理性權(quán)衡下的商業(yè)策略問題。

大模型競爭，終局會怎樣

提文：隨著競爭的深化，面向公眾的通用大模型大概率最終只有一到兩家能“雄霸市場”，但還有大量行業(yè)垂直場景等待大模型廠商們進入。

“先發(fā)”有時不一定“制人”，時間會篩選出真正的強者。2024年ICT行業(yè)趨勢年會上，何寶宏提到，大模型競爭的下半場將是從閉源過渡到基于開源，如今優(yōu)秀的開源模型能力已達到全球領(lǐng)先閉源模型能力的80%甚至更高，但成本卻是閉源模型的1/20甚至更低，未來場景里或多或少會選擇基于開源的模型。可以預見，大模型時代你追我趕式競爭將越來越激烈。

一款模型的誕生，需要代碼、數(shù)據(jù)集、訓練過程、模型權(quán)重共同發(fā)揮作用。何寶宏指出，當前大模型領(lǐng)域在數(shù)據(jù)、算法等方面的優(yōu)化上還有很大空間，“任何一個瓶頸都可以去突破，它就像排列組合，單項都最優(yōu)不一定結(jié)果最優(yōu)，最終看的是綜合最優(yōu)。”

何寶宏指出，任何大規(guī)模的商業(yè)變現(xiàn)，一定會經(jīng)歷把成本“打下來”的階段。“大家從過去買不到、買不起（高算力芯片）到現(xiàn)在買得到、買得起、用得起，這就是大模型大規(guī)模商業(yè)化的臨界點，而開源是降低成本、降低技術(shù)門檻的重要方法。”可以想象，面對開源模型帶來的競爭壓力，閉源模型必須在模型能力和成本表現(xiàn)上繼續(xù)突破才能“殺出重圍”。

大模型的構(gòu)成包含代碼、數(shù)據(jù)集、訓練過程、模型權(quán)重等組成部分，這就涉及開源模型究竟要開放哪些部分的話題了。何寶宏在訪談中指出，開源模型中的“開源”不等同于開源軟件中的“開源”，開源軟件指的是開放源代碼。但大模型不同，其組成部分眾多，傳統(tǒng)的開源定義已不太適應今日的大模型發(fā)展情況。因此，2024年10月，OSI（Open Source Initiative，開放源代碼促進會）發(fā)布了“開源AI定義”，其要求真正的開源AI大模型必須提供訓練數(shù)據(jù)的相關(guān)細節(jié)，包括來源和處理方式，提供用于訓練和運行的源代碼以便能復現(xiàn)，提供訓練時的設置和權(quán)重等，要求相當嚴格。“目前已知的開源模型仍以開放源代碼為主，沒有公司能做到開放訓練數(shù)據(jù)集。一方面，因為數(shù)據(jù)集是模型的核心競爭力之一；另一方面，圍繞數(shù)據(jù)集尚有很多數(shù)據(jù)歸屬等方面的法律界定不清晰、不統(tǒng)一，企業(yè)不會輕易公布。”何寶宏說。

何寶宏認為，隨著競爭的深化，面向公眾的通用大模型大概率最終只有一到兩家能“雄霸市場”，但企業(yè)也不必為此焦慮，還有大量行業(yè)垂直場景等待大模型廠商們進入。“個性化定制需要開源，開源給的是底座，大模型廠商要在底層通用知識基礎(chǔ)之上融合行業(yè)知識做二次開發(fā)，交付閉源垂直模型。如此，既降低了風險，又降低了行業(yè)模型的學習和使用成本，未來這部分市場潛力也會相當廣大。”

而C端大模型也有望從現(xiàn)在服務所有人的通用型服務演化到提供個性化服務。何寶宏說：“用戶的使用習慣也會被灌注到模型中，用戶與模型的互動會影響模型的參數(shù)配置，這就是智能體。智能體也需要個性化，只是我們目前還沒到那個階段而已。”

來源 | 2025年4月刊

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.