這是2024 年的百度——
這是2025 年的百度——
別笑,還是那句話,“人不能被困在 flag 里......小陳你說對吧?”
也不是針對百度。在 DeepSeek 爆火之后,各家巨頭、中頭、小頭都第一時間接入了。由于官網卡到沒法兒用,我還氪金買了 API。
蹭熱度的,趕熱鬧的,炒股的,大家都很開心——但沒聽說誰給 DeepSeek 的開發者付過一分錢,連我們的 API 都是去第三方渠道買的......
我們還問了微博大 V@蟻工廠,他經營的軟件公司已經部署 DeepSeek 了,確實一分錢都沒給。
那我們不禁好奇,這一堆做開源大模型的都是為愛發電嗎?都聽說以后要靠“生態”賺錢,這生態到底是什么?
視頻版
↓↓ 看完這個視頻就知道了 ↓↓
↑↑ 信我,真的超級好看 ↑↑
圖文版
雖然都是開源,但不是所有的開源大模型都像 DeepSeek 這樣慷慨,這主要看它們遵循哪種開源協議。
Deepseek采用的是最開放的MIT開源協議:
你可以隨便把 Deepseek 打包進軟件或服務,自用、商用、套殼拿去賣錢都可以,記得署名就行——基本上就是隨便用。
另一種同樣開放的協議是Apache 2.0。比如大模型六小龍里“智譜”的開源模型,用的就是 Apache 2.0 協議。它跟 MIT 只在署名之類的地方有區別,但都是可以拿去商用的。
并不是所有人都舍得把自己最先進的模型開源出來分享。像馬斯克的 xAI ,只以Apache 2.0 協議開源了舊的grok-1,更先進的 grok-2 和 grok-3 都沒有開源。
另一個廣受歡迎的開源大模型,阿里旗下的Qwen 系列,就比較復雜了:它們大部分用的是Apache 2.0,但Qwen 2.5-3B等個別模型用的是阿里自己制定的Qwen Research協議,要求只能用于研究和評估,商用的話需要單獨申請。
而扎克伯格旗下的Llama 系列,限制就更多一點。
比如 llama 3 允許普通人和中小公司商用,如果在 llama 3 發布時,公司已經是一個月活用戶超過7 億的巨頭,那就要單獨跟 Meta 單獨商用許可。按照這個協議,華為、百度、騰訊什么的,就不能像用 deepseek 那樣隨意部署了——不知道這是不是 llama 日后賺錢的方式之一。
而且 llama 3 的協議里還特地說明,用戶不能拿 llama 3 的生成結果,去訓練 llama 3 和衍生品之外的其他大模型。總之,是大方中透露著一絲狡黠~
但不管用哪種協議,做開源大模型都要投入大量成本,又給你免費用,到底圖什么呢?
當然,有可能人家已經格局打開,就是圖一樂。但研發成本總要覆蓋吧,錢從哪里來?
如果是自己賺錢的話,那目前最常見的盈利模式是——賣算力,賣苦力,和賣生態。
比如有 6710 億參數的滿血版 DeepSeek R1,至少需要 8 張 H100 或 A100 以上級別的 GPU 才能勉強跑起來。普通人和我們這種囊中羞澀的小團隊,根本玩不起。
所以開發大模型的公司就可以把自己的算力出租給你——也就是賣 API,按對話字數(token)收費。
做大模型的基本家家都賣 API。但按照 DeepSeek 官方的收費標準,聊個幾百萬字才幾十塊錢,如果是深夜“激情夜話”,還能更便宜。根據 DeepSeek 披露的數據,目前他們賣 API 的理論利潤率能達到545%,相當出色,震驚全場。
但這個利潤率能維持多久并不好說,因為賣 API 實在太卷了,很多公司現在注冊就送幾百萬 Token。
更重要的是,像我們的 API根本就不是在 DeepSeek 官方買的:因為 DeepSeek 可以免費商用,所以任何一個有算力的公司,都可以部署 DeepSeek,再賣給你 API。賣開源大模型的 API 沒有什么門檻,想維持高利潤自然也難。
據說 OpenAI 內部,也認為賣 API 沒有錢景。
阿里也在最新的財報電話會議中承認,Qwen 靠賣 API 是掙不了錢的。
賣算力不行,還能賣苦力——也就是按照客戶需求微調、定制大模型。
比如電商需要智能客服,游戲需要智能 NPC,政府機關需要智能公務員......這都需要結合各行業的需求和數據,微調大模型,獲得最佳效果。
像智譜就成功地拿到了一些企業和政府訂單,在 2024 年商業化收入翻倍;阿里的 Qwen 據說拿到了國行 iPhone 的訂單。
不管是賣算力還是賣苦力,賺的都是辛苦錢。
所以賣生態,可能才是最快最有想象力的賺錢方式。“生態”聽起來有點虛,我們不妨來看看阿里的實操示范:
出于保密,或者針對化定制的需求,很多公司需要自行部署開源大模型。但他們也不會自己去買一堆硬件回來,再招人維護,所以最終還是要把大模型部署在云服務器上。
那如果你用的是阿里開源的 Qwen 模型,那最可能部署在哪家的云服務上呢?
當然是阿里云——這正是阿里在財報電話中說的:雖然 Qwen 本身不賺錢,但能引導用戶使用阿里云的其他服務,讓阿里云整理多賺錢,所以大模型是“云服務中非常非常重要的一部分”。在阿里看來,未來大模型會成為像“電”一樣的基礎設施,而云計算就像是輸送電力的電網,是最清晰的盈利模式。
資本市場顯然也認可這一點:在 DeepSeek 爆發后,高漲的算力需求推高了所有云計算板塊的股票,直接推動阿里的市值暴漲了 1000 億——這可能是對大模型構建“生態”來賺錢最好的詮釋。
了解科技界的朋友對這樣的故事都不會陌生:比如你手機上 Android 操作系統也是開源的。
雖然各家廠商都可以魔改 Android,但 Google 還是能憑借系統組件把用戶引入自己的生態系統,然后憑借廣告、Google Play 抽成,售賣包括 Gmail 在內的整個 Google 云服務,賺得盆滿缽滿。
就算不賺錢,做生態對大廠也至關重要。關于這一點,扎克伯格在 2024 年這篇講 llama 開源為什么有利于 Meta 的文章中說得很清楚:
扎克伯格說,根據 Meta 之前的經驗,如果自己家的產品只能放在別人家的生態上,勢必會受到很多限制。比如 Facebook 就飽受蘋果的“蘋果稅”“隱私政策”等等的影響,廣告收入一度大打折扣。
但通過開源大模型,匯集各方的聰明才智,在短短兩三年時間里,開源大模型的表現就已經接近 ChatGPT 了。這能讓 Meta 避免大模型市場被閉源廠商所壟斷,以免日后再次出現“人在屋檐下,不得不低頭”的情況。只要做到這一點,就算大模型不直接賺錢,也是對 Meta 業務的巨大幫助。
所以站在巨頭的角度來說,如果可以通過開源鞏固自己的生態,是再好不過了;就算做不到,那也要努力通過開源,避免被限制到其他巨頭的生態里。也許這才是它們開源大模型的動機。
但最后,我們還是沒能回答DeepSeek 這樣的“小廠”,到底怎么靠開源掙錢的問題。
好消息是,人家并不需要我們操心:
DeepSeek 的母公司幻方是一家量化基金公司,靠金融投資賺錢。據說深度求索的目標是實現 AGI(通用人工智能),目前不在意盈利問題。所以 DeepSeek 爆火之后,官網一度卡死,連 API 充值通道都關閉了,人家也是安安穩穩過完年才不慌不忙加了算力,因為本來就不靠我們這些普通用戶去賺錢。
但壞消息是,以后到底有什么商業模式?目前沒人知道。
甚至也不排除一種可能,就是像風靡世界的 Linux 一樣,沒什么商業模式。
從 1970 年代開始,一些大公司就在開發閉源的 Unix 系統。到了 90 年代,Linus Torvalds 開發了開源的Linux 系統,逐漸蠶食了 Unix 的市場。如今大多數云計算、服務器和移動操作系統,都是基于 Linux 開發的。
那 Linux 賺大錢了嗎?并沒有。Linux 系統的內核是由 Linus Torvalds 一個人編寫的,目前由非營利機構Linux 基金會管理,主要靠大公司繳納的會員費和社會各界的捐贈過日子。
但科技史會記住 Linux:作為全球首個成功地大規模開源項目,Linux 打破壟斷,做到了真正的技術普惠,是科技行業的隱形引擎。
DeepSeek 們也一樣,它讓我們每個人都能玩到最先進的大模型產品,極大地沖擊了閉源大模型的壟斷生態,避免最先進的技術只掌握在少數幾個巨頭的手上。
我們當然希望他們都能賺到錢,但沒賺到又怎樣?科技史上,注定會有你們的一頁。
下期見!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.