網易首頁 > 網易號 > 正文申請入駐

這匹中國大模型黑馬，讓扎克伯格破防了！

2025-01-17 11:55:01　來源: 冰川思想庫

浙江舉報

分享至

DeepSeek用實例給風投們上了一課，不用高薪聘請擁有浮夸頭銜的資深從業者，以免費的AI開源項目為基礎，利用有限資源同樣能夠做出一流的AI大模型。

撰文丨周隆斌

1月13日，美國拜登政府在卸任前最后一周出臺了《人工智能擴散暫行最終規則》。

這份規則將全球各國和地區劃分為3個等級，在獲取美國最先進的AI芯片時，分別接受不同級別的限制。讓人非常不希望看到的是，中國被劃分進了最嚴格的三級管控，數據中心將被全面禁止進口尖端AI芯片。

這項規則是否施行，將在120天的公眾意見征詢期后再行商討。不過，顯而易見的是，美國政府試圖通過行政手段干擾全球芯片和AI行業正常發展。

AI技術中蘊藏著無限潛力已經被廣泛證實，尖端AI芯片更是訓練模型時必不可少的基礎。在獲取算力資源難度加大的背景下，國內AI行業的出路究竟在何方？

近期，被稱作“AI界拼多多”的國產AI大模型——DeepSeek（深度求索），用有限的算力資源，給出了一個解決方案。

01

有起錯的名字，沒有叫錯的綽號。去年底剛剛發布的DeepSeek-V3開源AI大模型，以史無前例的性價比，刷新了全球AI行業的認知。

先來看看這個AI大模型的性能，DeepSeek在自家公眾號中這么介紹V3模型：

DeepSeek-V3多項評測成績超越了Qwen2.5-72B和Llama-3.1-405B等其他開源模型，并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

簡單來講就是，DeepSeek-V3已經成為現在全球最強開源大模型，可以與頭部閉源大模型掰掰手腕。從測評結果上看，DeepSeek好像并沒有吹牛，在百科知識、代碼生成等場景中，DeepSeek-V3確實取得了第一梯隊的成績。

不過，行業內的評測是一份公開試卷，完全可以有針對性地對模型進行訓練。就像電腦的跑分測試，未必就那么客觀。在實際使用體驗上，DeepSeek-V3的數學和編程能力確實非常強，這也是評測的重點方向。不過，它在一些特殊語境或者創造性思維方面還是差點意思。

例如，向DeepSeek-V3詢問，香菇掉到了馬桶中，那它還能被稱作香菇嗎？它只會一本正經地給出回答，GPT-4o則是先點明這是一句幽默的提問，再進行回答。

對于將AI大模型當作搜索引擎的我來說，DeepSeek-V3是合格的。盡管在一些總結歸納上與GPT-4o略有差距，考慮到后者的使用限制，我還是愿意將免費的DeepSeek列為首選AI工具。

令人想不到的是，DeepSeek-V3整個模型的預訓練成本花費為557.6萬美元，僅需GPT-4o的二十分之一。“低廉”的成本給了DeepSeek砸穿行業底價的勇氣，開發者調用DeepSeek-V3的支出只要GPT-4o的十分之一，性價比爆棚。

更加難能可貴的是，DeepSeek-V3在訓練時使用的GPU是英偉達的H800，一款在性能上被閹割的特供AI芯片。OpenAI手握上萬塊英偉達一流的AI芯片，愿意為其融資的投資者絡繹不絕，成本從來都不是他們考慮的第一要素。

后來者大部分以OpenAI為標桿，AI大模型只有砸錢、砸算力才能做出來的觀念在行業中深入人心。正因如此，花小錢辦大事的DeepSeek才讓一眾硅谷大佬們驚呼這是“來自東方的神秘力量”。

扎克伯格在談到DeepSeek時，罕見地表示：“他們的技術真的很不錯，這個模型非常先進。（在AI大模型領域）中國正在全力沖刺，我們當然該支持美國的公司。實際上，這是一場差距很小的競爭。”

02

早在去年5月，DeepSeek發布DeepSeek-V2模型時，超低的價格就引起了AI大模型降價的血雨腥風。彼時DeepSeek尚未推出面向消費者的應用，大眾知名度遠沒有現在這么高。

直到去年12月26日，DeepSeek-V3推出網頁版后一夜爆火，月度訪問量迅速突破千萬。與大模型一同發布的，還有一篇53頁的論文，詳細介紹了DeepSeek-V3模型的技術細節，將如何用有限資源進行模型優化的策略全部公之于眾。

DeepSeek采用的主要技術總結下來有三點，創新的模型架構、高效的訓練技術以及優化資源利用。我認為，其中MLA（多頭潛在注意力機制）架構最值得稱道。DeepSeek將用戶任務分解為多個子任務，由不同的專家模型分別處理，再將各專家模型的結果匯總輸出結果。

這就意味著，大模型在接到用戶需求時，不用調動全部資源進行處理。提升模型運行效率的同時，顯著降低了運行成本，有種“專人專辦”的感覺。

如果仔細研究DeepSeek的解決方案，會發現DeepSeek更多是在進行“工程創新”。它雖然沒有創造出一套全新的技術，卻改進了業內原有的模型訓練方式。

有人認為業內對于DeepSeek的評價有些過高，它只是對原有技術進行了優化。這樣的看法顯然過度關注技術層面，而忽略了AI行業無限光明前景的背后，是有些陰暗的現實。

過去一年中，全球科技公司幾乎都鉚足了勁在AI項目上發力，全球AI初創公司如雨后春筍般冒出，“用AI重塑所有行業”的口號喊得震天響。然而，擺在所有企業面前的窘境是，AI商業化路徑并沒有被完全打通。

對于傳統企業而言，如果需要AI大模型為業務賦能，選擇開源模型進行微調，定制專屬大模型試錯成本更低。廣大消費者為AI功能付費的意愿也不高，大部分用戶都是“白嫖黨”，尚且屬于培養用戶習慣的階段。

就連作為AI行業的領軍企業OpenAI至今都尚未實現盈利，很大一部分原因在于尖端AI模型的訓練耗資驚人，運行成本也十分高昂。據測算，僅維持ChatGPT的運營，每天成本就高達70萬美元。OpenAI首席執行官山姆·奧特曼則表示，未來的AI模型成本預計將超過10億美元。

《紐約時報》獲得的融資文件顯示，OpenAI 2024年預計收入達到37億美元，但預計虧損也將達到50億美元，而2026年虧損可能會高達140億美元，這一估算還不包括給員工的股票激勵兌現。

可以說，高度依賴融資的OpenAI在破產的邊緣反復搖擺。如果明天投資界厭倦了看不到盈利希望的AI行業，OpenAI僅憑自身的造血能力，恐怕難以為繼，其他AI初創企業更是如此。

這樣的擔憂并非空穴來風，知名數據分析機構 CB Insights 發布的《2024年第三季度全球人工智能投融資報告》顯示，2024年第三季度生成式AI領域的投資額環比下降了29%，10億美元以上的大額融資量環比下降77%。

任何生意的核心都是成本與收入的平衡，DeepSeek為AI行業提供了一種嶄新的思路，既然收入端暫時難以大規模提升，不妨先從成本端發力。或許DeepSeek在技術上沒有多么驚天動地的創新，卻讓國內AI行業看到了一絲在夾縫中生存的可能性，也為全球AI行業長久存續提供了新范式。

DeepSeek的成功離不開前輩們技術開源的支持，DeepSeek也愿意將自己的成果以開源的方式反哺整個行業。在通往AGI（通用人工智能）的漫漫石階中，DeepSeek刻下了屬于自己的名字。

03

降低成本這件事并不是什么精妙的點子，更是中國企業最擅長的事情。為什么從百度、騰訊、阿里這些互聯網大廠，到月之暗面、智譜AI、零一萬物等號稱中國大模型領域“六小虎”的創業公司，沒有一家能夠提早想到呢？

如果深入了解DeepSeek這家公司后，就會發現這絕非偶然。

DeepSeek在V3模型發布前相當低調，模型發布后也沒有如國內同行一樣，鋪天蓋地地打廣告，知名度更多來自于用戶們口口相傳。但如果說到它的全資母公司幻方量化，股民朋友們肯定十分熟悉。

幻方量化，迄今為止國內唯一規模曾經超過千億元大關的量化私募。根據私募排排網數據顯示，幻方量化的代表產品九章幻方中證500量化多策略1號，從2017年1月19日成立至今（2025年1月10日），累計收益率超過300%，年化收益率達到19%，與巴菲特年化收益率的20%十分相近。

ChatGPT 3.5問世時，業內測算想要做出這種級別的大模型，至少需要1萬張英偉達A100芯片。彼時全球算力競賽尚未正式開啟，國內擁有萬卡算力的公司，滿打滿算也就6家，百度、騰訊、字節、阿里、商湯，還有一位手握入場券的正是幻方量化。

DeepSeek由幻方量化創始人梁文峰一手創辦，雖然公司成立時間是在2023年7月，但DeepSeek項目在幻方內部已經孵化很久。

2021年幻方量化私募規模破千億元時，梁文峰選擇主動降低管理規模，暫停旗下所有產品的申購，并免除所有基金的贖回費用。目前，幻方量化的管理規模已降至200億-300億元。

彼時外界幾乎沒有任何人能理解梁文峰的決定。主動降低管理規模固然有行業監管趨嚴、市場風險等客觀因素，但很少有私募基金會和送上門的錢過不去。以幻方量化當時的體量和名氣，不說業績提成，單是管理費每年都能躺賺數十億元。

現在看來，或許梁文峰早就看到了AI技術爆發的曙光。梁文峰在接受采訪時提到：“我們的出發點，就不是趁機賺一筆，而是走到技術的前沿，去推動整個生態發展。中國也要逐步成為貢獻者，而不是一直搭便車。”

04

DeepSeek這家公司的企業文化也十分獨特。其他國內科技企業習慣重金聘請行業大佬，DeepSeek的團隊則十分年輕化。

據梁文峰自己透露：“我們的核心技術崗位，基本以應屆和畢業一兩年的人為主。”就連公司的管理層，也都是一些畢業5年左右的年輕人。當然，這些年輕人沒有很深厚的工作背景，卻也都是國內一流院校的天之驕子。

DeepSeek內部采用扁平化管理模式，每一位員工的想法都會得到充分尊重。只要有新點子，不論職級，在經過內部討論后，都可以調動公司資源進行項目研究。DeepSeek-V3的MLA架構，最初正是由一位年輕研究員的個人興趣所誕生。

除此之外，背靠幻方的DeepSeek是業內罕見的不依靠外部融資生存的初創公司。沒有投資人給的壓力，商業化自然也不是DeepSeek的首要任務。所以直到V3模型之前，DeepSeek都沒有選擇上線面向大眾的產品。或許是巧合，OpenAI的ChatGPT也是迭代到3.5版本，才選擇公之于眾。

成員年輕化，組織結構扁平化，不以商業化為首要目標，這一切組合在一起，使得DeepSeek在行業中顯得格格不入。梁文峰主動跳出私募行業的舒適圈，帶領一群壓根沒有找到自己舒適圈的年輕員工，開辟出了一條未曾設想的道路。

有人說，DeepSeek閃亮登場，用少量算力資源訓練出超強大模型，英偉達慌了，芯片要賣不動了。然而，DeepSeek提供的是一種現有大模型訓練的優化方案，要想達成AGI光憑現有技術肯定是不夠的，下一代大模型還是要仰仗算力堆砌。

真正應該慌的，是那些AI初創企業們。

正如小米造車前，雷軍計劃5年投入1000億元。沒想到研發、建廠、營銷一系列開支下來，僅花費300億元，第一款車型小米SU7就火爆全國。國內投資圈這才明白過來，那些砸進去大幾百億連年虧損，毛利率轉正都難的造車新勢力們有多無能。

DeepSeek同樣用實例給風投們上了一課，不用高薪聘請擁有浮夸頭銜的資深從業者，以免費的AI開源項目為基礎，利用有限資源同樣能夠做出一流的AI大模型。

沒有對比就沒有傷害，其余AI初創公司的精美PPT中，究竟有多少是高管給投資人畫的大餅，無數輪募資中拿到的錢是不是用在了刀把上？DeepSeek論文發布后，不知道有多少AI初創公司的高管正在連夜開會，琢磨新的說辭。

在中美AI競賽中，DeepSeek以業界黑馬的形象出現，給硅谷帶來了一點小小的中國震撼。作為一家以量化交易起家的中國公司，DeepSeek并不被視為技術引領者，但他在有限的算力資源條件下，卻依然能夠做出令整個AI行業為之側目的技術創新。

這也讓世人看到，在這場前途未卜的AI大競賽當中，中國公司仍然有很大機會，結合自身優勢，在先進AI領域擁有自己的話語權，進而迸發出改變世界的力量。

*本文為冰川思想庫原創文章，未經授權禁止轉載，否則追究相關法律責任

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

OpenAI招了個高中輟學的，入職Sora團隊專攻AGI

量子位 2024-12-05 14:10:36
0 跟貼 0
AI竟會「自己認錯」？破解多智能體協作「羅生門」，斬獲ICML 2025 Spotlight

新智元 2025-06-02 16:48:08
0 跟貼 0

別讓對手用AI和機器人卷死你：生物初創公司必看的「逆襲指南」來了

生物世界 2025-03-20 00:08:36
0 跟貼 0

智算賽道“卷王”現身！騰訊云憑啥拿下90%大模型廠商？

通信世界 2025-06-03 06:13:03
0 跟貼 0
創業者的MBTI：NT型人格是天選老板“圣體”？

吳曉波頻道 2025-04-05 08:29:44
0 跟貼 0

小紅書上正在誕生第一批AI原住民

X博士 2025-02-19 19:37:05
1 跟貼 1

AI輔助編碼帶來思維方式轉變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0
垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0

網友實測Veo3視頻旋風：模擬車展、上課、ASMR

量子位 2025-05-25 09:14:22
0 跟貼 0
獨家！哈工大斬獲AI頂會ACL評審階段最高分，讓AI領略漢字之美

新智元 2025-06-01 09:07:51
2 跟貼 2
從數據標注工廠到國會大廳：Scale AI如何走到科技與政治舞臺中央

DeepTech深科技 2025-03-17 21:20:12
0 跟貼 0
大模型正在打破教育領域的“不可能三角〞

量子位 2025-04-17 19:02:09
0 跟貼 0
今年人形機器人賽道已涌進超180億元，50萬億級的科技競賽正蓄勢待發

鈦媒體APP 2025-06-03 08:19:17
0 跟貼 0
騰訊混元圖像2.0一手實測，毫秒級響應

量子位 2025-05-18 12:49:08
0 跟貼 0
研發自動化的初衷是讓每一個研究員都有Agent助理

量子位 2025-04-23 08:05:00
0 跟貼 0
下個萬億美元市場！老黃：人形機器人要落地

量子位 2025-05-19 20:06:49
0 跟貼 0
o3/o4-mini實測太炸裂：看照片反推定位

量子位 2025-04-17 22:23:17
0 跟貼 0
AI正大大降低動漫等虛擬內容制作門檻

量子位 2025-04-25 14:16:10
0 跟貼 0
AI的母語是什么？人類進化花了200萬年，AI只需一個晚上

量子位 2025-05-23 19:24:56
0 跟貼 0
AI的母語是什么？不是英語，不是漢語

量子位 2025-05-23 17:58:54
0 跟貼 0
OpenAI似乎步子邁太大了

虎嗅APP 2025-06-01 02:55:07
33 跟貼 33
老人自制家庭“纜車”上下樓，花費一年不影響鄰居：還申請了專利

星視頻 2025-06-02 17:50:27
150 跟貼 150
如廁自由？高分的機器人還是高分的人？

弓立軍 2025-05-31 12:16:34
1 跟貼 1
小鵬絕地翻盤，頭號功臣是她！

華商韜略 2025-03-28 14:19:16
0 跟貼 0
河南一水庫水位下降現千佛石窟，有1043尊石佛幾乎全部被敲掉頭部，水庫管理人員：汛期將至，禁止參觀

魯中晨報 2025-06-02 10:19:03
3881 跟貼 3881
我參加同學聚會被群嘲，可他們不知道，我早就成了大富豪

情感動畫社v 2025-05-30 08:02:56
1 跟貼 1
雷軍身價直逼4400億，妻子才是MVP？

華商韜略 2025-03-27 16:16:08
0 跟貼 0
馬斯克的xAI據悉啟動3億美元股份出售，估值高達1130億美元；微軟發布Bing Video Creator丨全球科技早參

每日經濟新聞 2025-06-03 08:10:05
0 跟貼 0
新勢力銷量“三連冠”零跑，浙江創業大潮中的車企樣本

科技向令說 2025-06-01 21:08:56
5 跟貼 5
端午節后4個月不再有法定節假日，國慶中秋合并放假8天

現代快報 2025-06-02 12:24:03
3005 跟貼 3005
雷軍距離徹底封神，只差一個中國首富

華商韜略 2025-03-06 17:06:07
0 跟貼 0
太惡劣！確認系擺拍！官方通報

蓬勃新聞 2025-06-02 12:55:17
2563 跟貼 2563
創業第一步，沒想到還挺難

破爛車王老師 2025-06-02 16:13:01
1 跟貼 1
靜悄悄的餓了么，戰斗力到底有多強？

華商韜略 2025-04-30 14:18:35
0 跟貼 0
比亞迪版圖大起底，實力超乎你的想象

華商韜略 2025-02-11 17:11:11
118 跟貼 118
劉強東：2024年是創業20年最有成就感的時候

每日經濟新聞 2025-03-21 17:50:16
0 跟貼 0
網紅二次創業，終于要有進展了

破爛車王老師 2025-05-29 17:04:53
3 跟貼 3
驚人的子彈、彈藥和彈頭制造過程，現代機器與技術

全球見聞筆記 2025-06-02 11:36:53
1 跟貼 1
巴菲特：人生最幸福的三件事

葉檀財經 2025-05-14 18:43:25
16 跟貼 16
為了讓電腦上的數學公式更好看，這件事折騰了快50年

量子位 2025-05-30 11:32:17
17 跟貼 17

冰川思想庫

匯聚思想，分享銳見。

2390文章數 123878關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機

家居

旅游

本地

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
指紋識別有可能認錯人嗎？
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

這匹中國大模型黑馬，讓扎克伯格破防了！

01

02

03

04

李斌：樂道一線減員40% 銷量反要大漲40%

經銷商因銷量慘淡關店 80多輛電動車被廠家遠程鎖死

經銷商因銷量慘淡關店 80多輛電動車被廠家遠程鎖死

傲了一輩子的恩里克，心中永遠住著一個小天使

大S女兒來北京！馬筱梅帶她喝下午茶

特朗普升級貿易戰 歐盟警告

吉利汽車5月銷量23.52萬輛 同比增長46%

態度原創

三星聯手英國內政部推廣 Galaxy 手機防盜功能

原木純白 邂逅自然本真

熱聞|清明假期將至，熱門目的地有哪些?

云游中國 |來仰天湖大草原，一起策馬奔騰

特朗普升級貿易戰歐盟警告

吉利汽車5月銷量23.52萬輛同比增長46%

原木純白邂逅自然本真