書名:《深度探索:解碼DeepSeek及人工智能的未來》
作者:陳勁 安健
出版社:中信出版集團
出版時間:2025年5月
內容簡介
本書深入剖析了中國人工智能崛起的神秘力量——DeepSeek,全面解讀了其背后的技術邏輯、商業模式以及對未來社會的深遠影響。通過對開源與閉源之爭的探討,以及對中美人工智能領域領袖人物不同戰略思考的剖析,作者揭示了人工智能技術背后的復雜性,勾勒出技術進化的脈絡,并勾畫出產業未來發展的路徑。書中還特別關注了中國在成本結構等方面的獨特優勢,展現了中國在全球人工智能競爭中的地位與潛力。本書會深入淺出地介紹人工智能DeepSeek的技術邏輯,技術上如何控制成本,商業化的底層邏輯,對于中國人工智能的發展和商業化都有很好的指導意義。
無論是科技愛好者、行業從業者,還是對未來充滿好奇的普通讀者,本書都將提供深刻的見解與啟發,幫助讀者更好地理解人工智能的當下與未來。
內容文摘
橫空出世的DeepSeek
表面上看,DeepSeek一夜之間爆火,火得一塌糊涂,火得一發不可收拾,但又火得莫名其妙。不過太陽底下沒有新鮮事,DeepSeek的橫空出世背后其實是中國AI公司在這一領域持續多年的深耕細作。DeepSeek的崛起是一個典型的中國科技初創公司憑借技術創新和開源模式迅速嶄露頭角的故事。
2024年12月末,有媒體報道稱,小米總裁雷軍以年薪千萬的優厚條件聘請了一位被稱為“天才AI少女”的年輕人才,負責領導小米的人工智能大模型團隊。這位出生于1995后的女性名叫羅福莉,過去兩年間曾效力于DeepSeek團隊,并深度參與了大模型研發的核心工作。
對于不關注科技圈的普羅大眾,這其實是DeepSeek第一次走進公眾視野,不過,當時天才少女的風頭顯然蓋過了DeepSeek,這越發使得后者在一夜成名后顯得低調而神秘。從零散的、關于創始人梁文鋒的背景資料中, 2015年12月1日水木社區上轉發的一則招聘啟事,勾畫出梁文鋒量化交易之路的輪廓:
2008年,L先生帶著8萬元本金,開始了自己獨立的量化交易之路。2015年,經歷過7年熊市牛市大輪回的L先生,以每年超過100%的復合收益率邁入了億元富豪的隊伍。
這個行業里最先富起來的L先生認為,中國的量化交易將從“單兵游俠”的時代轉向極客匯聚的私募基金時代。他和IT圈的朋友創辦了自己的公司,希望能打造一支世界一流的量化私募團隊。他們給自己的公司取名“幻方科技”。“幻方”取自于中國古代洛書《九宮圖》,是一種特殊的矩陣,是科學的結晶與吉祥的象征。
L先生的理想是有朝一日能夠與世界級的量化交易泰斗——西蒙斯的文藝復興公司相媲美。
這則校園招聘的標題是“頂尖量化對沖基金公司覓牛人”。十年前,梁文鋒是否能夠招到“牛人”不太好說。但隨著DeepSeek-V3的問世,業界普遍推測這一成就背后必有行業資深專家或“大牛”領銜。然而,羅福莉的走紅卻揭示了一個出人意料的事實:引領DeepSeek技術革新的主要推手并非傳統意義上的行業老將,而是一群像她這樣充滿活力和創新精神的年輕才俊。
盡管公司成員年輕,DeepSeek在人工智能領域卻堪稱老兵。正如這條招聘簡歷所透露的,其起點可以追溯至2008年,當時梁文鋒從浙江大學信息與電子工程學本科及碩士畢業,投身量化投資領域。他與友人共同探索利用數學模型和計算機程序進行交易的可能性,這段經歷讓他深刻體會到技術驅動創新的重要性。
2015年,梁文鋒與校友徐進聯合創立了“幻方量化”。徐進擁有浙江大學信號與信息處理博士學位,曾在華為技術有限公司上海研究所任職。他們購置了大量GPU,建立了實驗室,開始研究如何借助AI技術構建投資策略。這一舉措使幻方量化在短短四年內成長為管理資金規模超百億的私募巨頭。既然AI制定的量化策略能跑贏市場,那AI是否會產生真正的智能?大膽猜測,這第一桶金可能在梁文鋒心中種下了實現通用人工智能的種子。
隨著業務的擴展,幻方量化于2019年成立了專門的AI實驗室,并投入逾10億元資金,研發了AI超級計算機“螢火一號”和“螢火二號”。其中,“螢火二號”配備了約1萬張英偉達A100顯卡,其算力相當于超過72萬臺個人電腦。這些強大的計算資源助力幻方量化在2021年將資產管理規模提升至1000億元人民幣。
到了2022年底,ChatGPT的問世終于引燃了梁文鋒對通用人工智能(AGI)的熱情。多年的積累讓他做好了迎接這一挑戰的準備。“我們成立了名為深度求索的新公司,從語言大模型入手,未來還將涉及視覺等領域。”梁文鋒表示,盡管OpenAI公布了論文和代碼后,國內外涌現了許多大模型公司,但他堅信在未來20年內,無論是大企業還是初創公司都將擁有廣闊的發展空間。
與其他國產大模型不同,DeepSeek選擇了開源道路,并且在第三代大模型發布時仍未推出任何具體應用,也未全面考慮商業化。梁文鋒明確表示,他們的目標不在于開發單一應用,而是專注于基礎研究和前沿創新。這種純粹的理想主義,和不被任何資方束縛裹挾的底氣,在某種程度上來自于梁文鋒早已實現財務自由的灑脫。這一點,和馬斯克收購特斯拉大舉壓注新能源車,有異曲同工之妙。真正的耐心資本只能是自己的資本。
長期以來,人們普遍認為歐美科技界在從零到一的技術創新上更具優勢,而中國企業則擅長在應用層面發力,即所謂的“從1到N”。然而,梁文鋒并不認同這種觀點,他堅信中國AI不僅會跟隨,還能以創新者的身份參與到新的技術浪潮中。
2023年7月17日,梁文鋒成立了名為杭州深度求索人工智能基礎技術研究有限公司,宣布其目標是打造“真正具備人類級別智慧的人工智能”。當時,有一種觀點在網絡上流傳:在中國,擁有高性能GPU最多的機構并非人工智能公司,而是一家量化私募。據《財經十一人》報道,截至2023年,中國擁有超過1萬張GPU的企業不超過5家,幻方量化是其中唯一一家非科技“大廠”的企業。 這種一擲千金的果斷與勇氣,絕非一般企業管理者能企及;這種不合傳統商業邏輯的決策,只能來自于一個對通用人工智能有堅定信仰的創始人。
目 錄
序 言 勇立潮頭的恒定價值
第一章 為什么偏偏是中國,偏偏是DeepSeek?
橫空出世的DeepSeek
顛覆認知:從華爾街到AI大佬
技術民主化的勝利?
面對抄襲的指責:什么是蒸餾?
盜火者:辛頓、奧爾特曼、梁文鋒
第二章 大模型——站在巨人肩膀之上
苦澀的教訓
聯結主義—另一條道路
辛頓和深度神經網絡
突破算力和數據之墻
GPU對決CPU
深度神經網絡初露崢嶸
自注意力機制點燃大模型時代
驚艷:大模型的開竅時刻
大模型的中國涌現
第三章 淬火的刀:DeepSeek創新啟示錄
回溯:DeepSeek的來時路
MoE模型:各操一劍的頂級大師
MLA:DeepSeek的信息過濾員
妙招:多令牌預測
以柔克剛:用算法壓榨算力
“價格屠夫”?AI不是富豪的玩具
重構研發的三個常識:稀疏,無約束,多令牌
第四章 強化學習、大模型與歸來少年
千呼萬喚不出來—Scaling Law的邊際時刻
成也Scaling Law,敗也Scaling Law
不走尋常路:繞過監督微調
王者歸來:強化學習再登場
再談蒸餾:知識遷移的力量
DeepSeek:探索未知的少年
第五章 算力狂潮:從崇拜到跌落神壇
什么是算力
“賣鏟子”的英偉達
OpenAI與DeepSeek:兩種路線的較量
中國算力評估
第六章 開源與閉源:商業模式之爭
開源才是人類文明的常態
閉源的由來與微軟
OpenAI和馬斯克的開源之爭
DeepSeek:開源戰勝閉源
開源與閉源:AI商業模式的兩難選擇
第七章 豪賭未來:DeepSeek及其競爭對手
美國科技巨頭重金押注
各路英豪:中國AI的差異化競爭
顛覆式創新三要素
第八章 馴服AI幻覺:從蘇格拉底提問到多維思維
幻覺:大模型的致命之處
一道破萬法:使用AI將知識引導出來
高效使用AI的核心能力:學會提問
避免AI幻覺的另一個思路:聯網更新與交叉驗證
多元融合思維:拓展維度、精簡維度與維度轉換
第九章 未來己來:AI趨勢的多維透視
量子人工智能:算力躍遷的終極戰場
生成式AI的三重進化
行業滲透的深水區挑戰
具身智能:物理世界的AI覺醒
人機共生:后AI時代的能力重塑
第十章 大模型:從“諸神之戰”到負責任的創新
從DeepSeek到 deep innovation
創新者精神超越企業家精神
創新者精神:王選的故事
呼喚負責任創新
第十一章 唯有深度創新能力不可替代
熊彼特權重
會聚創新:一個灰燼中重生的案例
深度創新能力是人類最后的堅持
第十二章 AI:是普羅米修斯的火種還是潘多拉的魔盒?
速度與火焰終結一切
比爾·蓋茨的機器人稅
歌德的寓言,維納的擔憂
重溫工具理性與價值理性
參考文獻
作者簡介
陳勁
清華大學經濟管理學院創新創業與戰略系教授、技術創新研究中心主任,中國管理科學學會副會長,整合式創新、有意義的創新以及“基于核心能力的企業創新生態系統”理論的提出者,全國創新爭先獎獲得者,2021年、2023年入選“全球最具影響力的50位管理思想家”。
安健
君彧咨詢創始人、阿里巴巴前高級營銷專家、《哈佛商業評論》內容總監。
文章觀點不代表主辦機構立場。
◆ ◆ ◆
編輯郵箱:sciencepie@126.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.