99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

浙大天才,震驚硅谷

0
分享至



幻方量化&深度求索創始人 梁文鋒

作者 | 張靜波

來源 | 華商韜略

2024年冬天,杭州。

當西方還沉浸在圣誕節的狂歡中時,一位中國碼農,站在巨大的落地窗前,遠眺著窗外的京杭大運河。

幾分鐘后,他做了一件令硅谷震驚的事。

來自東方的神秘力量

“一種新的模式,讓整個山谷都嗡嗡作響!”

美國CNBC電視臺在報道這件事對硅谷的影響時,這樣評價道。

12月26日,杭州一家名為“深度求索”的中國初創公司,發布了全新一代大模型:

DeepSeek-V3。

在多個基準測試中,DeepSeek-V3的性能均超越了其他開源模型,甚至與頂尖的閉源大模型GPT-4o不相上下。


尤其在數學推理上,DeepSeek-V3更是遙遙領先。

令人驚訝的是,DeepSeek-V3在性能比肩GPT-4o的同時,研發卻只花了558萬美元,訓練成本不到后者的二十分之一。

這讓美國人徹底坐不住了。

在此之前,谷歌和Open AI花了幾年時間,耗資數億甚至數十億美元,調用了幾萬塊最先進的GPU,才干成同樣的事情。

強烈的對比,讓美國人反思:大模型和算力,是否還值得投資?

很多硅谷大佬在紛紛點贊的同時,也體驗到中國科技帶來的苦澀:當美國人休息時,他們在奮力追上我們!

有意思的是,這件事與中國空軍六代機現身,幾乎前后腳發生。

不少美國人認為,這比六代機更像上世紀50年代,蘇聯搶先發射第一顆人造衛星的斯普特尼克時刻。

然而,真正讓美國硅谷感到震撼的,還不是DeepSeek-V3的高性能、低成本,而是中國人展現出的首創精神。

中國AI公司過去幾乎都在照搬硅谷,以致人們普遍認為:美國擅長從0到1的技術突破,而中國只擅長從1到100的應用落地。

DeepSeek-V3打破了這種成見,它以MLA、DeepSeekMoE等多項開創性技術,大幅提升了模型的性能和訓練效率。

美國人驚訝地發現,原來中國公司也可以作為創新貢獻者,在他們的游戲之外,自定游戲規則。這在過去是極其罕見的。

因為表現太過優越,DeepSeek在硅谷被譽為來自東方的神秘力量。

這股神秘的東方力量,令人稱奇的地方在于,它幕后的資方并不是騰訊、阿里這樣的互聯網巨頭,而是一家低調的私募基金——幻方量化。

目前,國內擁有萬卡GPU的企業不超過5家,幻方就是其中之一。

它在2023年成立子公司“深度求索”,開始DeepSeek大模型的研發,整個團隊只有139名成員,遠少于OpenAI的1200人。

執掌這支戰隊的,是一個叫梁文鋒的80后,也是幻方量化的創始人。

當好奇心驅動了瘋狂

梁文鋒和幻方的故事,始于2008年。

那一年,從浙大畢業、主修軟件工程的他,沒有像同齡人一樣,進入大廠當碼農,而是一個人跑到成都,蝸居在出租屋里。

在那里,梁文鋒開始研究用計算機賺錢的各種路子。

幾番折騰下來,他決定下場做量化投資。但這個決定并不容易,畢竟當時量化在國內還是個新事物。

很多人并不相信,量化可以賺錢。

每當困難時,梁文鋒總會想起量化投資之父西蒙斯的一句話:一定有辦法對價格建模。

在這個信念支撐下,梁文鋒苦苦熬了兩年,終于柳暗花明。2010年,滬深300股指期貨推出,量化投資迎來了春天。

乘著這股東風,梁文鋒和他的團隊大賺一筆,自營資金超過5億元。

也就是同一時期,隨著深度學習算法的突破,人工智能大爆發。早年在浙大就研究人工智能的梁文鋒,燃起雄雄斗志。

2015年,他和浙大校友,共同創立了幻方量化。

幾個意氣風發的年輕人,試圖用數學和人工智能,在中國打造一個像文藝復興那樣世界頂級的量化對沖基金。

僅僅一年后,他們就上線了第一筆由AI驅動的實盤交易,并在隨后,將所有交易策略都AI化。

新技術的加持,讓幻方量化旗下基金回報率,遠超同期滬深300指數。


這推動幻方量化基金規模持續攀升,2021年一度超千億元大關,位列國內量化四大天王之一。

然而,基金規模膨脹的同時,梁文鋒卻面臨一個棘手問題。

AI交易策略需要算力支持,尤其是,隨著模型參數的激增,對GPU算力的需求也在不斷增長。

如何破解這一難題?梁文鋒的選擇是:堆算力!

從2019年開始,幻方量化大規模布局AI算力。

當年就投資2億元,建成“螢火一號”AI算力集群,搭載1100塊GPU算卡。而彼時的特斯拉,才剛剛提出Dojo超算概念。

幾個月后,當英偉達發布最新A100芯片時,梁文鋒再次搶跑,成為亞太地區第一批拿到此卡的人。

緊接著2021年,他又投資10億元,建成“螢火二號”,搭載1萬A100算卡,算力相當于76萬臺個人電腦。

其占地面積,比10個籃球場還要大。

在AI大模型還沒有爆發的年代,梁文鋒的舉動,讓很多人感到瘋狂。

一家私募基金囤這么多算力,究竟意欲何為?甚至有媒體抱怨:幻方量化把A股散戶嚇壞了。

外界對幻方量化的想象,還停留在資本市場上。

但梁文鋒的目光,早已望向星辰大海。

2017年,谷歌研究團隊在一篇開創性的論文中,首次提出Transformer架構。這是一種完全基于注意力機制的神經網絡,它顛覆了過去的傳統算法。

一家叫OpenAI的美國初創公司,基于新架構不斷訓練自己的大模型。最終在2022年以ChatGPT引爆AI大模型時代。

此后,全球互聯網巨頭,沿著OpenAI的路線推進,很少有人質疑。

但一群初生牛犢的年輕人,在梁文鋒的帶領下,干了一件極其瘋狂的事:他們試圖改進Transformer架構。

事實上,從2023年創立深度求索,進軍大模型的第一天起,梁文鋒及其團隊對算法框架的反思就開始了。

當別人陷入簡單模仿OpenAI的慣性中時,這群年輕人不走尋常路。

他們冒著失敗的風險,大膽嘗試了MLA(多頭潛在注意力機制)、DeepSeekMoE(混合專家模型)等多種開創性技術。

幾年前囤下的海量算力芯片,為他們的夢想,插上了翅膀。

最終,這群年輕人創造了歷史:DeepSeek-V3橫空出世,一夜震驚了硅谷。

中國不可能永遠跟隨

對比中美科技產業,我們常常感嘆:

中國為什么出不了像喬布斯、馬斯克、黃仁勛一樣偉大的企業家?

喬布斯生前只有一個目標:活著,就是為了改變世界。

黃仁勛早在青年時,就立下雄心壯志:要做不一樣的事,要徹底改變計算。

馬斯克更是瘋狂地喊出:要殖民火星,為人類尋找第二家園。

相比之下,中國企業家似乎把更多的目光,放在了賺錢和生存上,很少抬頭仰望星空,對創新的重視也不夠。

事實上,過去30年,我們已經習慣摩爾定律從天而降,躺在家里18個月就會出來更好的硬件和軟件。

這使得我們在一輪又一輪的IT浪潮中,基本沒有參與到真正的技術創新里。

但這種局面,在近幾年悄然改變,中國新生代企業家正以突破性創新,在西方的游戲之外另起爐灶。

“中國也要逐步成為創新貢獻者,而不是一直搭便車。”梁文鋒表示。

早在上大學時,梁文鋒就篤定:AI一定會改變世界。畢業后,他在量化投資上,賺了足夠多的錢。

這使得他,有足夠的資本,聽從內心的聲音,去做自己喜歡的事情,而不是首先權衡利弊得失。

DeepSeek創立之初,就確立了核心使命:探索通用人工智能的本質!

在中國AI界,還很少有企業敢提出如此瘋狂的目標。

于是,過去幾年,當很多大模型廠商忙著搶用戶,做商業化變現時,梁文鋒卻苦哈哈搞起了看似不賺錢的基礎研究。

“創新不完全是商業驅動的,還需要好奇心和創造欲。”他說。

在梁文鋒看來,中國企業在過去被商業驅動的慣性束縛了。他希望DeepSeek能擺脫這種束縛。

這樣的經營理念,在當下的中國企業界,顯得有點離經叛道。

曾經有不止一位業內人士表示:

梁文鋒是中國AI界非常罕見的人,他擁有恐怖的學習能力,兼具強大的infra工程和模型研究能力,又能調動資源。

在內部員工看來,梁文鋒則完全不像老板,更像一個極客。

時至今日,他依舊延續著低調的作風,和公司其他研究員一樣,每天看論文,寫代碼,參與小組討論。

這個低調的大佬,就連選人、用人的方式也跟主流格格不入。

當很多大模型公司熱衷于去海外挖人時,梁文鋒卻反其道而行之,堅持從本土招人,并放出豪言:

“世界前50名頂尖人才可能不在中國,但也許我們能自己打造這樣的人。”

不僅沒有海外人才,也沒有行業大佬。梁文鋒更喜歡沒有經驗的年輕人,因為他們不受條條框框的束縛。

在DeepSeek,選人的標準一直都是熱愛和好奇心。

事實上,這家初創公司并非外界傳言的,有一批高深莫測的奇才,而都是一些畢業才幾年的年輕人。

甚至,很多是北大、清華等Top高校還沒畢業的博四、博五實習生。

因為工作太前沿,這些年輕人在開展工作時,幾乎沒有參考資料。但也正是這種空白,讓他們敢于突破傳統。

比如,DeepSeek-V3最重要的創新之一MLA架構,就來自一個年輕人的突發奇想。

DeepSeek內部,也沒有上下級分工。

研究過程中,如果有想法,每個人都可以拉人討論,并隨時調用公司訓練集群的卡,無需審批,不設上限。

這種看似松散的管理方式,極大地調動了所有人的好奇心和創造欲,讓DeepSeek-V3得以橫空出世。

在梁文鋒身上,我們依稀看到了喬布斯、馬斯克、黃仁勛的影子。

“中國AI不可能永遠處在跟隨的位置!”

“真正的差距不是一年或兩年,而是原創與模仿之差。”

這兩句從梁文鋒口中喊出的話,不僅事關AI產業,也是中國企業在跟隨、模仿了西方幾十年后,不得不面對的突破方向。

低垂的果子都被摘完了,只有敢于突破,才能找到新的出路。

梁文鋒并不孤單。

今天,從大疆無人機汪滔,到宇樹機器人王興興……一大批新生代企業家,正將中國科技產業帶向無人區。

(全文完)

【邱處機簡介】

福建龍巖人,今年31歲,現在常駐北京。公眾號專注于撰寫商業牛人的成長經歷和認知升級,讓我們一起向他們學習,不斷成長,不斷進化。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
南京一百年名校突發火情,及時撲滅未造成大的影響

南京一百年名校突發火情,及時撲滅未造成大的影響

大風新聞
2025-06-09 18:59:27
俄歸還6000具烏軍遺體,烏拒絕接收?土耳其專家一語道破真相

俄歸還6000具烏軍遺體,烏拒絕接收?土耳其專家一語道破真相

近史博覽
2025-06-08 19:14:08
公務員上岸秘籍:死磕這四類專業,別管學校!

公務員上岸秘籍:死磕這四類專業,別管學校!

男女那點事兒兒
2025-06-09 09:09:19
絕了,才拿歐國聯!葡萄牙卻考慮換帥!C羅罕見發聲,穆帥成候選

絕了,才拿歐國聯!葡萄牙卻考慮換帥!C羅罕見發聲,穆帥成候選

阿泰希特
2025-06-09 14:48:18
秦海璐在人民日報撰文

秦海璐在人民日報撰文

新京報
2025-06-09 18:26:11
爆炸性消息!輝瑞乳腺癌新藥即將上市,或開啟癌癥治療新篇章!

爆炸性消息!輝瑞乳腺癌新藥即將上市,或開啟癌癥治療新篇章!

徐德文科學頻道
2025-06-08 22:02:44
人類的酒量差距很大嗎?網友:我老公剛下車就從褲兜掉出坨粑粑

人類的酒量差距很大嗎?網友:我老公剛下車就從褲兜掉出坨粑粑

娛樂圈人物大賞
2025-06-09 00:20:05
洛杉磯抗議民眾與警察爆發沖突,當地華人:華人居住區比較平靜,擔心公司被“打砸搶”

洛杉磯抗議民眾與警察爆發沖突,當地華人:華人居住區比較平靜,擔心公司被“打砸搶”

瀟湘晨報
2025-06-09 18:39:10
具俊曄愛妻人設快要立不住了,他的烤肉店悄悄撕掉了大S海報

具俊曄愛妻人設快要立不住了,他的烤肉店悄悄撕掉了大S海報

行走世界的老劉
2025-06-09 10:17:01
張藝謀沒帶火,搭檔周潤發也沒紅,演完《長安的荔枝》口碑逆轉了

張藝謀沒帶火,搭檔周潤發也沒紅,演完《長安的荔枝》口碑逆轉了

悠閑歷史
2025-06-09 17:48:51
諜戰劇《潛淵》開播,黃曉明被“打回原形”,他的老毛病又犯了!

諜戰劇《潛淵》開播,黃曉明被“打回原形”,他的老毛病又犯了!

大歪歪
2025-06-10 00:19:05
穩定幣第一股,大漲247%!

穩定幣第一股,大漲247%!

上觀新聞
2025-06-09 08:19:07
突然發現全國人民都不敢接電話了!

突然發現全國人民都不敢接電話了!

振華觀史
2025-04-15 13:29:07
趙本山兒子完美詮釋土和豪

趙本山兒子完美詮釋土和豪

情感大頭說說
2025-06-02 20:22:02
莫言:當你感受到沒有任何人可以依靠的時候,就是你要覺醒的時候

莫言:當你感受到沒有任何人可以依靠的時候,就是你要覺醒的時候

清風拂心
2025-04-23 15:15:03
詹姆斯:我在高一賽季贏得一切 高二的首次訓練教練就讓我滾出去

詹姆斯:我在高一賽季贏得一切 高二的首次訓練教練就讓我滾出去

直播吧
2025-06-10 08:59:25
“星鏈”衛星,突然大批墜落!馬斯克連轉兩條特朗普帖文,其父發聲:他玩得轉技術,卻玩不轉政治

“星鏈”衛星,突然大批墜落!馬斯克連轉兩條特朗普帖文,其父發聲:他玩得轉技術,卻玩不轉政治

上觀新聞
2025-06-09 15:07:46
高志凱舌戰印度學者:高志凱說以恒河為界讓印度人閉了嘴!

高志凱舌戰印度學者:高志凱說以恒河為界讓印度人閉了嘴!

科學傭人
2025-06-09 05:00:36
63歲活活餓死!陶淵明躺平真相:5個兒子全養廢,晚年沿街要飯

63歲活活餓死!陶淵明躺平真相:5個兒子全養廢,晚年沿街要飯

玥來玥好講故事
2025-06-06 21:03:39
550萬在美華人數據全公開,88%中國籍博士留在美國!

550萬在美華人數據全公開,88%中國籍博士留在美國!

霹靂炮
2025-05-29 23:14:55
2025-06-10 09:16:49
邱處機 incentive-icons
邱處機
商業牛人研究員
394文章數 1493關注度
往期回顧 全部

科技要聞

一文看懂WWDC:蘋果發布"十年一遇"設計革命

頭條要聞

特朗普:不清楚馬斯克是否在白宮使用過毒品

頭條要聞

特朗普:不清楚馬斯克是否在白宮使用過毒品

體育要聞

雷霆55號秀,NBA第一“概念神”

娛樂要聞

劉品言閃婚閃孕官宣 崴腳時被照顧打動

財經要聞

泡泡瑪特王寧成“河南新首富”

汽車要聞

首次搭載奧特能2.0平臺 新別克E5即將煥新上市

態度原創

藝術
親子
數碼
公開課
軍事航空

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

親子要聞

品讀 | 養女兒就好像自己重生一遍

數碼要聞

蘋果iPadOS 26登場,多任務處理等“史詩級更新”

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

烏方稱俄發動沖突以來最大空襲

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 子长县| 黄冈市| 南康市| 大庆市| 宝丰县| 开江县| 定陶县| 溆浦县| 河池市| 东方市| 苍梧县| 宁明县| 漳州市| 浦江县| 菏泽市| 大宁县| 阜宁县| 万荣县| 昌黎县| 东安县| 咸丰县| 舒城县| 如皋市| 和平区| 三穗县| 醴陵市| 朝阳区| 伊通| 措勤县| 阳西县| 山东省| 张家港市| 堆龙德庆县| 仙桃市| 库伦旗| 临潭县| 桦南县| 亳州市| 城口县| 淳安县| 昭通市|