99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

沒有KPI、極度扁平、極致創新……DeepSeek創始人梁文鋒60條思考|【經緯低調分享】

0
分享至

DeepSeek開源動作仍在持續。

要知道,自2025 年春節,DeepSeek 憑借超預期的產品體驗火爆出圈,超越一眾國產大模型。很多人都十分好奇創始人梁文鋒的背后故事。他的履歷堪稱傳奇,從高考狀元到創立千億規模的幻方量化,再到如今在大模型領域大放異彩的 DeepSeek。

在企業運營上,他不走尋常路。核心技術崗位啟用年輕人才,選人重能力與熱愛,公司沒有 KPI,給予員工充分自由。在商業模式上,產品定價追求普惠,暫不融資,一心構建產業生態。

本篇文章是根據梁文鋒過往采訪文章進行梳理,可能每一條思考不是完完全全出自梁文鋒之口,我們也很清楚這點。但底層思考邏輯應該是相通的,希望大家可以自由選擇,從中獲得一些啟示。以下,Enjoy:

梁文鋒 | 作者

路言 | 編輯

礪石商業評論 | 出品

2025年開年至今,DeepSeek的熱度都一直不減。

DeepSeek的火爆,本質上還是超預期的產品體驗帶來的口碑裂變。這再次證明了,在真正的產品力面前,營銷力不值一提。筆者在將DeepSeek與其他國產大模型進行細致對比后,最終不得不承認,DeepSeek是完全超越其他大模型一個時代的產品。

在任何一個杰出的產品背后,都離不開一個理想主義的創業者。例如,微信背后有中國最優秀的產品經理張小龍,《黑神話》背后有中國最優秀的游戲人馮驥。DeepSeek也不例外,其成功離不開核心創始人梁文鋒。

根據公開資料顯示,梁文鋒出生于1985年,今年將年滿40周歲,他出生于廣東省湛江市吳川市覃巴鎮。2002年,17歲的梁文鋒以高考狀元的身份考入浙江大學電子信息工程專業,2010年獲得浙江大學信息與通信工程碩士學位。

2008年全球金融危機期間,梁文鋒開始探索人工智能在全自動量化交易中的應用。2015年,他在杭州創立量化投資公司幻方量化,截至目前,資產管理規模突破千億人民幣大關。在幻方量化的資金與團隊支持下,2023年7月,梁文鋒又創建了專業的大模型公司DeepSeek,進軍通用人工智能領域,并最終在大模型領域超越了中國所有的科技巨頭,成為行業中最成功的技術領先者。

在網絡上,關于梁文鋒的公開報道并不多。但在DeepSeek火爆之前,他曾接受過36氪旗下《暗涌》公眾號的兩篇深度專訪,從這兩篇頗為寶貴的專訪中,我們可以清晰看出無論是在技術洞見,還是理想主義的思維模式上,梁文鋒確實與眾不同。

例如,他堅定的稱“我們要做的是AGI(通用人工智能),不是簡單應用,也不大是云服務”,他批評“大部分中國公司習慣follow,而不是創新”,他認為“OpenAI不是神,不可能一直沖在前面”,他還犀利地指出,“中國AI和美國真實的gap是原創和模仿的差距”。如果不是DeepSeek的巨大成功,梁文鋒的上述觀點會讓外界認為過于狂妄,但DeepSeek的成功,則證明了梁文鋒這些觀點背后的技術先見。

為了幫助讀者更好的了解這位低調的新銳創業者,我們專門匯總了其最核心的60條思考。這60條思考,一定程度上也可以幫助我們更加直觀的理解DeepSeek這家企業脫穎而出的底層邏輯。

DeepSeek創始人梁文鋒的60條思考:

1.我們做大模型,跟量化和金融都沒有直接關系。我們要做的是通用人工智能,也就是AGI。

2.語言大模型是通往AGI的必經之路,并且初步具備了AGI的特征,所以我們從這里開始。

3.我們不會過早設計基于模型的一些應用,會專注在大模型上。從長期看,大模型應用門檻會越來越低,初創公司在未來20年任何時候下場,也都有機會。我們的目標很明確,就是不做垂類和應用,而是做研究,做探索。

4.我們理解人類智能的本質就是語言,人的思維就是一個語言的過程。你以為你在思考,其實可能是你在腦子里編織語言。這意味著,在語言大模型上可能誕生出類人的人工智能(AGI)。

5.只做復刻的話,可以在公開論文或開源代碼基礎上,只需訓練很少次數,甚至只需finetune(微調)一下,成本很低。而做研究,要做各種實驗和對比,需要更多算力,對人員要求也更高,所以成本更高。

6.我們希望更多人,哪怕一個小App都可以低成本去用上大模型,而不是技術只掌握在一部分人和公司手中,形成壟斷。大廠的模型,可能會和他們的平臺或生態捆綁,而我們是完全自由的。

7.從商業角度來講,基礎研究是投入回報比很低的。我們比較確定的是,既然我們想做這個事,又有這個能力,這個時間點上,我們就是最合適人選之一。

8.從最早的1張卡,到2015年的100張卡、2019年的1000張卡,再到一萬張,這個過程是逐步發生的。很多人會以為這里邊有一個不為人知的商業邏輯,但其實,主要是好奇心驅動,對AI能力邊界的好奇。

9.對很多行外人來說,ChatGPT這波浪潮沖擊特別大;但對行內人來說,2012年AlexNet帶來的沖擊已經引領一個新的時代。AlexNet的錯誤率遠低于當時其他模型,復蘇了沉睡幾十年的神經網絡研究。雖然具體技術方向一直在變,但模型、數據和算力這三者的組合是不變的,特別是當2020年OpenAI發布GPT3后,方向很清楚,需要大量算力。那之后,我們有意識地去部署盡可能多的算力。

10.一件激動人心的事,不能單純用錢衡量。就像家里買鋼琴,一來買得起,二來是因為有一群急于在上面彈奏樂曲的人。

11.人工成本是對未來的投資,是公司最大的資產。我們選的人相對樸實一點,有好奇心,來我們這里有機會去做研究。大廠很難單純去做研究,做訓練,它更多會是業務需求驅動。如果不能很快應用,大廠不一定能持續堅持,因為它更需要看到結果。

12.我們招人有條原則是,看能力,而不是看經驗。如果追求短期目標,找現成有經驗的人是對的。但如果看長遠,經驗就沒那么重要,基礎能力、創造性與熱愛等更重要。

13.我們的核心技術崗位,基本以應屆和畢業一兩年的人為主。做一件事,有經驗的人會不假思索告訴你,應該這樣做,但沒有經驗的人,會反復摸索、很認真去想應該怎么做,然后找到一個符合當前實際情況的解決辦法。

14.我們招人的條件是熱愛,這些人的熱情通常會表現出來,因為他真的很想做這件事,所以這些人往往同時也在找你。

15.我們的考核標準和一般公司不太一樣。我們沒有KPI,也沒有所謂的任務。

16.創新需要盡可能少的干預和管理,讓每個人有自由發揮的空間和試錯機會。創新往往都是自己產生的,不是刻意安排的,更不是教出來的。我們交給員工重要的事,并且不干預他。讓他自己想辦法,自己發揮。

17.招人時確保價值觀一致,然后通過企業文化來確保步調一致。當然,我們并沒有一個成文的企業文化,因為所有成文的東西,又會阻礙創新。更多時候,是管理者的以身示范,遇到一件事,你如何做決策,會成為一種準則。

18.按照教科書的方法論來推導創業公司,在當下,他們做的事,都是活不下來的。但市場是變化的,真正的決定力量往往不是一些現成的規則和條件,而是一種適應和調整變化的能力。很多大公司的組織結構已經不能快速響應和快速做事,而且他們很容易讓之前的經驗和慣性成為束縛,而這波AI新浪潮之下,一定會有一批新公司誕生。

19.最讓我們興奮的是去搞清我們的猜想是不是事實,如果是對的,就會很興奮了。

20.信仰者會之前就在這里,之后也在這里。他們更會去批量買卡,或者跟云廠商簽長協議,而不是短期去租。

21.創新是昂貴且低效的,有時候伴隨著浪費。所以經濟發展到一定程度之后,才能夠出現創新。很窮的時候,或者不是創新驅動的行業,成本和效率非常關鍵。OpenAI也是燒了很多錢才出來的。

22.這個世界存在很多無法用邏輯解釋的事,就像很多程序員,也是開源社區的瘋狂貢獻者,一天很累了,還要去貢獻代碼。類似你徒步50公里,整個身體是癱掉的,但精神很滿足。

23.不是所有人都能瘋狂一輩子,但大部分人,在他年輕的那些年,可以完全沒有功利目的,投入地去做一件事。

24.我們的大模型服務降價只是按照自己的步調來做事,然后核算成本定價。我們的原則是不貼錢,也不賺取暴利,在成本之上稍微有點利潤。

25.搶用戶并不是我們的主要目的。我們降價一方面是因為我們在探索下一代模型的結構中,成本先降下來了,另一方面也覺得無論API,還是AI,都應該是普惠的、人人可以用得起的東西。

26.如果目標是做應用,那沿用Llama結構,短平快上產品也是合理選擇。但我們的目的地是AGI,這意味著我們需要研究新的模型結構,在有限資源下,實現更強的模型能力。這是scale up到更大模型所需要做的基礎研究之一。除了模型結構,我們還做了大量其他的研究,包括怎么構造數據,如何讓模型更像人類等,這都體現在我們發布的模型里。

27.最重要的是參與到全球創新的浪潮里去。過去很多年,中國公司習慣了別人做技術創新,我們拿過來做應用變現,但這并非是一種理所當然。這一波浪潮里,我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展。

28.隨著經濟發展,中國也要逐步成為貢獻者,而不是一直搭便車。過去三十多年IT浪潮里,我們基本沒有參與到真正的技術創新里。我們已經習慣摩爾定律從天而降,躺在家里18個月就會出來更好的硬件和軟件。但其實,這是西方主導的技術社區一代代孜孜不倦創造出來的,只因為之前我們沒有參與這個過程,以至于忽視了它的存在。

29.大部分中國公司習慣follow,而不是創新。

30.創新的成本肯定不低,過去那種拿來主義的慣例和過去的國情有關。但現在,無論中國的經濟體量,還是字節、騰訊這些大廠的利潤,放在全球都不低。我們創新缺的不是資本,而是缺乏信心以及不知道怎么組織高密度的人才實現有效的創新。

31.過去三十年,我們都只強調賺錢,對創新是忽視的。創新不完全是商業驅動的,還需要好奇心和創造欲。我們只是被過去那種慣性束縛了,但它也是階段性的。

32.在顛覆性的技術面前,閉源形成的護城河是短暫的。即使OpenAI閉源,也無法阻止被別人趕超。所以我們把價值沉淀在團隊上,我們的同事在這個過程中得到成長,積累很多know-how,形成可以創新的組織和文化,這就是我們的護城河。

33.開源,發論文,并沒有失去什么。對于技術人員來說,被follow是很有成就感的事。開源更像一個文化行為,而非商業行為。給予是一種額外的榮譽,一個公司這么做也會有文化的吸引力。

34.美國最賺錢的公司,都是厚積薄發的高科技公司。

35.中國AI和美國真實的gap是原創和模仿的差距。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。

36.英偉達的領先,不只是一個公司的努力,而是整個西方技術社區和產業共同努力的結果。他們能看到下一代的技術趨勢,手里有路線圖。中國AI的發展,同樣需要這樣的生態。很多國產芯片發展不起來,是因為缺乏配套的技術社區,只有第二手消息,所以中國必然需要有人站到技術的前沿。

37.我們不會閉源,我們認為先有一個強大的技術生態更重要。

38.我們短期內沒有融資計劃,我們面臨的問題從來不是錢,而是高端芯片被禁運。

39.更多的投入并不一定產生更多的創新,否則大廠可以把所有的創新包攬了。

40.我們認為當前階段是技術創新的爆發期,而不是應用的爆發期。長遠來說,我們希望形成一種生態,就是業界直接使用我們的技術和產出,我們只負責基礎模型和前沿的創新,然后其它公司在DeepSeek的基礎上構建toB、toC的業務。如果能形成完整的產業上下游,我們就沒必要自己做應用。

41.如果需要,我們做應用也沒障礙,但研究和技術創新永遠是我們第一優先級。

42.技術沒有秘密,但重置需要時間和成本。英偉達的顯卡,理論上沒有任何技術秘密,很容易復制,但重新組織團隊以及追趕下一代技術都需要時間,所以實際的護城河還是很寬。

43.提供云服務不是我們的主要目標,我們的目標是去實現AGI。

44.大廠有現成的用戶,但它的現金流業務也是它的包袱,也會讓它成為隨時被顛覆的對象。

45.大模型創業公司可能活下來2到3家。現在都還處在燒錢階段,那些自我定位清晰、更能精細化運營的,更有機會活下來。其它公司可能會脫胎換骨。有價值的東西不會煙消云散,但會換一種方式。

46.我經常思考的是,一個東西能不能讓社會的運行效率變高,以及你能否在它的產業分工鏈條上找到擅長的位置。只要終局是讓社會效率更高,就是成立的。中間很多都是階段性的,過度關注必然眼花繚亂。

47.我們發布的V2模型沒有海外回來的人,都是本土的。前50名頂尖人才可能不在中國,但我們能自己打造這樣的人。

48.DeepSeek也全是自下而上的。而且我們一般不前置分工,而是自然分工。每個人有自己獨特的成長經歷,都是自帶想法的,不需要push他。探索過程中,他遇到問題,自己就會拉人討論。不過當一個idea顯示出潛力,我們也會自上而下地去調配資源。

49.我們每個人對于卡和人的調動是不設上限的。如果有想法,每個人隨時可以調用訓練集群的卡無需審批,同時因為不存在層級和跨部門,也可以靈活調用所有人,只要對方也有興趣。

50.我們選人的標準一直都是熱愛和好奇心,所以很多人會有一些奇特的經歷,很有意思。很多人對做研究的渴望,遠超對錢的在意。

51.創新首先是一個信念問題。為什么硅谷那么有創新精神?首先是敢。Chatgpt出來時,整個國內對做前沿創新都缺乏信心,從投資人到大廠,都覺得差距太大了,還是做應用吧。但創新首先需要自信,這種信心通常在年輕人身上更明顯。

52.我們在做最難的事。對頂級人才吸引最大的,肯定是去解決世界上最難的問題。其實,頂尖人才在中國是被低估的。因為整個社會層面的硬核創新太少了,使得他們沒有機會被識別出來。我們在做最難的事,對他們是有吸引力的。

53.OpenAI不是神,不可能一直沖在前面。

54.AGI可能是2年、5年或者10年,總之會在我們有生之年實現。至于路線圖,即使在我們公司內部,也沒有統一意見。但我們確實押注了三個方向:一是數學和代碼,二是多模態,三是自然語言本身。數學和代碼是AGI天然的試驗場,有點像圍棋,是一個封閉的、可驗證的系統,有可能通過自我學習就能實現很高的智能。另一方面,多模態、參與到人類的真實世界里學習,對AGI也是必要的。我們對一切可能性都保持開放。

55.未來會有專門公司提供基礎模型和基礎服務,會有很長鏈條的專業分工。更多人在之上去滿足整個社會多樣化的需求。

56.我主要的精力在研究下一代的大模型,還有很多未解決的問題。

57.所有的套路都是上一代的產物,未來不一定成立。拿互聯網的商業邏輯去討論未來AI的盈利模式,就像馬化騰創業時,你去討論通用電氣和可口可樂一樣,很可能是一種刻舟求劍。

58.我們經歷了一個漫長的積累過程,外部看到的是幻方2015年后的部分,但其實我們做了16年。

59.未來中國產業結構的調整,會更依賴硬核技術的創新。當很多人發現過去賺快錢很可能來自時代運氣,就會更愿意俯身去做真正的創新。

60.未來硬核創新會越來越多,現在還不容易被理解,是因為整個社會群體需要被事實教育。當這個社會讓硬核創新的人功成名就,群體性想法就會改變,我們只是還需要一堆事實和一個過程。

參考資料:

1.《瘋狂的幻方:一家隱形AI巨頭的大模型之路》 暗涌

2.《揭秘DeepSeeK:一個更極致的中國技術理想主義的故事》暗涌


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
那個做K11的房企爆雷了,它也是香港第一家爆雷的本土房企

那個做K11的房企爆雷了,它也是香港第一家爆雷的本土房企

流蘇晚晴
2025-06-20 18:37:12
特朗普推遲進攻,美航母改變航線,中方擔憂的事,已經越來越近

特朗普推遲進攻,美航母改變航線,中方擔憂的事,已經越來越近

健身狂人
2025-06-21 07:43:51
外媒盛贊網易《歸唐》:屬于PS5世代的《神秘海域》

外媒盛贊網易《歸唐》:屬于PS5世代的《神秘海域》

游民星空
2025-06-20 21:10:32
劉亦菲新劇男主剛官宣就換人 離婚塌房連累到手的飯碗砸了

劉亦菲新劇男主剛官宣就換人 離婚塌房連累到手的飯碗砸了

鄉野小珥
2025-06-20 06:54:03
周華健兒子結婚,網友辣評:娶了個媽,生了個加勒比海盜!

周華健兒子結婚,網友辣評:娶了個媽,生了個加勒比海盜!

溫讀史
2025-06-02 11:37:57
章子怡太拼了!《醬園弄》竟隱藏大彩蛋,9歲醒醒熒幕首秀太嚇人

章子怡太拼了!《醬園弄》竟隱藏大彩蛋,9歲醒醒熒幕首秀太嚇人

喜歡歷史的阿繁
2025-06-21 00:42:52
不打了?特朗普親自出馬,官宣伊以將暫停沖突:一定會達成協議

不打了?特朗普親自出馬,官宣伊以將暫停沖突:一定會達成協議

兵說
2025-06-19 23:49:15
燃油車打響反擊戰:當AI將百公里油耗降至2L時,你還會買電動車嗎?|汽車觀察

燃油車打響反擊戰:當AI將百公里油耗降至2L時,你還會買電動車嗎?|汽車觀察

封面新聞
2025-06-20 10:35:09
情況有變!伊朗人開始按照內塔尼亞胡的節奏在走了……

情況有變!伊朗人開始按照內塔尼亞胡的節奏在走了……

翻開歷史和現實
2025-06-16 22:37:28
哈利伯頓:如果我們足夠幸運贏下G7,那將會被銘記很久

哈利伯頓:如果我們足夠幸運贏下G7,那將會被銘記很久

懂球帝
2025-06-20 13:58:08
1988年,遼寧丹東,熱戀中的北影學生王全安和蔣雯麗共赴錦江山

1988年,遼寧丹東,熱戀中的北影學生王全安和蔣雯麗共赴錦江山

娛你同歡
2025-06-20 23:55:33
文胖:杜蘭特正通過有效掌控交易市場來迫使自己被交易至心儀的球隊

文胖:杜蘭特正通過有效掌控交易市場來迫使自己被交易至心儀的球隊

雷速體育
2025-06-21 07:58:16
鴻蒙6來了!華為發布鴻蒙智能體框架 盤古大模型上新

鴻蒙6來了!華為發布鴻蒙智能體框架 盤古大模型上新

財聯社
2025-06-20 18:30:10
廣東名嘴陳維聰近況曝光,重新低調現身,廣東網友:可以做網紅了

廣東名嘴陳維聰近況曝光,重新低調現身,廣東網友:可以做網紅了

陳意小可愛
2025-06-21 04:31:02
難以置信3-1!主帥是前巴西國腳又年輕又帥,曾效力皇馬切爾西

難以置信3-1!主帥是前巴西國腳又年輕又帥,曾效力皇馬切爾西

bwb足球算個球
2025-06-21 06:24:36
窮人的富養是帶孩子到處旅游,增長了欲望;富人的富養竟是......

窮人的富養是帶孩子到處旅游,增長了欲望;富人的富養竟是......

霹靂炮
2025-06-06 22:31:58
曝曼聯或可6000萬簽埃基蒂克!阿莫林看中其一優勢,僅次于姆巴佩

曝曼聯或可6000萬簽埃基蒂克!阿莫林看中其一優勢,僅次于姆巴佩

羅米的曼聯博客
2025-06-21 08:24:47
重磅罰單遭質疑!名記6問足協:為何有爭議比賽不認定消極比賽?

重磅罰單遭質疑!名記6問足協:為何有爭議比賽不認定消極比賽?

奧拜爾
2025-06-20 19:20:38
廣東零食店遭哄搶后續,老板追究到底,總公司派人救援,官方出手

廣東零食店遭哄搶后續,老板追究到底,總公司派人救援,官方出手

鋭娛之樂
2025-06-20 20:25:40
知名相聲演員去世,享年51歲

知名相聲演員去世,享年51歲

極目新聞
2025-06-20 13:58:31
2025-06-21 08:59:00
經緯創投 incentive-icons
經緯創投
經緯創投公眾平臺
2315文章數 7144關注度
往期回顧 全部

財經要聞

58同城一邊裁員一邊跨界投資

頭條要聞

伊朗與歐洲三國日內瓦密談3小時 伊朗外長發表聲明

頭條要聞

伊朗與歐洲三國日內瓦密談3小時 伊朗外長發表聲明

體育要聞

周通:2年前想過退役,沒想到能踢世俱杯

娛樂要聞

黃曉明落榜原因曝光!葉珂曾秀幸福

科技要聞

余承東:鴻蒙6主打"毫秒級"時延與全面AI

汽車要聞

五項訂車禮/四款車型 一汽奧迪A5L正式開啟預售

態度原創

時尚
教育
本地
數碼
軍事航空

今年流行的“小紅裙”“小紅鞋”太美了!誰穿誰好看

教育要聞

這套期末評語模板走心又實用!老師請收藏

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

數碼要聞

消息稱三星1c DRAM內存技術的生產良率已達70%

軍事要聞

以方:有能力摧毀伊朗所有核設施

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 肥东县| 浑源县| 楚雄市| 蒙山县| 长治市| 加查县| 奈曼旗| 新余市| 米林县| 鄂托克前旗| 台南县| 阳西县| 尼勒克县| 灵台县| 都安| 威宁| 乌兰县| 澄江县| 德钦县| 资中县| 汉寿县| 泽库县| 得荣县| 柳州市| 连江县| 静乐县| 伊宁市| 清丰县| 天峻县| 南阳市| 石楼县| 噶尔县| 洛宁县| 梅河口市| 湛江市| 金川县| 禹城市| 库车县| 永安市| 桐梓县| 砀山县|