最近互聯網上都是關于Deepseek的消息,不管是吃喝拉撒,還有賺錢、寫作、算命等等都和它扯上關系。我這個人本身比較慢熱,接受新事物的能力不是很強,但它的名聲太大讓人不得不關注。
看到一則視頻里說DeepseeK創始人梁文鋒開發的模型Deepseek轟動硅谷,震驚全球,被海外稱為“來自東方的神秘力量”。Deepseek的估值,超越估值為1570億美元獨角獸OpenAI。
所以我有特別強烈的好奇心,看看他的創始人到底是一個怎么樣的人,竟然能創造這么大一個奇跡……
看了這么多的報道,可能很多人都知道他了。但是我想起那句話:即便再普及的知識,世界上也有一個億的人是不知道的。所以我決定查詢一下把它寫下來。
我還特意跑去問度娘(捂臉)和在網上其他地方查了一下。
比如我問回了DeepSeeK。它的回答類似于查無此人:
也太低調了吧?在他創建的工具中,竟然沒有任何的信息。
還問了豆包,回答如下:
它的回答就全面了許多。
還有以下這些在報道和網絡上的整理:
背景
梁文鋒,出生于1985年出生于廣東湛江的一個農村家庭,父母均為小學教師。
學習經歷
小時候就被發現有數學天賦,初中的時候自學完高中數學課程,12歲考入吳川一中,2002年以高考狀元身份進入浙江大學電子信息工程專業,主攻人工智能方向。
2010年獲得浙江大學信息與通信工程碩士學位。
創業經歷及成就
2008年帶著10萬塊錢本金進入量化投資領域開始創業,成立幻方科技有限公司,專注AI驅動的量化交易。
2013年,他與浙江大學校友徐進共同創立了杭州雅克比投資管理公司。?
2015年,梁文峰正式成立幻方科技有限公司,專注于AI驅動的量化交易。
2016年實現策略全面AI化轉型。
2018年確立以AI為核心戰略,研發螢火系列超級計算機。
2021年管理規模突破千億元,躋身國內量化私募“四大天王”?。
他的創業之路不僅限于量化投資,還在AI領域的創新也取得了顯著成就。他的團隊在算法優化和算力調度上具備獨特優勢,提出了MLA和多頭潛在注意力機制等核心技術。?
2023年7月,梁文峰創立深度求索(DeepSeek),依托幻方積累的算力資源進軍通用人工智能(AGI)領域。
DeepSeek提出了MLA(多頭潛在注意力機制)和DeepSeek-MoE稀疏架構,顯著降低了模型成本。例如,DeepSeek-V3的訓練成本僅為GPT-4的十分之一,性能比肩國際頂尖模型;DeepSeek-R1完全開源,數學推理能力對標OpenAI的o1模型,引發全球AI行業震動?13。
他主張技術普惠,推動技術開源與低成本化,如DeepSeek-V2的API定價僅為GPT-4 Turbo的1%。
他具有戰略遠見,主張中國AI需“基礎研究突破”,選擇從模型架構切入而非應用層開發,形成差異化競爭力?13,堅信人工智能定能改變世界。
梁文鋒的行業影響顯著,開源模型被斯坦福、MIT等頂尖機構采用,推動全球AI價格革命。
2025年他出席國務院專家會議及最高規格民企座談會,被視作中國AI領軍人物。
原來他和我同年,他創業的時候,我在生娃,人的命運真的是由每一個選擇構成的,因為選擇不同,所以命運不一樣,突然覺得好慚愧!
看了他的學習成長經歷和發展歷程,才知道原來他不是逆襲,而是一直卓越,希望在未來他能創造更多奇跡,給國家、給世界帶來更多的便利。
堅持推文不易 您的贊賞是對我們最大的支持
小手一抖,立馬轉走!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.