散英魂寄千萬雄鷹翱翔神州,
盡智魄載十億慧芯呼喚華夏。
——《國務院給予江上舟同志挽聯》
01
前沿導讀
據央視財經新聞報道,馬斯克的人工智能初創公司 x AI在直播中發布了其公司最新的Grok 3大模型產品。在直播畫面當中,一位來自于杭州的年輕工程師吳宇懷坐在畫面的中央位置,緊挨著創始人馬斯克。
在x AI公司公布的信息上面顯示,團隊成員里面有5位來自于中國的華人工程師。其中包括了來自杭州的吳宇懷,以及畢業于浙江大學的張國棟。兩人都屬于是學霸級別的工程師,在海外大學深造后,留在了海外高科技公司工作。
02
人才的重要性
根據官方信息顯示,吳宇懷畢業于多倫多大學,其主攻的專業方向是人工智能技術。后來進入斯坦福大學進行深造,并取得了博士學位,曾經還在谷歌公司工作過,擔任其AI項目的研究員,隨后進入了馬斯克的x AI公司,開始全力推進人工智能技術的研發。
而張國棟畢業于浙江大學,隨后進入多倫多大學攻讀到博士學位,其研究的技術領域也是與人工智能相關的產業。畢業后曾在微軟、谷歌等公司任職,現在是x AI公司的核心工程師之一。
DeepSeek的創始人梁文鋒,與x AI的張國棟一樣,都是畢業于浙江大學的工程師。不過與張國棟不同的是,梁文鋒在浙江大學攻讀到碩士之后,并沒有出國深造,而是選擇在國內創業。他創辦了幻方量化公司,主要的創業方向就是現在大熱的人工智能技術。
相對于吳宇懷和張國棟,梁文鋒剛起步的時候并沒有掀起多大的浪花,只是在相關領域當中有所成就。
幻方量化對比微軟、谷歌這種美國本土的頂級科技企業,其在企業規模、技術基礎、產業鏈布局上面,都有著明顯劣勢。尤其是在所能獲得的算力芯片上面,美國企業的優勢太大了。
從2019年開始,梁文鋒的幻方量化公司開始在人工智能領域儲備技術力量。他帶領團隊研發了螢火一號的ai訓練平臺,使用了1100塊GPU芯片,總投資約為2億元。隨后又研發了螢火二號平臺,使用了大約10000塊來自于英偉達的A100算力芯片,總投資規模提升到了10億元。
梁文鋒及其技術團隊在掌握了ai相關的技術后,開始進行通用ai技術的研發。他從幻方量化中拆分出一個全新的公司DeepSeek,專注于民用的大模型技術進行研發。
在梁文鋒發展人工智能的階段開始,到后來的DeepSeek創立。在這一階段當中,美國已經針對于中國的科技領域進行了全面壓制。中國企業獲得美國先進芯片的機會無限接近于0,而人工智能技術的發展又離不開高算力芯片的加持,這種情況極大拖慢了中國企業在ai大模型領域的發展腳步。
以往的民用ai大模型市場,被美國open ai公司推出的GPT軟件所統治。open ai公司是美國最早期發展人工智能技術的公司,當初英偉達開發出來了第一批支持CUDA技術的算力芯片,這些芯片被英偉達的創始人黃仁勛,親自交付給了open ai公司,支持其在人工智能領域的發展。
從GPT誕生開始,一直到后期的推廣階段,這款大模型是行業內公認的高水平大模型系統。直到梁文鋒將DeepSeek的大模型推出之后,這個情況才有了質變的發展。
DeepSeek一共推出了兩款水平較高的大模型系統,V3和R1。
V3大模型的硬件水平,已經被DeepSeek公司進行了公布,采用了2048塊來自于英偉達的H800芯片,訓練時間僅用了不到280萬個GPU小時。根據DeepSeek官方給出的數據顯示,其訓練成本僅為557.6萬美元,這個成本不到GPT-4o的二十分之一。
V3大模型側重于數學、代碼以及中文理解方面的理論推斷,并且該大模型已經進行了開源,所有對ai技術感興趣的開發者,都可以免費使用V3大模型的算法技術。
V3大模型的短板是文字生成類型的處理任務,針對于這個弱點,梁文鋒團隊又開發了R1大模型,該大模型專注于解決文字生成類型的推斷運算。
在此之前,文字生成領域的大模型標桿是open ai推出的o1大模型語言。
R1大模型上市之后,支持聯網搜索后進行推理,補齊了V3大模型在長文本推理和分析上面的弱點。并且在FRAMES的測試當中,R1的準確率達到了80%以上;在MMLU測試當中,R1的準確率為90.8%,open ai o1的準確率為91.8%,兩款大模型在性能與效果上面的表現不相上下。
DeepSeek兩款高水平大模型的推出,受到了美國ai領域的重點關注,甚至還在一定程度上影響了ai芯片供應商英偉達的股價。
梁文鋒也憑借著其核心領導者的身份,成為了國內ai領域的優秀青年工程師代表。
03
人才的競爭
在DeepSeek的大模型沖擊了美國ai技術領域之后,由馬斯克領導的x AI公司便開始全面推進Grok 3大模型的上市。
Grok 3使用了100000個來自于英偉達的H100高性能ai芯片進行訓練,通過數量龐大的GPU算力芯片,讓其大模型的訓練時間縮短到了19天。
夸張的硬件堆疊,加上夸張的訓練效率,讓這款全新的大模型系統在算力測試上面領先了所有競爭對手,包括DeepSeek與GPT推出的所有產品。
其高水平的算力背后,就是來自于吳宇懷和張國棟等人的技術研發。
相對于DeepSeek的創始人梁文鋒,吳宇懷和張國棟選擇了另一條在人工智能行業發展的路線。這就引申出了一個老生常談的問題,完成學業后是留在國內工作,還是去國外的高科技企業工作。
國外的企業,尤其是以歐美企業為主的技術工作崗位,在其開出的薪資待遇、公司的綜合實力、發展前景等方面,都是全球領域的頂級水平。
不管是微軟、谷歌,還是現在ai領域的龍頭英偉達,這些企業所給予技術人員的遠不是金錢上面的多少,而是在于引領行業發展的機會。英偉達的創始人黃仁勛,在某一個階段的個人資產數值,已經超過了英特爾公司的市值。
哪怕是當年蘋果公司的喬布斯和斯卡利,就因為喬布斯想要引領一個全新的技術時代,所以他在產品設計以及產品價格上面與斯卡利爆發了劇烈的沖突,最終導致蘋果公司罷免了喬布斯的職位,并且將他趕出了蘋果公司。
對于技術人員來說,薪資待遇只是吸引他們的一方面,更重要的一方面是,技術工程師需要看到自己能否參與到新技術的開創當中,新時代的技術變革需要有實力的工程師參與進來。
我們不能說在x AI工作的兩位中國工程師,他們選擇在馬斯克公司工作是個錯誤的選擇。如果在將來,這些在海外企業任職的技術工程師可以回國發展,那么這對于國內的技術發展來說,是一個不錯的消息。
往期經典回顧:20萬+閱讀量
往期經典回顧:40萬+閱讀量
往期經典回顧:100萬+閱讀量
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.