隨著DeepSeek這兩天火遍全網,美國的輿論風向也在變化,從一開始的懵逼、驚嘆、贊賞,到有些酸葡萄和充滿敵意的聲音冒了出來。
人工智能數據平臺Scale AI的首席執行官Alexandr Wang一口咬定DeepSeek有5萬塊走私的H100,但因為違反了美國出口管制所以不敢對外說。他這么說不奇怪,Scale AI一直努力融入美國“國防科技”的圈子,前高管Michael Kratsios現在當了特朗普的白宮科技政策辦公室主任,Alexandr更有責任秀一把愛國了。他沒有提出任何證據,英偉達今天也出來澄清沒有這回事,但這的確好像一下子解釋了為什么DeepSeek突然這么牛,有不少美國人真信了。
這幾天,美國國會和白宮還處在政府換屆的忙碌和混亂中,沒有對DeepSeek這事做什么回應,但幾乎能確定的是,如此高的討論熱度必然已讓DeepSeek進入特朗普政府的視野。這家專注于模型研發、對外低調的公司,已經被動卷入了中美人工智能的地緣政治,今后任何決策和動作都無法再忽視這個因素。對一家只有100多人的公司和創始人梁文鋒來說,這是一個挑戰。
同時,DeepSeek的崛起,影響的只是美國的開源模型生態或英偉達的股價。對正在審查拜登任內人工智能政策、剛推出了5000億美元AI基建計劃的特朗普政府,這也是個重大沖擊,可能直接影響其未來的政策走向。
雖然我們還不知道美國新政府怎么看這個事,但他們一定感受到了中美人工智能競爭的激烈,也認識到在人工智能方面中國是美國多么強大的一個對手。正如《經濟學人》的文章標題所言,“中國人工智能緊趕直追,給特朗普出了道難題”。
在此情況下,美國國內對DeepSeek冒出很多敵意,不足為奇。在我看來,OpenAI的早期投資人,Thrive Capital的創始合伙人Joshua Kushner今天在X上的一番言論頗有代表性,也比較全面展示了這種敵意:“‘親美’的技術專家們竟公然支持一款基于美國前沿領先模型訓練出來的中國模型,而訓練所用芯片很可能違反了出口管制規定,并且根據該模型自身的服務條款,還會將美國客戶數據帶回中國。”
違反芯片出口管制、偷了美國模型、把美國人數據交給中國,三條罪狀刀刀見血,值得引起重視。畢竟,這些聲音可能代表了美國國內相當一批“科技民族主義者”的看法,也直接刺激美國國會和政府的神經。
對有沒有違反美國芯片出口管制,估計是要調查的,但DeepSeek的出現會對特朗普政府關于芯片出口管制政策的評估產生什么影響,是更大的事。
DeepSeek的成功之一,是探索出了一條新路,在芯片(算力)受限情況下,以最低成本做出比肩美國的前沿模型。這一定程度上沖擊了此前純粹靠堆算力提升模型性能的路徑,也是導致今天英偉達股價大跌17%的內在邏輯。人們很自然地會思考:這是否意味著以后不需要太多高端GPU了,那美國對中國的高端芯片出口管制還有什么用?
在此問題上,美國國內過去幾天經歷了激烈的爭論。一些分析人士認為,DeepSeek橫空出世,代表了拜登政府芯片出口管制政策的失敗甚至反作用:你看你對中國禁運芯片,反倒逼他們想出來怎么用最少芯片訓練出很強的模型。但也有些專業人士認為,芯片出口管制本就有滯后性,效果顯現需要時間,拜登政府最后幾天甩出的“AI擴散出口管制框架”是個大招,應能補上之前的漏洞;而且連DeepSeek的老板梁文鋒自己都承認,他們現在最大的制約因素仍然是高端芯片禁運,怎么能說出口管制沒用呢?還有些人認為,DeepSeek訓練這些模型也是用的美國的H800 GPU,美國為當初就不該放開這類芯片,養虎為患。
這些不同的觀點,都會反映到美國政府那里,未來政策取決于哪些觀點被決策者入耳入心。幾乎可以想象,英偉達等美國芯片企業、半導體制造設備商肯定要拿這個為例子,向特朗普政府論證應當取消芯片出口管制。
但支持出口管制的陣營也很強。英偉達這次的回應,也強調了DeepSeek“推理時動態擴展”技術路線仍需要大量GPU。目前H20等不受控的GPU執行推理任務表現出色甚至優于H100,如果DeepSeek事件促使美國政府不僅卡中國模型訓練,也想要限制推理,對中國禁運H20也不無可能。拜登政府末期,智譜成為首家上了實體清單的中國大模型企業。考慮到特朗普第一任期對實體清單等各類制裁清單的癡迷,如果未來美國政府把更多中國大模型企業放進實體清單,似乎也不是多么出人意料。
所謂“基于美國前沿領先模型訓練中國模型”,可能引發對美國開源模型監管的反思,這是個更復雜的問題。美國科技界具有深厚的開源文化,主流觀點認為美國技術領導力受益于開源。拜登政府考慮過對開源模型進行出口管制,但最終放棄了,既是因為缺乏法律依據,也是因為美國司法判例曾多次認定代碼是一種思想和創意的表達方式,是受憲法第一修正案保護的“言論”。如果強行管制,不僅于法無據,反而可能違憲。因此,對開源軟件,除了一些具有軍事和安全意義的加密軟件,美國出口管制法是不管的。
盡管DeepSeek和Llama使用的模型架構不同,也未直接基于任何特定的美國開源模型進行開發,但美國還是有一些人認為DeepSeek是在Llama基礎上發展起來的,從而一定程度引發了一些爭論:Meta當初是不是就不該搞什么開源,這下不僅讓中國人學了去,而且青出于藍勝過了師傅。從開源社區的視角,這種觀點是有些荒謬的,但從政策制定者角度,卻可能不無道理。美國政府或許會思考:美國是否應該吸取教訓,限制一下中國對開源模型的參與。
目前全球開源模型開發者托管模型代碼和權重的主流開源平臺包括Hugging Face、Github等,都受美國法律管轄。GitHub上的開源模型代碼在遵守自身開源許可證的同時,也可能作為GitHub上的信息(Information)受到出口管制等美國法律的監管,影響開發者相關的上傳和下載行為。
我傾向于認為美國不會極端到限制中國開源模型開發者訪問或使用開源平臺,因為這對美國開源社區的副作用會很大,只會把中國開發者趕到OpenI啟智社區等中國開源平臺,豐富中國本土開源生態。
但美國歷史上真實發生過管制開源平臺的例子。2019年7月,為了遵守美國政府對伊朗的制裁,GitHub曾限制伊朗用戶訪問其平臺的私有代碼庫和部分公開代碼庫,甚至直接屏蔽了部分伊朗開發者的賬戶,導致很多開發者的項目被迫中斷。盡管此事引發了國際開源社區對Github的廣泛質疑,迫使其最終通過向財政部申請出口許可部分解決了問題,但殷鑒不遠,值得中國的開源模型開發者警惕。
Joshua Kushner最后提到的“將美國客戶數據帶回中國”,本質是中美數據跨境流動這個老問題,再往上一層則是目前中國大模型應用在美國應用商店上架、可供美國用戶下載和使用的問題。特朗普第一任期,曾試圖以《國際緊急經濟權力法》(IEEPA)為依據,迫使美國應用商店下架中國應用程序,最終因受制于“伯曼修正案”在法律訴訟中敗北,并因隨后的敗選而不了了之。本屆任期,特朗普是否會延續此前針對中國應用程序的政策,目前尚不明朗。
和小紅書一樣,DeepSeek這些AI應用遠程向美國用戶提供服務,落入了《保護美國人免受外國對手控制的應用程序侵害法》、商務部《信息通信技術與服務最終規則》等法律法規的管轄范圍。美國理論上可以使用這些法律工具限制和下架這些應用。這些應用程序服務美國用戶,很難不產生一些數據的跨境交互。但美國司法部去年12月發布的《防止受關注國家及相關人員訪問美國敏感個人數據和政府相關數據的規定》最終規則將在今年3月27日生效,屆時這些應用在美國運營產生的數據跨境交互也將直接受到該聯邦法規的監管。
對DeepSeek,中美雙方的反應最好都適度冷卻。對中國來說,要在慶祝和自豪的同時警惕危機,防止大洋對岸的“捧殺”。對美國而言,要客觀理性看待DeepSeek的成功,避免地緣政治化和國家安全化。但也許無論如何,過去的幾天已經對中美下一階段人工智能競爭產生了深遠影響。
文章僅做學術探討和市場研究交流使用,相關判斷不代表任何公司或機構立場,也不構成任何投資建議。轉載請注明來源。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.