特朗普提名的商務部長Howard Lutnick今天下午出席美國國會參議院能源和商務委員會對他的提名確認聽證。這兩天DeepSeek在美國關注度這么高,我想這可能會是聽證會上的重要話題,就全程聽了下。
不出所料,好幾位參議員向Lutnick提出了DeepSeek問題,Lutnick的回應十分強硬,基本上認定是DeepSeek竊取了美國的技術,而且Meta和英偉達等美國公司變相給他們提供了機會。他覺得這事凸顯了美國的出口管制的一大不足:沒有和關稅搭配著來,成了“打地鼠”的游戲。如果他上來了一定會嚴格實施限制措施和執行,確保美國領先。
同一天,“知情人士”根彭博社透露,特朗普政府正在考慮對H20芯片(英偉達最新“閹割版”特供中國的GPU)實施出口管制。媒體問了英偉達,英偉達沒有否認這個事,說“愿意配合政府,以便政府實施自己的AI政策”。
如果看過兩天前我寫的“”,應該能記得我當時曾警示:“目前H20等不受控的GPU執行推理任務表現出色甚至優于H100,如果DeepSeek事件促使美國政府不僅卡中國模型訓練,也想要限制推理,對中國禁運H20也不無可能。”很不幸一語成讖,拜登政府時期沒做成的事,怕要在受了DeepSeek刺激的特朗普政府執政初期實現了。2024 年中國市場H20芯片出貨量大概是70 萬枚,每季度銷量環比增長達 50%,說明國內需求還是挺大的,需要未雨綢繆。
委員會首席議員、民主黨人Maria Cantewell開場發言上來就說了DeepSeek,強調這凸顯了美國出口管制的問題,希望Lutnick能夠改善BIS的工作,加強對中國的出口管制,維護美國科技優勢。
Lutnick說,要防止再發生DeepSeek這種事,美國公司必須停止幫助中國。Meta 的開放平臺讓DeepSeek利用了它們的生態。DeepSeek買了大量的英偉達芯片,并找到了規避限制的方法,才實現了發展。這一切必須結束。如果他們要和我們競爭,那就讓他們競爭,但不能再用我們的工具來對抗我們。
參議員Todd Young問Lutnick,美國投資科技來之不易的成果被泄密,知識產權泄露給了敵對國家和實體,你怎么保持警惕防范這種情況?Lutnick主動說:是啊,還有什么比中國的人工智能公司DeepSeek更說明這個問題的緊迫,他們通過獲取、偷竊或借鑒我們的東西,用極低成本創造成果,這太過分了,必須解決。
另一個參議員問,DeepSeek的模型據稱是用一批不受出口管制限制的舊一代芯片訓練出來的,成本比美國模型少得多。不管中國是怎么做到的,他們可能并沒有我們想象的那么落后。你當了商務部長后怎么確保美國贏得和中國的人工智能競賽?Lutnick說,這說明我們的出口管制,如果沒有關稅支持,就像打地鼠游戲一樣,在這限制了,他們又會在那想辦法繞過限制。必須用關稅模式來支持出口管制,這樣就能告訴中國,當美國說不的時候,那就必須是不。這關乎尊重。中國不尊重我們,還想辦法繞過限制。我不相信DeepSeek的成果是完全正當獲得的。這太荒謬了。他們偷竊、非法獲取,拿走了我們的知識產權。這種情況必須停止。我會嚴格推行限制措施并確保其得到執行,讓美國保持領先,美國必須領先。
有參議員問,你怎么看美國用戶的模型托管在中國服務器上,以及模型被逆向工程的風險。這個其實關乎知識產權。你能說說怎么打算保護美國的知識產權嗎?Lutnick說,得讓中國明白,如果你們不尊重我們公司的知識產權,就別指望你們的公司在美國享受同樣的待遇,“對等”很重要。這個參議員還問,你是搞金融出身,DeepSeek的母公司是一家對沖基金,我在調查它,你覺得前兩天美國公司市值的損失是中國在做空我們嗎?Lutnick說,我不知道,但很值得查一下。
有參議員問,怎么對DeepSeek這樣的事追究中國的責任?我們也希望和中國建立有效的關系,但如果沒有問責機制,這根本無法實現。Lutnick回答說:最好的辦法就是“對等”(Reciprocity)。中國如怎么對我們,我們也怎么對他們。我們對中國太縱容了,他們在中國市場肆意剝奪我們的權利,我們卻允許他們在美國暢通無阻地利用我們。這種狀況必須改變。本屆政府應該不斷強調“對等”原則:要是中國不尊重我們的規則,我們也不用對他們客氣。
OpenAI指責DeepSeek蒸餾他們的模型侵犯了其知識產權,白宮的人工智能政策顧問David Sacks也在一邊呼應。“模型蒸餾”是否構成知識產權的“合理使用”,是個很有意思的問題。我今天請教了一些知識產權法的專家,但沒有獲得特別準確權威的結論。
“模型蒸餾”的過程就像是“老師帶學生”,讓一個輕量級的 AI(“學生模型”)學會大模型(“教師模型”)的本領,達到接近的能力,但計算量更小、運行更快。這個過程中,研究人員準備大量的數據(比如問題、句子、代碼等),先喂給大模型,讓它生成標準答案,給“學生模型”作為學習目標。“學生模型”拿到相同的問題,嘗試自己回答。訓練過程會對比:1)“學生模型”的回答 vs. “教師模型”的回答(越相似,學習效果越好);2)“學生模型”的置信度 vs. “教師模型”的置信度(模仿老師的信心分布)。通過反復訓練,讓學生逐漸“學會”老師的回答風格和思維方式。
目前全球范圍內關于大模型的知識產權爭端主要是圍繞訓練數據(文本、圖像)本身的版權侵權爭議,例如“訓練數據爬取是否構成侵犯版權”、“AI 生成內容的版權歸屬”、“API 濫用是否違反服務條款”等等,法院司法實踐有Getty Images訴Stability AI案等著名案例。但印象中幾乎沒人提出過“蒸餾模型內部知識”算不算侵權的問題,也沒有任何法院就這種情況給過司法裁決。
我不是知產法的專家,如果講錯了歡迎專業的讀者們留言拍磚。據我的理解,版權法更多保護“可表達的內容”(如代碼、文字、圖像本身),而不保護“算法、功能”或“抽象的知識”,AI模型本身通常不受傳統版權法保護。如果在蒸餾過程中,“學生模型”沒有獲取或復制”教師模型“的模型權重、源代碼、專有訓練數據,而只是基于”大模型”的“輸出”來訓練學生模型,恐怕很難構成對版權作品的“實質性復制 (substantial copying)”。
但某些情況下,閉源的“大模型”受到API服務條款或商業秘密保護,如果“蒸餾”錯在“超范圍使用API”、“違反保密義務”或“違規獲取對方的非公開信息”,可能會導致其他形式的侵權。比如OpenAI的使用協議里明確規定:“試圖或協助任何人對我們的服務(包括我們的模型、算法或系統)進行逆向工程、反編譯或發現其源代碼或底層組件(但適用法律禁止該限制的情況除外)。”Llama 2的社區許可證協議(LLAMA 2 Community License Agreement)也規定:“被許可人不得使用 Llama 材料或任何輸出或Llama 材料的結果來改進任何其他大型語言模型(不包括 Llama 2 或其派生作品)。”
但即便DeepSeek屬于這種情況,違反的也應該是合同法,觸發的是違約行為,和版權法沒關系。如果在蒸餾過程中,有人從內部獲取并利用了原廠商的非公開模型權重、算法細節或訓練數據,屬于“商業秘密盜用”或“不正當競爭”。
但拋開是不是侵犯版權的問題不說,就像David Sacks說的,OpenAI等美國公司下一步很可能會想辦法限制中國公司蒸餾他們的模型。美國政府應該也會研究怎么通過法律來禁止,比如考慮對美國AI公司施加類似反洗錢領域“了解你的客戶”(KYC)要求,讓他們監測和報告中國公司的“模型蒸餾”行為。但這個實際實施難度很大,Llama和Mistral 的模型,都可以免費下載并在私有化部署的數據中心使用,就算有蒸餾也很難發現。
再就是像一些行業專家比喻的,大模型公司之間相互進行模型蒸餾很常見,就像汽車廠商會買來對方的發動機拆解研究一樣,本來就是一種市場競爭的手段。Hugging Face 聯合創始人兼 CTO Julien Chaumond 也覺得“模型蒸餾”能避免大家重復造輪子,提高效率和降低資源消耗,促進AI技術普及應用,禁止“模型蒸餾”可能會阻礙技術創新,影響AI 生態系統的健康成長。
文章僅做學術探討和市場研究交流使用,相關判斷不代表任何公司或機構立場,也不構成任何投資建議。轉載請注明來源。Lutnick任命確認聽證會證詞、重要涉華內容實錄、關于模型蒸餾知識產權問題的相關分析參見知識星球。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.