1月13日,美國歷史上第一個(也是人類歷史上第一個)人工智能出口管制規(guī)則終于揭開了面紗。168頁的新規(guī)以“臨時最終規(guī)則”形式發(fā)布,1月13日當(dāng)天起生效,1月15日會刊登在《聯(lián)邦公報》。公眾在《聯(lián)邦公報》刊登后120天內(nèi)可以提交反饋意見。
我把該規(guī)則的結(jié)構(gòu)總結(jié)為:管AI硬件(GPU等)+管模型權(quán)重。
一、管AI硬件
自2022年1017規(guī)則以來,所有對AI芯片的出口管制,本質(zhì)上也可以理解為對AI的管制在硬件領(lǐng)域的體現(xiàn)。兩年過去了,大家看得很清楚:美國半導(dǎo)體出口管制打的是中國AI,戰(zhàn)略目標(biāo)是絕不能讓中國先于美國實現(xiàn)通用人工智能。
要管制的GPU的性能標(biāo)準(zhǔn),本次規(guī)則里沒有任何變化,和2023年1017規(guī)則保持一致,重點還是總處理性能、性能密度達到一定閾值的數(shù)據(jù)中心芯片,也是大模型訓(xùn)練最為倚重的硬件,具體而言:
3A090.a: - 總處理性能為4800或以上;或 - 總處理性能為1600或以上,且性能密度為5.92或以上。 3A090.b: - 總處理性能為2400-4800以下,且性能密度為1.6(包含本數(shù))至5.92以下(不包含本數(shù)); - 總處理性能為1600或以上,且性能密度為3.2(包含本數(shù))至5.92以下(不包含本數(shù))。 ECCN 4A090.a:控制計算機、“電子組件”和“部件”,其中包含的集成電路滿足或超過3A090.a中的限制。 ECCN 4A090.b:控制計算機、“電子組件”和“部件”,其中包含的集成電路滿足或超過3A090.b中的限制。
主要的不同是創(chuàng)新了管GPU的方法,一定程度上顛覆了美國出口管制的傳統(tǒng)邏輯,面向推出了一套面向全球的出口許可體系,把不同國家區(qū)分為三個等級的紡錘狀結(jié)構(gòu):
(一)紡錘最上部,是美國最親密的17個盟友(加上美國,可以用體制內(nèi)經(jīng)常用的“美西方”指代)。這些國家被新規(guī)稱為“人工智能授權(quán)國家”,管制政策和以前基本沒有變化。
澳大利亞、比利時、加拿大、丹麥、芬蘭、法國、德國、愛爾蘭、意大利、日本、荷蘭、新西蘭、挪威、韓國、西班牙、瑞典、臺灣地區(qū)
對“美西方”國家境內(nèi)的公司出口(包括轉(zhuǎn)口和國內(nèi)轉(zhuǎn)移),只需要提交一個聲明,承諾不會把到手的GPU:1)違反美國出口管制,轉(zhuǎn)賣給美西方以外國家的公司;2)轉(zhuǎn)賣給美西方以外國家的設(shè)在美西方的子公司;3)以遠程云服務(wù)形式向美西方以外的國家提供算力,用于訓(xùn)練大模型。
(二)紡錘最下面,是美國視為“外國敵手”的中國,以及其他美國武器禁運的國家和地區(qū)。對這些國家,管制政策也沒有變化,還是最嚴(yán)格的推定拒絕。
(三)紡錘中間的大肚子,是上述兩類之外的100多個國家,包括新加坡、馬來西亞、阿聯(lián)酋、沙特等。它們也是這次新規(guī)里AI硬件限制的重點,我簡稱為“中間國家”。
對“中間國家”的受控GPU供應(yīng),新規(guī)用“總處理性能”(TPP)劃了兩條線(關(guān)于何為TPP,我在去年4月“”一文中作了通俗易懂的解釋):
一條線是向單個“中間國家”的公司出口26,900,000TPP(大約1700塊GPU),在該范圍內(nèi)的GPU出口適用“低處理性能”許可例外(完全不管)。美國覺得,絕大多數(shù)芯片交易屬于這種“少量GPU采購訂單”,這種量級的芯片采購遠低于訓(xùn)練最先進AI模型需要的數(shù)量,一般很多是那些大學(xué)、醫(yī)療機構(gòu)和研究機構(gòu)出于研究需要下的訂單,這類的沒必要管。
另一條線是GPU出口配額,設(shè)定為2025年至2027年向“中間國家”累計出口 790,000,000TPP(每個國家約5萬塊GPU):從2025年一季度起算一直到2027年四季度,加起來就只能買這么多。2025年以前賣出去的、因為GPU丟失、損壞、故障、搬遷和轉(zhuǎn)售等損耗的TPP,不算在里面。如果進口GPU是為了研發(fā)、生產(chǎn)或存儲,且不會轉(zhuǎn)運給中國等禁運國家,原則上也不占用配額。
美國政府認(rèn)為,兩年累計5萬塊的配額,能確保這些“中間國家”的公司開發(fā)出一些模型,獲得經(jīng)濟收益,但用這點算力開發(fā)出來的模型始終會離美國的先進大模型差著一個級別。同時,這樣還能確保美國公司和技術(shù)“給這些國家的政府、醫(yī)療保健行業(yè)和當(dāng)?shù)仄髽I(yè)提供服務(wù)”(說得像是燈塔國的恩賜,實際意思是還能繼續(xù)賺這些國家的錢)。
如果超出5萬塊的配額,再往這些國家出口就是“推定拒絕”(默認(rèn)不能賣)。BIS會和國務(wù)院、能源部、國防部一道每年審查后續(xù)幾年的配額情況,決定要不要提升或者降低配額。
這些國家可以跟美國簽署一個政府間協(xié)議,給美國提供“國家安全保證”,承諾進口這些GPU一定會確保美國的國家安全利益。這種情況下,GPU配額能翻一倍(10萬塊)。BIS會在新規(guī)里明確列出這些國家。
這種一看就是美國國務(wù)院出的主意,還是拜登政府的對華“多邊圍堵”路數(shù)。川普第一任期也搞過,美國2018年出了個“云法案”,授權(quán)美國政府從美國世界各地的云服務(wù)商調(diào)取存儲在他國的數(shù)據(jù)。這顯然損害他國數(shù)據(jù)主權(quán),美國怕其他國家不高興,在“云法案”里塞了條規(guī)定,說如果你跟我簽個協(xié)議,你也可以調(diào)存在美國的數(shù)據(jù)。
這是分化“中間國家”的策略,和美國簽的協(xié)議屬于有國際法效力的條約,能想象到里面幾乎一定會有這些要求國家跟隨美國出口管制、反向投資審查、支持美國的“民主AI”國際標(biāo)準(zhǔn)等。這借鑒了美國一些智庫提的建議,用“我手里有GPU”逼其他國家追隨美國限制中國、支持美國主導(dǎo)AI國際規(guī)則和標(biāo)準(zhǔn)制定權(quán)。
對“美西方”在海外的公司和“中間國家”的公司,新規(guī)設(shè)置了兩類“數(shù)據(jù)中心經(jīng)驗證最終用戶”,允許它們申請相關(guān)的認(rèn)證,拿到認(rèn)證就能買更多的GPU。
2024年10月,BIS出了“數(shù)據(jù)中心經(jīng)驗證最終用戶”(DC VEU)授權(quán)(具體背景可參見“?)。新規(guī)進一步將其分為“通用經(jīng)驗證最終用戶”授權(quán)(UVEU)、“國家經(jīng)驗證最終用戶”(NVEU)授權(quán)。
UVEU:只有美西方本土公司(總部在美西方境內(nèi))、美西方本土公司在“中間國家”的子公司能申請。數(shù)據(jù)中心里實際擁有受控GPU的主體負(fù)責(zé)提交申請,如果它不能提供全部的申請信息(比如GPU等基礎(chǔ)設(shè)施是A所有,但物理安全或邏輯安全由B公司負(fù)責(zé)),則A必須跟BIS報告所有參與數(shù)據(jù)中心運營的其他實體的身份。A可能需要拿到這些其他實體的書面保證。如果數(shù)據(jù)中心所有權(quán)是A的,但運營是B負(fù)責(zé)(比如Equinix和AWS的合作模式),A和B都得拿到UVEU授權(quán)。
如果要拿到UVEU,這些公司部署的算力必須主要集中在“美西方”,在“美西方”以外部署的算力不能超過全球部署總算力的 25%。;在“中間國家”國家可以部署算力,但單個國家不能超過全球總量的7%。如果是美國公司,在美國部署的算力至少要達到50%。
NVEU:“中間國家”的公司可以申請,拿到了就不再受該國GPU配額(5萬塊)的限制,但仍然有上限。美國政府規(guī)定,每家拿到NVEU的公司2025至2027年累計最多可獲得的5,064,000,000TPP(約32萬塊GPU)。BIS分析了訓(xùn)練最先進AI模型所需的計算集群規(guī)模,以及這些集群未來三年內(nèi)可能的增長速度,最后確定了這個TPP上限。這些配額可確保上述公司能訓(xùn)出來的模型落后美國最先進模型訓(xùn)練所需計算集群規(guī)模約 12 個月或一代。美國認(rèn)為,這能確保最先進AI模型和最大計算集群不受控制地擴散所帶來的風(fēng)險。
根據(jù)這個新規(guī),要想拿到UVEU和NVEU,相關(guān)公司基本上要跟中國在半導(dǎo)體、AI和軍民融合劃清界限,而且要有好的“人權(quán)記錄”。具體來說:
1、需要有可信的計劃證明:1)具備大規(guī)模數(shù)據(jù)中心運營需要的物理、網(wǎng)絡(luò)和人員安全標(biāo)準(zhǔn);2)遵守美國出口管制法;3)尊重人權(quán)或有尊重人權(quán)的良好業(yè)績記錄。
2、和美國《出口管理條例》規(guī)定的“軍事最終用戶”或“軍事情報最終用戶”沒有“關(guān)聯(lián)”(包括研發(fā)協(xié)議和聯(lián)合活動)。
3、所有的母公司、子公司(包括相關(guān)專業(yè)雇員)都必須:1)遵守美國財政部的反向投資審查規(guī)則,不得投資中國的半導(dǎo)體、量子計算和特定前沿AI模型設(shè)計和研發(fā)。2)遵守美國商務(wù)部的ICTS規(guī)則,消除對中國等禁運國家生產(chǎn)的先進半導(dǎo)體和網(wǎng)絡(luò)設(shè)備的供應(yīng)鏈依賴。3)消除《2019年安全可信通信網(wǎng)絡(luò)法》第2條所列的設(shè)備和服務(wù)的供應(yīng)鏈依賴。4)向BIS申報所有和中國等禁運國家的公司、在實體清單和SDN清單上公司的合作活動(例如合資企業(yè))。
4、不能把受控芯片轉(zhuǎn)讓給:1)中國等禁運國家境內(nèi)的實體;2)總部在這些國家的實體;3)實體清單、國際戰(zhàn)略核不擴散制裁清單、SDN清單、被拒絕人員清單上的實體或其雇員(不論國籍);4)中國等禁運國家政府的雇員(不論國籍);5)可能有很高風(fēng)險會轉(zhuǎn)移芯片給中國等禁運國的實體或人員。
5、獲得UVEU認(rèn)證的公司集團內(nèi)部之間跨國轉(zhuǎn)移受控芯片,提前60天通知 BIS。BIS 可以施加許可要求或其他額外條件。
6、未經(jīng)BIS允許,所有子公司和母公司不能給“美西方”以外國家的實體提供用于訓(xùn)練受控模型權(quán)重的基礎(chǔ)設(shè)施即服務(wù)(IaaS)。如果模型微調(diào)使用的計算操作不超過受控模型訓(xùn)練操作的25%,以及提供模型的API訪問或IaaS服務(wù)用于推理而非訓(xùn)練,可以豁免許可。
此外,還需要遵守一系列的監(jiān)控、記錄、報告義務(wù),以及所有權(quán)、基準(zhǔn)、軟件與網(wǎng)絡(luò)、供應(yīng)鏈、人員方面的具體要求。
二、管模型權(quán)重
管制模型權(quán)重,BIS的具體做法是在《商業(yè)管制清單》(CCL)里給“先進AI模型”的“參數(shù)”(parameters)新增了一個ECCN編碼 4E091,管制理由為“地區(qū)穩(wěn)定”。“參數(shù)”指的是在模型訓(xùn)練期間學(xué)習(xí)的任何值(例如,網(wǎng)絡(luò)權(quán)重、偏差等)。
怎么定義AI模型的“先進”?我在“?一文中曾預(yù)測:“可能以模型訓(xùn)練所需的浮點運算量(FLOPs)劃線,確定一個閾值”來管制模型權(quán)重。從新規(guī)來看,美國政府的確采取了這種路徑。BIS在新規(guī)里說:“聽取了美國政府各部門技術(shù)專家的意見,我們確定衡量AI模型性能的一個合理指標(biāo)是計算量(即用于訓(xùn)練模型的計算操作次數(shù)),這一結(jié)論得到了頂尖AI研究人員的經(jīng)驗證據(jù)的支持。”
BIS認(rèn)為,少于10的26方以下計算操作訓(xùn)練出額的模型權(quán)重已經(jīng)存儲在全球各地了,很容易能被外國獲得,所以也就沒必要管制了。所以它們設(shè)定的最終閾值是用超過10的26次方次計算“操作”訓(xùn)練出來的閉源模型?!安僮鳌卑ㄈ魏魏罄m(xù)訓(xùn)練過程,例如對預(yù)訓(xùn)練模型的微調(diào),但不包括輸入訓(xùn)練數(shù)據(jù)的收集和整理。
對這些模型權(quán)重的出口,許可政策是推定拒絕(默認(rèn)不批),基于兩個原因:1)一個強大的模型就算只被出口了一次,也可能被恐怖分子拿到。2)模型權(quán)重其實就是一堆數(shù)據(jù),可以存儲、復(fù)制和傳輸,只要出口一次就很難阻止其全球傳播。所以,對這種東西,要用最嚴(yán)格的管制力度。關(guān)于模型權(quán)重的出口許可政策,對“美西方”國家,新規(guī)設(shè)置了許可例外(豁免許可);對中國等不友好國家,一律禁運;對“中間國家”的公司,獲得了NVEU認(rèn)證后可以適用許可例外。
除了管美國國內(nèi)的模型權(quán)重,BIS還首次對美國境外的模型權(quán)重創(chuàng)造了外國直接產(chǎn)品規(guī)則。美國認(rèn)為,先進的閉源AI模型訓(xùn)練高度依賴美國原產(chǎn)的受控GPU及含有該類GPU的服務(wù)器等部件,沒有這些硬件就無法生成模型權(quán)重,所以可以適用外國直接產(chǎn)品規(guī)則管制美國以外的模型權(quán)重。具體而言,只要使用了受控GPU、服務(wù)器和其他電子設(shè)備訓(xùn)練的閉源模型,且計算操作達到或超過10的26次方計算操作,即便相關(guān)模型在美國以外訓(xùn)練,其出口也要受美國的管制。即使模型訓(xùn)練沒有使用上述受控硬件,但如果是在受控模型權(quán)重基礎(chǔ)上通過微調(diào)、量化等“后訓(xùn)練”(Post-Training)技術(shù)生成的模型權(quán)重,也受到管制。
在模型權(quán)重部分,新規(guī)還增加了一條紅旗警示(Red Flag 28):美國本土運營的IaaS提供商,如果給外國公司在美國的子公司客戶訓(xùn)練10的26次方以上大模型,模型訓(xùn)練和之后交付模型權(quán)重的行為可能導(dǎo)致模型權(quán)重被轉(zhuǎn)移給客戶的外國母公司,從而違反出口管制。這種情況下,IaaS提供商可能被視為“協(xié)助或教唆”違反出口管制。BIS建議,這些美國IaaS服務(wù)商在把生成的模型權(quán)重交付給該客戶時,要先問清楚模型權(quán)重是不是會出口;如果需要申請許可才能交付的,得先拿到許可;或者告訴客戶需要去申請許可才能交付給它。
總的來說,這個新規(guī)和之前了解到的信息比較一致,但還是有三個surprise:
一是竟然對模型權(quán)重也施加了外國直接產(chǎn)品規(guī)則,這對中國公司在海外訓(xùn)練的大模型帶來了直接的合規(guī)風(fēng)險,在海外使用美國GPU不再是一個理想的選擇,從美國的云服務(wù)商和AI公司來說,這也讓他們很難受,不僅合規(guī)負(fù)擔(dān)上升,還要擔(dān)心嚇跑客戶。
二是對美國云服務(wù)商盡調(diào)義務(wù)的要求竟然如此嚴(yán)格,這已經(jīng)超出了此前只是要求美國云“了解你的客戶”(KYC)的力度,終于能理解為什么Oracle的高級副總裁前兩天火氣那么大地發(fā)文抨擊了。
三是對“中間國家”的出口配額,原來聽說要取消,但還是留下來了,只是通過鼓勵這些國家的企業(yè)去申請NVEU、鼓勵這些國家的政府和美國簽國家安全保障協(xié)議,局部做了軟化。這充分說明美國對AI能力被中國獲得的關(guān)切已經(jīng)嚴(yán)重到了不顧他國外交反彈的程度。對中國云的海外擴張來說,這或許是個機會。在的當(dāng)下,任何這種機會都要抓住。
文章僅做學(xué)術(shù)探討和市場研究交流使用,相關(guān)判斷不代表任何公司或機構(gòu)立場,也不構(gòu)成任何投資建議。轉(zhuǎn)載請注明來源。關(guān)于AI出口管制規(guī)則的全文中文版及更多深度分析,參見知識星球。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.