做算力供給方和需求方的“橋梁”,讓國內中小型企業都有算力可用。
作者|甲小姐 小喇叭
過去幾個月,DeepSeek在全球AI生態掀起一股強勢的“鯰魚效應”,大模型領域為期兩年的開閉源之爭終于出現里程碑式轉折,開源路線第一次闖出了逼近閉源SOTA水平的模型,AI平權真正成為了可能。
隨之而來的,是包括應用、AI Infra、算力中心,乃至底層芯片架構在內,整條AI產業鏈既有秩序的打破和重組。
過去一年,中國新建了200余座智算中心,但點亮率不足20%。DeepSeek的出現點亮了大批閑置算力中心,激活了大量需求,卻也讓國產算力生態的核心矛盾暴露在公眾面前——高性價比算力供不應求。
矛盾來自中國算力生態的沉疴。模型基礎設施產業鏈的鏈條是“能源-建設-運營”,其中,建設過熱,卻運營不足,這不僅導致大量算力閑置,更使得整個算力產業鏈的利潤向建設方和能源方集中,運營方持續虧損,進而運營越發不充分,最終形成惡性循環。
汪玉看到了這個核心矛盾背后的機遇。
汪玉是國際電氣與電子工程師協會會士,清華大學電子工程系長聘教授、系主任,清華大學信息科學技術學院副院長,也是無問芯穹的發起人。他曾聯合創立AI芯片公司深鑒科技,后被賽靈思收購,親歷軟硬協同優化的技術攻堅。
2023年5月,他發起無問芯穹。他將無問芯穹定位為“算力運營商”,并立下一個樸實的目標——做算力供給方和需求方的“橋梁”,讓國內中小型企業都有算力可用。而要做到這一點,技術問題只是需要解決的所有問題的冰山一角。
在無問芯穹即將迎來2周年的時刻,甲小姐對話汪玉,聊聊國產算力生態的當下和未來。
1.談態勢:“開源和閉源不需要分出勝負”
甲小姐:2023年到2024年,中國AI市場經歷了爆發、混亂到收斂的過程,先是“百模大戰”,然后逐漸收斂至“大廠+六小虎”的格局,而這一格局在2025年初被DeepSeek打破了,產業秩序再次不確定起來。你近來的核心感受是什么?
汪玉:忙著寫各種報告,給各種人解釋DeepSeek為什么會引發這么大的關注。
甲小姐:你怎么解釋?
汪玉:主要有兩點:
一是開源體系使模型接近閉源模型的SOTA水平,推動了模型平權。DeepSeek的出現有點像當年蘋果的封閉系統對于安卓的感受。安卓出來后,更多人能參與這件事,這是個巨大的變化。我們開玩笑說,DeepSeek就像游戲里開放了裝備商店,所有人都能公平地獲取頂級“武器”。
二是資源受限反而激發了我們的創新精神。當年AMD因資金不足選擇Chiplet(小芯片)路線,后來Chiplet成為共識。現在歐美大廠也開始研究DeepSeek,這很有趣。
甲小姐:小米加步槍也能“鬧革命”。
汪玉:但即使是小米加步槍,總體資源也得comparable(相當的),否則想贏也很難。
甲小姐:去年5月你在甲子引力上提到“今年(2024)并沒有讓我覺得AI的能力有了顯著提升的感受”,這之后你的感受有變化嗎?AI的能力有本質變化嗎?
汪玉:最初的語言模型是基于瞬間直覺反饋,去年o1推出后,模型的多層次推理能力增強,支持長時間思考,這是個重大變化。
但在軟硬件優化方面,尚未看到本質變化。當然還是有變化發生,例如,月之暗面提出PD分離(Prefilling Decoding Disaggregation),下一步可能是計算分離。我覺得只在學校里做從0到1的突破不夠,后續的工程拓展還是需要與工業界有更多合作。
甲小姐:Deepseek發布后,閉源模型還有必要存在嗎?
汪玉:閉源會繼續存在,就像安卓出現后蘋果還在——垂直整合的路線會一直存在,開源和閉源不需要分出勝負。
甲小姐:DeepSeek有可能成為AI時代的安卓嗎?
汪玉:至少現在像。
甲小姐:很多人說DeepSeek像安卓是從開源角度做類比,如果從商業模式或生態版圖來看呢?
汪玉:現在AI的垂直整合優化,從算法到軟件,到芯片,甚至到應用,這幾層之間都是耦合的,但每一層都在波動。目前我們沒有看到某一層在收斂。
甲小姐:是技術路線沒有收斂,還是什么沒有收斂?
汪玉:接口。傳統CPU定義了軟硬件接口,通過指令集明確分層,上層軟件、下層芯片。但在AI時代,不同應用和模型對指令的需求各不相同,沒有明確分工。這也是為什么我們需要把所有人都召集起來。
甲小姐:收斂到最后的形態可能是什么?
汪玉:收斂到最后的形態不一定跟現在的操作系統類似,可能會出現新的東西。是操作系統,還是一個模型或者模型調度的一套agent機制?現在有這么多APP,是因為操作系統決定了上面的APP長這個樣子,但AI可能在未來就一個入口,你跟它交互就好了。
甲小姐:你看好阿里的AI超級框嗎?
汪玉:這都是路上的嘗試。可能底層模型還得進一步變得更厲害,還是挺難的。
甲小姐:在你眼中,DeepSeek對算力生態的影響,利好誰,利空誰?
汪玉:現在有兩個共識,一是DeepSeek把蛋糕做大了;二是模型訓練需求將遠小于推理需求。目前英偉達的芯片在訓練方面表現最佳,但推理芯片的最佳選擇尚不確定。
甲小姐:DeepSeek自身強大的Infra能力是否會對AI Infra廠商帶來沖擊?
汪玉:這是利好。AI Infra人才稀缺,大模型廠商肯定會自己干,但眾多中小企業缺乏Infra能力,我們從day 1就看到了這一需求。
甲小姐:現在的時間點看,Scaling law還有效嗎?
汪玉:互聯網數據不足可能會影響語言模型的訓練效果。但從多模態和與物理世界對齊的角度看,我們還有很多沒做好,還可以按照Scaling Law的邏輯繼續發展,因為目前好數據太少。數據的采集、生成和利用非常關鍵,否則很難有更好的模型。
2.談矛盾:“高性價比的算力供不應求,一定要拉通算大賬
甲小姐:你曾說過大模型的基礎設施建設存在“過度炒作”。如何理解“過度炒作”?
汪玉:算力產業是一整條鏈,能源、建設、運營,之后是小企業成長。
一定要拉通算大賬。理想情況是,每個環節都有利潤。能源、建設、運營都得賺錢,小企業成長,資本方獲利。
但目前建設環節過熱,只注重建設而忽視運營能力的補齊。大部分中小企業客戶沒有直接使用裸金屬的能力,導致很多空置的情況。
甲小姐:2025年中國算力供需的核心矛盾是什么?
汪玉:高性價比算力供不應求。
先看芯片。基礎設施軟件、芯片架構的優化程度和制造成本決定了芯片好不好用。如果性價比不足,用戶就不會優先使用。
再算力中心的建設和使用。
CoreWeave(注:由英偉達支持的云服務初創公司)建了就能賣出去,短短幾年取得了高速增長,是因為現在英偉達芯片供不應求,它優化得好,就會有profit margin(利潤率)。美國雖然能源成本更高,但芯片性價比高,提升了整個算力中心的性價比。
但在中國,芯片本身的性價比還有待提高,而電力指標、建設成本、運營成本以及之后小企業的利潤空間均是單獨計算的。在沒有把所有項拉通算大帳的情況下,運營肯定非常虧。
假設,建一個算力中心,要達到同樣的能力,買英偉達的卡需要1億,國產芯片需要1.5億,那差距的50%誰來買單?消費者不會接受,只能由產業鏈分攤。加上國產芯片的生態不夠完善,對運營平臺能力的要求其實更高,技術投入也更大。
在產業鏈上,建設方和能源方都能賺錢,資本方也能從小企業成長中獲利,但算力運營環節的性價比卻算不過來。如果中國算力產業鏈沒有整體優勢,就會出現供需錯配。
在產業鏈上若想盈利,必須學會算大賬——將資本投入、綠色能源、建設規劃、平臺運營、優質企業招引、本地經濟增長、人才培養等通盤考慮,才能真正理解產業升級的價值。
甲小姐:拋開算賬問題,目前國內芯片的性能表現如何?
汪玉:目前國內芯片和國際先進水平大概差1.5代。國內大多數芯片性能已接近英偉達A系列,最新一代接近H系列,但能否達到B系列(尤其是B200)水平仍不確定。國內主要受限于芯片制造供應鏈,尤其是制程和帶寬。制程受限于代工能力,帶寬受限于封裝技術。如果國內供應鏈能突破瓶頸,吸收臺積電的先進制程和CoWoS等先進封裝技術,趕上英偉達是有可能的。
甲小姐:在整個算力價值鏈中,Infra的比重有多大?
汪玉:我沒有具體算過,但Infra肯定有價值,機會在于把所有芯片用起來,這能產生巨大的社會價值。中國的問題是,各種異構芯片分散在不同地方,歸不同人所有,中小B企業找不到合適算力。我們把“橋梁”搭起來,本身就很有價值。
甲小姐:算力之外,模型也在降本。比如DeepSeek模型一輪訓練的成本僅560萬美元,把模型訓練的成本打下來;阿里通義千問推出的推理模型QwQ-32B,消費級顯卡也能部署,也大大降低了部署和應用高性能模型的成本。這是否暫時緩解了中國對高性能GPU的燃眉之急?
汪玉:訓練上看,Scaling Law還是有效的,基礎模型訓練對高性能算力的需求不僅依然存在,還需要系統優化能力進一步提高硬件的利用效率。推理上看,推理時計算疊加應用生態起來,市場上對推理算力還有百倍以上的市場需求。全盤來看,我們還是處于算力不足的大環境下。
3.談目標:“繞過或重現CUDA都不是本質”
甲小姐:有知情人士透露,2024年,中國新建成了200多個智算中心,點亮率卻不足20%。但DeepSeek點亮了很多智算中心。事實是這樣嗎?
汪玉:確實有一些智算中心開始運營了,但肯定在虧損。歸根結底還是算賬問題。假設建設算力中心時花了7萬元購買了很多顯卡,但現在市場價已經降至5-6萬元,那算力中心就是賣多少虧多少,不賣虧得更慘。對于性能要求不高的客戶可能會用這些算力,但目前這類客戶數量還不夠多。
甲小姐:整體上看國內的算力需求大致有幾類,分別怎么解決?
汪玉:絕大多數中小B和所有C端需求都在用公有云,已上市的公有云廠商基本上股價都在漲。第二類是很多政府建的算力中心,主要問題在于沒有人做運營,這是我們要做的事。
甲小姐:不少人都在debate,用性價比高的進口卡能賺錢,用國產卡會虧,那該怎么辦?
汪玉:長遠來看,我們希望建設“國產模型-國產芯片-國產系統”的全國產閉環。國家正在討論是否建立一個從應用到算法、軟件系統和芯片的聯盟,讓企業充分利用現有芯片。只有用得越多,才能更快改進,性價比才會提升。
甲小姐:繞過CUDA是國產算力生態的核心目標嗎?
汪玉:現在有兩種路徑,一種是CUDA兼容,比如沐曦、摩爾線程;一種是重寫指令集,比如華為、寒武紀。其實CUDA只是一個program的一個model,繞不繞過它,或是否要重做CUDA并不是本質問題。只要大家能夠約定好某些通用接口,例如在通信協議和底層重要算子上達成一致,能把芯片用起來,這就夠了。
甲小姐:會出現一個強勢企業主導這個約定嗎?
汪玉:現在好像沒有強勢大企業,這種割裂的格局可能還會持續一段時間。
甲小姐:目前各家大廠都在做生態,生態和生態之間會形成什么樣的關系?
汪玉:我們現在干的事情就是把不同生態間的壁壘抹掉,讓大家接入統一的訓練和推理接口,因為絕大多數人并不關心底層到底長什么樣,只要能調用就好了。
4.談模式:“我們在做各種‘盒子’,用戶不需要知道盒子里是什么”
甲小姐:無問芯穹的出發點是做AI Infra,但現在已經涉足了算力租賃、大模型云平臺、一體機、芯片(如LPU)設計,以及端側模型優化等,你們似乎什么都做?
汪玉:其實我們是在做不同規模的“盒子”——超大盒子、中等盒子和小盒子。
超大盒子是云上的訓練或推理集群,中等盒子是邊緣側的比如一體機,小盒子是智能終端。用戶不需要感受到盒子內部是什么,就能用上高性價比的算力。
大盒子本質上是在異構、異域、異屬硬件上搭建的云平臺。搭建這樣的云平臺非常復雜,需要涵蓋IaaS、PaaS以及一些上層工具,因此看起來我們在做很多事情。
甲小姐:你們內部如何決定做什么,不做什么?
汪玉:明確要先做好大盒子,云還是很重要。
甲小姐:你們怎么定義“一朵云”?
汪玉:過往大家往往認為云就是重資產投入,但我們看來云的核心能力其實在于平臺上的服務能力閉環,如何把建設的算力資源讓千行百業的客戶們用起來,這是我們的使命。
甲小姐:你們具體賺誰的錢?
汪玉:大盒子的商業模式主要就是通過算力運營和提供技術服務來獲取商業利潤,客戶有標準化需求也要定制化能力,我們的核心優勢就在于過硬的技術以及項目運營交付的能力,解決不同需求時,對技術和功能的優先級有不同要求。中等盒子和小盒子的輸入和輸出定義很明確,背后就是技術邏輯;大盒子的輸入輸出都不明確,每個人的訴求都不同,需要滿足很多功能化的要求。
甲小姐:DeepSeek一體機各家都在推,一體機是不是過熱了?
汪玉:還好。應用爆發后,硬件要跟上,大家總得有能用的東西。許多企業因數據安全問題需要私有化部署,DeepSeek一體機肯定是要做的。只不過中國的競爭永遠都相對更激烈。
部分企業推出的DeepSeek一體機 制圖:甲子光年
甲小姐:據甲子光年不完全統計,現在已經有60多家公司推出一體機,大家有定義清楚一體機嗎?
汪玉:就像大家最開始建了很多算力中心一樣,好用不好用自己知道,過一段時間就會慢慢收斂了,收斂是需要時間的。
甲小姐:你們做的LPU現在是什么進展?LPU最終會代替GPU嗎?
汪玉:已經有FPGA的版本,芯片仿真也做了,效果很不錯,但流片可能需要上億級投入。我們不知道未來機器人芯片的具體形態。目前大家普遍使用GPU是因為通用性強,未來一旦需求收斂,可能會轉向更簡單直接的設計用于訓練和推理。
甲小姐:你們自己囤卡嗎?
汪玉:我們買過一些,但很少。囤卡是重資產運營邏輯,我們不希望這樣。很多人問我們和Coreweave的區別,我說Coreweave是自己own算力,我們是利用算力。
甲小姐:去年12月你們發布了一款全模態的端側理解模型。端側AI雖然大勢所趨,但當模型參數量不斷增長,端側設備是否注定只能做“殘血版AI”?
汪玉:端模型被調侃成“殘血版AI”,主要還是從純算法視角去評價。但終端用戶的感知是個整體的事,它需要先結合底層硬件、中間的推理軟件,然后才是模型,最后還涉及產品定義、交互效果。端側AI關鍵在于如何更好地和云上AI配合使用。
甲小姐:今天無問芯穹的定位還是算力運營商嗎?
汪玉:現階段肯定還是。云上還是第一步,一定要做扎實。
甲小姐:運營商的壁壘是技術突破還是資源整合?
汪玉:都是壁壘。算力中心項目對政府而言類似招商引資,我們不僅要提供技術。部分企業對技術理解不足,不知道做一朵云有多難,政府也很難判斷,所以有時無問芯穹的角色很像一個國家算力網建設的智庫。
甲小姐:你們和地方政府具體的合作模式是什么?
汪玉:每個政府需求不同,國內算力分布不均,大多集中在不發達地區,少數建在發達城市的算力可能用不起來。我們需要將這些算力聯網,幫政府搭建平臺,幫助政府更好的落實算力政策,支持當地產業升級。
甲小姐:你們現在的商業模式是什么?
汪玉:云服務本身就是很成熟的商業模式,我們的區別僅僅是不持有資產本身,但要提供的技術能力是一樣的。
甲小姐:未來各業務板塊在無問芯穹的比重如何?
汪玉:我們還是非常聚焦在如何把“一朵云”做好,同時憑借公有云經驗,在私有云部署上能提供更好的服務,積累更多客戶。端側是公司業務增長的第二曲線,做“盒子”的邏輯不會變。
5.談創業:“和上次很像,有一部分想得很清楚,有一部分需要實踐迭代”
甲小姐:你怎么向投資人解釋你的商業計劃?
汪玉:AI創業存在不確定性,但我們有確定的優勢。我們的技術能力處于第一梯隊,資源整合能力在小公司中是最強的,資金儲備也足夠支撐短期發展。現在我們更關注能否整合中國算力,服務好重點區域,這已非常不容易了。
甲小姐:你的上一家公司深鑒科技最終以被收購為結局,你有設想過無問芯穹的結局嗎?
汪玉:我還是挺希望能獨立的,因為也不缺錢(笑)。賣掉公司的真正挑戰是團隊方向可能改變,這關乎共同使命和愿景。我們希望讓企業都有算力可用。現在絕大多數人已經能理解,如果基礎設施(Infra)做得好,不僅能節省成本,還能提升模型本身的能力。我希望我們能為這個目標努力很久,別人做我怕堅持不住,我會努力讓這個目標堅持下去。
甲小姐:CEO夏立雪曾對媒體表示,無問芯穹的目標是讓大模型落地成本下降10000倍。這要如何實現?
汪玉:10000倍的下降肯定會是行業共同努力的結果,包括應用、算法、軟件和芯片制造各個環節。我們在這些領域確實有技術貢獻,但不可能獨立完成。
甲小姐:通俗地講,成本下降的方法是什么?
汪玉:我最近開了門課,叫基礎人工智能軟硬件核心技術討論,有一個公式:
按照這個公式:計算量和參數量要降低,利用率要提升。
算法層干的是計算量、參數量和利用率;芯片層干的是算力和帶寬;能耗是能源建設的問題;硬件價格跟制造工藝相關——從這個公式就可以看到成本下降要多方面的努力。
甲小姐:無問芯穹今年的目標是什么?
汪玉:要focus,用“一朵云”解決問題。當然,過程中可能會遇到各種技術需求和工程化問題。
甲小姐:這次創業你的心態有什么變化嗎?
汪玉:這次平和一點。我喜歡做創新的事,這次和上次很像,有一部分想得很清楚,還有一部分需要實踐迭代。
6.談趨勢:“物理知識的參與必不可少”
甲小姐:今年具身智能、物理AI的概念很火,你怎么看這些熱度?
汪玉:這都是一種趨勢預判。我們預計AI服務將呈現兩種形態:純數字空間的形態和與物理世界互動的形態。AI要與物理世界互動,就需要物理知識作為支撐,目前尚未出現超越現有物理公式的AI能力。
甲小姐:有流派認為,一個真正的超級大腦能自我學習,不需要依賴太多物理公式。你怎么看這一派?
汪玉:現在具身智能有的依賴現實數據,也依賴模擬數據。模擬數據就會把物理公式往里懟,相當于生成一些數據來訓練模型。目前來看,物理知識的參與是必不可少的,例如擰螺絲的力度這類細節,對模型訓練來說是非常復雜且關鍵的。
甲小姐:物理AI的平臺最終會以什么形態出現?
汪玉:具身智能目前有VLA(Vision Language Action)這種形態,它描述了從感知到推理再到執行的操作流程。不過,VLA可能還會繼續演進,但無論如何,未來都會更注重與物理世界的交互,需要具備感知和執行能力,這與傳統訓練方式不同。因此,電子領域可能會在具身智能方面發揮更大作用。因為電子更偏物理,計算機則偏數學。
甲小姐:你之前提到會重點關注醫療和機器人方向的數據應用價值,為什么是這兩個領域?
汪玉:從電子系視角看,未來電子系將連接物理世界與數字世界,涵蓋感知、傳輸、計算和反饋。數字化是智能化的基礎,需要依托載體。我們正思考未來的核心載體,并從未來十年到二十年的情境倒推今天應做什么。
從基礎設施角度看,通信基礎設施尤其是衛星通信至關重要。我們系有人嘗試用八顆衛星覆蓋全球,為海洋、低空等場景提供通信支持;同時,算力基礎設施也需要升級,未來醫療、能源、城市模擬等各領域都需要算力支持。
此外,無人化趨勢下,未來機器人的數量可能會達到上億量級,而目前機器人的產量還處于千、萬量級,彌補這4-5個數量級的差距需要技術推動。
甲小姐:如果AI在未來出現了新的技術路線,進入AI3.0時代,AI Infra的角色會受到挑戰嗎?你們的路線會受到影響嗎?
汪玉:我不清楚,如果AI3.0不需要那么多算力,那就不需要基礎設施了(笑)。但目前似乎有一種趨勢:從出現到成為產業引領者通常需要3到5年。這一波科技公司對學術前沿把控較積極,都在關注新變化,因為不確定性是最大挑戰。所以大家都在寫論文,目的是交流,至少要清楚前沿在哪里。
甲小姐:現在人工智能出現了兩條路:AGI(通用人工智能),通過提升單體智能逼近甚至超越人類決策能力;MoA(多智能體協作),超級協調者指揮多個Agent協同作戰。哪個是人工智能的終局?還有其他可能嗎?
汪玉:現在MoA(多智能體協作)剛開始,趨勢可能向上;而MoE(混合專家模型)趨勢較平緩,所以MoA更受關注。
唐杰之前解讀OpenAI時,認為OpenAI的成功在于組織能力,這是最高層次的能力。無論是人機共處還是機器間的協作,都離不開協同。從機器角度看,單體能力突破受限于物理限制,因此合作和協同大概率是必然趨勢。
甲小姐:我印象很深刻的是,去年你參與甲子引力,我最后一個問題是,如果有一個預言家可以告訴你們十年之后一個問題的正確答案,你最好奇的問題是什么?你的答案是:“人可以長生嗎?”為什么是這個問題?
汪玉:人活一輩子都希望能多做一些有趣的事,我們現在做算力和具身至少能為人衰老后的境遇提供支撐。
甲小姐:你覺得人可以長生嗎?
汪玉:很難,120歲是有可能的。
|甲小姐對話系列回顧|
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.