做算力供給方和需求方的“橋梁”,讓國內(nèi)中小型企業(yè)都有算力可用。
作者|甲小姐 小喇叭
過去幾個(gè)月,DeepSeek在全球AI生態(tài)掀起一股強(qiáng)勢的“鯰魚效應(yīng)”,大模型領(lǐng)域?yàn)槠趦赡甑拈_閉源之爭終于出現(xiàn)里程碑式轉(zhuǎn)折,開源路線第一次闖出了逼近閉源SOTA水平的模型,AI平權(quán)真正成為了可能。
隨之而來的,是包括應(yīng)用、AI Infra、算力中心,乃至底層芯片架構(gòu)在內(nèi),整條AI產(chǎn)業(yè)鏈既有秩序的打破和重組。
過去一年,中國新建了200余座智算中心,但點(diǎn)亮率不足20%。DeepSeek的出現(xiàn)點(diǎn)亮了大批閑置算力中心,激活了大量需求,卻也讓國產(chǎn)算力生態(tài)的核心矛盾暴露在公眾面前——高性價(jià)比算力供不應(yīng)求。
矛盾來自中國算力生態(tài)的沉疴。模型基礎(chǔ)設(shè)施產(chǎn)業(yè)鏈的鏈條是“能源-建設(shè)-運(yùn)營”,其中,建設(shè)過熱,卻運(yùn)營不足,這不僅導(dǎo)致大量算力閑置,更使得整個(gè)算力產(chǎn)業(yè)鏈的利潤向建設(shè)方和能源方集中,運(yùn)營方持續(xù)虧損,進(jìn)而運(yùn)營越發(fā)不充分,最終形成惡性循環(huán)。
汪玉看到了這個(gè)核心矛盾背后的機(jī)遇。
汪玉是國際電氣與電子工程師協(xié)會會士,清華大學(xué)電子工程系長聘教授、系主任,清華大學(xué)信息科學(xué)技術(shù)學(xué)院副院長,也是無問芯穹的發(fā)起人。他曾聯(lián)合創(chuàng)立AI芯片公司深鑒科技,后被賽靈思收購,親歷軟硬協(xié)同優(yōu)化的技術(shù)攻堅(jiān)。
2023年5月,他發(fā)起無問芯穹。他將無問芯穹定位為“算力運(yùn)營商”,并立下一個(gè)樸實(shí)的目標(biāo)——做算力供給方和需求方的“橋梁”,讓國內(nèi)中小型企業(yè)都有算力可用。而要做到這一點(diǎn),技術(shù)問題只是需要解決的所有問題的冰山一角。
在無問芯穹即將迎來2周年的時(shí)刻,甲小姐對話汪玉,聊聊國產(chǎn)算力生態(tài)的當(dāng)下和未來。
1.談態(tài)勢:“開源和閉源不需要分出勝負(fù)”
甲小姐:2023年到2024年,中國AI市場經(jīng)歷了爆發(fā)、混亂到收斂的過程,先是“百模大戰(zhàn)”,然后逐漸收斂至“大廠+六小虎”的格局,而這一格局在2025年初被DeepSeek打破了,產(chǎn)業(yè)秩序再次不確定起來。你近來的核心感受是什么?
汪玉:忙著寫各種報(bào)告,給各種人解釋DeepSeek為什么會引發(fā)這么大的關(guān)注。
甲小姐:你怎么解釋?
汪玉:主要有兩點(diǎn):
一是開源體系使模型接近閉源模型的SOTA水平,推動(dòng)了模型平權(quán)。DeepSeek的出現(xiàn)有點(diǎn)像當(dāng)年蘋果的封閉系統(tǒng)對于安卓的感受。安卓出來后,更多人能參與這件事,這是個(gè)巨大的變化。我們開玩笑說,DeepSeek就像游戲里開放了裝備商店,所有人都能公平地獲取頂級“武器”。
二是資源受限反而激發(fā)了我們的創(chuàng)新精神。當(dāng)年AMD因資金不足選擇Chiplet(小芯片)路線,后來Chiplet成為共識?,F(xiàn)在歐美大廠也開始研究DeepSeek,這很有趣。
甲小姐:小米加步槍也能“鬧革命”。
汪玉:但即使是小米加步槍,總體資源也得comparable(相當(dāng)?shù)模?,否則想贏也很難。
甲小姐:去年5月你在甲子引力上提到“今年(2024)并沒有讓我覺得AI的能力有了顯著提升的感受”,這之后你的感受有變化嗎?AI的能力有本質(zhì)變化嗎?
汪玉:最初的語言模型是基于瞬間直覺反饋,去年o1推出后,模型的多層次推理能力增強(qiáng),支持長時(shí)間思考,這是個(gè)重大變化。
但在軟硬件優(yōu)化方面,尚未看到本質(zhì)變化。當(dāng)然還是有變化發(fā)生,例如,月之暗面提出PD分離(Prefilling Decoding Disaggregation),下一步可能是計(jì)算分離。我覺得只在學(xué)校里做從0到1的突破不夠,后續(xù)的工程拓展還是需要與工業(yè)界有更多合作。
甲小姐:Deepseek發(fā)布后,閉源模型還有必要存在嗎?
汪玉:閉源會繼續(xù)存在,就像安卓出現(xiàn)后蘋果還在——垂直整合的路線會一直存在,開源和閉源不需要分出勝負(fù)。
甲小姐:DeepSeek有可能成為AI時(shí)代的安卓嗎?
汪玉:至少現(xiàn)在像。
甲小姐:很多人說DeepSeek像安卓是從開源角度做類比,如果從商業(yè)模式或生態(tài)版圖來看呢?
汪玉:現(xiàn)在AI的垂直整合優(yōu)化,從算法到軟件,到芯片,甚至到應(yīng)用,這幾層之間都是耦合的,但每一層都在波動(dòng)。目前我們沒有看到某一層在收斂。
甲小姐:是技術(shù)路線沒有收斂,還是什么沒有收斂?
汪玉:接口。傳統(tǒng)CPU定義了軟硬件接口,通過指令集明確分層,上層軟件、下層芯片。但在AI時(shí)代,不同應(yīng)用和模型對指令的需求各不相同,沒有明確分工。這也是為什么我們需要把所有人都召集起來。
甲小姐:收斂到最后的形態(tài)可能是什么?
汪玉:收斂到最后的形態(tài)不一定跟現(xiàn)在的操作系統(tǒng)類似,可能會出現(xiàn)新的東西。是操作系統(tǒng),還是一個(gè)模型或者模型調(diào)度的一套agent機(jī)制?現(xiàn)在有這么多APP,是因?yàn)椴僮飨到y(tǒng)決定了上面的APP長這個(gè)樣子,但AI可能在未來就一個(gè)入口,你跟它交互就好了。
甲小姐:你看好阿里的AI超級框嗎?
汪玉:這都是路上的嘗試??赡艿讓幽P瓦€得進(jìn)一步變得更厲害,還是挺難的。
甲小姐:在你眼中,DeepSeek對算力生態(tài)的影響,利好誰,利空誰?
汪玉:現(xiàn)在有兩個(gè)共識,一是DeepSeek把蛋糕做大了;二是模型訓(xùn)練需求將遠(yuǎn)小于推理需求。目前英偉達(dá)的芯片在訓(xùn)練方面表現(xiàn)最佳,但推理芯片的最佳選擇尚不確定。
甲小姐:DeepSeek自身強(qiáng)大的Infra能力是否會對AI Infra廠商帶來沖擊?
汪玉:這是利好。AI Infra人才稀缺,大模型廠商肯定會自己干,但眾多中小企業(yè)缺乏Infra能力,我們從day 1就看到了這一需求。
甲小姐:現(xiàn)在的時(shí)間點(diǎn)看,Scaling law還有效嗎?
汪玉:互聯(lián)網(wǎng)數(shù)據(jù)不足可能會影響語言模型的訓(xùn)練效果。但從多模態(tài)和與物理世界對齊的角度看,我們還有很多沒做好,還可以按照Scaling Law的邏輯繼續(xù)發(fā)展,因?yàn)槟壳昂脭?shù)據(jù)太少。數(shù)據(jù)的采集、生成和利用非常關(guān)鍵,否則很難有更好的模型。
2.談矛盾:“高性價(jià)比的算力供不應(yīng)求,一定要拉通算大賬
甲小姐:你曾說過大模型的基礎(chǔ)設(shè)施建設(shè)存在“過度炒作”。如何理解“過度炒作”?
汪玉:算力產(chǎn)業(yè)是一整條鏈,能源、建設(shè)、運(yùn)營,之后是小企業(yè)成長。
一定要拉通算大賬。理想情況是,每個(gè)環(huán)節(jié)都有利潤。能源、建設(shè)、運(yùn)營都得賺錢,小企業(yè)成長,資本方獲利。
但目前建設(shè)環(huán)節(jié)過熱,只注重建設(shè)而忽視運(yùn)營能力的補(bǔ)齊。大部分中小企業(yè)客戶沒有直接使用裸金屬的能力,導(dǎo)致很多空置的情況。
甲小姐:2025年中國算力供需的核心矛盾是什么?
汪玉:高性價(jià)比算力供不應(yīng)求。
先看芯片?;A(chǔ)設(shè)施軟件、芯片架構(gòu)的優(yōu)化程度和制造成本決定了芯片好不好用。如果性價(jià)比不足,用戶就不會優(yōu)先使用。
再算力中心的建設(shè)和使用。
CoreWeave(注:由英偉達(dá)支持的云服務(wù)初創(chuàng)公司)建了就能賣出去,短短幾年取得了高速增長,是因?yàn)楝F(xiàn)在英偉達(dá)芯片供不應(yīng)求,它優(yōu)化得好,就會有profit margin(利潤率)。美國雖然能源成本更高,但芯片性價(jià)比高,提升了整個(gè)算力中心的性價(jià)比。
但在中國,芯片本身的性價(jià)比還有待提高,而電力指標(biāo)、建設(shè)成本、運(yùn)營成本以及之后小企業(yè)的利潤空間均是單獨(dú)計(jì)算的。在沒有把所有項(xiàng)拉通算大帳的情況下,運(yùn)營肯定非常虧。
假設(shè),建一個(gè)算力中心,要達(dá)到同樣的能力,買英偉達(dá)的卡需要1億,國產(chǎn)芯片需要1.5億,那差距的50%誰來買單?消費(fèi)者不會接受,只能由產(chǎn)業(yè)鏈分?jǐn)偂?/strong>加上國產(chǎn)芯片的生態(tài)不夠完善,對運(yùn)營平臺能力的要求其實(shí)更高,技術(shù)投入也更大。
在產(chǎn)業(yè)鏈上,建設(shè)方和能源方都能賺錢,資本方也能從小企業(yè)成長中獲利,但算力運(yùn)營環(huán)節(jié)的性價(jià)比卻算不過來。如果中國算力產(chǎn)業(yè)鏈沒有整體優(yōu)勢,就會出現(xiàn)供需錯(cuò)配。
在產(chǎn)業(yè)鏈上若想盈利,必須學(xué)會算大賬——將資本投入、綠色能源、建設(shè)規(guī)劃、平臺運(yùn)營、優(yōu)質(zhì)企業(yè)招引、本地經(jīng)濟(jì)增長、人才培養(yǎng)等通盤考慮,才能真正理解產(chǎn)業(yè)升級的價(jià)值。
甲小姐:拋開算賬問題,目前國內(nèi)芯片的性能表現(xiàn)如何?
汪玉:目前國內(nèi)芯片和國際先進(jìn)水平大概差1.5代。國內(nèi)大多數(shù)芯片性能已接近英偉達(dá)A系列,最新一代接近H系列,但能否達(dá)到B系列(尤其是B200)水平仍不確定。國內(nèi)主要受限于芯片制造供應(yīng)鏈,尤其是制程和帶寬。制程受限于代工能力,帶寬受限于封裝技術(shù)。如果國內(nèi)供應(yīng)鏈能突破瓶頸,吸收臺積電的先進(jìn)制程和CoWoS等先進(jìn)封裝技術(shù),趕上英偉達(dá)是有可能的。
甲小姐:在整個(gè)算力價(jià)值鏈中,Infra的比重有多大?
汪玉:我沒有具體算過,但I(xiàn)nfra肯定有價(jià)值,機(jī)會在于把所有芯片用起來,這能產(chǎn)生巨大的社會價(jià)值。中國的問題是,各種異構(gòu)芯片分散在不同地方,歸不同人所有,中小B企業(yè)找不到合適算力。我們把“橋梁”搭起來,本身就很有價(jià)值。
甲小姐:算力之外,模型也在降本。比如DeepSeek模型一輪訓(xùn)練的成本僅560萬美元,把模型訓(xùn)練的成本打下來;阿里通義千問推出的推理模型QwQ-32B,消費(fèi)級顯卡也能部署,也大大降低了部署和應(yīng)用高性能模型的成本。這是否暫時(shí)緩解了中國對高性能GPU的燃眉之急?
汪玉:訓(xùn)練上看,Scaling Law還是有效的,基礎(chǔ)模型訓(xùn)練對高性能算力的需求不僅依然存在,還需要系統(tǒng)優(yōu)化能力進(jìn)一步提高硬件的利用效率。推理上看,推理時(shí)計(jì)算疊加應(yīng)用生態(tài)起來,市場上對推理算力還有百倍以上的市場需求。全盤來看,我們還是處于算力不足的大環(huán)境下。
3.談目標(biāo):“繞過或重現(xiàn)CUDA都不是本質(zhì)”
甲小姐:有知情人士透露,2024年,中國新建成了200多個(gè)智算中心,點(diǎn)亮率卻不足20%。但DeepSeek點(diǎn)亮了很多智算中心。事實(shí)是這樣嗎?
汪玉:確實(shí)有一些智算中心開始運(yùn)營了,但肯定在虧損。歸根結(jié)底還是算賬問題。假設(shè)建設(shè)算力中心時(shí)花了7萬元購買了很多顯卡,但現(xiàn)在市場價(jià)已經(jīng)降至5-6萬元,那算力中心就是賣多少虧多少,不賣虧得更慘。對于性能要求不高的客戶可能會用這些算力,但目前這類客戶數(shù)量還不夠多。
甲小姐:整體上看國內(nèi)的算力需求大致有幾類,分別怎么解決?
汪玉:絕大多數(shù)中小B和所有C端需求都在用公有云,已上市的公有云廠商基本上股價(jià)都在漲。第二類是很多政府建的算力中心,主要問題在于沒有人做運(yùn)營,這是我們要做的事。
甲小姐:不少人都在debate,用性價(jià)比高的進(jìn)口卡能賺錢,用國產(chǎn)卡會虧,那該怎么辦?
汪玉:長遠(yuǎn)來看,我們希望建設(shè)“國產(chǎn)模型-國產(chǎn)芯片-國產(chǎn)系統(tǒng)”的全國產(chǎn)閉環(huán)。國家正在討論是否建立一個(gè)從應(yīng)用到算法、軟件系統(tǒng)和芯片的聯(lián)盟,讓企業(yè)充分利用現(xiàn)有芯片。只有用得越多,才能更快改進(jìn),性價(jià)比才會提升。
甲小姐:繞過CUDA是國產(chǎn)算力生態(tài)的核心目標(biāo)嗎?
汪玉:現(xiàn)在有兩種路徑,一種是CUDA兼容,比如沐曦、摩爾線程;一種是重寫指令集,比如華為、寒武紀(jì)。其實(shí)CUDA只是一個(gè)program的一個(gè)model,繞不繞過它,或是否要重做CUDA并不是本質(zhì)問題。只要大家能夠約定好某些通用接口,例如在通信協(xié)議和底層重要算子上達(dá)成一致,能把芯片用起來,這就夠了。
甲小姐:會出現(xiàn)一個(gè)強(qiáng)勢企業(yè)主導(dǎo)這個(gè)約定嗎?
汪玉:現(xiàn)在好像沒有強(qiáng)勢大企業(yè),這種割裂的格局可能還會持續(xù)一段時(shí)間。
甲小姐:目前各家大廠都在做生態(tài),生態(tài)和生態(tài)之間會形成什么樣的關(guān)系?
汪玉:我們現(xiàn)在干的事情就是把不同生態(tài)間的壁壘抹掉,讓大家接入統(tǒng)一的訓(xùn)練和推理接口,因?yàn)榻^大多數(shù)人并不關(guān)心底層到底長什么樣,只要能調(diào)用就好了。
4.談模式:“我們在做各種‘盒子’,用戶不需要知道盒子里是什么”
甲小姐:無問芯穹的出發(fā)點(diǎn)是做AI Infra,但現(xiàn)在已經(jīng)涉足了算力租賃、大模型云平臺、一體機(jī)、芯片(如LPU)設(shè)計(jì),以及端側(cè)模型優(yōu)化等,你們似乎什么都做?
汪玉:其實(shí)我們是在做不同規(guī)模的“盒子”——超大盒子、中等盒子和小盒子。
超大盒子是云上的訓(xùn)練或推理集群,中等盒子是邊緣側(cè)的比如一體機(jī),小盒子是智能終端。用戶不需要感受到盒子內(nèi)部是什么,就能用上高性價(jià)比的算力。
大盒子本質(zhì)上是在異構(gòu)、異域、異屬硬件上搭建的云平臺。搭建這樣的云平臺非常復(fù)雜,需要涵蓋IaaS、PaaS以及一些上層工具,因此看起來我們在做很多事情。
甲小姐:你們內(nèi)部如何決定做什么,不做什么?
汪玉:明確要先做好大盒子,云還是很重要。
甲小姐:你們怎么定義“一朵云”?
汪玉:過往大家往往認(rèn)為云就是重資產(chǎn)投入,但我們看來云的核心能力其實(shí)在于平臺上的服務(wù)能力閉環(huán),如何把建設(shè)的算力資源讓千行百業(yè)的客戶們用起來,這是我們的使命。
甲小姐:你們具體賺誰的錢?
汪玉:大盒子的商業(yè)模式主要就是通過算力運(yùn)營和提供技術(shù)服務(wù)來獲取商業(yè)利潤,客戶有標(biāo)準(zhǔn)化需求也要定制化能力,我們的核心優(yōu)勢就在于過硬的技術(shù)以及項(xiàng)目運(yùn)營交付的能力,解決不同需求時(shí),對技術(shù)和功能的優(yōu)先級有不同要求。中等盒子和小盒子的輸入和輸出定義很明確,背后就是技術(shù)邏輯;大盒子的輸入輸出都不明確,每個(gè)人的訴求都不同,需要滿足很多功能化的要求。
甲小姐:DeepSeek一體機(jī)各家都在推,一體機(jī)是不是過熱了?
汪玉:還好。應(yīng)用爆發(fā)后,硬件要跟上,大家總得有能用的東西。許多企業(yè)因數(shù)據(jù)安全問題需要私有化部署,DeepSeek一體機(jī)肯定是要做的。只不過中國的競爭永遠(yuǎn)都相對更激烈。
部分企業(yè)推出的DeepSeek一體機(jī) 制圖:甲子光年
甲小姐:據(jù)甲子光年不完全統(tǒng)計(jì),現(xiàn)在已經(jīng)有60多家公司推出一體機(jī),大家有定義清楚一體機(jī)嗎?
汪玉:就像大家最開始建了很多算力中心一樣,好用不好用自己知道,過一段時(shí)間就會慢慢收斂了,收斂是需要時(shí)間的。
甲小姐:你們做的LPU現(xiàn)在是什么進(jìn)展?LPU最終會代替GPU嗎?
汪玉:已經(jīng)有FPGA的版本,芯片仿真也做了,效果很不錯(cuò),但流片可能需要上億級投入。我們不知道未來機(jī)器人芯片的具體形態(tài)。目前大家普遍使用GPU是因?yàn)橥ㄓ眯詮?qiáng),未來一旦需求收斂,可能會轉(zhuǎn)向更簡單直接的設(shè)計(jì)用于訓(xùn)練和推理。
甲小姐:你們自己囤卡嗎?
汪玉:我們買過一些,但很少。囤卡是重資產(chǎn)運(yùn)營邏輯,我們不希望這樣。很多人問我們和Coreweave的區(qū)別,我說Coreweave是自己own算力,我們是利用算力。
甲小姐:去年12月你們發(fā)布了一款全模態(tài)的端側(cè)理解模型。端側(cè)AI雖然大勢所趨,但當(dāng)模型參數(shù)量不斷增長,端側(cè)設(shè)備是否注定只能做“殘血版AI”?
汪玉:端模型被調(diào)侃成“殘血版AI”,主要還是從純算法視角去評價(jià)。但終端用戶的感知是個(gè)整體的事,它需要先結(jié)合底層硬件、中間的推理軟件,然后才是模型,最后還涉及產(chǎn)品定義、交互效果。端側(cè)AI關(guān)鍵在于如何更好地和云上AI配合使用。
甲小姐:今天無問芯穹的定位還是算力運(yùn)營商嗎?
汪玉:現(xiàn)階段肯定還是。云上還是第一步,一定要做扎實(shí)。
甲小姐:運(yùn)營商的壁壘是技術(shù)突破還是資源整合?
汪玉:都是壁壘。算力中心項(xiàng)目對政府而言類似招商引資,我們不僅要提供技術(shù)。部分企業(yè)對技術(shù)理解不足,不知道做一朵云有多難,政府也很難判斷,所以有時(shí)無問芯穹的角色很像一個(gè)國家算力網(wǎng)建設(shè)的智庫。
甲小姐:你們和地方政府具體的合作模式是什么?
汪玉:每個(gè)政府需求不同,國內(nèi)算力分布不均,大多集中在不發(fā)達(dá)地區(qū),少數(shù)建在發(fā)達(dá)城市的算力可能用不起來。我們需要將這些算力聯(lián)網(wǎng),幫政府搭建平臺,幫助政府更好的落實(shí)算力政策,支持當(dāng)?shù)禺a(chǎn)業(yè)升級。
甲小姐:你們現(xiàn)在的商業(yè)模式是什么?
汪玉:云服務(wù)本身就是很成熟的商業(yè)模式,我們的區(qū)別僅僅是不持有資產(chǎn)本身,但要提供的技術(shù)能力是一樣的。
甲小姐:未來各業(yè)務(wù)板塊在無問芯穹的比重如何?
汪玉:我們還是非常聚焦在如何把“一朵云”做好,同時(shí)憑借公有云經(jīng)驗(yàn),在私有云部署上能提供更好的服務(wù),積累更多客戶。端側(cè)是公司業(yè)務(wù)增長的第二曲線,做“盒子”的邏輯不會變。
5.談創(chuàng)業(yè):“和上次很像,有一部分想得很清楚,有一部分需要實(shí)踐迭代”
甲小姐:你怎么向投資人解釋你的商業(yè)計(jì)劃?
汪玉:AI創(chuàng)業(yè)存在不確定性,但我們有確定的優(yōu)勢。我們的技術(shù)能力處于第一梯隊(duì),資源整合能力在小公司中是最強(qiáng)的,資金儲備也足夠支撐短期發(fā)展。現(xiàn)在我們更關(guān)注能否整合中國算力,服務(wù)好重點(diǎn)區(qū)域,這已非常不容易了。
甲小姐:你的上一家公司深鑒科技最終以被收購為結(jié)局,你有設(shè)想過無問芯穹的結(jié)局嗎?
汪玉:我還是挺希望能獨(dú)立的,因?yàn)橐膊蝗卞X(笑)。賣掉公司的真正挑戰(zhàn)是團(tuán)隊(duì)方向可能改變,這關(guān)乎共同使命和愿景。我們希望讓企業(yè)都有算力可用。現(xiàn)在絕大多數(shù)人已經(jīng)能理解,如果基礎(chǔ)設(shè)施(Infra)做得好,不僅能節(jié)省成本,還能提升模型本身的能力。我希望我們能為這個(gè)目標(biāo)努力很久,別人做我怕堅(jiān)持不住,我會努力讓這個(gè)目標(biāo)堅(jiān)持下去。
甲小姐:CEO夏立雪曾對媒體表示,無問芯穹的目標(biāo)是讓大模型落地成本下降10000倍。這要如何實(shí)現(xiàn)?
汪玉:10000倍的下降肯定會是行業(yè)共同努力的結(jié)果,包括應(yīng)用、算法、軟件和芯片制造各個(gè)環(huán)節(jié)。我們在這些領(lǐng)域確實(shí)有技術(shù)貢獻(xiàn),但不可能獨(dú)立完成。
甲小姐:通俗地講,成本下降的方法是什么?
汪玉:我最近開了門課,叫基礎(chǔ)人工智能軟硬件核心技術(shù)討論,有一個(gè)公式:
按照這個(gè)公式:計(jì)算量和參數(shù)量要降低,利用率要提升。
算法層干的是計(jì)算量、參數(shù)量和利用率;芯片層干的是算力和帶寬;能耗是能源建設(shè)的問題;硬件價(jià)格跟制造工藝相關(guān)——從這個(gè)公式就可以看到成本下降要多方面的努力。
甲小姐:無問芯穹今年的目標(biāo)是什么?
汪玉:要focus,用“一朵云”解決問題。當(dāng)然,過程中可能會遇到各種技術(shù)需求和工程化問題。
甲小姐:這次創(chuàng)業(yè)你的心態(tài)有什么變化嗎?
汪玉:這次平和一點(diǎn)。我喜歡做創(chuàng)新的事,這次和上次很像,有一部分想得很清楚,還有一部分需要實(shí)踐迭代。
6.談趨勢:“物理知識的參與必不可少”
甲小姐:今年具身智能、物理AI的概念很火,你怎么看這些熱度?
汪玉:這都是一種趨勢預(yù)判。我們預(yù)計(jì)AI服務(wù)將呈現(xiàn)兩種形態(tài):純數(shù)字空間的形態(tài)和與物理世界互動(dòng)的形態(tài)。AI要與物理世界互動(dòng),就需要物理知識作為支撐,目前尚未出現(xiàn)超越現(xiàn)有物理公式的AI能力。
甲小姐:有流派認(rèn)為,一個(gè)真正的超級大腦能自我學(xué)習(xí),不需要依賴太多物理公式。你怎么看這一派?
汪玉:現(xiàn)在具身智能有的依賴現(xiàn)實(shí)數(shù)據(jù),也依賴模擬數(shù)據(jù)。模擬數(shù)據(jù)就會把物理公式往里懟,相當(dāng)于生成一些數(shù)據(jù)來訓(xùn)練模型。目前來看,物理知識的參與是必不可少的,例如擰螺絲的力度這類細(xì)節(jié),對模型訓(xùn)練來說是非常復(fù)雜且關(guān)鍵的。
甲小姐:物理AI的平臺最終會以什么形態(tài)出現(xiàn)?
汪玉:具身智能目前有VLA(Vision Language Action)這種形態(tài),它描述了從感知到推理再到執(zhí)行的操作流程。不過,VLA可能還會繼續(xù)演進(jìn),但無論如何,未來都會更注重與物理世界的交互,需要具備感知和執(zhí)行能力,這與傳統(tǒng)訓(xùn)練方式不同。因此,電子領(lǐng)域可能會在具身智能方面發(fā)揮更大作用。因?yàn)殡娮痈锢恚?jì)算機(jī)則偏數(shù)學(xué)。
甲小姐:你之前提到會重點(diǎn)關(guān)注醫(yī)療和機(jī)器人方向的數(shù)據(jù)應(yīng)用價(jià)值,為什么是這兩個(gè)領(lǐng)域?
汪玉:從電子系視角看,未來電子系將連接物理世界與數(shù)字世界,涵蓋感知、傳輸、計(jì)算和反饋。數(shù)字化是智能化的基礎(chǔ),需要依托載體。我們正思考未來的核心載體,并從未來十年到二十年的情境倒推今天應(yīng)做什么。
從基礎(chǔ)設(shè)施角度看,通信基礎(chǔ)設(shè)施尤其是衛(wèi)星通信至關(guān)重要。我們系有人嘗試用八顆衛(wèi)星覆蓋全球,為海洋、低空等場景提供通信支持;同時(shí),算力基礎(chǔ)設(shè)施也需要升級,未來醫(yī)療、能源、城市模擬等各領(lǐng)域都需要算力支持。
此外,無人化趨勢下,未來機(jī)器人的數(shù)量可能會達(dá)到上億量級,而目前機(jī)器人的產(chǎn)量還處于千、萬量級,彌補(bǔ)這4-5個(gè)數(shù)量級的差距需要技術(shù)推動(dòng)。
甲小姐:如果AI在未來出現(xiàn)了新的技術(shù)路線,進(jìn)入AI3.0時(shí)代,AI Infra的角色會受到挑戰(zhàn)嗎?你們的路線會受到影響嗎?
汪玉:我不清楚,如果AI3.0不需要那么多算力,那就不需要基礎(chǔ)設(shè)施了(笑)。但目前似乎有一種趨勢:從出現(xiàn)到成為產(chǎn)業(yè)引領(lǐng)者通常需要3到5年。這一波科技公司對學(xué)術(shù)前沿把控較積極,都在關(guān)注新變化,因?yàn)椴淮_定性是最大挑戰(zhàn)。所以大家都在寫論文,目的是交流,至少要清楚前沿在哪里。
甲小姐:現(xiàn)在人工智能出現(xiàn)了兩條路:AGI(通用人工智能),通過提升單體智能逼近甚至超越人類決策能力;MoA(多智能體協(xié)作),超級協(xié)調(diào)者指揮多個(gè)Agent協(xié)同作戰(zhàn)。哪個(gè)是人工智能的終局?還有其他可能嗎?
汪玉:現(xiàn)在MoA(多智能體協(xié)作)剛開始,趨勢可能向上;而MoE(混合專家模型)趨勢較平緩,所以MoA更受關(guān)注。
唐杰之前解讀OpenAI時(shí),認(rèn)為OpenAI的成功在于組織能力,這是最高層次的能力。無論是人機(jī)共處還是機(jī)器間的協(xié)作,都離不開協(xié)同。從機(jī)器角度看,單體能力突破受限于物理限制,因此合作和協(xié)同大概率是必然趨勢。
甲小姐:我印象很深刻的是,去年你參與甲子引力,我最后一個(gè)問題是,如果有一個(gè)預(yù)言家可以告訴你們十年之后一個(gè)問題的正確答案,你最好奇的問題是什么?你的答案是:“人可以長生嗎?”為什么是這個(gè)問題?
汪玉:人活一輩子都希望能多做一些有趣的事,我們現(xiàn)在做算力和具身至少能為人衰老后的境遇提供支撐。
甲小姐:你覺得人可以長生嗎?
汪玉:很難,120歲是有可能的。
|甲小姐對話系列回顧|
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.