編者按
有一個非常大的問題是,當代的左翼不太關心先進的生產力,太執著于想要改變生產關系了,以至于他們已經忘了在歷史上左翼是代表先進生產力的。
歷史唯物主義和其他哲學流派的根本區別在于,它從現實而不是什么虛構的假設出發,它絕不拋棄人們所面臨的,活生生的社會條件,使用科學的方法(政治經濟學)去刨析人們自身,并以此發現現實社會的運動規律。
在《資本論》發表一個多世紀后的今天,我們向讀者獻上這份對話。要撿起歷史唯物主義的方法論,就必須學習目前最先進的生產方式(以硬件生產中的雙循環為例)假使左翼運動無法撿起先進生產力的大旗并用力揮舞它,就無法引領歷史走向進步一方。
值得注意的是,這份對話為我們呈現出一系列問題。編者認為,鏡知同志提出了一些尖銳的問題,例如NVIDIA公司具有何種意義上的普遍性,使得其能夠代表先進生產力;它究竟是主觀上(看上去)成果豐碩,還是具有一整套嚴密的科研-生產體系支撐;以及左翼為何要推動開源社區。但無論如何,編者希望本文能夠為諸位讀者帶來新思考:左翼運動如何揮舞先進生產力的旗幟?
對話集
左翼、開源社區與先進生產力
對話人:流云(左);鏡知(右)
我們重新開始。有一個非常大的問題是,當代的左翼不太關心先進的生產力,太執著于想要改變生產關系了,以至于他們已經忘了在歷史上左翼是代表先進生產力的。
他們其實還執著于去糾結于不太先進的生產力,像很多傳統第二產業方面的一些東西。
對,但現狀是,你需要明白現在生產力發展的問題在哪里,你才能理解我們要怎么改變生產關系。你需要先理解最先進的生產力,馬克思是知道當年的生產怎么搞的,但是當代的左翼很少有人對這個問題進行研究,還在想馬克思時代的生產是怎么搞的,以至于他們已經無法理解現代的先進的工業體系是怎么運行的了。我覺得這是一個非常大的問題。
左翼(一部分左翼)明明在假想一種集體性的、人類的總危機的到來,但是大量的左翼沒有一個能夠重建生產結構的能力。連重建的能力都沒有,怎么改變生產關系呢?
其實你說的關于重建生產結構這個事情,看前幾百年的歷史,你會發現(左翼缺乏)相關的能力是比較正常的現象。就是所謂的“砸碎舊世界”和“重建新世界”之爭。
也不叫之爭,大部分左翼就是沒有這個能力。但是左翼必須去思考現有的生產關系哪里有問題,理解這些行業的痛點在哪里,包括工人、從業者、受眾和專家在想的問題。我等會可能會舉一些例子。
我之前想寫一篇文章,叫《當代左翼需要研究NVIDIA這家公司》。因為NVIDIA事實上擁有全球最先進的計算機硬件生產力。它有非常龐大的資金,養活一大批行業專家,還能把不同領域的人(比如通信和計算)集中在一起做整個系統,這很少有公司能做到,可能華為算另一家。它(NVIDIA)能以半年為周期迭代軟件,以一到兩年為周期迭代硬件,這個生產效率是非常恐怖的,全世界可能只有幾家能做到(AMD算半吊子,英特爾軟件也爛)。
而且,我之前認為學術界是單純的實體(之前的研究方向是PL),但現在認為學術界(至少SYS/ARCH)和工業界的聯系非常強,至少在計算機(越來越像工科/制造業)這塊。工業界很大程度上推動了學術界的研究方向。比如NVIDIA出了一個軟硬件系統,學術界就會針對它做研究,哪怕它不完善。例如,有國內實驗室研究怎么用NVIDIA的稠密硬件通過軟件運行稀疏矩陣計算。可以說,工業界一定程度上掌握了(學術)評審標準。
NVIDIA還跟科學界合作做長期的事。比如它零幾年推出通用計算架構后,一幾年學術界(Hinton等人)就開始嘗試用GPU訓練神經網絡,發現很適合。但NVIDIA很快的就進一步放大了這個需求,在GPGPU里加了TensorCore(低精度矩陣乘加單元)。可以說,沒有NVIDIA就沒有(現在的)深度學習。
你剛剛說的這一點,只有NVIDIA如此,還是其他廠也有類似行為?
其他廠有,但不太成功。
如果其他廠有類似行為但不成功,那只能證明NVIDIA路子走對了,及格了,但這更多是能力差異,不是路線差異。
我再舉個例子。大概2020年左右,有幾家做深度學習加速器的創業公司,比如國外的Groq(不是馬斯克的Grok)、Tenstorrent(Jim Keller在的那家)等。以Groq為例,它犯了非常低級的錯誤,體系結構初學者都能看出來。他們延續Google TPU思路但更極端,為了高帶寬不用內存(DRAM),全用片上緩存(SRAM)。但SRAM成本極高(單位比特晶體管多),導致總成本可能比用昂貴HBM的NVIDIA還高。Groq宣稱推理延遲低,但不敢報吞吐量,而目前大模型應用場景都需要吞吐量。
其次,Groq用全靜態的軟件調度流水線(超長指令字VLIW),理論上運算器密度可以比NVIDIA高(硬件調度邏輯省了)。但一旦接入內存或網絡,必然產生不規則抖動,靜態調度無法消除。而NVIDIA看似浪費晶體管在調度硬件上(計算掩蓋訪存/通信延遲),卻是為了保證運算單元能被充分利用。
我聽下來,就是這兩家公司選擇了不同的技術路線,NVIDIA的路線被證明很牛逼,走對了。
很難想象這么大投資的公司(流片一次幾億,迭代可能花十億,還不算人力),設計上卻犯了非常低級的錯誤。
這和NVIDIA與其他公司的區別關系在哪?
NVIDIA沒犯這種低級錯誤。
其他競爭者都犯過類似的低級錯誤嗎?
這是一類NVIDIA競爭者的情況。還有像Tenstorrent等其他類型。
我目前只能提取一點:NVIDIA犯的錯誤最少,而且幾乎每次都走對了,技術非常先進。
我猜測有兩種可能:一是它的主管人或團隊非常厲害,或者能把所有人都集中起來研發;二是NVIDIA內部把所有可能的路線都試過了,只是沒公開失敗經驗(犯錯的經驗更珍貴)。
那你覺得是其他競爭者管理水平不佳,或者沒有NVIDIA好?
不是好不好的問題,可能需要一個充分討論的機制和糾錯機制。
所以你認為NVIDIA內部可能有一個類似實驗室的功能,把所有路線都試完了,才拿出正確路線,所以每次都能走對?
我不是NVIDIA員工,只能猜測。要么有厲害的人,要么有厲害的管理體系,要么試過了所有東西,要么兼而有之。
厲害的人也會犯錯,例如JimKeller(硅仙人),他的AI軟件棧似乎就有一些問題。
如果你想寫相關文章,如何去證明這些猜測呢?沒有前提,后面文章寫不了。
也許我該找些資料,不然只能尬吹NVIDIA多牛逼。我需要找證據,可能問問在NVIDIA工作過的朋友。
我還想說一個不那么顯然的知識:不只是軟件依賴硬件,硬件也依賴軟件,是互相依賴。從供應鏈角度看,軟件追溯上去是庫、編譯器、指令集、硬件廠商。但硬件廠商的研發,也需要先拿到實際的Workload(工作負載)去測試性能、功耗等。
可以說這個供應鏈是一種環狀結構?
對。硬件越厲害,軟件越厲害;軟件越厲害,硬件越厲害。這是一個滾雪球的結構。NVIDIA滾得很大,蘋果也是,英特爾上世紀也是。英特爾最早一批搞出個人消費電腦(雖然最初性能很爛,像大玩具),但以低廉價格賣給消費者,就有了開發者和用戶,賣了之后又有錢投入研發。
這里實際有兩個循環,像一個無窮符號(∞):
1.左循環(產業資本循環): 廠商 -> 實驗室/研發 -> 工廠/制造 -> 廠商
2.右循環(生態系統循環): 廠商/產品 -> 開發者 -> 用戶 -> 反饋 (Feedback) -> 廠商/產品
這兩個循環互相驅動。現在崛起的巨大科技企業(NVIDIA, Intel, Apple, 高通, 聯發科, 華為麒麟等)幾乎都是這么崛起的。這也導致新指令集很難成功,因為它缺少右邊的開發者-用戶反饋循環(因為沒有所以沒有)
但這個循環可以靠強大的產業資本強行啟動。比如你有很多錢,招很懂的人,燒錢迭代硬件(硬件迭代比軟件成本高得多,需要流片測試)。做出強力芯片后,吸引開發者(或企業自己做上游開發者,完善工具鏈)。工具鏈好了,就能吸引嘗鮮用戶(比如成本敏感的用戶,或特定需求的用戶)。
蘋果從x86切到ARM就是例子。它控制著編譯器(Clang/LLVM)和整個軟件棧,M芯片出來時續航優勢明顯,常用軟件(Office, 瀏覽器等)也移植好了,吸引了商務用戶。蘋果一夜之間遷移大量自家軟件到ARM,獲得了大量真實世界的workload來優化硬件。它就是用強大的產業資本推動了右側循環。
所以是不是意味著,有一個很厲害、能掌握上下游的產業資本,推動這個事情,就有大概率能做成?
對。但現在世界上缺少同時掌握軟硬件系統、有架構師和勞動力、協作又好的公司。NVIDIA算一個,蘋果算一個,然后就不多了。微軟只掌握軟件,英特爾只掌握硬件,AMD軟件也爛(所以MI300理論性能高但訂單少)。某種意義上,軟件棧的重要性甚至高于硬件。
能做好這個事情的人(或公司)不多,這是我們得出的結論。這又能說明什么呢?
我覺得左翼需要研究這個問題。
我聽你說完發覺,這個問題可能不是左翼的人也在研究。
但考慮到我們最開始說的,左翼必須掌握最先進的生產力,那么左翼就必須研究透這個(雙循環)結構。
這個產業界的結構,左邊是所謂的產研一體(研發-實驗-工廠),右邊是抓用戶反饋、抓社區。說到社區,開源社區(比如Linux)某種意義上是英特爾(當年開放手冊、提供廉價硬件平臺)一手養起來的。先有英特爾的開放姿態和微機平臺,后有Linus基于此寫出Linux對抗昂貴/垃圾的舊系統。英特爾用這些“小孩子玩意兒”打敗了傳統大型機廠商。
某種意義上,英特爾把一部分(軟件生態)工作放給了開源社區。現在的AMD、摩爾線程等也在用類似思路(開放手冊、擁抱開源驅動)。開源社區生長在開放的廠商和環境之上,是一個依附性質的關系。
21世紀的廠商學聰明了,像蘋果雖然封閉,但也利用開放的LLVM編譯器吸取社區反饋和貢獻。AMD、摩爾線程也是如此。
開源社區完成了廠商(或時代/絕對精神)賦予它的歷史使命,linux或許是上一個世代的絕對精神的代言人。
舉個特例:香山(RISC-V CPU核),包括伯克利的BOOM。它們用學術界的人做研發(成本低,研究生工資比產業工人低),燒產業資本流片驗證,用SPEC等理論測試集做feedback(雖然不如真實workload反饋準確及時)。這種模式用相對低的資本完成了產業資本循環。香山核公開后,基于它修改的芯片性能就有保底,避免了社會重復研發的成本,這無疑是一種生產力進步和解放,即使他們不一定是革命者。
回到開源社區。它的成功在于對軟件業起到了強大的補充作用(大部分人提供反饋,少數精英貢獻代碼)。它的失敗在于困在軟件業,出不去硬件。它們沒有懂軟件以外的人協作,也沒有足夠的產業資本去設計和迭代硬件。
這又回到了剛剛說的那個老問題:需要產業資本。
對。我認為開源的生產方式是一個種子,但還沒發芽。
是否因為沒有這個很厲害的產業資本,種子就發不了芽?
硬件社區也有例子,國內靠嘉立創的免費打樣和公開設計平臺,利用閑置產能造了一個社區出來。社區依附在實體制造業/硬件廠商上。嘉立創用閑置生產力造出了零成本的實驗反饋環境。比較英特爾和嘉立創,發現只要有足夠用戶和開發者,把產業資本轉起來,就能搞出迭代循環。
所以開源社區的繁榮,說到底還是需要產業資本。
是的。
所以左翼需要產業資本投入進這個循環,把它造出來。
對。
我感覺你說了這么多,都是在圍繞那個老問題(左翼與生產力、資本的關系)做詳細回答。
是老問題。
那么問題來了,這個厲害的產業資本該如何獲得呢?
答案是我不知道。我只能回答:如果左翼獲得了產業資本,他們必須把這個(開放的、迭代的)循環建起來。
這里面有個悖論:當左翼真的獲得了產業資本時,意味著他之前很有可能已經具備了建立這個體系的能力。時間和因果的先后不確定。
對,可能也是一個環。
可以確定的是,當左翼獲得資本時,差不多也該獲得建立體系的能力。
但左翼獲得資本后,也可能按照老路走,走封閉的路。
所以你想強調的是一個方向?
對,我想強調一個方向。
你感覺左翼很有可能會螺旋(停滯),不會上升?
對,它可能并不會上升。
你主要想提醒需要上升。
對。我們應該把開源社區的模式往制造業推。不僅要公開軟件設計圖,還要創造一個可以共享、公開迭代的硬件世界。我們需要能造出自己的“打印機”(生產工具),還要能造出批量制造“打印機”的“制造機”,以及制造“制造機”的“制造機”,并把所有圖紙、制造方法(從手工到工業化)、教育材料全部公開出來,讓人能從零開始build出整套系統。而不是讓知識被封鎖在公司里,以商業機密或經驗的方式存在。
因為現有模式依賴信息差賺錢,遵循資本主義邏輯,不利于所有人發展生產力。
但你現在說的,是很靠后的愿景了。
是很靠后的愿景。我們是隨便談。我覺得這是未來左翼需要完成的生產力發展方向。右翼可能只會利用這個社區來完成他的目的(比如蘋果免費使用開源軟件,但curl等關鍵開源基礎設施的作者窮困潦倒)
你上次已經說了,嚴格來說蘋果、NVIDIA這些都是右翼公司。不是利用,這些東西本身就是他們的。
對。所以左翼需要把這個(開放、共享的生產體系)推向全社會、全世界。這可能是過程,也可能是結果,或者兩者都是,我現在不知道。
你沒辦法預料這個事情。
是的。
那你文章打算怎么寫呢?
可能需要講開源社區應該推向硬件/制造業,背后需要公共性質的產業資本。
我覺得你還應該寫最初的那個命題:左翼需要掌握先進生產力。你需要把NVIDIA的那幾點獨特性給證明了,后面才好寫。
你說得對。我說到最后有點偏題了。
你得把這個獨特性和(你認為的)先進性結合起來。
但很遺憾,我現在還不能證明。我可能需要找材料。
我感覺你今天聊完,反而把自己聊迷糊了?沒有上次那么堅定了?
對,聊迷糊了。上次是很確定想那么說。
我在想,我能從上個世紀的教育科研體系(比如前三十年)找靈感嗎?我覺得有點困難。
我現在不能證明NVIDIA有多厲害,它的成功關鍵是什么。我只能反面證明它的對手們有多草臺。
但你證明對手草臺,與你第一個命題(左翼要鉆研先進生產力)有點背道而馳。
是的。
我還在想,NVIDIA的研發體系到底怎么樣?我需要去了解。我懷疑它非常先進,左翼可能需要學這個。這是最好的情況。但它有哪些值得學的東西?有多少?我現在只能打個問號。這只是粗淺想法,可能后面會成形。
你怕的是,它(NVIDIA的成功)并沒有那么多主觀的英明判斷,純粹是市場經濟養蠱養出來的“蠱王”?
是有這個可能。我需要搞清楚,NVIDIA究竟是主觀上這么厲害,還是僅僅是遵循市場經濟邏輯的“賭”贏了。
注解:
這篇文章是作者ly(流云)和他人的談話記錄,該談話記錄同時面向一部分業內人士和行業外人士,如果存在錯誤,歡迎讀者指出。
錄音經過whisper轉文字并經過大語言模型縮減總結。最終結果經過人工審核,能夠確保內容符合原意。
文章內括號的部分由大語言模型插入插敘或補充上下文。
后續:
作者經過與業內人士(包括nvidia員工和其它GPGPU設計公司員工)交流后得出初步結論:NVIDIA內部并不存在一套很厲害的次時代的軟件棧,而是在使用本世代甚至上世代的軟件棧,這一點令作者失望。但這反而說明了NVIDIA在軟件水平上(至少在使用軟件勞動力的水平上)很厲害,因為即使這樣,NVIDIA的軟件水平還是硬件行業內頂尖的。
NVIDIA的商業決策非常厲害(或者說是壟斷巨頭應該有的水平),它非常清楚只依靠大模型泡沫是很容易出事的,所以在商業決策上它退可守傳統HPC(高性能計算)的市場,例如它往新硬件中添加了FP64(科學計算所需)的Mattrix Multiple硬件。甚至游戲玩家市場(RTX50系大幅度優化了DLSS)。進可追世界模型、物理學大模型和智能機器人、智能汽車。
盡管它在一部分領域的探索并不成功:例如神經網絡物理仿真的精度并不比傳統方法令人滿意,以及讓ai學習多模態數據來總結物理定律的物理學大模型路線遭遇了挫折。但它依然將能發展的領域推到了極限,這一點做到了行業壟斷巨頭“應有的水平”。
稿件來源于lyzh、鏡知同志
編者按由NLR編輯部呈現
轉載、投稿請聯系郵箱newleftreviewaccept@gmail.com
哲學家只是用不同的方式解釋世界
而真正重要的是改變它
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.