5月17日,由搜狐主辦的2025搜狐科技年度論壇在北京盛大開幕。多位院士、科學家與產業界人士齊聚一堂,激發智慧的深度碰撞,奔赴科技的星辰大海。
本屆論壇線上線下結合,開啟全天的思想盛宴。在下午的現場環節,清華大學計算機系教授、中國工程院院士鄭緯民發表了題為《人工智能大模型的基礎設施建設與應用探索》的演講。
鄭緯民院士指出,2025年人工智能發展呈現兩大特點:第一個是多模態,大模型能處理文字、圖像、視頻。第二個是應用于GDP密切相關的行業,中國在推動AI落地方面具有顯著優勢。
他進一步向大家介紹,人工智能大模型的生命周期主要包括五個環節:數據獲取、預處理、模型訓練、微調和推理。前三個環節需要大量算力和存儲資源,通常由大型科技公司如阿里、華為、DeepSeek等完成。一般單位只需基于已有基礎模型進行領域適配的微調和后續的推理應用。
鄭緯民院士提出,當前大模型訓練主要依賴兩類系統:一是英偉達GPU,其硬件性能與生態成熟度領先,但面臨禁售、價格高漲和一卡難求的困境;二是國產芯片,全國已有3萬余家企業投入研發,硬件性能逐步提升,但核心障礙在于生態兼容性不足。
對此,鄭緯民院士建議從兩方面突破,一方面構建“類 CUDA”系統,確保降低開發者學習成本,通過習慣遷移重塑生態;另一方面提升國產卡硬件性能至國外同類產品的60%以上(若達 70%~80%更佳),即便起步晚、進程難,只要性能基本達標,配合生態優化,仍可吸引用戶。此外,還需集中資源做好一些核心軟件。
而后,鄭緯民院士還以大模型訓練中的容錯難題、長上下文推理的內存瓶頸,以及算力資源矛盾等實際問題為例,介紹了一些當前模型訓練和推理中面臨的挑戰。
清華大學計算機系教授、中國工程院院士鄭緯民
以下為演講原文(精編版):
現在人工智能2025年大模型兩個特點。第一個特點,多模態。這個大模型能處理文字、圖像、視頻。第二個,真正把它用起來了,用到了跟GDP直接相關的行業。剛才幾位說的時候,中國人最擅長做這件事,把這個東西應用于跟GDP直接相關的行業。
下面跟大家簡單說說人工智能的五個大周期,生命周期里面五個環節。
第一,大模型最重要的事情就是模型訓練,訓練的就是數據,數據拿機器訓練。第一件事情,數據獲取。從世界各地能拿到數據的地方把數據拿來,拿來到我們的實驗室的硬盤。
第二個事情,數據預處理。剛才拿來的數據有重復的、有廣告、格式不一樣,也就是質量不太高。通過預處理把這個質量提高,這件事情做起來,GPT4要做半年預處理。預處理完以后,數據質量高了。
第三個,模型訓練。這個時間也很長,設備也很多。最后訓練完以后得到一個基礎大模型。
第四個,模型微調。把第三個過程出來的基礎大模型,假如用在醫院,這個還不行,它還不怎么會看病。主要原因,模型訓練的時候,醫院的數據太少了。因此,在基礎大模型的基礎上,把醫院的數據再第二次訓練,叫微調,出來的就是醫院大模型,它能看病了。基礎大模型要用到金融,直接用還不行,主要是金融數據訓練太少。因此,在基礎大模型基礎上,把金融的數據第二次訓練,我們叫微調,得到一個金融大模型。模型微調,實際上就是在基礎大模型基礎上,對某一個領域數據第二次訓練,得到某一個領域的大模型。
最后一個,模型推理,真正把它用起來了。
這五個環節,第一、第二、第三需要大機器、大存儲,一般單位不要做這件事。比如你是醫院,醫院不要做這件事,前面三件事情不要做。誰能做呢?DeepSeek也在做、阿里也在做、華為也在做,他們會最后出來一個基礎大模型,我們在基礎大模型的基礎上下載一個基礎大模型,做醫院的模型微調。前面三個,一般單位都不要做,我們只做對醫院來說就是模型微調,這是要做的。
第四、第五個推理,每個人都有關系。構建國產自然系統的基礎軟件非常重要。現在支持大模型訓練的有三個系統,第一個是基于英偉達公司的GPU,硬件性能好,生態好,但是問題是人家不賣了,價格貴了好幾倍,一卡難求。第二個,國產系統,最近幾年全國差不多有3萬來家公司生產AI芯片,進展也是不錯了,但是什么現狀呢,國產的卡不太喜歡用,不是它的硬件質量不好,而是它的生態不好。
這件事情很重要,要改變生態我認為要做兩件事。第一個,建一個類CUDA系統,什么叫生態,就是習慣了、喜歡用就叫生態系統。英偉達系統有一個叫CUDA,把CUDA學會了就會編軟件了。現在很多年了,很多人都喜歡CUDA,國產的系統如果不是CUDA的,人家就不喜歡,就不喜歡用。因此,我覺得我們要建一個類CUDA,雖然是國產卡的系統,但是編軟件的時候跟CUDA一樣,這個事情可以做的,沒問題的。
第二個,國產卡的硬件系統如果能得到國外同類系統的60%,不是說60%就夠了,到70%、80%就更好,但是我們晚,進程也比較困難。只要達到60%,把生態做好了,大家也會喜歡用。現在我們感覺到不好用,不是因為硬件性能不好,而是生態不太好。一個是做類CUDA,還有一個是做10個軟件。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.