網易首頁 > 網易號 > 正文申請入駐

對話朱松純：中國的AI敘事關乎國運

2025-04-18 19:06:32　來源: 搜狐科技

北京舉報

分享至

出品｜搜狐科技

作者｜楊錦

在大模型的熱鬧之外，朱松純不懼做一個少數派。

他認為，科學本質是用簡約的模型解釋復雜的現象，比如楊振寧、愛因斯坦這些科學家，他們構建世界的模型里可能只有一兩個參數。而今天的大模型，動輒百億甚至千億級的參數，還不可解釋，“從這個角度看，確實是非常丑陋的。”

但他也承認，從工程的角度來講，大模型又能夠在某些方面產生比較好的結果。

他和北京通用人工智能研究院（通研院）及北大幾位老師最新合編的圖書《通用人工智能標準、評級、測試與架構》，針對通用人工智能提出了系統的標準、評級、測試與架構體系，對大模型也適用。

什么是智能？怎么樣才算是通用了？在這套評測體系下，智能體不僅要完成任務，還需要自主定義任務，這意味著，智能體沒辦法像在其他評測體系上一樣“刷榜”。

過去20年，刷榜像附著在人工智能發展史上的藤壺，他本人也曾長時間地站在數據驅動和刷榜的一線。2004年，朱松純和另一位全球計算機領域頂級科學家沈向洋，在他的湖北家鄉創建了蓮花山研究院，是最早規模性地做大數據標注的機構。

刷榜是針對性地做端到端訓練，而通用泛化的任務，是一個無窮的任務，比如訓練機器人學會抓杯子，這很快，但問題是，稍微換個位置、改個重量、變個尺寸，它又不認識了。

打掉無數個榜單之后，他開始覺得，這是一個“任務陷阱”。這個路，可能是走不通的。

朱松純目前擔任北京通用人工智能研究院院長，北京大學人工智能研究院、智能學院院長。

作為國際知名的計算機專家、統計與應用數學家、人工智能專家，朱松純曾在國際頂級期刊和會議上發表論文300多篇，解決了“什么是紋理”的底層科學問題。又分別在31歲、35歲和39歲的時候，三次問鼎計算機視覺領域最具聲望的馬爾獎。

一個登過頂的人，在遍覽眾山小后，從山上走了下來，不再爬山、更不想爬樹。他想登月了。

2017年，朱松純提出了“小數據、大任務”范式，核心是“給機器立心”，讓智能體可以自主性地構建物理的感知，因為這是在數據中看不見的。

在這個理論體系下，通研院訓練出了由價值、因果驅動的智能體“通通”，只用了10張顯卡。整個通研院，也只有一兩百張卡。

到今年，“通通”的智商和情商相當于一個五歲左右的小女孩，能夠在一定程度上理解周圍環境，有自己的個性，會耍賴、撒謊。

來源于《通用人工智能標準、評級、測試與架構》

相比之下，在一些測試中，大模型能通過人類司法考試，在數學、編程、法律等學科的表現接近人類博士平均分，在醫學考試中的正確率能夠超過大多數醫學博士考生，看起來似乎厲害多了。

但朱松純認為，AI會解幾何題、能打螺絲，這些是專業能力，不是通用、泛化的能力。做出來的答案，可能是蒙的，也可能是刷題或者死記硬背的。有著認知架構的通用智能體，可能現在幼稚，卻有自主性和成長性。

他一再呼吁，中國要形成自己的AI敘事，不能一味地跟隨硅谷的模式，堆算力、堆數據，要找到一條自己的路線，做原創性的研究。

“我們要非常嚴肅認真地對待通用人工智能的問題，它不是一個只是炒作的熱點話題。真正的通用人工智能還沒有起來，還需要接著投入，這是真正關乎到我們國運的選擇。”

以下為對話精編：

搜狐科技：注意到您對大模型的態度似乎有一些變化。之前在楊振寧先生百年誕辰活動上，您曾說大模型是非常丑陋的，很難通向AGI，但是您最新主編的這本通用人工智能的測試標準書，把大模型也覆蓋進來了，另外通研院也開始在大模型上構建通用智能體的認知和決策體系，這個轉變的契機是什么？

朱松純：當時是談科學的美，因為對于科學的美來說，整個理性的科學從20世紀黃金和白銀時期，你看楊振寧、愛因斯坦這些人，他們構建世界的模型里面可能就只有一兩個參數，咱們現在的模型可能幾十億甚至上千億個參數。

物理模型要解釋那么復雜的現象，它只有幾個參數或者一個參數，從科學的角度來講，大道至簡，用越簡約的模型來解釋越來越復雜的現象，這是科學的本質。

大模型不光參數太大，還解釋不清楚。搞深度學習的人都不清楚那個模型里面到底是個啥東西，沒人能解釋，Transformer這里面的表達也是完全無法解釋的，所以從這個意義上講，它肯定是很丑陋的。

但是從工程的角度來講，它又能夠產生比較好的結果，這一點我們不能不承認。

搜狐科技：為什么要把大模型納為評測目標？目前中美頭部大模型的測試結果怎么樣？

朱松純：肯定是要把它作為其中的一種智能系統，因為我們要把所有（種類）智能體都要放進來測，有的是它能夠刷一個功能，有的刷很多功能。有的沒有具身，我們就給它配個目前最好的身體給它測，從測出來的結果來看，效果確實是不太好的。

搜狐科技：您之前提得比較多的是UV函數，然后您今天講CUV，這個C是指什么？

朱松純：就是它的認知架構，它腦袋的復雜度有多大。比如說有一個圖像，每個人看的東西都不一樣是吧？假設我把人所有能看到的東西綜合起來，那就是人的認知的極限了，有可能未來機器看到的比所有的人看到的還多。

這就是C，認知架構，它的英語是“Cognitive Architecture”。我們說C的進化，就是指它能夠看到越來越多的節點了。

搜狐科技：對我們小數據、大任務的范式，外界似乎也有一些質疑。

朱松純：有人說，是不是因為科學的方式在轉換，你們是不是掉隊了？也有人說你們是不是思想保守？如果數據是一個表層的現象，它是被里面的一些核心的訴求所驅動的怎么說話、怎么做事呢，如果你去擬合表層的東西，你就要很多參數，因為你是去擬合很高維的空間，但是如果你搞清楚了它底層的訴求，你就可以解釋很多現象。

這就是我們說的要追求一個簡化的模型，這也是為什么我們提CUV架構，我們還是希望不斷地追求美和簡約。

搜狐科技：您聽到這種聲音會生氣嗎？

朱松純：根本就不需要生氣，每個人的出發點都不一樣，大部分對這個東西質疑的人，就是屬于那種做實驗刷榜刷慣的人。

我們刷榜刷了20年了，在20年過程中，已經形成了一個思維定勢和習慣。就是說你給我拿一個代碼，在哪個數據上讓我測一下，試一下能不能work，這就是一種典型的思維。我就感覺很好笑。

運營編輯 |孟莎莎

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.