出品|搜狐科技
作者|楊錦
在大模型的熱鬧之外,朱松純不懼做一個少數派。
他認為,科學本質是用簡約的模型解釋復雜的現象,比如楊振寧、愛因斯坦這些科學家,他們構建世界的模型里可能只有一兩個參數。而今天的大模型,動輒百億甚至千億級的參數,還不可解釋,“從這個角度看,確實是非常丑陋的。”
但他也承認,從工程的角度來講,大模型又能夠在某些方面產生比較好的結果。
他和北京通用人工智能研究院(通研院)及北大幾位老師最新合編的圖書《通用人工智能標準、評級、測試與架構》,針對通用人工智能提出了系統的標準、評級、測試與架構體系,對大模型也適用。
什么是智能?怎么樣才算是通用了?在這套評測體系下,智能體不僅要完成任務,還需要自主定義任務,這意味著,智能體沒辦法像在其他評測體系上一樣“刷榜”。
過去20年,刷榜像附著在人工智能發展史上的藤壺,他本人也曾長時間地站在數據驅動和刷榜的一線。2004年,朱松純和另一位全球計算機領域頂級科學家沈向洋,在他的湖北家鄉創建了蓮花山研究院,是最早規模性地做大數據標注的機構。
刷榜是針對性地做端到端訓練,而通用泛化的任務,是一個無窮的任務,比如訓練機器人學會抓杯子,這很快,但問題是,稍微換個位置、改個重量、變個尺寸,它又不認識了。
打掉無數個榜單之后,他開始覺得,這是一個“任務陷阱”。這個路,可能是走不通的。
朱松純目前擔任北京通用人工智能研究院院長,北京大學人工智能研究院、智能學院院長。
作為國際知名的計算機專家、統計與應用數學家、人工智能專家,朱松純曾在國際頂級期刊和會議上發表論文300多篇,解決了“什么是紋理”的底層科學問題。又分別在31歲、35歲和39歲的時候,三次問鼎計算機視覺領域最具聲望的馬爾獎。
一個登過頂的人,在遍覽眾山小后,從山上走了下來,不再爬山、更不想爬樹。他想登月了。
2017年,朱松純提出了“小數據、大任務”范式,核心是“給機器立心”,讓智能體可以自主性地構建物理的感知,因為這是在數據中看不見的。
在這個理論體系下,通研院訓練出了由價值、因果驅動的智能體“通通”,只用了10張顯卡。整個通研院,也只有一兩百張卡。
到今年,“通通”的智商和情商相當于一個五歲左右的小女孩,能夠在一定程度上理解周圍環境,有自己的個性,會耍賴、撒謊。
來源于《通用人工智能標準、評級、測試與架構》
相比之下,在一些測試中,大模型能通過人類司法考試,在數學、編程、法律等學科的表現接近人類博士平均分,在醫學考試中的正確率能夠超過大多數醫學博士考生,看起來似乎厲害多了。
但朱松純認為,AI會解幾何題、能打螺絲,這些是專業能力,不是通用、泛化的能力。做出來的答案,可能是蒙的,也可能是刷題或者死記硬背的。有著認知架構的通用智能體,可能現在幼稚,卻有自主性和成長性。
他一再呼吁,中國要形成自己的AI敘事,不能一味地跟隨硅谷的模式,堆算力、堆數據,要找到一條自己的路線,做原創性的研究。
“我們要非常嚴肅認真地對待通用人工智能的問題,它不是一個只是炒作的熱點話題。真正的通用人工智能還沒有起來,還需要接著投入,這是真正關乎到我們國運的選擇。”
以下為對話精編:
搜狐科技:注意到您對大模型的態度似乎有一些變化。之前在楊振寧先生百年誕辰活動上,您曾說大模型是非常丑陋的,很難通向AGI,但是您最新主編的這本通用人工智能的測試標準書,把大模型也覆蓋進來了,另外通研院也開始在大模型上構建通用智能體的認知和決策體系,這個轉變的契機是什么?
朱松純:當時是談科學的美,因為對于科學的美來說,整個理性的科學從20世紀黃金和白銀時期,你看楊振寧、愛因斯坦這些人,他們構建世界的模型里面可能就只有一兩個參數,咱們現在的模型可能幾十億甚至上千億個參數。
物理模型要解釋那么復雜的現象,它只有幾個參數或者一個參數,從科學的角度來講,大道至簡,用越簡約的模型來解釋越來越復雜的現象,這是科學的本質。
大模型不光參數太大,還解釋不清楚。搞深度學習的人都不清楚那個模型里面到底是個啥東西,沒人能解釋,Transformer這里面的表達也是完全無法解釋的,所以從這個意義上講,它肯定是很丑陋的。
但是從工程的角度來講,它又能夠產生比較好的結果,這一點我們不能不承認。
搜狐科技:為什么要把大模型納為評測目標?目前中美頭部大模型的測試結果怎么樣?
朱松純:肯定是要把它作為其中的一種智能系統,因為我們要把所有(種類)智能體都要放進來測,有的是它能夠刷一個功能,有的刷很多功能。有的沒有具身,我們就給它配個目前最好的身體給它測,從測出來的結果來看,效果確實是不太好的。
搜狐科技:您之前提得比較多的是UV函數,然后您今天講CUV,這個C是指什么?
朱松純:就是它的認知架構,它腦袋的復雜度有多大。比如說有一個圖像,每個人看的東西都不一樣是吧?假設我把人所有能看到的東西綜合起來,那就是人的認知的極限了,有可能未來機器看到的比所有的人看到的還多。
這就是C,認知架構,它的英語是“Cognitive Architecture”。我們說C的進化,就是指它能夠看到越來越多的節點了。
搜狐科技:對我們小數據、大任務的范式,外界似乎也有一些質疑。
朱松純:有人說,是不是因為科學的方式在轉換,你們是不是掉隊了?也有人說你們是不是思想保守?如果數據是一個表層的現象,它是被里面的一些核心的訴求所驅動的怎么說話、怎么做事呢,如果你去擬合表層的東西,你就要很多參數,因為你是去擬合很高維的空間,但是如果你搞清楚了它底層的訴求,你就可以解釋很多現象。
這就是我們說的要追求一個簡化的模型,這也是為什么我們提CUV架構,我們還是希望不斷地追求美和簡約。
搜狐科技:您聽到這種聲音會生氣嗎?
朱松純:根本就不需要生氣,每個人的出發點都不一樣,大部分對這個東西質疑的人,就是屬于那種做實驗刷榜刷慣的人。
我們刷榜刷了20年了,在20年過程中,已經形成了一個思維定勢和習慣。就是說你給我拿一個代碼,在哪個數據上讓我測一下,試一下能不能work,這就是一種典型的思維。我就感覺很好笑。
運營編輯 |孟莎莎
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.