“目前,我們擁有一項新穎而壯觀的成就——人工智能,它是人類思想的榮耀。我們還沒有為它進化出一個目的地。”這句來自美國前國務卿基辛格的預言,警示著人類社會正站在一個轉折點上,機器智能的崛起將深刻影響我們的未來。
機器智能究竟是什么?它與人類智能又有怎樣的關系?我們該如何理解和應對這場變革?
長江商學院劉勁教授在最新文章中詳細對比了人類智能與機器智能的相似之處和不同之處。他指出,機器智能與人類智能之間存在著巨大的差異。人類智能是一個復雜的系統,融合了感官能力、推理和抽象思維能力、情感理解能力以及創造力和靈活性。而機器智能則更依賴于強大的運算能力和存儲能力,以及大數據的學習和能源需求。
作者 | 劉勁
來源 | 第一財經
劉 勁
長江商學院會計與金融學教授
投資研究中心主任
人有智能,機器也可以有。本文試圖從多個方面詳細對比人的智能與機器智能,探討它們的相似之處和不同之處,從而幫助我們從人的角度去理解機器智能,也讓人可以更好地發展和利用機器智能。
人類智能和機器智能的不同特點
人的智能是一個復雜系統。概括討論時至少可以分為四種能力。
●第一,感官能力:視覺、聽覺、嗅覺、味覺和觸覺。這些感官不僅幫助我們接收來自外界的物理刺激,還通過復雜的大腦處理系統將這些刺激轉化為可理解的信息。比如視覺不僅幫助我們識別物體的形狀、顏色和大小,還能感知空間關系和運動軌跡,進行物體的空間定位。人類的感知系統不僅能準確識別單一的感官信息,還能將多感官信息綜合起來,形成更加全面的感知體驗。
●第二,高度的推理和抽象思維能力。我們不僅能夠從已有的信息中推理出結論,還能夠進行抽象思考,創造新的知識。例如,數學中的證明、科學理論的構建,都是高度抽象的思維表現。邏輯推理能力讓我們能夠處理復雜的因果關系,形成假設并驗證其正確性。歸納推理則幫助我們從有限的觀測數據中總結出普遍規律。
●第三,情感理解能力使我們不僅能夠識別和體驗自己的情感,還能理解他人的情感,并通過同理心作出適當的回應。同理心的作用不僅限于個人之間的互動,還影響著我們在更廣泛社會層面的行為。例如,在合作和集體行動中,人類通過理解他人的需求和情感,能夠在復雜的社會環境中協作并共同解決問題。
●第四,創造力和靈活性是人類智力的另一個顯著特征。人類不僅能夠解決已有問題,還能創造新的思想、藝術品和技術。我們能夠應對新環境中的復雜問題,利用先前經驗和直覺進行靈活調整。創新不局限于單純的邏輯推理,它往往是通過打破常規、跨界融合和對不確定性的探索來實現的。人類的創造力使我們能夠從零開始,提出新問題并找到新的解決方案。
雖然都是智能,相對于人類智能來講,機器智能表現出一系列完全不同的特點。機器智能的核心優勢之一在于其強大的運算能力和存儲能力。計算機通過晶體管開關來快速處理信息,能夠在短時間內完成大量的數據處理任務。現代超級計算機每秒能夠進行數萬億次的計算,處理的數據量也達到了驚人的水平。這種高速計算和存儲能力使得機器在許多領域,特別是大數據分析和科學模擬方面,大大地超過了人類的處理能力。
機器智能依賴對大數據的學習,而人類則可以通過少量的樣本或經驗做出有效的推斷。人有很強的直覺和創造性,能夠根據情境的變化迅速調整策略,解決新的問題,并在沒有明確指導的情況下作出決策;但機器更依賴于既定規則和數據驅動的模式識別,因此在面對未知或沒有明確數據的情況時,機器的學習效率和準確性往往大打折扣。
機器智能雖然在信息處理能力上遠超人類大腦,但也伴隨著巨大的能源需求。人工智能系統,尤其是在進行深度學習時,需要消耗大量的能源。數據中心通常需要巨大的電力供應,才能維持系統的正常運行。一個GPU的功率是500瓦,訓練一個大模型得要上萬個GPU并行運算。相比之下,人類大腦的能量消耗極低,只有大約20瓦到30瓦的功率,相當于一個不大的燈泡。
語言在人類智能中的核心作用
語言不僅是人類溝通的工具,也是思維的載體。它是表達思想、傳遞信息的核心媒介。語言的獨特性在于它不僅能夠傳遞具體的信息,還能夠幫助人類進行抽象思維和創造性思考。語言的形式多種多樣,從口語到書面語言,再到更為復雜的符號語言,以不同的形式高效地承載豐富的信息。
口語和文字是人類最基本的語言形式。口語使得信息能夠快速而直接地交流,而文字則提供了記錄和保存信息的方式。文字的發明大大推動了文明的進步,它使得知識能夠跨越時空傳遞,從而極大地提高了人的學習和溝通的效率。
語言本身是一種低維度、低通量、低速率的信息傳遞方式。人類的口語語速和文字閱讀能力通常是每秒幾個字節,而計算機則可以達到每秒數千兆比特(Gbps)的速度。
同時,人類語言的信息維度相對較低,主要通過文字、語音等有限的表達形式傳遞信息,而計算機則可以通過多維信息(如圖像、視頻、音頻、網絡數據包)來傳輸和處理信息。
人類可以用視覺和聽覺來感受多維信息,但很難用語言來描述。比如,我們被一幅畫或者一個交響樂所震撼,但很難仔細描繪是為什么,只能說出感覺。一般只有當人們把信息可以用語言來表達的時候才說有了“理解”,而對那些無法用語言描述的認知叫“感悟”。在人們試圖去理解復雜事物時,必須對多維信息進行降維處理,所以也會因此損失一部分信息的深度和復雜性。
人類智能的生物學基礎
人類的智能是一個復雜的現象,涉及大腦的神經網絡、基因的作用以及后天的學習過程。人類的大腦是高度復雜的器官,由約860億個神經元組成,這些神經元再通過約100萬億個突觸相互連接,形成一個錯綜復雜的神經網絡。這個神經網絡不僅負責基本的生理功能,還支持高階的智能,如語言、推理、問題解決、情感調節等。其中,突觸連接的可塑性,即神經元之間連接強度的變化,是學習和記憶的生物基礎。
DNA(脫氧核糖核酸)是生命的遺傳信息載體,它包含了所有生物體形成和功能運作的指令。人的DNA包含大約30億個堿基對和約2.5萬個基因。基因的表達可以直接影響大腦神經元的生成、突觸的形成以及大腦神經網絡的連接,這為我們思考、學習、記憶和情感調節等各類智力活動提供了基礎。
人類的大腦與其他動物的神經系統相比,具有獨特的優勢。首先,人類大腦的神經元數量遠超大多數動物。前面說過,人有860億個神經元,黑猩猩有280億個,而到了狗就只有2.5億個左右。此外,突觸的數量也是影響大腦功能的一個重要因素。研究發現人類的大腦中的突觸數量也遠超其他物種。
雖然神經元和突觸的數量并非智能的唯一決定因素,但卻是毫無疑問的物質基礎。就像芯片,不見得晶體管越多性能就越高,因為還有架構和算法等其他因素在起作用。但如果其他條件一樣,一般來講,晶體管越多,算力就越大。
機器學習
基于深度神經網絡的機器學習是AI飛速發展的一個決定性因素。如何來理解這種算法上的突破?
一種看法來自神經網絡之父杰弗里·辛頓(Geoffrey Hinton),即通過計算機模擬人腦的工作原理。辛頓研究的初衷并非是為了制造可以拿來用的智能機器,而是為了理解人的智能:由于人腦的神經網絡過于復雜,就試圖用模擬人腦的神經元及其連接方式來幫助我們構建具有自主學習能力的系統。他認為對于這種機器智能的研究,反過來能讓我們對人的智能有更深入的理解。
但辛頓的這種觀點屬于極少數,絕大多數AI專家的觀點是把它看作是一種對傳統統計計算的延伸。經典的統計方法往往假設數據之間的關系是線性的,然而,現實世界中(圖像處理、自然語言處理等)的數據關系往往是高度非線性且多維的。普遍逼近定律是神經網絡的一個核心理論,它表明,只要神經網絡的規模足夠大,理論上它能夠逼近任何非線性函數。這一理論為神經網絡的強大表現提供了理論依據,意味著神經網絡能夠通過足夠的訓練來解決幾乎任何復雜的非線性問題。注意這里AI并不需要和人一樣思考,它更是一種機器處理數據的方法,是一種完全不同的智能。
在現實中我們觀察到的是規模定律的表現。規模定律指神經網絡的性能往往隨著網絡規模的增加、數據的增加、算力的增加而增強。所以當有復雜、困難的學習問題需要解決時,往往可以通過增加數據、算力、模型的規模來實現。
機器學習的算法有很多種,永遠在進化過程中。概括起來,有三種起到非常重要的作用。
●第一,向人類的智慧學習。向人類學習的方法有監督學習與無監督學習。在監督學習中,機器通過已標記的訓練數據來學習輸入與輸出之間的關系。對數據的標記是人類智慧的體現。與監督學習不同,無監督學習并沒有對數據進行標注,而是讓機器自主識別數據中的潛在結構。比如,如果把互聯網上的文本用來做自然語言處理的學習,這些文本都是人類智慧的結晶,機器學習到的規律就自然來自人類的智慧。
●第二,向自然學習(強化學習)。強化學習是機器通過與環境的互動進行學習。與監督學習不同,強化學習沒有明確的標簽,而是通過獎懲機制來調整行為。機器會根據執行某個動作后的獎勵或懲罰來調整自己的行為策略,從而優化未來的決策。強化學習在游戲(如圍棋、象棋)和機器人控制等領域有廣泛應用。
●第三,向其他模型學習。模型之間的學習有蒸餾學習與轉移學習兩種。在蒸餾學習中,較大的模型經過訓練后所獲得的知識可以通過學習轉移到較小的模型中。這種知識轉移使得較小的模型能夠在較少的計算資源下表現出與大模型相當的性能。轉移學習是指機器學習模型將一個任務上學到的知識遷移到另一個任務中。與從零開始的學習不同,轉移學習可以通過預訓練模型在新任務中快速進行微調,減少對大量標注數據的需求。這兩種學習的共同之處是智能從一個模型向另外一個模型上的轉移。
比較機器學習與人類學習
人類的學習和機器學習有很多相似之處。人類和機器都可以通過與環境的互動進行學習。嬰兒通過觸摸、抓取、拋物等行為,逐漸學會如何控制身體并理解事物的性質。試錯在這一過程中起著至關重要的作用。通過不斷的嘗試,嬰兒能夠從錯誤中獲得反饋,改正錯誤并優化行為。在科研和技術創新的過程中,科學家和工程師也是通過做實驗、試錯來探索未知,獲得新知。這一點和AI的強化學習非常類似。
人類通過老師或他人傳遞的知識進行學習,類似于機器學習中的監督學習和蒸餾學習。通過教師的指導,學生能夠理解復雜的概念,并在此基礎上進一步學習。蒸餾學習同樣是通過“導師”模型的指導,幫助較小的模型獲得較高的表現。監督學習更像是老師根據自己的認知給學生留家庭作業,通過和標準答案的對標,學生就可以學到正確的解題方法。
教育體系的結構與轉移學習有很多相似之處。在傳統的教育體系中,在中小學階段,教育側重于基礎知識的普及。學生通過接受數學、科學、文學、歷史等課程,打下普適的知識基礎,并在此基礎上培養邏輯思維、批判性思維和問題解決能力。進入大學階段,學習變得更加專業化,學生可以選擇自己感興趣的學科,深入研究并獲取專業知識。
這種教育體系類似于大模型通過互聯網上的廣泛知識進行預訓練,再通過后期的微調來適應更專業的任務。轉移學習讓機器能夠更高效地將從一個任務中學到的知識應用到另一個任務中,減少了從零開始學習的時間。
人類學習的基礎是大腦和DNA,尤其是遺傳信息對大腦結構和功能的塑造。人腦是進化的一種結果,進化可以看作是一個長期的強化學習過程(38億年),而DNA就是存儲模型參數的媒介。基因通過“生育后代”這一獎勵機制推動了智力的逐步進化。
通過“適者生存”,人類在不斷與環境互動中適應并優化自己認知的生物基礎。活下來的物種都是進化中的佼佼者,只不過每種物種所處的環境天差地別,因此學習的結果也有極其豐富的多樣性。
在過去十幾年AI突飛猛進的發展中,可能最重要的靈感就是規模定律:從李飛飛的Imagenet,到Transformer,到GPT-3和GPT-4,人們發現AI的性能依賴巨大的數據量、巨大的算力、巨大的內存、巨大的能量。當AI的發展遇到了瓶頸,一個最簡單的方法就是進一步加算力、加內存、加數據、加能量。
這種靈感并沒有一個嚴謹的理論基礎,但如果我們觀察生物界,不難發現不同物種之間的智能差異和神經元、突觸的規模有很強的正向關系。最近的DeepSeek之所以對全球AI領域產生了巨大的沖擊,一個非常重要的因素是它證明大模型在效率上有很大的提升空間。因此我們可以在不增加規模的同時,通過增強效率,來增強模型的性能。
然而,如果我們借鑒動物界中觀察到的規律,不難預測這種沖擊不大可能從根本上沖擊規模定律的根基:如果人需要800萬億個突觸來思考,那么超越人類的AI是否也需要超過800萬億個參數才有可能?所以有上萬億個參數的大模型是否只是個起點?在使用了各種增強效率的方法之后,增大規模仍然可能是目前最重要的發展途徑。
從我們的分析可以看到,智能的表達可以是多種多樣的。人類的智能和機器智能是兩種截然不同的東西。人的智能效率極高,需要的能量少,數據也少,但很難擴展,因為受到生物遺傳的限制。機器智能能量效率低,往往需要大量的數據和大規模的運算,但通過增大規模,算力幾乎可以無限擴展。
無論人還是機器,學習知識的方式非常相似,學習的基礎都是數據。其中數據可以來自老師,也可以源于自然。向老師學習,老師的智能就是天花板;向自然學習,就可以突破人類智能的極限。所以AI的優勢在可擴展性,它發展的絕對瓶頸常在數據和能源。
文中圖片來自圖蟲創意,轉載需獲授權。
教授觀點
end
點擊下方卡片,關注長江商學院
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.