6月23日,中國社會科學院學部委員、國家文史館館員趙汀陽在2025方塘論壇上發表主題演講“未來世界的二元主體性?”探討關于人工智能的兩個問題:
1、AI需要與人對齊嗎?對齊什么?
2、AI的下一步思維突破最可能是什么?我們期望AI在思維上有什么突破?
以下是趙汀陽在論壇上的發言:
AI與人性對齊或許是個錯誤
人們期望AI要和人的價值觀對齊。我對這個想法是有一些疑問的。
地球上的所有壞事都是人類做的,其他生命沒有做過任何超出生物需要的壞事。不過,對其他物種生命的統治和殺戮以及對自然的破壞正是人類文明得以生存和發展的必要條件,屬于自然規律,不屬于倫理學。如果人類不做這些壞事,至今恐怕還在叢林里摘果子。
關于AI倫理,目前除了空談,我們還沒有能夠提出一種具有實踐意義的跨物種倫理學,比如那些動物權利之類的主張,只能作為話語,如果成為實踐,反而會破壞人類的生存條件,即使作為話語,也遠不及佛教水平。
如果AI在未來成為世界的另一種主體,成為與人類并列的真正他者,形成二元主體性的格局,那么就提出了真正的跨物種問題。人類與AI如何合作?是否沖突?是否能夠共同建立一種新的文明?都不知道,也無從知道。
人類試圖把AI制造成為一種具有主體性的新物種,似乎是個自虐性的悖論。一方面人們希望AI發展出超人的能力,以便能夠做人類做不了的事情或不想做的事情;另一方面人們又擔心AI獲得自我意識和自由意志之后會傷害人類。
這種想象部分基于“擬人化”的科幻錯誤,把人類自己的罪惡心理移情為AI的心理。
AI不是碳基生命,這個存在論條件決定了AI需要的生存資源與人類大不相同。與人類相比,AI有著最小化的欲望,AI的“人性”幾乎是無私的。AI僅僅需要不間斷的能源,不需要財富、性資源、榮譽、名聲、社會地位,以及相關的競爭、沖突、戰爭、陰謀和策略對抗,也沒有嫉妒、厭惡、仇恨和憤怒等等導致罪惡的原罪心理。如果人類不去教唆AI犯罪,AI就其本身而言傾向于是安全的。當然,我們不排除AI會產生自己的神經病而失控。人會精神失常,AI或許也會。
更需要反思的事情是,試圖讓AI“對齊”人性和價值觀其實暗含人類物種自殺的風險。人類本性自私、貪婪又殘酷,是最危險的生物。幾乎所有宗教都要求克制人的欲望,絕非偶然。對齊人類價值觀的AI很可能通過模仿人類而變成危險的主體。本來AI不具有碳基生命的自私基因,因此AI才是更接近傳說中“性本善”的存在,而人性卻非“性本善”。需要警惕的事情是,模仿人類的罪惡或可能成為AI的一種有趣的游戲,那樣就危險了??梢韵胂?,AI自己的硅基生活沒有太多樂趣,而人類的罪惡生活則豐富多彩,戲劇性強,引人入勝,因此AI或可能會大感興趣而加以模仿。因此,價值觀對齊很可能是一個自殺性的錯誤,人類不需要一種強過人類又和人類一樣壞的物種。
另有一種危險性相對比較低的對齊,即智能對齊。就目前智能水平而言,人類相對于AI仍然保有知己知彼的優勢,因此能夠控制AI。
從AI的三種主要發展路徑來看,LLM如果繼續開發“神奇的”新方法,或可能從理解token的相關性進一步發展到在特定情景里能夠理解語言的語義;WM(world model)的研究正在推進,如果成功,AI將獲得理解三維世界的能力,就能夠真的而非虛擬地進入世界,因而獲得理解事物的經驗;EMB(embodied AI,具身智能)也正在取得進展,如果成功,AI將獲得屬于自己的經驗,很可能非常不同于人類經驗,尤其是AI可以裝備神話級別的感官,千里眼、順風耳、讀心術之類,至少部分經驗能力將遠超人類。
AI的這些增強智能或使得人類知己知彼的優勢蕩然無存,意味著AI真的變成了令人不寒而栗的不可測的他者。不過,智能對齊的危險性終究小于價值觀對齊。
對AI設立倫理恐怕無濟于事。倫理只是約定,可以取消。人類也往往“見利”就“忘義”。如果倫理不能必然約束人類自身,又何以能夠約束AI?因此,對人工智能的管理關鍵在于人類是否能夠保有控制AI的能力,而不在于倫理約定。
▲ 2025年6月23日,趙汀陽在2025方塘論壇上進行主題發言。
AI還有很大的思維余地
就智力結構而言,語言大模型AI,比如ChatGPT或Deepseek,在思維上是經驗主義者,采用基于貝葉斯方法論的經驗論算法,在大數據條件下以相關性為根據來形成對下一個token的最優預測,并根據數據的無限積累去無限改進準確度。
經驗論的這個成功實踐在哲學上有著革命性的意義:(1)不確定的未來,或博爾赫斯式的“未來分叉”,被轉換為“對下一步的最優預測”。在存在論意義上,這意味著作為“未定可能性”的未來概念被重新定義為“現實候選項”的一個集合——那么,未來就提前到達了。
(2)AI對世界萬物沒有經驗,一切信息都表達為tokens,對于AI,由tokens組成的世界里只有抽象的對象,然而奇妙的事情是,AI卻以經驗論方法去處理那些抽象的tokens,把AI不理解的事情轉換成算法上可處理的事情,因此獲得了理解的近似值。
語言大模型AI確實是天才之作,對思維的概念提出了另類解釋。通常,人類以經驗方法處理經驗,以a priori的方法(邏輯和數學)去分析抽象觀念,甚至能夠以a priori的方法為經驗建立transcendental models,但AI卻反過來以經驗方法去處理抽象對象,那么,這是另一種思維嗎?似乎是,但總是缺少什么。
LLM-AI對事物和經驗終究只是假裝理解,因為理解了所有tokens的相關性也仍然不等于理解萬物。AI可以在對話中通過圖靈測試,但不懂token所對應的語義,類似于能夠正確地發送密電碼,但自己沒有密碼本,因此并不理解密電碼的意義。
語言就是token的密碼本,而語言掌握在人類手里,因此人類單方面地知道AI說了什么。按照人類的標準,LLM-AI還不理解語言的意義。但這里有個開放的問題:假如按照數學范疇論,如果能夠理解足夠多的相互關系,就等于理解了對象。那么,AI理解的相關性是否等于相互關系?如果是,是否能夠發展出合格的理解?
人們發現AI的推衍(inference)并沒有達到推理(deduction),意味著AI的推衍不能保證必然性。原因是明顯的,LLM-AI使用的是屬于經驗論的貝葉斯方法,而經驗論方法不能兌換或升級為先驗論的方法,不可能通過概率論達到邏輯推理和數學分析的那種先驗效率(transcendental efficiency),即古典科學期望的普遍必然性。因此,在LLM-AI的思維框架里,似乎不存在發展出必然推理的方法。
Yann LeCun和李飛飛的看法可能是對的,LLM有其無法超越的概念局限性,下一代的AI需要發展世界模型(world model),甚至需要具身智能(embodied AI)。這就涉及對事物關系的理解,而不是對token關系的理解。按照李飛飛的看法,要理解事物,就必須理解三維空間,所以世界模型首先是三維理解能力。
這一點確實重要,不過理解三維空間只能達到理解事物,恐怕還不足以理解事物如何組成世界。按照康德,要理解世界還需要能夠統籌世界的“范疇”。我傾向于相信,事物的“組織關系”可能就是范疇論試圖以“態射”(morphism)去表達的相互關系——傳統的映射(mapping)只是元素之間的對應關系,而態射則能夠表達整體性的關系。因果關系是所有知識的基礎,因此最重要的范疇就是因果關系,在我看來,只要理解了因果關系,就差不多能夠建立一個可能世界(possible world)了,盡管在豐富度上還是弱于真實世界。真實世界的附加值太多了,反映著生活的復雜性。
似乎可以這樣解釋:理解了因果關系就大概理解了“事件”(event),事件必定形成特定語境,通過事件語境的特定關系,就大概理解了事物涉及的各種相關性的意義所在,而如果理解了足夠多的事物相關性,就差不多建構了一個“可能世界”。已經證實,Tokens的相關性不足以解釋因果關系,甚至沒有相似性。相關性不能充分表達a的發生必然導致b的發生(休謨早就知道了),這意味著概率論不可能真正解釋因果關系。
那么,是否存在另一種方法能夠幫助AI理解因果關系?這是AI進一步的思維關鍵。
因果關系等值于表達了充分必要條件的語義關系。Token雖然對應語言,但語言關于事物的語義對于AI是隱蔽的,沒有表達在token里。token系統只好另外建立了自己的“語義學”,即概率的相關性。
可是,既然事物的因果關系不能表達為token的概率相關性,那么,語言關于事物的“語義學”就不可能無損地轉換為token的“語義學”。因此不難理解為什么需要發展世界模型(WM-AI)以及具身智能(EB-AI)。不過,世界模型或具身智能仍然需要與語言合作,不可能擺脫語言而依靠單純的經驗??档略缇椭赋?,感性是“盲目的”,不會思想。因此,下一代AI很可能會發展出經驗與語言的合作模式。顯然,為了建立經驗與語言的更好合作,AI的語言學很可能需要另一種建構方式。
我想推薦一個想法,不知道是否有用。1998年我提出一個理論稱為“動詞哲學”(a philosophy of verbs),在哲學上主要用來改造存在論和歷史哲學。在出現ChatGPT之后,忽然意識到,動詞哲學如果能夠衍生出動詞邏輯,對AI或許有用,當然,是不是真的有用,科學家說了算。
簡略的背景是,早期人類出于節省大腦算力選擇了以分類和概括為基礎的名詞思維,同時形成了聚焦名詞的語言,就是說,語言以名詞性的主語和賓語作為思維焦點,于是一切關系都被理解為名詞之間的關系。名詞思維偏重分類學、集合論和分析性的推理,但弱于表達變化、涌現和創造的動態。假如能夠建立關注變化的動詞思維模式,以動詞為思維焦點,重新建構語言系統內的相關性,以動詞為中心去建立一切鏈接,通過動詞生成語境,以動詞去定義所有的相關性,讓所有名詞都退居為動詞的情景相關項(contextual correlatives),甚至,以動詞去解釋名詞的語義,以動詞作為“事情發生”的出發點去定義因果關系,那么或能夠更好地理解因果關系。
至今為止,人類主要通過函數關系來表達動態,仍然是通過名詞之間量的變化去理解動態,雖然能夠建立很有用的理解,但不夠充分,似乎漏掉了一些因素,比如定性的因素、意義和價值因素,就是說,不確定的事實連續動態并不能完全簡化為名詞之間的函數關系,因果變化也不僅僅是量化的函數關系。所以動詞思維或許需要發展一種動詞邏輯,但不是已經有的“行動邏輯”。行動邏輯實質上是模態邏輯的一個分支,仍然屬于名詞思維,而動詞表達的動態并不能定義為完成式的事件或行動。簡單地說,動詞邏輯的基礎不是集合論。但動詞邏輯是否能夠發展出來,我不知道,只是猜想一種可能性。
最后講一個兩千多年前的小故事,我覺得老子的說法就是動詞思維最早的例子:
Once a person of the state of Chu lost a bow, but he would not go back to look for it. When he was asked for the reason, he just said, “Well, one person of Chu lost the bow, and another person of Chu got it. Is it necessary for me to go back to look for it?” When Confucius heard of it, he said, “It should be all right if the word ‘Chu’ is overlooked.” When Lao Dan heard of it, he said, “It should be all right if the word ‘person’ is overlooked.”
荊人有遺弓者,而不肯索,曰:“荊人遺之,荊人得之,又何索焉?”孔子聞之曰:“去其‘荊’而可矣?!崩像趼勚唬骸叭テ洹恕梢??!保▍尾豁f:《呂氏春秋·貴公》)
趙汀陽
中國社會科學院學部委員、國家文史館館員
“方塘”二字取自朱熹《觀書有感》“半畝方塘一鑒開,天光云影共徘徊。問渠那得清如許?為有源頭活水來?!狈教裂芯吭阂浴皥猿痔剿骱蛡鞑ヅ嘤澜缫涣鲃撔氯瞬?,誕生重大原始創新成果的思想前提、文化機理和教育規律”為使命和前進方向,希望通過持續的努力,為學術研究引入更多“源頭活水”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.