本文來自微信公眾號:奇點(diǎn)漫游者,作者:賽先聲,原文標(biāo)題:《如果AI的創(chuàng)造力“涌現(xiàn)”是個誤會,那AI怎么幫我們創(chuàng)新?》,題圖來自:AI生成
我們正處在一個由AI驅(qū)動的“文藝復(fù)興2.0”時代。從ChatGPT的吉卜力創(chuàng)意熱潮到Veo3生成的爆款短視頻,AI似乎有媲美甚至超越人類的創(chuàng)造力。
我們一直以為,這種能力的覺醒源于更龐大的數(shù)據(jù)集、更復(fù)雜的算法和對人類世界的完美模仿。我們曾堅信,通往更強(qiáng)創(chuàng)造力的道路,是用天量的數(shù)據(jù)“喂養(yǎng)”出一個靈感涌現(xiàn)不絕的“創(chuàng)新之神”。
但如果真相恰恰相反呢?如果AI的創(chuàng)造力并非源于其“無所不知”,而是源于其“一知半解”?如果那些我們一直試圖修復(fù)的“技術(shù)缺陷”,恰恰是點(diǎn)燃其創(chuàng)意火花的秘密引擎呢?
最近,一篇發(fā)表在《Quanta Magazine》上的重磅研究,顛覆了我的認(rèn)知。斯坦福大學(xué)的研究者梅森·坎布(Mason Kamb)和蘇里亞·甘古利(Surya Ganguli)的研究成果表明,AI的創(chuàng)造力并非某種高深莫測的“涌現(xiàn)智能”,而是一個令人意外的、由“不完美”設(shè)計所催生的必然結(jié)果。
一、揭開創(chuàng)意的面紗:所謂的“靈感涌現(xiàn)”只是美麗的誤會
長期以來,當(dāng)我們看到AI生成了一幅“宇航員在巴洛克風(fēng)格的宮殿里騎馬”的圖像時,我們傾向于認(rèn)為AI“理解”了宇航員、馬和巴洛克風(fēng)格,并像人類藝術(shù)家一樣將它們創(chuàng)造性地結(jié)合起來。這是一種令人欣慰的擬人化想象,但研究表明,這是一個美麗的誤會。
真相是,以擴(kuò)散模型(Diffusion Models)為代表的生成式AI,其創(chuàng)造力的核心并非來自對概念的“高階理解”,而是源于其架構(gòu)中兩個看似“缺陷”的底層約束。這種對全局的“無知”,恰恰讓AI擺脫了人類思維中的一種經(jīng)典枷鎖——“功能固著”(Functional fixedness)。
功能固著是一種人類有而AI沒有的認(rèn)知偏誤,是指人們知道了一些事物的固定的作用和功能之后,就會習(xí)慣性地認(rèn)為這些事物就是用來干這些事情,而忽視了這些事物的其他方面的功能。
在著名心理學(xué)家卡爾·鄧克爾(Karl Duncker)的“蠟燭問題”實(shí)驗(yàn)中,人們很難想到用裝圖釘?shù)暮凶觼碜鰻T臺,因?yàn)槲覀儗Α昂凶印钡耐暾R(它是容器)限制了想象力。AI則沒有這種“知識的詛咒”,它不“理解”盒子,只“看到”其可以支撐物體的局部屬性,因此這種“無知”反而成全了它的創(chuàng)造力。
AI不是一個全知全能的畫家,更像一個技藝高超的馬賽克藝術(shù)家,他雖然看不見整幅壁畫的全貌,但憑借手中有限的彩色瓦片和一套嚴(yán)格的拼接規(guī)則,卻能創(chuàng)造出令人驚嘆的全新圖案。
二、AI創(chuàng)造力的“黃金鐐銬”:兩大基本原則
那么,這兩副給AI戴上,卻反而讓它舞姿更美的“黃金鐐銬”究竟是什么?
第一副鐐銬:局部性(Locality)。這指的是AI模型在處理信息時,并不是像我們一樣“縱覽全局”,而是一次只能聚焦于一個極小的圖像區(qū)塊(patch)。它像一個透過鎖孔看世界的觀察者,視野極其有限。
AI不知道一只完整的貓是什么樣的,但它對“貓的毛發(fā)紋理”、“貓耳朵的尖銳輪廓”、“貓眼睛的反光”這些局部特征了如指掌。這種“視野缺陷”迫使它在生成圖像時,無法直接復(fù)制一整只記憶中的貓,而必須將無數(shù)個它學(xué)到的“局部碎片”重新組合。
第二副鐐銬:平移等變性(Translational Equivariance)。這聽起來很專業(yè),但原理卻很直觀。它是一套保證“結(jié)構(gòu)一致性”的鐵律。簡單來說,如果模型在一個局部區(qū)塊學(xué)會了“磚墻”的紋理,那么當(dāng)它需要在圖像的另一個位置畫磚墻時,它會運(yùn)用完全相同的規(guī)則和結(jié)構(gòu)。這確保了AI生成的世界不會陷入混亂。
這一思想與AI先驅(qū)、圖靈獎得主楊立昆大力倡導(dǎo)的“世界模型”(World Models)不謀而合。兩者的核心都在于,讓AI學(xué)習(xí)這個世界可預(yù)測、可泛化的基本規(guī)律,而不是去死記硬背無窮無盡的表象。正是這種對底層規(guī)則的遵循,讓AI的“拼貼”顯得真實(shí)可信。
當(dāng)“局部性”將世界打碎成無限重組的可能,而“平移等變性”則像一根無形的線,將這些碎片以一種和諧、連貫、符合邏輯的方式縫合起來,創(chuàng)造力的奇跡便誕生了。
無獨(dú)有偶,近年來AI研究者們開發(fā)的“等變局部評分”(Equivariant Local Score, ELS)機(jī),正是一個只優(yōu)化這兩個核心原則的簡化數(shù)學(xué)模型,它竟然能高度復(fù)現(xiàn)復(fù)雜擴(kuò)散模型的輸出,這再次證明了——約束,而非自由,才是AI創(chuàng)造力的真正源泉。
三、化“限制”為“催化劑”:系統(tǒng)性提升AI創(chuàng)新力的3個方法
理解了AI創(chuàng)造力的根本原理,我們提升AI創(chuàng)新能力的方向就變得豁然開朗。我們不再是盲目地擴(kuò)大模型、堆砌數(shù)據(jù),而是可以像一位熟練的工程師一樣,通過“設(shè)計約束”來主動引導(dǎo)和激發(fā)AI的創(chuàng)造潛力。
這種“擁抱限制”的哲學(xué),在人類的創(chuàng)新史上早已屢見不鮮。史蒂夫·喬布斯畢生信奉“至繁歸于至簡(Simplicity is the ultimate sophistication)”,他對iPhone只保留一個Home鍵的極致約束,恰恰成就了一代產(chǎn)品的革命性體驗(yàn)。
同樣,在AI的世界里,我們也可以通過以下方法,將限制化為創(chuàng)新的催化劑:
方法一:設(shè)計“不完美”的架構(gòu)。未來的AI模型設(shè)計,重點(diǎn)可能不再是單純地追求“更大更強(qiáng)”,而是要戰(zhàn)略性地構(gòu)建具有特定“創(chuàng)造性缺陷”的架構(gòu)。我們可以設(shè)計出在不同維度上具有不同“局部性”視野的模型,或者引入更多有趣的“等變性”規(guī)則(如旋轉(zhuǎn)、縮放等),就像給樂高玩家提供不同形狀和功能的積木,讓他們能搭建出更富想象力的作品。
方法二:駕馭數(shù)據(jù)“信息差”。如果我們想讓AI畫出更有創(chuàng)意的椅子,或許我們不應(yīng)該只給它看成千上萬張椅子的照片。我們可以嘗試一種“信息差”訓(xùn)練法:給模型看無數(shù)物體的局部紋理(木頭、金屬、織物),再給它看無數(shù)種結(jié)構(gòu)(四條腿的、單腿的、懸空的),但就是不給它看一張完整的“椅子”。這將迫使模型在其“局部知識庫”中進(jìn)行前所未有的探索和組合,從而“發(fā)明”出我們從未見過的椅子設(shè)計。
方法三:將提示工程提升為“約束的藝術(shù)”。當(dāng)我們向AI輸入“一只由水晶構(gòu)成的蝴蝶,棲息在熔巖流上”時,我們正是在讓模型在嚴(yán)格的約束下(水晶質(zhì)感+蝴蝶結(jié)構(gòu)+熔巖環(huán)境),去完成一次前所未有的“創(chuàng)作越獄”。
這讓人想起了傳奇音樂家布萊恩·伊諾(Brian Eno)著名的“傾斜策略(Oblique Strategies)”卡牌。當(dāng)創(chuàng)作陷入僵局時,他會抽出一張寫有“只用一個音符”或“重復(fù)一個動作”這類指令的卡牌,通過這種人為的限制來打破思維定勢,激發(fā)全新的靈感。
這一方法也讓提示詞的意義變得更加深刻。一個好的提示詞,本質(zhì)上就是在施加一種巧妙的“創(chuàng)造性約束”。
四、擁抱“不完美”,我們面臨什么問題?
對AI創(chuàng)造力的研究和探索,或許能讓我們反思對AI“完美”復(fù)現(xiàn)人腦的執(zhí)迷,轉(zhuǎn)而善用AI的“不完美”。我們手中的創(chuàng)新鑰匙,不再是無窮無盡的數(shù)據(jù)和算力,而是設(shè)計“智慧約束”的能力。
這也引發(fā)了兩個更深層次的問題:
既然約束是創(chuàng)造力的引擎,那么是否存在一種“最優(yōu)約束”的尺度?太多的約束會扼殺創(chuàng)意,太少則會導(dǎo)致混亂,那個激發(fā)最大創(chuàng)新的“黃金分割點(diǎn)”在哪里?
如果AI的創(chuàng)造力源于一種與人類截然不同的“認(rèn)知范式”,那么追求讓AI像人一樣思考的通用人工智能(AGI)道路,是否從一開始就走偏了?
或許這些將是未來AI領(lǐng)域的重點(diǎn)研究方向。
本文來自微信公眾號:奇點(diǎn)漫游者,作者:賽先聲
本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表虎嗅立場。未經(jīng)允許不得轉(zhuǎn)載,授權(quán)事宜請聯(lián)系 hezuo@huxiu.com
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4605182.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.