大數據文摘出品
人工智能的“創造力”并不是神秘魔法,它或許只是算法自身架構的必然產物。
ICML 2025(International Conference on Machine Learning 2025) 上的一篇論文研究表明:擴散模型在生成圖像時表現出的“創意”,其實來源于去噪過程中的技術缺陷。
AI的“創造力”不是魔法,而是結構性的副產物
該論文由斯坦福大學應用物理專業的研究生梅森·坎布(Mason Kamb)主導完成。
他和導師、物理學家蘇里亞·岡古利(Surya Ganguli)構建了一套名為“等變局部評分機”(Equivariant Local Score Machine,簡稱ELS)的數學模型。
這套系統不是訓練后的AI模型,而是一套純數學公式,完全基于“局部性”和“等變性”這兩個機制,預測AI去噪圖像的構成。
圖注:這兩個公式定義了ELS模型的核心機制,用于生成擴散模型中的逆向更新流
這里的局部性指的是模型只關注圖像中的一個個像素塊,而不是整體圖像。
而等變性則意味著圖像被稍微移動時,AI生成的圖像也會做出相應調整,以保持結構一致性。
論文鏈接:https://arxiv.org/abs/2412.20292
傳統看法認為,這些只是技術局限。但坎布認為,這兩個機制本身就是AI“創造力”的源泉。
他大膽提出,如果一個系統只追求局部性和等變性,它自然就會表現出擴散模型那樣的創造行為。
他和導師隨后用ELS模型將一系列被轉換為“數字噪聲”的圖像重新“去噪”,再與真正的擴散模型輸出的圖像進行對比。
結果令人震驚。
ELS如何解釋擴散模型的“創意”
ELS模型的預測結果與真實AI模型輸出圖像平均相似度高達90%,這種準確率在機器學習領域前所未見。
圖注:論文提出的解析理論可以逐例準確預測卷積擴散模型在 MNIST、CIFAR10、FashionMNIST 和 CelebA 數據集上的輸出,即使這些輸出非常原創且遠離訓練數據。
“這太不可思議了,”作者表示,“我們以前從未在這個領域見過如此高的擬合度?!?/p>
這意味著所謂的“創造”,可能只是AI系統對局部片段的專注所帶來的副產物。從圖像的角度來說,AI根本不知道整個圖要長成什么樣。
它只是對一個個像素塊做出最合理的“猜測”,然后通過一種叫“評分函數”的數學機制把這些局部片段拼到一起。
拼接過程中可能發生微小偏差,也可能出現“異?!苯M合,比如多出幾根手指的人臉圖像。
這正是研究者們最初觀察到的“多指人”現象的來源。
作者在看到AI生成圖像中的這些異常時,立刻聯想到自己長期研究的“形態發生”理論。形態發生,是解釋生物體如何從胚胎發展為完整身體結構的自然過程。
這一理論源于圖靈模式,由計算機科學先驅艾倫·圖靈提出,解釋細胞如何通過相互作用形成特定組織結構。
圖靈模式強調:每個細胞只響應周圍鄰居的信號,沒有一個中央“大腦”控制整體構造。
AI的擴散模型也是類似機制:沒有“全局大腦”,只是局部決策。
從這個角度看,AI在“創作”時的行為,和自然界細胞構建身體的行為幾乎一致。
這一發現提供了一個全新的視角:創造力,也許并不是頂層智能的象征,而是從底層結構中自然“冒出來”的現象。
正如坎布所說,“只要你引入了局部性,創造力就自然而然地出現了?!?/p>
以往研究者一直試圖把AI的“創造”解釋為某種高級認知模擬。他們認為AI是通過“學習人類風格”來創作的,仿佛它具備某種類似于人類意識的抽象能力。
圖注:即使訓練集里只有一張全黑圖和一張全白圖,模型也能通過“拼小塊”的方式,組合出各種新圖,只要這些小塊在局部看起來是合理的(比如一個小區域內大多數顏色和中心像素一致)。但如果模型“走得太快”(步長太大),就可能拼出看起來不協調的圖像。
這項工作表明,這種看法可能走反了方向。AI的創造力,并不來自它學會了“如何創造”。而是來自它“不知道”如何看全局,只能靠局部組裝,從而不斷“誤打誤撞”出新的內容。
正因如此,它才像是在拼接一幅從未見過的拼圖。
創造力不是神秘靈感,而是結構與組合的產物
這讓我們不得不重新思考另一個更大的問題:人類的創造力,是否也源于類似的機制?
有專家認為,人類的創作行為,很多時候也是在片段信息中“填補空白”。我們憑借經歷、夢境、記憶、愿望,把碎片拼成作品,AI也是一樣,只不過它拼的是看到過的圖像或指令。
在這種理解下,人類和AI的“創造力”,可能共享一種本質機制,對不完整世界的修補嘗試。
當我們試圖彌補知識的空缺,最終卻做出一個別人從未想到的組合時,我們稱之為“創新”。
如果AI的創造力也能被數學形式精確預測,是否意味著“創意”從來不是“神來之筆”,而是“計算之果”?
而現在,這篇論文提出的ELS模型可能找到了這個機制。它不僅揭示了AI圖像生成背后的“黑箱”,也打開了通往理解人類思維內部結構的大門。
當然,擴散模型的創造機制依賴“局部性”和“等變性”,但語言模型等其他AI系統,并不依賴這些。
但這項研究告訴我們:創造力不是奇跡,是結構性的必然。
在一個復雜系統里,當局部與局部之間不斷試探、不斷組合,一種“整體圖景”就會在無意識中浮現。
正如圖靈模式下的胚胎細胞那樣,它們從未見過整個人體,卻能長出完整的手腳。
AI模型也從未見過一幅完整的“圖像”,卻能拼出看起來像是藝術的產物。
或許,這才是真正的創造。
作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!
GPU 訓練特惠!
H100/H200 GPU算力按秒計費,平均節省開支30%以上!
掃碼了解詳情?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.