網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

人類創(chuàng)造力的核心機(jī)制，AI已經(jīng)開始掌握了 | 北大CogSci 2025

2025-06-25 14:44:36　來源: 量子位

北京舉報(bào)

分享至

“AI永遠(yuǎn)無法取代人類”證據(jù)-1！

北大團(tuán)隊(duì)最新論文揭示：人類引以為傲的創(chuàng)造力，如今AI也開始掌握了。

甚至，研究人員還提出了一種系統(tǒng)性框架，首次從認(rèn)知科學(xué)的角度，對(duì)AI模型的組合創(chuàng)造力（Combinational Creativity）進(jìn)行了量化評(píng)估與優(yōu)化。

結(jié)果發(fā)現(xiàn)，GPT-4等先進(jìn)模型在創(chuàng)意理解任務(wù)上已經(jīng)超越普通人類（準(zhǔn)確率70% vs. 50%）。

這項(xiàng)研究不僅揭示了當(dāng)前先進(jìn)模型理解組合創(chuàng)造力的水平，還提出了一種可計(jì)算的方法，顯著提升了AI的創(chuàng)意生成能力。

值得一提的是，這篇論文還被認(rèn)知科學(xué)學(xué)會(huì)年度會(huì)議CogSci 2025收錄，并被大會(huì)選為口頭報(bào)告（Oral）進(jìn)行現(xiàn)場(chǎng)講解。

所以，這到底是咋回事兒呢？

AI開始掌握人類創(chuàng)造力的核心機(jī)制

一切起源于這樣一個(gè)問題：

當(dāng)AI看到寄居蟹住進(jìn)易拉罐，它想到了什么？

一只寄居蟹鉆進(jìn)廢棄的易拉罐——這個(gè)畫面你可能在海灘上見過。大多數(shù)人只是一笑而過，但藝術(shù)家卻能從中讀出深刻的環(huán)保警示，比如人類垃圾正在成為野生動(dòng)物的“新家園”。

那么，人工智能會(huì)怎么“想”呢？

最新研究揭示了一個(gè)令人驚訝的答案：AI正在學(xué)會(huì)像藝術(shù)家一樣進(jìn)行“組合創(chuàng)造”。不是簡(jiǎn)單地拼貼概念，而是真正理解為什么某些看似不相關(guān)的元素組合在一起會(huì)產(chǎn)生全新的意義。

當(dāng)AI看到寄居蟹與易拉罐的組合時(shí)，它不僅能識(shí)別出“動(dòng)物+容器”的基本元素，還能解釋它們之間的功能關(guān)聯(lián)（都是“居住空間”），更進(jìn)一步，它開始理解這種組合背后的深層含義，即對(duì)人類活動(dòng)影響自然生態(tài)的反思。

這種從“識(shí)別”→“解釋”→“引申”的三層認(rèn)知過程，正是人類創(chuàng)造力的核心機(jī)制。而現(xiàn)在，AI也開始掌握這種能力了。

要知道在人類智能的諸多特質(zhì)中，創(chuàng)造力被認(rèn)為是最難被機(jī)器復(fù)制的能力之一。

尤其是“組合創(chuàng)造力”（Combinational Creativity），即通過重新組合已有概念，生成新穎、富有意義的想法，被視為真正創(chuàng)新的核心。

盡管近年來如GPT-4V、DALL·E 3等視覺-語言模型（VLMs）在生成圖像和文本方面展現(xiàn)出驚人的“創(chuàng)意”，但其底層機(jī)制究竟是真正的“創(chuàng)造性組合”，還是對(duì)訓(xùn)練數(shù)據(jù)的復(fù)雜模仿，仍是AI研究領(lǐng)域爭(zhēng)論的焦點(diǎn)。

傳統(tǒng)評(píng)估AI創(chuàng)造力的方法多聚焦于結(jié)果的“新穎性”與“實(shí)用性”，而忽略了“創(chuàng)造性過程”本身的結(jié)構(gòu)與機(jī)制。

因此，要判斷AI是否真的“理解”組合創(chuàng)造，就必須建立一個(gè)能夠揭示其認(rèn)知路徑的系統(tǒng)框架。

用系統(tǒng)性框架量化評(píng)估AI的“組合創(chuàng)造力”

對(duì)此，受認(rèn)知科學(xué)家Margaret Boden和認(rèn)知科學(xué)中的“概念融合理論”（Conceptual Blending Theory）的啟發(fā)，研究團(tuán)隊(duì)首次提出了一個(gè)面向AI系統(tǒng)的分層評(píng)估框架——IEI框架（Identification–Explanation–Implication）。

該框架將組合創(chuàng)造力分解為三個(gè)層次：

識(shí)別（Identification）：能否正確分解輸入概念的基本元素；
解釋（Explanation）：能否發(fā)現(xiàn)概念間的潛在關(guān)聯(lián)；
引申（Implication）：能否理解超越原始輸入的語義內(nèi)涵。

這一框架不僅適用于評(píng)估AI，也為人類創(chuàng)造力的計(jì)算化研究提供了新思路。

上圖展示了IEI框架如何結(jié)合“概念融合理論”，對(duì)組合創(chuàng)造力進(jìn)行建模與評(píng)估。

在左側(cè)，兩個(gè)輸入概念通過共性抽象（Generic Space）與融合空間（Blend Space）產(chǎn)生新的組合創(chuàng)意。

右側(cè)則對(duì)應(yīng)IEI框架在理解與生成任務(wù)中的三層處理邏輯：從識(shí)別基本元素（如寄居蟹與易拉罐）、解釋功能類比（如容器功能相似），再到引申出更深層的意義（如對(duì)人類破壞動(dòng)物棲息地的環(huán)保反思）。

這一流程可用于系統(tǒng)評(píng)估AI模型對(duì)組合創(chuàng)意的理解能力，并引導(dǎo)生成具有多層含義的創(chuàng)意內(nèi)容。

實(shí)驗(yàn)結(jié)果：超越平均人類，但仍不及專家

通過構(gòu)建包含專業(yè)藝術(shù)家創(chuàng)作組合的數(shù)據(jù)集（CreativeMashup），研究發(fā)現(xiàn)：

GPT-4等先進(jìn)模型在創(chuàng)意理解任務(wù)上已超越普通人類（準(zhǔn)確率70% vs. 50%）；但在深層語義解讀（如隱喻、文化象征）上，仍顯著落后于人類專家（人類專家的平均勝率為78%）。

下圖為人類被試與模型在三個(gè)任務(wù)上的實(shí)驗(yàn)結(jié)果：

更關(guān)鍵的是，當(dāng)研究團(tuán)隊(duì)將這一框架嵌入生成模型（如DALL-E 3）時(shí)，其創(chuàng)意輸出的質(zhì)量提升了35%（基于人類專家盲測(cè)）。

這表明，AI的創(chuàng)造力并非固定不變，而是可以通過結(jié)構(gòu)化思維引導(dǎo)優(yōu)化。

下圖展示了多個(gè)主流文圖生成模型在創(chuàng)意生成任務(wù)中的表現(xiàn)，分別由人類專家、完整的IEI 方法（識(shí)別+解釋+引申），以及簡(jiǎn)化的II方法（識(shí)別+引申）進(jìn)行偏好排名評(píng)估。

排名分?jǐn)?shù)越低表示生成結(jié)果越受歡迎。

可以看出，使用IEI框架優(yōu)化后的模型在生成質(zhì)量上更接近人類專家偏好，說明該方法在提升創(chuàng)意輸出方面具有顯著效果。

從理論到應(yīng)用：AI創(chuàng)造力的未來

總體而言，該研究的價(jià)值不僅在于評(píng)估，更在于為AI的創(chuàng)造性應(yīng)用提供了方法論：

設(shè)計(jì)：使AI能真正理解“為什么這樣組合有意義”，而非機(jī)械拼貼；
認(rèn)知研究：為人類與機(jī)器創(chuàng)造力的比較提供了標(biāo)準(zhǔn)化基準(zhǔn)。

這組圖像展示了AI如何通過重組動(dòng)物特征來表達(dá)抽象屬性，如顏色、速度、用途與形態(tài)，以視覺方式呈現(xiàn)出對(duì)不同概念特征的理解與創(chuàng)意表達(dá)。

也可以把看起來無關(guān)的物體和概念組合在一起，生成帶有隱喻的圖像，用一種新穎的方式表達(dá)社會(huì)話題。

同時(shí)，還能將日常用品（如護(hù)手霜、背包）與象征物（如花朵、皇冠、地圖）進(jìn)行創(chuàng)意組合，以展現(xiàn)AI在產(chǎn)品設(shè)計(jì)中的應(yīng)用潛力。

順便一提，目前團(tuán)隊(duì)創(chuàng)建的CreativeMashup數(shù)據(jù)集已開放下載。

論文地址：https://ppyyqq.github.io/aicc/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.