“AI永遠(yuǎn)無法取代人類”證據(jù)-1!
北大團(tuán)隊(duì)最新論文揭示:人類引以為傲的創(chuàng)造力,如今AI也開始掌握了。
甚至,研究人員還提出了一種系統(tǒng)性框架,首次從認(rèn)知科學(xué)的角度,對(duì)AI模型的組合創(chuàng)造力(Combinational Creativity)進(jìn)行了量化評(píng)估與優(yōu)化。
結(jié)果發(fā)現(xiàn),GPT-4等先進(jìn)模型在創(chuàng)意理解任務(wù)上已經(jīng)超越普通人類(準(zhǔn)確率70% vs. 50%)。
這項(xiàng)研究不僅揭示了當(dāng)前先進(jìn)模型理解組合創(chuàng)造力的水平,還提出了一種可計(jì)算的方法,顯著提升了AI的創(chuàng)意生成能力。
值得一提的是,這篇論文還被認(rèn)知科學(xué)學(xué)會(huì)年度會(huì)議CogSci 2025收錄,并被大會(huì)選為口頭報(bào)告(Oral)進(jìn)行現(xiàn)場(chǎng)講解。
所以,這到底是咋回事兒呢?
AI開始掌握人類創(chuàng)造力的核心機(jī)制
一切起源于這樣一個(gè)問題:
- 當(dāng)AI看到寄居蟹住進(jìn)易拉罐,它想到了什么?
一只寄居蟹鉆進(jìn)廢棄的易拉罐——這個(gè)畫面你可能在海灘上見過。大多數(shù)人只是一笑而過,但藝術(shù)家卻能從中讀出深刻的環(huán)保警示,比如人類垃圾正在成為野生動(dòng)物的“新家園”。
那么,人工智能會(huì)怎么“想”呢?
最新研究揭示了一個(gè)令人驚訝的答案:AI正在學(xué)會(huì)像藝術(shù)家一樣進(jìn)行“組合創(chuàng)造”。不是簡(jiǎn)單地拼貼概念,而是真正理解為什么某些看似不相關(guān)的元素組合在一起會(huì)產(chǎn)生全新的意義。
當(dāng)AI看到寄居蟹與易拉罐的組合時(shí),它不僅能識(shí)別出“動(dòng)物+容器”的基本元素,還能解釋它們之間的功能關(guān)聯(lián)(都是“居住空間”),更進(jìn)一步,它開始理解這種組合背后的深層含義,即對(duì)人類活動(dòng)影響自然生態(tài)的反思。
這種從“識(shí)別”→“解釋”→“引申”的三層認(rèn)知過程,正是人類創(chuàng)造力的核心機(jī)制。而現(xiàn)在,AI也開始掌握這種能力了。
要知道在人類智能的諸多特質(zhì)中,創(chuàng)造力被認(rèn)為是最難被機(jī)器復(fù)制的能力之一。
尤其是“組合創(chuàng)造力”(Combinational Creativity),即通過重新組合已有概念,生成新穎、富有意義的想法,被視為真正創(chuàng)新的核心。
盡管近年來如GPT-4V、DALL·E 3等視覺-語言模型(VLMs)在生成圖像和文本方面展現(xiàn)出驚人的“創(chuàng)意”,但其底層機(jī)制究竟是真正的“創(chuàng)造性組合”,還是對(duì)訓(xùn)練數(shù)據(jù)的復(fù)雜模仿,仍是AI研究領(lǐng)域爭(zhēng)論的焦點(diǎn)。
傳統(tǒng)評(píng)估AI創(chuàng)造力的方法多聚焦于結(jié)果的“新穎性”與“實(shí)用性”,而忽略了“創(chuàng)造性過程”本身的結(jié)構(gòu)與機(jī)制。
因此,要判斷AI是否真的“理解”組合創(chuàng)造,就必須建立一個(gè)能夠揭示其認(rèn)知路徑的系統(tǒng)框架。
用系統(tǒng)性框架量化評(píng)估AI的“組合創(chuàng)造力”
對(duì)此,受認(rèn)知科學(xué)家Margaret Boden和認(rèn)知科學(xué)中的“概念融合理論”(Conceptual Blending Theory)的啟發(fā),研究團(tuán)隊(duì)首次提出了一個(gè)面向AI系統(tǒng)的分層評(píng)估框架——IEI框架(Identification–Explanation–Implication)。
該框架將組合創(chuàng)造力分解為三個(gè)層次:
- 識(shí)別(Identification):能否正確分解輸入概念的基本元素;
- 解釋(Explanation):能否發(fā)現(xiàn)概念間的潛在關(guān)聯(lián);
- 引申(Implication):能否理解超越原始輸入的語義內(nèi)涵。
這一框架不僅適用于評(píng)估AI,也為人類創(chuàng)造力的計(jì)算化研究提供了新思路。
上圖展示了IEI框架如何結(jié)合“概念融合理論”,對(duì)組合創(chuàng)造力進(jìn)行建模與評(píng)估。
在左側(cè),兩個(gè)輸入概念通過共性抽象(Generic Space)與融合空間(Blend Space)產(chǎn)生新的組合創(chuàng)意。
右側(cè)則對(duì)應(yīng)IEI框架在理解與生成任務(wù)中的三層處理邏輯:從識(shí)別基本元素(如寄居蟹與易拉罐)、解釋功能類比(如容器功能相似),再到引申出更深層的意義(如對(duì)人類破壞動(dòng)物棲息地的環(huán)保反思)。
這一流程可用于系統(tǒng)評(píng)估AI模型對(duì)組合創(chuàng)意的理解能力,并引導(dǎo)生成具有多層含義的創(chuàng)意內(nèi)容。
實(shí)驗(yàn)結(jié)果:超越平均人類,但仍不及專家
通過構(gòu)建包含專業(yè)藝術(shù)家創(chuàng)作組合的數(shù)據(jù)集(CreativeMashup),研究發(fā)現(xiàn):
GPT-4等先進(jìn)模型在創(chuàng)意理解任務(wù)上已超越普通人類(準(zhǔn)確率70% vs. 50%);但在深層語義解讀(如隱喻、文化象征)上,仍顯著落后于人類專家(人類專家的平均勝率為78%)。
下圖為人類被試與模型在三個(gè)任務(wù)上的實(shí)驗(yàn)結(jié)果:
更關(guān)鍵的是,當(dāng)研究團(tuán)隊(duì)將這一框架嵌入生成模型(如DALL-E 3)時(shí),其創(chuàng)意輸出的質(zhì)量提升了35%(基于人類專家盲測(cè))。
這表明,AI的創(chuàng)造力并非固定不變,而是可以通過結(jié)構(gòu)化思維引導(dǎo)優(yōu)化。
下圖展示了多個(gè)主流文圖生成模型在創(chuàng)意生成任務(wù)中的表現(xiàn),分別由人類專家、完整的IEI 方法(識(shí)別+解釋+引申),以及簡(jiǎn)化的II方法(識(shí)別+引申)進(jìn)行偏好排名評(píng)估。
排名分?jǐn)?shù)越低表示生成結(jié)果越受歡迎。
可以看出,使用IEI框架優(yōu)化后的模型在生成質(zhì)量上更接近人類專家偏好,說明該方法在提升創(chuàng)意輸出方面具有顯著效果。
從理論到應(yīng)用:AI創(chuàng)造力的未來
總體而言,該研究的價(jià)值不僅在于評(píng)估,更在于為AI的創(chuàng)造性應(yīng)用提供了方法論:
- 設(shè)計(jì):使AI能真正理解“為什么這樣組合有意義”,而非機(jī)械拼貼;
- 認(rèn)知研究:為人類與機(jī)器創(chuàng)造力的比較提供了標(biāo)準(zhǔn)化基準(zhǔn)。
這組圖像展示了AI如何通過重組動(dòng)物特征來表達(dá)抽象屬性,如顏色、速度、用途與形態(tài),以視覺方式呈現(xiàn)出對(duì)不同概念特征的理解與創(chuàng)意表達(dá)。
也可以把看起來無關(guān)的物體和概念組合在一起,生成帶有隱喻的圖像,用一種新穎的方式表達(dá)社會(huì)話題。
同時(shí),還能將日常用品(如護(hù)手霜、背包)與象征物(如花朵、皇冠、地圖)進(jìn)行創(chuàng)意組合,以展現(xiàn)AI在產(chǎn)品設(shè)計(jì)中的應(yīng)用潛力。
順便一提,目前團(tuán)隊(duì)創(chuàng)建的CreativeMashup數(shù)據(jù)集已開放下載。
論文地址:https://ppyyqq.github.io/aicc/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.