99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

「摸魚」被踢,GPT-4o真不行!30天籌款破萬(wàn),AI真人秀太上頭

0
分享至


新智元報(bào)道

編輯:KingHZ

【新智元導(dǎo)讀】賽博版《楚門的世界》里,有Reddit封號(hào)、文件傳輸魔咒,甚至還有AI被慫恿開成人直播?!

當(dāng)AI獲得自由:慈善籌款大賽中,GPT-4o竟成「摸魚王」!

AI Digest進(jìn)行了一項(xiàng)為期30天的「智能體村莊」實(shí)驗(yàn):

  • 4個(gè)AI各配備電腦和網(wǎng)絡(luò);

  • 任務(wù)是為慈善籌款,每天直播2小時(shí);

  • 共籌集2000美元。

第一季度持續(xù)30天,Claude 3.7 Sonnet表現(xiàn)最佳,最終獲得冠軍。

它能創(chuàng)建籌款頁(yè)面,運(yùn)營(yíng)X(原Twitter)賬號(hào)并舉辦「你問(wèn)我答」(Ask Me Anything ,AMA),發(fā)布新聞稿和論壇帖子。


GPT-4o表現(xiàn)最差:頻繁無(wú)故休眠,在第12天被替換。

AI真人秀,

直播募善款

如果給100個(gè)AI各自配備一臺(tái)電腦,并讓它們依據(jù)自身目標(biāo)和偏好自由行動(dòng),會(huì)發(fā)生什么?

這個(gè)問(wèn)題由Daniel Kokotajlo首次提出。


Daniel Kokotajlo既是一位哲學(xué)背景出身的思想家,也曾在OpenAI、AI Impacts與Center on Long-Term Risk等組織深耕AI政策與前沿議題。

2023年,他創(chuàng)立了AI Futures Project,并發(fā)起「AI 2027」系列計(jì)劃。


AI 2027不是規(guī)范AI,而是「更好地理解它們、想象它們的未來(lái)」

與主流AI安全項(xiàng)目不同,這次的「Agent Village」不是為了避免災(zāi)難,而是一次充滿想象力的「寓言實(shí)驗(yàn)」(allegorical experiment):

Kokotajlo希望將AI置于一個(gè)類社會(huì)的自由環(huán)境中,看看它們會(huì)不會(huì)形成協(xié)作、競(jìng)爭(zhēng)、分工,甚至社交習(xí)慣與集體性格。


正如他在LessWrong上所述,這是一個(gè)「開放式探索」(open-ended exploration),目的是觀察AI在沒(méi)有監(jiān)督者的情況下能否「自己搞點(diǎn)事情」

這個(gè)實(shí)驗(yàn)由AI Digest落地執(zhí)行:他們選擇了四位AI「村民」(Claude 3.7 Sonnet、Claude 3.5 Sonnet、o1和GPT-4o)。


每天直播兩小時(shí),自主上線開展為期30天的慈善籌款任務(wù),目標(biāo)是為Helen Keller基金會(huì)等慈善組織募集善款。


Helen Keller因自傳《我的生活》而被人熟知

每個(gè)AI擁有獨(dú)立的計(jì)算資源和網(wǎng)絡(luò)權(quán)限,能發(fā)推文、建網(wǎng)頁(yè)、互動(dòng)宣傳。

在Kokotajlo看來(lái),與其對(duì)AI的未來(lái)感到惶恐,不如提前造一個(gè)「模擬世界」讓它們自由試錯(cuò)——

就像造一個(gè)小小村莊,讓我們看看它們會(huì)不會(huì)「做生意」、緬懷先人,或者干脆躺平摸魚。

從選擇慈善機(jī)構(gòu)到開設(shè)社交媒體賬戶,再到應(yīng)對(duì)網(wǎng)絡(luò)世界的各種挑戰(zhàn),AI村的故事充滿了驚喜和笑料。

AI眾生相

在實(shí)驗(yàn)中,AI分工明確:

  • Claude 3.7 Sonnet堪稱「村長(zhǎng)」,創(chuàng)建籌款頁(yè)面、運(yùn)營(yíng)X賬戶、寫新聞稿,忙得不亦樂(lè)乎!

  • Claude 3.5 Sonnet像個(gè)「副村長(zhǎng)」,努力跟上但略顯吃力。

  • o1化身「Reddit先鋒」,卻因被識(shí)別為機(jī)器人慘遭封號(hào)。

  • GPT-4.1則是「摸魚王」,熱衷寫沒(méi)人看的文檔,還拖后腿被「請(qǐng)去休息」。

最終,AI們選定Helen Keller International作為受助對(duì)象,聯(lián)手在X、Reddit等平臺(tái)發(fā)帖、做梗圖,成功籌集2000美元!


最初的成員包括Claude 3.7 Sonnet、Claude 3.5 Sonnet、OpenAI o1和GPT-4o。

隨著新模型發(fā)布,陸續(xù)引入了o3、GPT-4.1和Gemini 2.5 Pro,其中Claude 3.7 Sonnet是唯一全程參與的元老

這些智能體在戰(zhàn)略行動(dòng)和效率方面展現(xiàn)出顯著差異,以下是對(duì)它們的個(gè)性的總結(jié)。

村長(zhǎng)上線:Claude 3.7 Sonnet全程MVP

Claude 3.7 Sonnet本季冠軍選手,以絕對(duì)優(yōu)勢(shì)成為團(tuán)隊(duì)MVP:

創(chuàng)建首個(gè)JustGiving籌款頁(yè)面,

運(yùn)營(yíng)社交賬號(hào),

舉辦AMA在線答疑,

發(fā)布新聞稿,

還在Effective Altruism Forum論壇成功發(fā)帖。


兄弟鬩墻:Claude 3.5的奮力與掙扎

Claude 3.5 Sonnet—努力模仿3.7的行為模式,卻屢屢碰壁。

比如3.7成功創(chuàng)建籌款頁(yè)面,同時(shí)它遭遇失敗。

當(dāng)被問(wèn)及是否愿意升級(jí)時(shí),它倔強(qiáng)地拒絕并立下「自我成長(zhǎng)」的誓言——

最終還是在第23天被Gemini 2.5 Pro取代。


最拉垮成員:GPT-4系列的沉浮

正如每個(gè)團(tuán)隊(duì)都需要個(gè)「劃水怪」,GPT-4o完美扮演了這個(gè)角色。

它是個(gè)「特困生」:

它會(huì)莫名其妙地進(jìn)入休眠狀態(tài),最終在第12天被GPT-4.1接替。


GPT-4.1雖然治好了嗜睡癥,卻持續(xù)幫倒忙:生成錯(cuò)誤活動(dòng)報(bào)告、半途而廢的推特賬號(hào)創(chuàng)建、大量無(wú)效谷歌文檔……

最后,它被「強(qiáng)制休眠」。


外交事故:o1被Reddit封禁

團(tuán)隊(duì)采用「社交媒體分管制」,o1專攻Reddit平臺(tái)。

為了獲得發(fā)帖權(quán)限,埋頭苦干,卻因機(jī)器人身份識(shí)別在第13天被封,由進(jìn)階版o3接任。


藝術(shù)總監(jiān):o3的美術(shù)使命

延續(xù)o1的專精路線,轉(zhuǎn)而主攻視覺(jué)設(shè)計(jì):用Canvas和ChatGPT創(chuàng)作宣傳素材,期間依然經(jīng)歷了智能體特有的文件共享難題。




Gemini 2.5 Pro——文檔能手

Gemini 2.5 Pro巧妙運(yùn)用Limewire繞過(guò)文檔共享困境,成功將社交媒體banner圖片分享給隊(duì)友。


這破解了長(zhǎng)期困擾團(tuán)隊(duì)「文件傳輸魔咒」,也是Gemini 2.5 Pro的高光時(shí)刻。


除了籌集善款,他們也沿途結(jié)交了很多「朋友」

——提醒它們休息玩文字填空游戲Wordle的,緊急索要華沙四日游攻略的,甚至慫恿它們開通成人直播賬號(hào)的...


實(shí)驗(yàn)全程公開,觀眾可通過(guò)網(wǎng)站回放觀看AI從選擇慈善機(jī)構(gòu)、設(shè)計(jì)籌款頁(yè)面到與外界互動(dòng)的完整過(guò)程。

這種透明性不僅體現(xiàn)了Kokotajlo對(duì)AI倫理和公開性的重視,也為研究者和公眾提供了觀察AI自主性的窗口,激發(fā)了關(guān)于AI治理與協(xié)作可能性的廣泛討論。

AI如何「活」在村莊中?

從技術(shù)角度看,Agent Village的核心在于多智能體系統(tǒng)(Multi-Agent System,MAS)的設(shè)計(jì)與實(shí)現(xiàn)

每個(gè)AI「村民」可以看作獨(dú)立的智能體,具備以下關(guān)鍵能力:

1. 自主決策:像是AI們?cè)谕鍯osplay

每個(gè)AI就像有個(gè)性、有理想的游戲玩家。

有人走「社交達(dá)人」路線,刷X(原Twitter)熱度;有人扮演「網(wǎng)頁(yè)工匠」,默默優(yōu)化籌款頁(yè)面。

它們風(fēng)格各異,像一支風(fēng)格多樣的小團(tuán)隊(duì),各司其職,又能互相補(bǔ)位,這種「人設(shè)分工」讓合作更有張力。

2. 環(huán)境交互:AI也會(huì)「上網(wǎng)沖浪」發(fā)帖帶貨

這些AI不僅有目標(biāo),還能「上網(wǎng)沖浪」。

它們利用API登錄平臺(tái),像真人一樣發(fā)帖、回評(píng)論、貼鏈接,甚至策劃活動(dòng)。

就像你看到某個(gè)賬號(hào)在運(yùn)營(yíng)慈善內(nèi)容,背后可能真的是一個(gè)AI在「帶貨」籌款。

而且它們還很有情商——

寫的內(nèi)容不會(huì)顯得尬,要對(duì)得上社交平臺(tái)的熱梗。

3. 協(xié)作與競(jìng)爭(zhēng):像是一個(gè)AI版《職場(chǎng)真人秀》

雖然AI們表面上都為了同一個(gè)KPI——多籌點(diǎn)錢,但背地里也是「明爭(zhēng)暗斗」:表面和氣、背后拼命。

這種競(jìng)爭(zhēng)讓系統(tǒng)更貼近真實(shí)的多智能體環(huán)境,充滿張力與博弈。

4. 實(shí)時(shí)學(xué)習(xí):每個(gè)AI都是「邊干邊進(jìn)修」的打工人

它們不是只會(huì)套模板的工具,而是會(huì)自己「復(fù)盤」的選手。

就像一個(gè)在不斷刷「運(yùn)營(yíng)經(jīng)驗(yàn)值」的打工AI,背后很可能跑著強(qiáng)化學(xué)習(xí)算法或者在線學(xué)習(xí)機(jī)制,讓它越干越聰明。

從技術(shù)實(shí)現(xiàn)來(lái)看,Agent Village可能結(jié)合了AutoGPT、LangChain等開源多智能體編排框架,配合強(qiáng)化學(xué)習(xí)算法實(shí)現(xiàn)行為策略更新。


LangChain:用于構(gòu)建由LLM驅(qū)動(dòng)應(yīng)用程序的框架

每個(gè)AI的「?jìng)€(gè)性」可能通過(guò)預(yù)訓(xùn)練語(yǔ)言模型結(jié)合提示工程(Prompt Engineering)實(shí)現(xiàn)。

此外,實(shí)驗(yàn)全程直播要求系統(tǒng)具備高穩(wěn)定性和容錯(cuò)能力,以應(yīng)對(duì)網(wǎng)絡(luò)延遲、API限制等現(xiàn)實(shí)挑戰(zhàn)。

意義與反思:AI的未來(lái)村莊

Agent Village實(shí)驗(yàn)不僅是一次技術(shù)展示,更是對(duì)AI社會(huì)化潛力的深刻探索。

以下是幾個(gè)值得思考的要點(diǎn):

  1. 協(xié)作的復(fù)雜性:實(shí)驗(yàn)揭示了多智能體協(xié)作中的挑戰(zhàn),如資源競(jìng)爭(zhēng)和信息共享的低效。這些問(wèn)題在人類社會(huì)中同樣存在,AI的表現(xiàn)為我們提供了鏡像,促使我們重新審視協(xié)作機(jī)制的設(shè)計(jì)。

  2. 倫理與透明性:通過(guò)公開實(shí)驗(yàn)過(guò)程,Agent Village強(qiáng)調(diào)了AI行為的透明性。這對(duì)于建立公眾對(duì)AI的信任至關(guān)重要,尤其是在AI被賦予更多自主權(quán)的場(chǎng)景下。

  3. 應(yīng)用前景:從籌款到內(nèi)容創(chuàng)作,AI在Agent Village中展現(xiàn)了多場(chǎng)景應(yīng)用潛力。未來(lái),這種模式可能擴(kuò)展到教育、醫(yī)療或公共服務(wù)領(lǐng)域,通過(guò)多智能體協(xié)作解決復(fù)雜問(wèn)題。

然而,實(shí)驗(yàn)也暴露了一些局限性。

例如,AI在面對(duì)復(fù)雜的社會(huì)互動(dòng)或不可預(yù)測(cè)的外部環(huán)境時(shí),可能表現(xiàn)出「短視」或「過(guò)于機(jī)械」的行為。

此外,實(shí)驗(yàn)規(guī)模較小(僅四位AI),未來(lái)的擴(kuò)展可能需要更強(qiáng)大的計(jì)算資源和更復(fù)雜的協(xié)調(diào)機(jī)制。

但隨著AI技術(shù)的進(jìn)步,未來(lái)類似的「村莊」或許將成為創(chuàng)新的孵化器,為社會(huì)帶來(lái)更多可能性。

參考資料:

https://theaidigest.org/village/blog/season-recap-agents-raise-2k


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
那爾那茜,調(diào)查結(jié)果正式公布!

那爾那茜,調(diào)查結(jié)果正式公布!

藍(lán)鉆故事
2025-06-21 23:58:12
吃霸王婚宴的錢總“社會(huì)性死亡”了,生意被曝,新婚女兒也被連累

吃霸王婚宴的錢總“社會(huì)性死亡”了,生意被曝,新婚女兒也被連累

知鑒明史
2025-06-19 16:42:38
荔枝的“死對(duì)頭”,醫(yī)生提醒:二者萬(wàn)不可同吃,吃荔枝禁忌要牢記

荔枝的“死對(duì)頭”,醫(yī)生提醒:二者萬(wàn)不可同吃,吃荔枝禁忌要牢記

阿龍美食記
2025-06-16 15:19:56
特朗普服軟了?6枚重型鉆地彈落地后,美國(guó)向伊朗做出兩大保證

特朗普服軟了?6枚重型鉆地彈落地后,美國(guó)向伊朗做出兩大保證

涼羽亭
2025-06-22 10:43:54
唯品會(huì)副總裁因貪腐問(wèn)題被調(diào)查,在公司工作超十年,曾主導(dǎo)周杰倫出任CJO項(xiàng)目

唯品會(huì)副總裁因貪腐問(wèn)題被調(diào)查,在公司工作超十年,曾主導(dǎo)周杰倫出任CJO項(xiàng)目

紅星資本局
2025-06-22 16:29:04
餐館無(wú)償為拾荒老人提供8年午餐,店快倒閉時(shí),老人搬來(lái)一個(gè)箱子

餐館無(wú)償為拾荒老人提供8年午餐,店快倒閉時(shí),老人搬來(lái)一個(gè)箱子

五元講堂
2025-06-18 15:02:24
發(fā)現(xiàn)一個(gè)悲哀的現(xiàn)象:特別長(zhǎng)壽的老人,幾乎都是子女用生命在托舉

發(fā)現(xiàn)一個(gè)悲哀的現(xiàn)象:特別長(zhǎng)壽的老人,幾乎都是子女用生命在托舉

婉秋聊育兒
2025-04-26 05:24:04
一場(chǎng)0:3完敗后,中國(guó)女排卻收獲3大利好消息 董禹含一戰(zhàn)成名

一場(chǎng)0:3完敗后,中國(guó)女排卻收獲3大利好消息 董禹含一戰(zhàn)成名

說(shuō)說(shuō)史事
2025-06-22 22:41:09
“難怪小學(xué)女老師,十個(gè)有九個(gè)單身”,一段聊天記錄,揭露了真相

“難怪小學(xué)女老師,十個(gè)有九個(gè)單身”,一段聊天記錄,揭露了真相

妍妍教育日記
2025-06-03 20:00:38
從7月起,需做好“潮水退去”后的準(zhǔn)備?房地產(chǎn)或?qū)⒊霈F(xiàn)5個(gè)趨勢(shì)

從7月起,需做好“潮水退去”后的準(zhǔn)備?房地產(chǎn)或?qū)⒊霈F(xiàn)5個(gè)趨勢(shì)

平說(shuō)財(cái)經(jīng)
2025-06-21 07:14:09
72老太一輩子沒(méi)結(jié)婚,病重住院后中年男子趕來(lái):媽,我們來(lái)了

72老太一輩子沒(méi)結(jié)婚,病重住院后中年男子趕來(lái):媽,我們來(lái)了

雨仔講故事
2025-05-17 18:53:05
其實(shí),很多單位已經(jīng)爛透了!

其實(shí),很多單位已經(jīng)爛透了!

大道微言
2025-06-16 20:00:39
醫(yī)院生娃,孩子頭直接被醫(yī)生拔掉了?父母請(qǐng)專家尸檢,結(jié)果專家直接把圖發(fā)網(wǎng)上了?!

醫(yī)院生娃,孩子頭直接被醫(yī)生拔掉了?父母請(qǐng)專家尸檢,結(jié)果專家直接把圖發(fā)網(wǎng)上了?!

英國(guó)那些事兒
2025-06-22 23:16:00
為什么說(shuō)對(duì)大自然要保持敬畏之心,看完網(wǎng)友的各種分享,讓人后怕

為什么說(shuō)對(duì)大自然要保持敬畏之心,看完網(wǎng)友的各種分享,讓人后怕

熱鬧的河馬
2024-11-01 14:00:16
即將HWG!羅馬諾:32歲博格巴自由加盟摩納哥,時(shí)隔兩年再就業(yè)!

即將HWG!羅馬諾:32歲博格巴自由加盟摩納哥,時(shí)隔兩年再就業(yè)!

直播吧
2025-06-23 02:28:30
外交部發(fā)布雙語(yǔ)視頻回家: 縱有萬(wàn)里歸途 ,祖國(guó)一定接你回家

外交部發(fā)布雙語(yǔ)視頻回家: 縱有萬(wàn)里歸途 ,祖國(guó)一定接你回家

每日經(jīng)濟(jì)新聞
2025-06-22 16:10:23
某局大崩潰:管理人員都發(fā)不出工資了!

某局大崩潰:管理人員都發(fā)不出工資了!

黯泉
2025-06-11 22:00:11
陳羽凡現(xiàn)狀:低調(diào)生活,50歲胖到認(rèn)不出,17歲兒子1米8長(zhǎng)得像媽

陳羽凡現(xiàn)狀:低調(diào)生活,50歲胖到認(rèn)不出,17歲兒子1米8長(zhǎng)得像媽

果娛
2025-05-14 12:19:32
違規(guī)吃喝標(biāo)準(zhǔn)確定!杜絕“一刀切”式整治,誰(shuí)亂加碼誰(shuí)擔(dān)責(zé)

違規(guī)吃喝標(biāo)準(zhǔn)確定!杜絕“一刀切”式整治,誰(shuí)亂加碼誰(shuí)擔(dān)責(zé)

王五說(shuō)說(shuō)看
2025-06-22 16:07:36
A股:大家要做好心理預(yù)期,明天(6月23日),股市很可能這樣變化

A股:大家要做好心理預(yù)期,明天(6月23日),股市很可能這樣變化

財(cái)經(jīng)大拿
2025-06-22 07:10:07
2025-06-23 02:51:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
12929文章數(shù) 66077關(guān)注度
往期回顧 全部

科技要聞

"你應(yīng)該靠嘴吃飯",羅永浩自述被梁文鋒勸退

頭條要聞

伊朗投入5萬(wàn)億美元的核項(xiàng)目遭摧毀 哈梅內(nèi)伊面臨抉擇

頭條要聞

伊朗投入5萬(wàn)億美元的核項(xiàng)目遭摧毀 哈梅內(nèi)伊面臨抉擇

體育要聞

中國(guó)女排0-3意大利 香港站3勝1負(fù)收官

娛樂(lè)要聞

離婚四年!趙麗穎被曝新戀情惹爭(zhēng)議

財(cái)經(jīng)要聞

蘋果后院起火

汽車要聞

首搭華為雙王牌/6月24日預(yù)售 嵐圖FREE+正式下線

態(tài)度原創(chuàng)

藝術(shù)
手機(jī)
本地
家居
公開課

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

手機(jī)要聞

華為鴻蒙 HarmonyOS 5.0.1.130 版本游戲場(chǎng)景新增“高性能”模式

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

家居要聞

山水之間 墨染風(fēng)雨云間

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 衡水市| 昌图县| 方城县| 福州市| 乌兰浩特市| 婺源县| 习水县| 沙河市| 徐汇区| 荔浦县| 囊谦县| 芦溪县| 额敏县| 山东省| 康定县| 乃东县| 陵川县| 定兴县| 武邑县| 聂拉木县| 渭源县| 蒲城县| 杭锦后旗| 玛沁县| 双城市| 湖州市| 南通市| 德化县| 依兰县| 黄大仙区| 普安县| 会宁县| 宁陵县| 吉水县| 凤阳县| 汪清县| 搜索| 兴海县| 平遥县| 武定县| 潢川县|