草莓,來得比想象中的要更快!
這兩天網(wǎng)上一直在傳OpenAI將會在兩周內(nèi)發(fā)布全新的草莓模型,號稱史上最強。
結(jié)果消息剛傳出來,OpenAI就在北京時間的半夜正式發(fā)布了全新的o1模型系列。
川哥記得去年下半年就有人一直在傳OpenAI在秘密訓(xùn)練新的大模型。
而OpenAI創(chuàng)始人奧特曼也在公眾面前多次明示暗示他們在訓(xùn)練中見到了不可思議的事兒。
而如今,這顆被寄予厚望的"草莓"也終于揭開了神秘面紗。
說實話,川哥第一眼看到o1的介紹時,確實有被震撼到。
這哪里是一顆草莓,這分明就是一顆原子彈啊!
它不僅在各種高難度基準(zhǔn)測試中碾壓GPT-4,甚至在某些領(lǐng)域已經(jīng)超越了人類專家。
更重要的是,o1的出現(xiàn),很可能給整個AI領(lǐng)域帶來一場史詩級的變革。
o1到底有多強?
在國際數(shù)學(xué)奧林匹克(IMO)資格考試中,強如GPT-4也只能正確解答13%的問題,而o1卻能解決83%!
這意味著,o1已經(jīng)有能力獲得數(shù)學(xué)奧賽金牌了。
要知道,數(shù)學(xué),從來就是衡量智能的金標(biāo)準(zhǔn)。
而如今,AI終于在這一領(lǐng)域,與人類天才近乎并肩了。
更令人震撼的是,在GPQA Diamond這種博士級別的基準(zhǔn)測試中,o1更是首次超越了擁有博士學(xué)位的人類專家。
這個基準(zhǔn)測試涵蓋了化學(xué)、物理和生物學(xué)等領(lǐng)域的高深知識,o1能在這里勝出,足以證明它已經(jīng)具備了相當(dāng)強大的科學(xué)推理能力。
在編程方面,o1同樣表現(xiàn)驚艷。
在模擬的Codeforces編程競賽中,o1的Elo評分高達1807,超過了93%的人類競爭對手。
這意味著,o1已經(jīng)可以成為一名出色的軟件工程師了。
但o1最讓人驚嘆的,還是它的思考能力。
就像人類在回答難題前要深思熟慮一樣,o1會在給出答案前先進行大量的內(nèi)部推理。
通過強化學(xué)習(xí),它能不斷完善自己的思維過程,嘗試各種策略,甚至意識到自己的錯誤并加以修正。
這種"深思熟慮"的能力,讓o1可以解決之前AI無法應(yīng)對的復(fù)雜問題。
同時也驗證了語言模型能通過強化學(xué)習(xí)實現(xiàn)躍升。
就像AlphaGo當(dāng)年一樣,給AI模型越多算力,它就輸出越多智能。
咱們不妨大膽想一想,如果這一過程無限延續(xù)下去,智能爆炸還會遠嗎?
說實話,看到這里,川哥不禁想起了電影《她》中的AI助手薩曼莎。
o1的思考模式,是不是已經(jīng)越來越接近真正的智能了?
當(dāng)然,OpenAI也意識到了o1潛在的風(fēng)險。
為了確保安全,他們采取了一系列措施,包括將安全規(guī)則整合到o1的思維鏈中,以及隱藏原始思維鏈等。
但這些措施是否足夠?在AI越來越強大的今天,我們真的能完全掌控它嗎?
不過,話說回來,o1的出現(xiàn)無疑是一個重大突破。
雖然它還不能稱為AGI,但它的出現(xiàn)無疑預(yù)示著,那個曾經(jīng)只存在于科幻中的未來,正以前所未有的速度迫近我們。
想到這,川哥突然腦洞大開,o1里的o或許也有一層"origin"的深意,起源、開端,1則暗示了一個全新時代的開啟。
AGI時代,或許真的很近了。
OpenAI目前針對ChatGPT付費用戶開放了o1的兩個版本,o1預(yù)覽版和o1 mini版。
o1預(yù)覽版每周只能使用30次,o1-mini版每周可以使用50次。
從這兒也不難看出來,o1需要調(diào)用的算力有多強了,哪怕是去年的GPT 4也是以小時為單位的,到o1這直接按周來計算了。
而這還都不算是完全形態(tài)的o1模型。
等到o1的完全體開放的時候,難以想象會是一個什么局面。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.