凌晨 1 點(diǎn),OpenAI 悄悄上線了o1模型。
相比過去的 GPT 系列,o1模型不僅具備超強(qiáng)的推理能力,還可以像人類一樣仔細(xì)思考。
你沒聽錯!AI 不再是那種"秒答"的小助手,而是升級成一個會“深思熟慮”的大腦。
o1 模型到底有多強(qiáng)?
大家都知道 GPT-4 強(qiáng)大,但o1模型直接超越了 GPT 系列,以更強(qiáng)的推理能力登場。
之前 OpenAI 推出的 GPT 模型已經(jīng)很能干了,比如幫我們寫文章、編程、回答各種問題。而這次,o1讓 AI 變得更聰明,尤其在處理復(fù)雜問題時簡直堪稱神器。
根據(jù) OpenAI 的測試,o1模型在一些高難度的數(shù)學(xué)和科學(xué)問題上達(dá)到了令人難以置信的準(zhǔn)確度。在 2024 年的美國數(shù)學(xué)邀請賽(AIME)中,o1模型的正確率高達(dá) 83%,直接進(jìn)入了美國前 500 名數(shù)學(xué)高手的行列。而GPT-4o 的正確率僅為 13%,差距簡直巨大!
另外,o1在編程比賽中的表現(xiàn)也相當(dāng)亮眼,尤其是在 Codeforces 上,它的Elo 評分達(dá)到了 1807,高于 93% 的競爭對手,這簡直是 AI 編程能力的又一次飛躍。要知道,GPT-4o 在這方面的 Elo 評分只有 808,對比之下,o1 不僅速度快,準(zhǔn)確率也高得驚人。
o1 模型的“深思熟慮”
一直以來,AI 模型的發(fā)展都受到推理能力的局限,但 OpenAI 的 o1 模型似乎徹底打破了這個瓶頸。它不再像以往的模型那樣只靠海量數(shù)據(jù)進(jìn)行“死記硬背”,而是引入了強(qiáng)化學(xué)習(xí)機(jī)制。用通俗的話說,o1 會在給出答案之前“思考”。它會在響應(yīng)問題之前形成一個“思維鏈”,這讓它在復(fù)雜問題上表現(xiàn)得像個真正的思考者。
這就好比你問一個人難題,他不會馬上回答,而是先沉思片刻,整理思路再做出回復(fù)。而 o1 的思維鏈和推理能力,在OpenAI的測試中表現(xiàn)出色,甚至超過了很多博士級別的專家。
這可是一個真正的飛躍!這也讓OpenAI CEO 奧特曼在發(fā)布會上直言:“雖然 o1 還有缺陷,但第一次使用它時,你一定會被它震撼到。”
更貴、更慢,但更聰明的 o1
雖然o1模型的能力非常強(qiáng)大,但它也有一些明顯的不足。
首先,它的推理速度比較慢。
與 GPT 系列不同,o1需要花費(fèi)10 到 20 秒來生成答案。這意味著,如果你想讓o1來回答一些簡單的問題,它可能會顯得“有點(diǎn)笨拙”,因?yàn)樗枰ǜ鄷r間去“思考”。
其次,o1 的使用成本也非常高。
據(jù) OpenAI 透露,在 API 中,o1-preview每 100 萬個 token 的輸入費(fèi)用為 15 美元,輸出費(fèi)用高達(dá) 60 美元,比 GPT-4o 高出3到4倍。這對于一些小型企業(yè)或個人開發(fā)者來說,可能會帶來不小的經(jīng)濟(jì)負(fù)擔(dān)。
雖然速度慢、價格高,但o1的推理能力確實(shí)讓它在應(yīng)對復(fù)雜問題時無可替代。如果你是編程、科學(xué)研究、數(shù)學(xué)推理等領(lǐng)域的從業(yè)者,o1將會是你最強(qiáng)的幫手。
o1-mini價格友好的選擇
為了讓更多用戶能夠體驗(yàn)到o1的強(qiáng)大,OpenAI 還發(fā)布了o1-mini版本。相比o1-preview,o1-mini的推理能力稍微弱一點(diǎn),但它更加高效、價格也更加親民。
這個版本專門為STEM(科學(xué)、技術(shù)、工程、數(shù)學(xué))領(lǐng)域進(jìn)行了優(yōu)化,尤其在編程任務(wù)中表現(xiàn)不俗。
o1-mini在數(shù)學(xué)競賽中的表現(xiàn)也很出色,得分與o1-preview相差不大,但它的使用成本更低。如果你是一個開發(fā)者,想要體驗(yàn)o1的強(qiáng)大推理能力,那么o1-mini可能是一個不錯的選擇。
o1將如何改變未來?
目前,ChatGPT Plus 和 Team 用戶已經(jīng)可以通過 ChatGPT 使用o1-preview和o1-mini。不過,每位用戶每周只能發(fā)送 30 條o1-preview消息,或 50 條o1-mini消息。
對于企業(yè)和教育用戶,OpenAI 計劃下周開放這兩個模型的使用權(quán)限。如果你是開發(fā)者,還可以通過 API 使用o1進(jìn)行應(yīng)用開發(fā)。不過,API 的使用速率有限,每分鐘只能發(fā) 20 次請求。
未來,OpenAI 還計劃為o1增加更多功能,比如網(wǎng)絡(luò)瀏覽、文件和圖片上傳等。隨著這些功能的逐步推出,o1的應(yīng)用場景將會更加廣泛,不僅在科學(xué)、編程、教育等領(lǐng)域有巨大的潛力,甚至可能在更多日常生活中得到應(yīng)用。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.