網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

OpenAI重磅推出o1模型：從“秒答”到“深思熟慮”！

2024-09-13 15:22:52　來源: 小微模型

北京舉報

分享至

凌晨 1 點(diǎn)，OpenAI 悄悄上線了o1模型。

相比過去的 GPT 系列，o1模型不僅具備超強(qiáng)的推理能力，還可以像人類一樣仔細(xì)思考。

你沒聽錯！AI 不再是那種"秒答"的小助手，而是升級成一個會“深思熟慮”的大腦。

o1 模型到底有多強(qiáng)？

大家都知道 GPT-4 強(qiáng)大，但o1模型直接超越了 GPT 系列，以更強(qiáng)的推理能力登場。

之前 OpenAI 推出的 GPT 模型已經(jīng)很能干了，比如幫我們寫文章、編程、回答各種問題。而這次，o1讓 AI 變得更聰明，尤其在處理復(fù)雜問題時簡直堪稱神器。

根據(jù) OpenAI 的測試，o1模型在一些高難度的數(shù)學(xué)和科學(xué)問題上達(dá)到了令人難以置信的準(zhǔn)確度。在 2024 年的美國數(shù)學(xué)邀請賽（AIME）中，o1模型的正確率高達(dá) 83%，直接進(jìn)入了美國前 500 名數(shù)學(xué)高手的行列。而GPT-4o 的正確率僅為 13%，差距簡直巨大！

另外，o1在編程比賽中的表現(xiàn)也相當(dāng)亮眼，尤其是在 Codeforces 上，它的Elo 評分達(dá)到了 1807，高于 93% 的競爭對手，這簡直是 AI 編程能力的又一次飛躍。要知道，GPT-4o 在這方面的 Elo 評分只有 808，對比之下，o1 不僅速度快，準(zhǔn)確率也高得驚人。

o1 模型的“深思熟慮”

一直以來，AI 模型的發(fā)展都受到推理能力的局限，但 OpenAI 的 o1 模型似乎徹底打破了這個瓶頸。它不再像以往的模型那樣只靠海量數(shù)據(jù)進(jìn)行“死記硬背”，而是引入了強(qiáng)化學(xué)習(xí)機(jī)制。用通俗的話說，o1 會在給出答案之前“思考”。它會在響應(yīng)問題之前形成一個“思維鏈”，這讓它在復(fù)雜問題上表現(xiàn)得像個真正的思考者。

這就好比你問一個人難題，他不會馬上回答，而是先沉思片刻，整理思路再做出回復(fù)。而 o1 的思維鏈和推理能力，在OpenAI的測試中表現(xiàn)出色，甚至超過了很多博士級別的專家。

這可是一個真正的飛躍！這也讓OpenAI CEO 奧特曼在發(fā)布會上直言：“雖然 o1 還有缺陷，但第一次使用它時，你一定會被它震撼到。”

更貴、更慢，但更聰明的 o1

雖然o1模型的能力非常強(qiáng)大，但它也有一些明顯的不足。

首先，它的推理速度比較慢。

與 GPT 系列不同，o1需要花費(fèi)10 到 20 秒來生成答案。這意味著，如果你想讓o1來回答一些簡單的問題，它可能會顯得“有點(diǎn)笨拙”，因?yàn)樗枰ǜ鄷r間去“思考”。

其次，o1 的使用成本也非常高。

據(jù) OpenAI 透露，在 API 中，o1-preview每 100 萬個 token 的輸入費(fèi)用為 15 美元，輸出費(fèi)用高達(dá) 60 美元，比 GPT-4o 高出3到4倍。這對于一些小型企業(yè)或個人開發(fā)者來說，可能會帶來不小的經(jīng)濟(jì)負(fù)擔(dān)。

雖然速度慢、價格高，但o1的推理能力確實(shí)讓它在應(yīng)對復(fù)雜問題時無可替代。如果你是編程、科學(xué)研究、數(shù)學(xué)推理等領(lǐng)域的從業(yè)者，o1將會是你最強(qiáng)的幫手。

o1-mini價格友好的選擇

為了讓更多用戶能夠體驗(yàn)到o1的強(qiáng)大，OpenAI 還發(fā)布了o1-mini版本。相比o1-preview，o1-mini的推理能力稍微弱一點(diǎn)，但它更加高效、價格也更加親民。

這個版本專門為STEM（科學(xué)、技術(shù)、工程、數(shù)學(xué)）領(lǐng)域進(jìn)行了優(yōu)化，尤其在編程任務(wù)中表現(xiàn)不俗。

o1-mini在數(shù)學(xué)競賽中的表現(xiàn)也很出色，得分與o1-preview相差不大，但它的使用成本更低。如果你是一個開發(fā)者，想要體驗(yàn)o1的強(qiáng)大推理能力，那么o1-mini可能是一個不錯的選擇。

o1將如何改變未來？

目前，ChatGPT Plus 和 Team 用戶已經(jīng)可以通過 ChatGPT 使用o1-preview和o1-mini。不過，每位用戶每周只能發(fā)送 30 條o1-preview消息，或 50 條o1-mini消息。

對于企業(yè)和教育用戶，OpenAI 計劃下周開放這兩個模型的使用權(quán)限。如果你是開發(fā)者，還可以通過 API 使用o1進(jìn)行應(yīng)用開發(fā)。不過，API 的使用速率有限，每分鐘只能發(fā) 20 次請求。

未來，OpenAI 還計劃為o1增加更多功能，比如網(wǎng)絡(luò)瀏覽、文件和圖片上傳等。隨著這些功能的逐步推出，o1的應(yīng)用場景將會更加廣泛，不僅在科學(xué)、編程、教育等領(lǐng)域有巨大的潛力，甚至可能在更多日常生活中得到應(yīng)用。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.