99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

o3-pro正式推出!說聲“嗨”就花了80美元,思考1+1用時16分鐘

0
分享至

OpenAI深夜放大招,正式推出“最新最強版”推理模型o3-pro

而且同一時間,o3模型降價80%不降智。



官方測評結果顯示,在專家評估中,所有人一致更偏愛o3-pro而非o3的回答。



此外,o3-pro也一舉超越o3、o1-pro,成為當前最擅長數學、科學和編程的OpenAI模型。



OpenAI CEO奧特曼也第一時間激動表示:

  • 這真是太聰明了!我第一次看到它相對于o3的勝率時,簡直不敢相信。



目前o3-pro已取代o1-pro,面向ChatGPT的Pro和Team用戶開放,Enterprise和Edu用戶將在下周獲得使用權限。

而對開發(fā)者來說,o3-pro已經可以通過API接入:

每百萬輸入tokens收費20美元(約合人民幣143元),每百萬輸出tokens收費80美元(約合人民幣574元)

有多貴呢?

溫馨提醒,據稱一句簡單的“嗨”就花了網友80美元(doge)。



或許OpenAI也意識到這個價格確實有點貴,所以另一邊趕緊宣布o3降價80%。



o3降價80%不降智

官網顯示,o3的最新API價格如下:

每百萬輸入tokens收費2美元,每百萬輸出tokens收費8美元。

對比o1-pro下降了80%以上,不僅是o3-pro的1/10,而且和GPT-4o(每百萬輸入/輸出分別為2.5美元和10美元)基本持平。



至于降價原因,明面上的說法是OpenAI對推理服務架構進行了全面優(yōu)化。

就是說,雖然o3和o3-pro底層模型相同,但由于推理更高效,所以價格自然就下調了。

不過,就在奧特曼對這一價格“沾沾自喜”時,關于o3“是否真的沒有降智”卻陷入了爭議。



網友們也是相當直白,在奧特曼這條推文底下直接表達了懷疑:



甚至有博主以親身經歷(暫無法確定真實性)出來發(fā)聲,認為o3在實測中變笨了。

  • OpenAI降價并非出于慈善……



然而這一說法也遭到了其他網友的反駁,總體來看目前對峙雙方并未就這一爭議拿出實質性證據



雖然爭議尚未討論出具體結果,但一些關于o3-pro的測試結果已經新鮮出爐。

和開頭所提一致,官方在更嚴格的“4/4可靠性”評估中也驗證了o3-pro尤為擅長數學、科學和編程。

p.s. 這項評估需要o3-pro在四次嘗試中(而不僅僅是一次,pass@1)正確回答問題~



不過官方也多次提醒,由于o3-pro可以使用工具,因此響應時間通常比o1-pro更長

  • 我們建議將其用于對可靠性要求更高的棘手問題,等待幾分鐘是值得的。

這也和一眾網友實測下來的感受相符,o3-pro確實變強了,能夠解決一些其他模型無法答對的問題,不過由于響應變慢,價格也是真貴。

HyperWriteAI CEO讓它思考“1+1=?”,結果往往需要耗時1分鐘以上(第一次問甚至用時16分鐘)



當然,這也恰好代表了o3-pro的錯誤打開方式。

不論是官方建議還是一些好的網友實測結果,都說明o3-pro更適合挑戰(zhàn)一些有難度、有價值的問題

賓大教授Ethan Mollick分享了一個其他模型都曾鎩羽而歸的問題:從“SPACE”到“EARTH”制作一個單詞階梯。

這個游戲需要模型從“SPACE”到“EARTH”,每次只改變一個字母,單詞真實有效且長度不變(右側為解釋“為什么這是一個合法的英語單詞”)

而o3-pro成功完成了挑戰(zhàn),并且這不是模型通過聯(lián)網搜索得到的答案(即通過推理得到)



另一位生物醫(yī)學科學家也分享了與o3-pro合作開發(fā)免疫系統(tǒng)的例子。

作為對比,他也向o3提出了同一任務(要求先識別出人類天然免疫系統(tǒng)的關鍵局限性),結果表明o3-pro更勝一籌。

  • o3列出的前五個問題雖然強調了類似的重要問題,但后兩個問題無需徹底重構免疫系統(tǒng)即可解決。
  • 相比之下,o3-pro不僅提出了更多限制,而且它所指出的每一個限制都是極其關鍵、內在的問題,需要徹底重構。



整體而言,通過ARC-AGI測試結果可以看到,o3-pro在高難任務上表現略好,但提升幅度不大,且成本隨難度上升。

p.s. 這項測試主要考驗AI在面對新問題時的抽象推理和問題解決能力~



奧特曼發(fā)小作文

  • 這是我最后一次在沒有任何人工智能幫助的情況下寫這樣的文章了。

有意思的是,同一時間奧特曼也火速發(fā)了一篇小作文——

題目為《The Gentle Singularity(溫和的奇點)》,來探討AI發(fā)展對人類社會的影響。



其主要觀點包括下面這些:

1、2025年,我們迎來了能夠真正進行認知工作的智能Agent,編寫計算機代碼的方式將徹底改變。2026年,我們很可能會看到能產生原創(chuàng)見解的系統(tǒng);2027年,或許會出現能在現實世界中執(zhí)行任務的機器人

2、到了2030年代,智慧和能源——即想法及實現想法的能力——將變得極其豐富。這兩者長期以來一直是人類進步的基本限制;如果智慧和能源變得充足(加上良好的治理),理論上我們可以實現一切。

3、隨著數據中心的生產逐漸自動化,智能的成本最終應該會接近電力成本。(很多人關心ChatGPT每次查詢用多少能量;平均每次查詢大約耗電0.34瓦時,大概相當于烤箱運行一秒多一點,或高效燈泡使用幾分鐘。此外,每次查詢大約用水0.000085加侖,約等于十五分之一茶匙。)

4、相比AI,人類有一個長期且重要的優(yōu)勢:我們天生在意他人,以及他人怎么想、怎么做,而對機器卻沒什么感情。

5、從相對論的角度看,奇點是一點點發(fā)生的,融合是逐步進行的。我們正攀登那條技術指數增長的長弧線;向前看總覺得是陡峭的垂直,向后看則像是平緩的線,但其實它是一條平滑的曲線。(回想2020 年,如果那時我們說2025年會接近 AGI,聽起來會很瘋狂,但對比過去五年所發(fā)生的一切,也許現在的預測不那么瘋狂了。)

6、我們(整個行業(yè),不只是OpenAI)正在為世界構建一個大腦,它的極限將取決于我們的好點子。

7、OpenAI如今做的事情很多,但最根本的身份仍是一個超級智能研究公司

BTW,奧特曼最新推文有透露,原計劃中的公開權重模型要推遲了。



嗯,又一個期貨(doge)~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
G4步行者輸雷霆,賽后4壞消息!防守被針對,卡萊爾+2將辣眼!

G4步行者輸雷霆,賽后4壞消息!防守被針對,卡萊爾+2將辣眼!

籃球資訊達人
2025-06-14 12:44:23
以色列的外部打擊不可怕,伊朗內部的分裂才要命

以色列的外部打擊不可怕,伊朗內部的分裂才要命

合贊歷史
2025-06-13 15:37:42
網紅王某,竟是潛逃31年的殺人犯!詳情披露

網紅王某,竟是潛逃31年的殺人犯!詳情披露

新京報
2025-06-14 08:52:53
羅帥宇父親曾稱有人想用1500萬元封口,湖南省衛(wèi)健委工作人員:馬上會有官方通報

羅帥宇父親曾稱有人想用1500萬元封口,湖南省衛(wèi)健委工作人員:馬上會有官方通報

深圳晚報
2025-06-13 19:40:17
涉嫌嚴重違紀違法,李玉瓊被查

涉嫌嚴重違紀違法,李玉瓊被查

新京報
2025-06-13 19:27:28
伊朗反擊以色列,首次擊落五代機?伊朗公布殘骸照片,貽笑大方

伊朗反擊以色列,首次擊落五代機?伊朗公布殘骸照片,貽笑大方

新航空視界
2025-06-14 13:30:40
伊朗給以色列又上了一課,高超音速導彈大突防,2架F-35被擊落

伊朗給以色列又上了一課,高超音速導彈大突防,2架F-35被擊落

野山歷史
2025-06-14 08:19:09
惠州樓市迅雷不及掩耳,惠州樓市大亞灣房價從8300變成7700元

惠州樓市迅雷不及掩耳,惠州樓市大亞灣房價從8300變成7700元

有事問彭叔
2025-06-12 19:37:52
于正:我天天拉著整個團隊為她背書,為什么就是捧不紅她?

于正:我天天拉著整個團隊為她背書,為什么就是捧不紅她?

小椰的奶奶
2025-06-14 09:51:05
斬首之后立刻換帥,哈梅內伊亮出反擊底牌

斬首之后立刻換帥,哈梅內伊亮出反擊底牌

陸棄
2025-06-13 15:18:39
男大學生嫖娼時間太長,女子報警,律師:第21分鐘起算強奸

男大學生嫖娼時間太長,女子報警,律師:第21分鐘起算強奸

霹靂炮
2025-06-11 22:59:04
深度‖伊萬離開中國,他留給國足兩個隱患,被韋世豪一語道破

深度‖伊萬離開中國,他留給國足兩個隱患,被韋世豪一語道破

史行途
2025-06-14 08:31:35
為何越南女嫁到中國后全跑光了,越南女說出了真相

為何越南女嫁到中國后全跑光了,越南女說出了真相

二月侃事
2025-06-14 10:26:42
義烏襪業(yè)大王破產18年,兒子在國外來電:爸,巴黎的房子還要嗎?

義烏襪業(yè)大王破產18年,兒子在國外來電:爸,巴黎的房子還要嗎?

七分瘦三分肥
2025-06-11 22:23:44
羅嘉良兒子顏值被噴「浪費基因」!17位男神星二代「長殘」引熱議

羅嘉良兒子顏值被噴「浪費基因」!17位男神星二代「長殘」引熱議

和斌斌一起看劇
2025-06-06 06:20:03
特朗普突然打出一張“王牌”,下令拒絕對華出口?比關稅更危險!

特朗普突然打出一張“王牌”,下令拒絕對華出口?比關稅更危險!

阿筀田間生活
2025-06-14 03:44:10
梅西2009年對陣曼聯(lián)的頭球被做成藝術品并被拍賣,估價百萬!

梅西2009年對陣曼聯(lián)的頭球被做成藝術品并被拍賣,估價百萬!

氧氣是個地鐵
2025-06-13 15:06:31
苗苗在家開荒種有機蔬菜,手臂磕傷滿臉是汗,鄭愷和岳父一起干活

苗苗在家開荒種有機蔬菜,手臂磕傷滿臉是汗,鄭愷和岳父一起干活

鑫鑫說說
2025-06-14 09:07:40
中國將成為全球乃至人類歷史上第一個“電力王國”

中國將成為全球乃至人類歷史上第一個“電力王國”

生活新鮮市
2025-06-13 14:11:35
當全網都在玩梗的時候,江蘇人已經忙掙錢了

當全網都在玩梗的時候,江蘇人已經忙掙錢了

揚子晚報
2025-06-13 21:27:45
2025-06-14 14:51:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
10659文章數 176166關注度
往期回顧 全部

科技要聞

一輛新車比特斯拉FSD都便宜,全行業(yè)陪葬?

頭條要聞

摩薩德在伊朗境內建立無人機基地 部署精確制導武器

頭條要聞

摩薩德在伊朗境內建立無人機基地 部署精確制導武器

體育要聞

32隊爭10億獎金,全新世俱杯來了!

娛樂要聞

鳳凰傳奇曾毅手表引爭議 含性暗示元素

財經要聞

樓市權威發(fā)聲

汽車要聞

長城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤大棋!

態(tài)度原創(chuàng)

旅游
親子
房產
家居
公開課

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

親子要聞

每天做好四個訓練,教你如何做好孩子的前庭訓練

房產要聞

又一城購房補貼!買房就發(fā)錢,正在海南樓市瘋狂擴散!

家居要聞

森林幾何 極簡灰調原木風

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 海原县| 麻栗坡县| 三亚市| 青岛市| 读书| 汝南县| 江永县| 通江县| 大新县| 衡阳县| 凤山县| 高台县| 荔波县| 西畴县| 浦北县| 桐城市| 铁岭市| 卢氏县| 汝阳县| 城口县| 义乌市| 海晏县| 民勤县| 五华县| 涿州市| 南和县| 达拉特旗| 宁都县| 揭阳市| 皮山县| 拜城县| 紫金县| 仁寿县| 定日县| 黎平县| 陇川县| 金溪县| 两当县| 漯河市| 新营市| 米林县|