99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

被DeepSeek卷到了!Sam Altman首次承認OpenAI的閉源策略“站在了歷史錯誤的一邊”|甲子光年

0
分享至


免費用戶也可使用o3 mini推理模型了!

作者|趙健

北京時間2月1日凌晨,OpenAI正式發布o3-mini,這是OpenAI推理系列中最新、最具成本效益的模型,已在ChatGPT和API中開放使用。

這可以看作OpenAI對過去一周多風靡美國市場的DeepSeek的回應。

在o3 mini發布的同時,OpenAI高管團隊還在Reddit上舉辦了一場線上的AMA(ask me anything),回答有關o3 mini以及AI發展相關的一切問題。

在被問及是否會考慮發布一些模型權重以及一些研究時,OpenAI首席執行官Sam Altman首次承認:“我個人認為,我們在這里站在了歷史的錯誤一邊,需要找出一個不同的開源策略。OpenAI中并非所有人都認同這一觀點,這也不是我們當前的最高優先事項。

此外,OpenAI高管團隊還討論了o3 mini的功能、價格以及其他產品更新、算力等相關的話題。

可以說,如果沒有DeepSeek,OpenAI不會這么快做出回應,無論是模型還是言論。

1.OpenAI首次將推理模型開放給免費用戶

本次發布的o3-mini在2024年12月發布了預覽版本,是OpenAI首個支持高度請求的開發者功能的小型推理模型,包括函數調用、結構化輸出和開發者消息。o3-mini將支持流式傳輸,開發者還可以在三種推理努力選項——低、中、高——之間進行選擇,以優化其特定用例。這種靈活性使得o3-mini在解決復雜挑戰時可以“更努力地思考”,或者在延遲是關鍵問題時優先考慮速度。但是o3-mini不支持視覺能力,因此開發者應繼續使用OpenAI o1進行視覺推理任務。

OpenAI表示o3-mini突破了小型模型所能實現的界限,提供了卓越的STEM(Science、Technology、Engineering、Mathematics)功能,尤其擅長科學、數學和編碼,同時保持了o1-mini的低成本和低延遲。專家測試人員的評估表明,與OpenAI o1-mini相比,o3-mini的答案更準確、更清晰,推理能力更強。

OpenAI表示,測試人員在56%的時間里更喜歡o3-mini的回答,并觀察到在困難的現實問題上重大錯誤減少了 39%。在中等推理努力下,o3-mini在一些最具挑戰性的推理和智力評估(包括 AIME 和 GPQA)上的表現與o1相當。


o3 mini在數學競賽AIME 2024的成績表現,圖片來自OpenAI

價格層面,OpenAI提供了不同的套餐設置:Pro用戶將可以無限制訪問o3-mini,而Plus和Team用戶將擁有三倍的速率限制(與o1-mini相比);免費用戶可以通過選擇消息編寫器下方的“Reason”按鈕在ChatGPT中嘗試o3-mini。

這是OpenAI首次將推理模型開放給免費用戶,此前發布的o1模型只有ChatGPT plus會員可以使用。而免費開放的原因其實也很顯然,那就是被DeepSeek免費且開源的R1給卷到了。

不過,ChatGPT plus會員會享有更高版本的模型“o3-mini-high”,它會思考得更深入,并給出更好的答案。

作為此次升級的一部分,OpenAI將Plus和Team用戶的速率限制從每天50條消息(使用o1-mini)提高到每天150條消息(使用o3-mini)。此外,o3-mini現在可以與搜索功能配合使用,以查找最新的答案并鏈接到相關的網絡資源。這是OpenAI將搜索功能整合到推理模型中的早期原型。

在安全層面,OpenAI用來教o3-mini安全響應的關鍵技術之一是審慎對齊,即在回答用戶提示之前,訓練模型推理人類編寫的安全規范。與OpenAI o1類似,o3-mini在具有挑戰性的安全性和越獄評估方面明顯超越了GPT-4o。在部署之前,OpenAI表示仔細評估了o3-mini的安全風險,采用了與o1相同的準備、外部紅隊和安全評估方法。

2.OpenAI團隊回答一切?

OpenAI高管團隊在Reddit上舉辦了一場線上的AMA(ask me anything),回答有關o3 mini以及AI發展相關的一切問題。

參與本次活動的共6人,包括首席執行官Sam Altman、首席研究官Mark Chen、首席產品官Kevin Weil、工程副總裁Srinivas Narayanan、API 研究主管Michelle Pokrass、研究主管Hongyu Ren。

首先是大家最關心的關于DeepSeek的焦點問題。

有用戶表示顯然這是一個非常令人印象深刻的模型,這會如何改變OpenAI對未來模型的計劃?

Sam Altman此前對于DeepSeek評價很高,這次也給出了類似的評價。他回復稱:“這是一個非常好的模型!我們將生產出更好的模型,但領先優勢將比前幾年有所減弱。”

鑒于DeepSeek在開源領域取得的成功,有人問OpenAI是否考慮發布一些模型權重并發表一些研究?

Sam Altman對此回應稱:“是的,我們正在討論。我個人認為,我們在這里站在了歷史的錯誤一邊,需要找出一個不同的開源策略;OpenAI中并非所有人都認同這一觀點,這也不是我們當前的最高優先事項。”

這似乎是Sam Altman首次正面承認OpenAI的閉源“是一個錯誤”。但OpenAI是否會真正開源?這恐怕將是一個艱難的選擇。

第二個集中話題是關于o3 mini的產品功能。

首先是價格問題。有人對比發現,o3 mini的價格與Deepseek和Gemini相比仍然沒有競爭力。比如,在百萬tokens規模下,Deepseek R1的API輸入價格(緩存命中)為0.14美元,輸出價格為2.19美元,而o3 mini的輸入價格為0.55美元,輸出價格為4.40美元。


DeepSeek API價格,deepseek-chat指的是DeepSeek-V3.,deepseek-reasoner指的是DeepSeek-R1,圖片來自DeepSeek官網


O系列推理模型價格,圖片來自OpenAI官網

OpenAI API研究主管Michelle Pokrass對此回應:“我們發現o3-mini與美國托管的Deepseek版本相比具有競爭力。我們認為對于這種級別的智能來說,這是一個真正實惠的選擇。”

OpenAI會計劃提高plus會員的價格嗎?Sam Altman回應稱:“實際上我想隨著時間的推移減少它。”

大模型推理成本的下降是一個必然趨勢。OpenAI在發布o3 mini時表示,該模型延續了其降低智能成本的記錄——自推出GPT-4以來,每個token的價格降低了95%——同時保持了頂級的推理能力。

針對o3 mini的價格,OpenAI制定了不同的套餐模式。有人問,為什么當plus用戶擁有大量o3-mini-high限額時,訂閱PRO版本仍然值得?

Sam Altman回應稱,如果你認為o1 pro還算值得,那么你應該認為o3 pro超級值得。

工程副總裁Srinivas Narayanan進一步解釋:“我們現在有o1專業模式,還有操作員模式。我們可能會繼續有更多方法使用更多計算來解決專業級的難題。是的,專業用戶喜歡無速率限制。”

其次是思維鏈的展示問題。o3 mini并不像DeepSeek R1那樣給出非常詳細的思維鏈過程,而是非常簡潔。


o3 mini的思維鏈展示


DeepSeek R1的思維鏈展示

于是有用戶提問,我們能看看所有的思考標記嗎?

首席產品官Kevin Weil回復稱:“我們正在努力展示比今天更多的內容——很快就會實現。所有內容都有待確定,展示所有CoT會導致競爭性提煉,但我們也知道人們(至少是高級用戶)想要它,所以我們會找到正確的方法來平衡它。”

關于o3 mini知識庫的時間更新問題,有用戶表示不理解。“在我支付了plus費用之前,GPT-4o擁有的知識截止到2024年6月,但是現在我支付了plus費用,知識截止時間又改回了2023年10月。為什么會這樣?”

Sam Altman對此回應稱:“現在我們已經啟用了搜索功能,這一點就不再那么重要了——就我自己的使用而言,我再也沒有考慮過知識截止的問題了。”

OpenAI本次發布的是o3 mini,于是有人問完整版本o3何時首次亮相?

Sam Altman一如既往開始畫餅:“我猜會是幾周以上,幾個月以下。”

第三個話題集中在其他產品更新,也就是OpenAI曾經發布的“期貨”產品何時兌現。

有用戶關心4o圖像生成器是否還會發布,這是大約一年前OpenAI發布的功能。GPT-4o是一種多模態人工智能模型,可同時理解和生成文本、圖像和音頻內容,但目前為止圖像生成功能還未更新。


圖片來自Reddit

首席產品官Kevin Weil對此回復稱:“是的!我們正在努力。我認為等待是值得的。”有人繼續追問有沒有大概的時間表,Kevin Weil先是開玩笑地說“你想給我找麻煩”,隨后又補充說“可能要幾個月”。

此外,關于圖像生成模型DALL-3的后續版本,Kevin Weil也是一模一樣的回復:“是的!我們正在努力。我認為等待是值得的。”

有用戶對此“千篇一律”的回復表示不滿意,并調侃道“這是GPT-3在回應嗎?”

有用戶關注長上下文窗口的問題,詢問能否很快實現1M上下文。

對此,工程副總裁Srinivas Narayanan回復“正在努力,但沒有明確的日期表”。

關于很多人都關心的GPT-5,Sam Altman表示還沒有時間表。

首席產品官Kevin Weil則回應稱,會在“o-17 micro和 GPT-(π+1) 之后不久”。換句話說,遙遙無期。

不過Sam Altman表示會有一些即將發布的更新,比如高級語音模式。

有人問,有了語音、視頻、屏幕共享、任務和操作員,OpenAI現在已經發布了相當多的組件,這些組件共同構成了非常完整的自動化體驗。在我們可以說擁有完整的AI體驗之前,是否還缺少一些部分?如果是,那么缺少哪些部分?

對此,工程副總裁Srinivas Narayanan回復:“是的,很多部分正在整合在一起。繼續提高推理能力仍然是最關鍵的部分。連續的視頻輸入和視頻輸出真的很酷。在任何環境中實現自動化——不僅僅是瀏覽器,而是整個計算機或其他設備。以及輕松理解和使用不同應用程序(在工作和個人生活中)的能力。”

最后是關于算力以及AGI相關的問題。

有人問,假設現在是2030年,你剛剛創建了一個大多數人稱之為AGI的系統。它在你提出的每一個基準測試中都表現出色,并且在速度和性能上都擊敗了你最好的工程師和研究人員。現在怎么辦?除了“在網站上提供”之外,還有其他計劃嗎?

工程副總裁Srinivas Narayanan回復:“我們與人工智能交互的界面將發生根本性的變化。事情將變得更加代理化。人工智能將在后臺為我們持續工作,完成復雜的任務并實現我們的目標。它們會在有需要時向我們匯報。機器人技術也應該足夠先進,讓它們能夠在現實世界中為我們完成有用的任務。”

Sam Altman認為,最重要的影響是加速科學發現的速度,我相信這是對改善生活質量的最大貢獻。

有人提到了芯片,問OpenAI如何看待trillium、cerebers等更專用的芯片/TPU?OpenAI正在研究這些芯片嗎?

Sam Altman的回應很簡潔:GB200現在很難被擊敗!

不久之前,Sam Altman宣布第一個完整的8機架GB200 NVL72現已在Azure中為OpenAI運行。

有人問,Stargate(星際之門)的成功對 OpenAI 的未來有多重要?

首席產品官Kevin Weil回應稱:“非常重要。我們看到的一切都表明,我們擁有的計算能力越多,我們構建的模型就越好,我們制造的產品就越有價值。我們現在同時在兩個維度上擴展模型——更大的預訓練和更多的 RL/strawberry——兩者都需要計算。為數億用戶提供產品也是如此!隨著轉向為您持續工作的更多代理產品,這需要計算。所以把 Stargate 想象成我們的工廠,它將電力/GPU 轉化為適合您的超棒產品。”

看起來,DeepSeek與OpenAI已經形成了兩種不同的技術路線。

DeepSeek代表了以更低的成本,尤其是計算成本,來實現更高的性能的路線。而OpenAI是Scaling Law的忠實信仰者,仍然堅持“大力出奇跡”——如果繼續擴展計算,就能繼續擴展性能。

這兩種不同路線的選擇就是實現AGI的分水嶺嗎?

(封面圖來源:OpenAI)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美媒評選全球最差航母,遼寧艦排第一,殊不知我們核動力已在路上

美媒評選全球最差航母,遼寧艦排第一,殊不知我們核動力已在路上

火星方陣
2025-04-30 11:18:20
我國肺癌高發,都是豆制品惹的禍?再次提醒:真正致癌的是這3物→

我國肺癌高發,都是豆制品惹的禍?再次提醒:真正致癌的是這3物→

華醫網
2025-04-26 05:41:39
伊朗再次有尊嚴的體面的跪下了,大有你不給面子我就跪死在你面前

伊朗再次有尊嚴的體面的跪下了,大有你不給面子我就跪死在你面前

歸史
2025-04-11 13:33:10
關稅大戰中國曾遭重大危機! 川普若抓住機會,現在美國已經翻盤了

關稅大戰中國曾遭重大危機! 川普若抓住機會,現在美國已經翻盤了

紅色鑒史官
2025-05-01 21:50:03
他空降到廣明市任市委書記,在同學聚會上初戀嘲笑他,他不動聲色

他空降到廣明市任市委書記,在同學聚會上初戀嘲笑他,他不動聲色

喬生桂
2025-04-17 17:00:33
球迷高喊崔康熙下課!王大雷安撫:大家都冷靜點,球隊現在困難

球迷高喊崔康熙下課!王大雷安撫:大家都冷靜點,球隊現在困難

直播吧
2025-05-01 23:49:33
“陽臺6不放,放后財不來”,陽臺再大也別擺這3種東西!不是迷信

“陽臺6不放,放后財不來”,陽臺再大也別擺這3種東西!不是迷信

巢客HOME
2025-03-12 10:15:03
拿到離婚證,我直接斷了岳母銀行卡,夜不歸宿的妻子卻愣住了

拿到離婚證,我直接斷了岳母銀行卡,夜不歸宿的妻子卻愣住了

荔枝人物記
2025-04-28 07:55:10
馬筱梅發聲了!側面否認和前夫離婚是因為孩子,更沒拿玥兒立人設

馬筱梅發聲了!側面否認和前夫離婚是因為孩子,更沒拿玥兒立人設

鄉野小珥
2025-05-02 13:23:19
把人燒成灰裝進盒子里再放進棺材里,這不是多此一舉嗎?

把人燒成灰裝進盒子里再放進棺材里,這不是多此一舉嗎?

逍遙論經
2025-05-02 10:24:42
33分驚天逆轉!凱爾特人如何打破塵封7年的NBA紀錄?

33分驚天逆轉!凱爾特人如何打破塵封7年的NBA紀錄?

重生之我在人間看熱鬧
2025-05-02 06:25:07
廣東大三甲現低級失誤!患者術后缺氧腦死亡,近期生殖微創兩起死亡

廣東大三甲現低級失誤!患者術后缺氧腦死亡,近期生殖微創兩起死亡

荷蘭豆愛健康
2025-05-01 08:08:57
孫儷的成功,是自律 是不合群的成功。周末大家聚餐,張藝謀說孫麗

孫儷的成功,是自律 是不合群的成功。周末大家聚餐,張藝謀說孫麗

東方不敗然多多
2025-05-02 00:01:21
天津小伙迎娶朝鮮女人,岳父直言:我要一噸大米、一百萬彩禮

天津小伙迎娶朝鮮女人,岳父直言:我要一噸大米、一百萬彩禮

蘭姐說故事
2025-04-29 15:00:15
曝央企總經理出軌多人:在女下屬家中偷情20余次,出差嫖娼被捉奸

曝央企總經理出軌多人:在女下屬家中偷情20余次,出差嫖娼被捉奸

博士觀察
2025-05-01 22:18:09
善惡終有報,曾為安倍晉三哭喪的影后呂麗萍,如今已成為“笑話”

善惡終有報,曾為安倍晉三哭喪的影后呂麗萍,如今已成為“笑話”

卷史
2025-05-02 13:38:20
謝霆鋒與兒子聚餐:祖孫三代同框,兄弟倆帥氣,眼神藏不住崇拜

謝霆鋒與兒子聚餐:祖孫三代同框,兄弟倆帥氣,眼神藏不住崇拜

子芫伴你成長
2025-05-01 21:02:51
又有比賽看了,國乒出征澳門世界杯,所有主力都在。

又有比賽看了,國乒出征澳門世界杯,所有主力都在。

kk愛美食
2025-05-02 16:37:47
劉國梁剛卸任,國乒就打贏第1場“硬仗”,樊振東還需要回歸嗎

劉國梁剛卸任,國乒就打贏第1場“硬仗”,樊振東還需要回歸嗎

何老師呀
2025-05-01 09:39:41
北京一家8口去吃席,海鮮茅臺吃到撐,回家發現忘記隨禮了

北京一家8口去吃席,海鮮茅臺吃到撐,回家發現忘記隨禮了

濤哥美食匯
2025-04-23 08:45:43
2025-05-02 17:31:00
甲子光年
甲子光年
中國科技產業化前沿智庫
3050文章數 9237關注度
往期回顧 全部

科技要聞

在華不及預期!蘋果稱關稅將增9億美元成本

頭條要聞

五一首日7000名游客涌入榮昌政府食堂:吃掉1500斤豬肉

頭條要聞

五一首日7000名游客涌入榮昌政府食堂:吃掉1500斤豬肉

體育要聞

為了湖人的28號秀,森林狼差點沒換來戈貝爾

娛樂要聞

霍啟剛郭晶晶夫婦現身馬麗新片首映

財經要聞

黃仁勛在美國又穿西裝表態,怎么看?

汽車要聞

全路況 大格局 前路山海皆坦途

態度原創

家居
房產
親子
本地
公開課

家居要聞

輕奢婚房 自由隨性生活

房產要聞

火了!一二手房交易量大漲,五一購房窗口期來了!

親子要聞

人類嬰兒剛出生為何這么“愚蠢”?不愚蠢就不會有人類的今天!

本地新聞

春色滿城關不住 | 花漾千陽!塬上秘境藏幾重詩意?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 武冈市| 潜山县| 南安市| 琼海市| 基隆市| 申扎县| 河池市| 紫阳县| 阳高县| 赣州市| 拉萨市| 日喀则市| 晋州市| 衡水市| 双城市| 渑池县| 金乡县| 上蔡县| 新蔡县| 霍林郭勒市| 河东区| 大化| 洛扎县| 彝良县| 江津市| 通许县| 惠安县| 苗栗市| 玉溪市| 平度市| 日喀则市| 米泉市| 措勤县| 普陀区| 牡丹江市| 宁波市| 宜州市| 专栏| 阿图什市| 乌兰浩特市| 多伦县|