99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

不是 GPT-5,卻可能更關鍵的一步

0
分享至


會聊天的 AI,我們已經見多了。能干實事的 AI,才剛剛開始登場。

昨晚,OpenAI 一口氣發布兩款新模型:o3o4-mini,沒有等 GPT-5,沒有開發布會,更沒有宣傳大模型參數。它們的重點不是“更強”,而是“更能干”。

這次更新的信號很明確:AI,不再只是回答你,而是能理解問題 → 分析路徑 → 自選工具 → 自己動手。AI 正在從“陪聊型選手”,轉向“動手型搭子”。

GPT-5 沒來,但 OpenAI 先放出更關鍵的東西

原本,o3 是為 GPT-5 準備的旗艦模塊。但面對開發者對“能解決問題的 AI”需求高漲,OpenAI 做了一個戰略決策:不等了,單發出場

于是我們迎來了這組“雙子星”模型:

  • o3:面向專業場景的旗艦模型,推理能力顯著增強。

  • o4-mini:輕量級版本,主打性價比,每百萬 tokens 僅 $1.10,遠低于 Claude 和 Gemini 等主流模型。

更關鍵的是,它們都秉持 OpenAI 近幾輪的核心思路:從語言模型,向任務代理模型進化。

真·能干活的 AI,到底長什么樣?

如果你想知道“動手型 AI”到底哪不一樣,可以看這些新特性:

-高級推理:不再死記硬背,而是像人一樣“邊想邊修”。通過強化學習優化后的推理路徑更完整、可追溯,尤其在需要深度邏輯思維的任務上,性能相比前代 o1 有了顯著提升。

-看圖理解:不只是“看懂圖”,而是能將圖表、草圖、演示稿中的信息納入推理鏈路。這是 OpenAI 推理模型首次具備真正的圖像參與式理解能力。

你可以上傳圖片,例如白板筆記、圖表或模糊掃描件,模型不僅能分析、放大、旋轉圖像,還能基于圖中信息進行推理。在一次直播演示中,o3 成功解析了一張科學研究海報,通過瀏覽相關文獻、放大特定區域,推斷出圖像中未直接呈現的結論。

這類能力顯著增強了 AI 在教育、科研和技術分析等場景下的實用性。

- 自動選工具:不等你下指令,它能自行決定是要瀏覽網頁、執行代碼、生成圖像,還是解釋文件——這是真正意義上的“任務代理”。

o3 與 o4-mini 首次具備了在 ChatGPT 中自主調用多個工具的能力,包括:網頁瀏覽、Python 代碼執行、圖像處理與生成、文檔解析等

當你交代一個復雜任務時,模型可以根據上下文自行“組裝”解決路徑。例如,遇到編碼問題時,o3 能直接在 ChatGPT 的代碼畫布中編寫、執行并調試 Python 腳本,大幅簡化開發者的工作流程。

-編程副駕:發布了本地工具 Codex CLI,直接在命令行里和你并肩寫代碼、調 bug、跑腳本。

-成本大幅下降,高級模型不再高不可攀:如果說 o3 面向的是高階用戶,那 o4-mini 則是一次真正的“成本革命”。


它的 API 定價僅為每百萬輸入 token$1.10、輸出$4.40,相比 o3 的 10/40 美元,價格下降了近九成,同時也對 DeepSeek R1(0.14 / 2.19 美元)等性價比模型發起正面競爭。

從今年初的 o3-mini 起,OpenAI 就在試圖“把高級推理拉下神壇”。如今的 o4-mini,正是這場策略的延續 ——讓開發者和普通用戶都能以低門檻接入高能力 AI。

?Kevin點評:別再問 AI 能做什么,要看它值不值得天天用。

這些能力的本質,不是某項技術點的大爆發,而是整套系統向“任務代理協作系統”的方向邁出的一大步。

推理戰爭,已經開打了

眼下,各家模型都在比“誰能干更多事”,但其實本質都在卷一件事:推理能力到底能不能落地?

-DeepSeek靠 R1 拼性價比,吸開發者。

-Gemini把多模態和搜索生態打包說事。

-Meta押注開源,試圖全域覆蓋。

而 OpenAI 的組合打法很清晰:

一邊用 o3 占領高階場景,

一邊用 o4-mini 放低門檻爭取開發者和大眾用戶,

再搭配 Codex CLI 等工作流級工具,逐步筑起“閉環生態”。

而且官方還透露:后續將推出推理能力極強的開源模型。

?Kevin點評:它不是不告訴你答案,而是先判斷你為啥問。AI 的“人味”,從這一刻開始。

這是一次對“開源陣營”的正面宣戰,也是在為整個 AI 社群重新立標桿。

類人協作,成了新階段起點

在性能測試上,o3 和 o4-mini 也確實給出了不俗表現:

  • 數學 / 科學類推理測試,顯著優于前代 GPT-4。

  • GitHub 編程題準確率達 70%,超越 Claude 3.7。

  • ARC-AGI 測試得分高達 87.5%,超過人類平均水平。

但更值得注意的是,它們的“行為模式”也發生了結構性變化。

OpenAI 引入了新的“審慎對齊(Cautious Alignment)”機制——模型不再簡單“拒絕回答”,而是會評估你的意圖,判斷是否協助。更像一個“理性判斷的同事”,而不是“機械的客服”。

這固然更接近人類,但也開啟了一輪新問題:模型是否會“想太多”?開放性是否變差?黑箱風險是否加劇?

現在沒有標準答案,但可以確定的是——AI 的“參與感”正在增強

最后說句現實的

不管你是程序員、教師、研究員,還是內容創作者,這波更新都值得親測。

現在,o3 和 o4-mini 已全面開放,首次實現“強模型 + 低門檻”的雙重突破。

你可以通過 ChatGPT 使用(Plus、Pro 和 Team 用戶直接可選),也可以通過 API 接入開發,甚至免費用戶也能有限體驗 o3-mini,未來 o4-mini 也可能下放。


? Kevin點評:從“高價嘗鮮”到“低門檻上手”,這次模型升級真正打通了“能用”與“常用”之間的鴻溝。

比起 GPT-4 的“全能+高價”,o3 和 o4-mini 更明確地告訴你:

我能做什么、做得多好、你花多少錢。

這才是 AI 工具成為“日常搭子”的分水嶺,也是一場推理競賽的新起點。

你最近在用哪款 AI 模型?

你覺得 o3 和 o4-mini 夠“動手”了嗎?歡迎評論區聊聊你真實的使用感受。

本文由「AI 范兒」出品

我每天都在更新,如果你覺得這些內容對你有用,

那我們就加個關注、交個朋友。

點這里關注我,記得標星哦~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1死2傷!南寧一高中發生傷害案,嫌疑人已死亡,重要信息被曝光…

1死2傷!南寧一高中發生傷害案,嫌疑人已死亡,重要信息被曝光…

火山詩話
2025-05-17 05:55:33
G7×7!約基奇迎來生涯第七次搶七 前六次場均24+15+7 戰績4勝2負

G7×7!約基奇迎來生涯第七次搶七 前六次場均24+15+7 戰績4勝2負

直播吧
2025-05-16 11:28:02
馬思純你瘦成這樣真的認不出來!網友:她適合微胖,瘦的沒氣色了

馬思純你瘦成這樣真的認不出來!網友:她適合微胖,瘦的沒氣色了

生活新鮮市
2025-05-16 14:57:16
莫言:晚年苦不苦,要看五十五,人到55歲,還沒擁有這三樣東西,晚年多半凄涼,別不當回事

莫言:晚年苦不苦,要看五十五,人到55歲,還沒擁有這三樣東西,晚年多半凄涼,別不當回事

不二大叔
2025-05-16 21:22:20
1960年趙一曼兒子給毛主席寄了封諷刺信,偉人回應6個字盡顯格局

1960年趙一曼兒子給毛主席寄了封諷刺信,偉人回應6個字盡顯格局

紀實文錄
2025-05-14 16:02:26
全國渣女統一床上語錄

全國渣女統一床上語錄

速效救心丸
2023-10-30 09:53:22
原來如此!被我們誤解很深的朝代——南宋

原來如此!被我們誤解很深的朝代——南宋

形上謂道
2025-05-17 01:14:10
字母哥有機會加盟勇士?文胖:勇士確實有可以用來交易的籌碼

字母哥有機會加盟勇士?文胖:勇士確實有可以用來交易的籌碼

直播吧
2025-05-17 00:46:14
朝鮮導游揭秘:中國游客這點錢連水果都吃不起!

朝鮮導游揭秘:中國游客這點錢連水果都吃不起!

百姓識天下
2025-04-29 17:52:10
為什么董襲瑩開車總能遇到綠燈?

為什么董襲瑩開車總能遇到綠燈?

關爾東
2025-05-15 21:30:37
湖北小伙娶伊朗女博士,到伊朗才知岳父是富豪,揚言:軟飯吃定了

湖北小伙娶伊朗女博士,到伊朗才知岳父是富豪,揚言:軟飯吃定了

回京歷史夢
2025-04-26 12:41:01
香港女子被當街連捅5次,內地小伙沖上救人,港媒發歧視字眼

香港女子被當街連捅5次,內地小伙沖上救人,港媒發歧視字眼

星光看娛樂
2025-05-17 08:41:11
與大選有關?曝輝瑞上層曾密謀推遲新冠疫苗臨床試驗,有高管害怕被查申請調離

與大選有關?曝輝瑞上層曾密謀推遲新冠疫苗臨床試驗,有高管害怕被查申請調離

小蘿卜絲
2025-05-16 11:13:57
特朗普被揭老底,對中國低頭不是因為稀土,而是被中方拿捏了七寸

特朗普被揭老底,對中國低頭不是因為稀土,而是被中方拿捏了七寸

阿握聊事
2025-05-16 10:08:51
探訪被舉報的劉曉慶名下公司:附近職員稱園區長期無人辦公,但每月都有人來找某某公司

探訪被舉報的劉曉慶名下公司:附近職員稱園區長期無人辦公,但每月都有人來找某某公司

時尚的弄潮
2025-05-17 02:34:06
小孩子的精神內核真是穩定,從不內耗!

小孩子的精神內核真是穩定,從不內耗!

特約前排觀眾
2025-05-17 00:05:10
面對美國制裁,中國科技創新力的超強韌性及其來源

面對美國制裁,中國科技創新力的超強韌性及其來源

賽格大道
2025-05-16 07:43:13
英超最新積分戰報:兩大豪強倒下,爭五格局大亂,曼城掉到第6

英超最新積分戰報:兩大豪強倒下,爭五格局大亂,曼城掉到第6

足球狗說
2025-05-17 06:58:49
1.2萬元買個“零蛋”?五菱神車來了,友商懵了,到底什么來頭?

1.2萬元買個“零蛋”?五菱神車來了,友商懵了,到底什么來頭?

汽車指南針
2025-05-14 11:02:13
80年代,鄧樸方請朋友幫他找個老婆,但提出一個要求:不能有孩子

80年代,鄧樸方請朋友幫他找個老婆,但提出一個要求:不能有孩子

帝哥說史
2025-05-15 06:35:02
2025-05-17 09:32:49
AI范兒 incentive-icons
AI范兒
AI范兒是一個專注于人工智能領域的資訊和學習平臺,提供最新的人工智能資訊
497文章數 128關注度
往期回顧 全部

科技要聞

OpenAI最強寫代碼AI智能體來了:Codex上線

頭條要聞

特朗普"生日閱兵"細節披露:預計6600名士兵參加

頭條要聞

特朗普"生日閱兵"細節披露:預計6600名士兵參加

體育要聞

退役8個月后喜提3冠,人生的轉折如此突然

娛樂要聞

嘉行回應黃楊鈿甜風波翻車,引發眾怒

財經要聞

一船難求,又要開始了?

汽車要聞

吉利發布最強一季報后,繼續整合、補短板是關鍵

態度原創

時尚
本地
藝術
健康
公開課

金靖靠穿搭意外走紅,“時尚完成度靠臉”終于被推翻?

本地新聞

2025年“5·19中國旅游日”活動啟動儀式

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

唇皰疹和口腔潰瘍是"同伙"嗎?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 蓬莱市| 龙门县| 陇川县| 恩施市| 海宁市| 杭锦后旗| 项城市| 阿合奇县| 临邑县| 枝江市| 沅江市| 饶平县| 慈利县| 沙坪坝区| 汉寿县| 临泉县| 吴江市| 穆棱市| 盖州市| 西青区| 伊宁市| 陇川县| 栖霞市| 宁蒗| 乐清市| 丰镇市| 石台县| 稷山县| 鄂托克前旗| 彰化市| 金沙县| 江山市| 汾西县| 庐江县| 西宁市| 咸丰县| 印江| 崇义县| 镇宁| 建瓯市| 达孜县|