99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

你拍張圖,它能思考、執(zhí)行、總結(jié):OpenAI o3/o4-mini 正式邁入“帶圖干活”時(shí)代

0
分享至

全文3,000字 | 閱讀約20 分鐘



(o3和o4 mini發(fā)布會(huì))


你上傳一張筆記本上的手寫內(nèi)容,它會(huì):

? 判斷圖像方向

? 自動(dòng)旋轉(zhuǎn)調(diào)整

? 放大筆跡區(qū)域

? 最后讀出文字內(nèi)容并轉(zhuǎn)化成結(jié)構(gòu)化答復(fù)

——整個(gè)過程只需要 20 秒。

這就是中 OpenAI 文最新發(fā)布的 o3 和 o4-mini 正在做的事情。

相比你熟悉的 GPT-4,它們不是“會(huì)看圖”,而是“能帶圖思考”。

中 OpenAI 文官方在介紹中 o3 能力時(shí),列出了這樣一組典型用例:

你正在閱讀我們深度解讀文章。

我們不講“最新模型參數(shù)”, 我們只關(guān)心一件事: 這個(gè)能力,如何讓你個(gè)人和組織“干得更好”?

這四個(gè)看似簡單的需求,其實(shí)背后都藏著一個(gè)通用的認(rèn)知挑戰(zhàn):

AI 不只是要“識別”,而是要能“理解 + 判斷 + 操作”。

而在“Read handwriting”這個(gè)最基礎(chǔ)卻最常見的使用場景里, 中 o3 就交出了一張“全自動(dòng)認(rèn)知”的答案。


上圖示例:上傳了一張倒置的紙質(zhì)筆記圖像,模型自動(dòng)執(zhí)行:

識別方向 → 旋轉(zhuǎn)圖像 → 放大手寫區(qū) → 解讀內(nèi)容 → 結(jié)構(gòu)化輸出

最終結(jié)果是:"4th February – finish roadmap."

第一節(jié)|視覺推理到底有多強(qiáng)?數(shù)據(jù)說話

GPT-4 是強(qiáng),但 o3 和 o4-mini ,是“進(jìn)了實(shí)驗(yàn)室的超級體”。 這次發(fā)布,不只是升級,而是直接刷新了全行業(yè)多模態(tài)性能榜單。

我們從中 OpenAI 文放出的內(nèi)部測試結(jié)果中,選取了幾組關(guān)鍵指標(biāo),它們清晰展示了——

有時(shí)候,一組圖,比一堆術(shù)語更有說服力。

OpenAI 這次放出的o3 和 o4-mini 文測試成績,幾乎是“全場開掛”。

我們拆解了四組核心能力圖表,讓你一眼看出這次有多猛。

圖①:數(shù)學(xué)與科學(xué)能力


你可能沒聽說過這些縮寫,簡單說:

AIME 是美國高中數(shù)學(xué)競賽,能拿 90 分已經(jīng)是數(shù)學(xué)天才級;

GPQA 是博士級別科學(xué)難題,代表 AI 是否“理解概念結(jié)構(gòu)”;

Humanity’s Last Exam 是“跨學(xué)科綜合問答”,涉及哲學(xué)、語言、自然科學(xué)……

結(jié)果呢?

o4-mini :

?? AIME 得分高達(dá) 93.4%,可以吊打清北大部分理科生

?? Humanity’s Last Exam 達(dá)到 26.6% 正確率,已經(jīng)接近 DeepMind 特調(diào)模型

這不是“會(huì)答題”,這是“能考試”的 AI。

圖②:看圖解題,這次終于不是噱頭了


(MMMU / MathVista / CharXiv 圖像推理圖)

  • 在大學(xué)級視覺問題 MMMU 上,準(zhǔn)確率高達(dá) 82.9%;

  • 在數(shù)學(xué)圖像任務(wù) MathVista,達(dá)到 86.8%;

  • 在科學(xué)圖表推理 CharXiv,從 GPT-4 的 55.1%,提升到 o3 的 78.6%

以前,大模型看圖像常常“牛頭不對馬嘴”。

現(xiàn)在,它真的能“看圖——想一想——答上來”了

圖③:在代碼世界里,它比很多打工人還穩(wěn)


(SWE-Lancer / SWE-Bench / Aider Polyglot圖)

在真實(shí) freelance 項(xiàng)目任務(wù)上,o3-high 完成的項(xiàng)目價(jià)值高達(dá) $65,250 美元

  • 在 SWE-Bench 的工程編程評測中,準(zhǔn)確率超過 69%,不是玩票,是能“交付”的程度

  • 它不再只是“寫段代碼玩玩”,而是懂上下文、能 debug、能改的代碼合作者。

圖④:指令理解與工具調(diào)用能力


(MultiChallenge / BrowseComp / Tau-bench圖)

  • 多輪對話中,它能準(zhǔn)確理解復(fù)雜指令,比 o1 準(zhǔn)確率高出十幾個(gè)百分點(diǎn);

  • 在網(wǎng)頁搜索、函數(shù)調(diào)用等多步驟任務(wù)中,它能自己規(guī)劃步驟、選擇路徑,并給出完整結(jié)果。

這不是回答問題,這是一整套解決問題的流程能力。

? 小結(jié):

o3 和 o4-mini 不是更聰明的語言模型,而是更“像人”的問題解決者。
?? 第二節(jié)|從會(huì)看圖,到能“用圖思考”

過去,AI 看圖的能力,往往止步于“識別”:

這是一張圖

圖里有一只貓

這段文字可能是“hello world”

但這一次,AI 不止是看懂圖——而是把圖像納入整個(gè)“思考鏈條”中。

案例一:上傳一張倒著的筆記圖,AI 自己調(diào)整方向并提取結(jié)論


用戶提問:“幫我看看這張筆記本上寫了什么?”

這張圖是倒置拍攝、角度歪斜,文字模糊不清。

而 AI 是這樣一步步處理的:

  1. 檢測圖像方向 → 自動(dòng)識別為倒置

  2. 旋轉(zhuǎn)圖像 → 進(jìn)行區(qū)域裁剪

  3. 放大局部區(qū)域 → 提取手寫文字內(nèi)容

  4. 最終輸出結(jié)構(gòu)化結(jié)論

AI 輸出: “4th February – finish roadmap.”

這一過程的關(guān)鍵不是 OCR(文字識別),而是圖像+推理+操作鏈條的組合:

  • 不是“看清楚”文字,而是“為了理解內(nèi)容、主動(dòng)操作圖像”

  • 不需要你告訴它“請旋轉(zhuǎn)”,它自己判斷該不該轉(zhuǎn)、怎么轉(zhuǎn)

  • 在圖像模糊不清時(shí),也能通過多步驟放大 + 定位 + 推理,提取關(guān)鍵信息

這不是“識別圖像”,而是“和圖像一起思考”(Thinking with images)。

多模態(tài)推理的本質(zhì)突破是什么?

一句話:AI 不再等你“結(jié)構(gòu)化輸入”,它能自己把非結(jié)構(gòu)化變成結(jié)構(gòu)化。

你拍一張教科書的圖,它能解題;

你拍一張會(huì)議白板,它能總結(jié)要點(diǎn);

你拍一組流程圖,它能拆解成操作步驟。

? 小結(jié):

“帶圖思考”讓 AI 第一次成為真正的認(rèn)知助手,而不是信息工具。
第三節(jié)|你問它能幫你做什么?

你也許會(huì)問:AI 會(huì)帶圖思考,那和我有什么關(guān)系?

我們想告訴你:這件事的改變,不是科研級的突破,而是你每天都能遇到的場景。

學(xué)生 / 教育

  • 拍一道題,它能逐步講解解題過程;

  • 拍一頁錯(cuò)題,它能自動(dòng)總結(jié)常見誤區(qū);

  • 拍一張課堂板書,它能提取知識結(jié)構(gòu),生成圖解筆記。

程序員

  • 上傳一張報(bào)錯(cuò)截圖,它能識別關(guān)鍵報(bào)錯(cuò)內(nèi)容、分析可能原因,并告訴你修復(fù)建議。

? 商務(wù)辦公

  • 拍一張白板圖,它能自動(dòng)總結(jié)會(huì)議要點(diǎn),拆分待辦事項(xiàng);

  • 拍一頁筆記,它能轉(zhuǎn)成結(jié)構(gòu)化行動(dòng)計(jì)劃;

  • 拍 PPT 頁面,它能幫你提煉成大綱 + 金句。

醫(yī)生 / 工程師 / 設(shè)計(jì)師

  • 醫(yī)學(xué)圖像、工程圖紙、UI 線框圖……只要是“要用眼判斷”的信息,AI 都能幫你讀、分析、總結(jié)。

未來趨勢

無論是自動(dòng)文檔整理、圖表理解,還是“看懂環(huán)境+做決策”的多模態(tài)機(jī)器人,視覺推理,正成為“通用 AI 能力”的核心模塊。

你可能沒意識到,視覺推理正在變成你的“第二雙眼”。
?? 第四節(jié)|邁向“代理智能”

過去,AI 是工具箱——你告訴它要干什么,它給你結(jié)果。

而現(xiàn)在,AI 開始變成“自動(dòng)干活的助手”:它不僅會(huì)用工具,還會(huì)判斷什么時(shí)候用、用哪個(gè)、怎么用。

o3 和 o4-mini,是OpenAI首次明確引入「代理式工具調(diào)用能力(Agentic Tool Use)」的模型。

這意味著,它正在從“被動(dòng)響應(yīng)”進(jìn)化為“主動(dòng)規(guī)劃”。


(面對同一道極難數(shù)學(xué)題,o3 能主動(dòng)分解任務(wù)并規(guī)劃工具調(diào)用,o1 則只是重述題目。)

這張圖展示了核心差異:

  • o1:只是“讀懂”題目并嘗試生成靜態(tài)結(jié)果

  • o3:會(huì)分析題意 → 調(diào)用內(nèi)建知識 → 主動(dòng)觸發(fā)函數(shù)模塊/計(jì)算模塊 → 輸出過程+結(jié)論

什么是“Agentic Tool Use”?三件事你要知道:

? 1. 會(huì)“決定用不用工具”

它不再是你手動(dòng)觸發(fā)代碼執(zhí)行,而是它判斷任務(wù)是否復(fù)雜,是否需要借助搜索/Python/文件分析等外部工具

? 2. 會(huì)“組合多工具解決問題”

你提一個(gè)問題,它可以先搜索 → 再寫代碼分析數(shù)據(jù) → 最后生成圖表或結(jié)論

比如你問:“今年夏天上海用電會(huì)不會(huì)比去年多?” 它會(huì):

  • 搜索歷史數(shù)據(jù) →

  • 寫代碼預(yù)測用電趨勢 →

  • ? 輸出圖表 →

  • ?? 分析關(guān)鍵因素并解釋預(yù)測邏輯

? 3. 會(huì)“根據(jù)中間結(jié)果改變策略”

如果第一次搜索結(jié)果不理想,它會(huì)換個(gè)關(guān)鍵詞再查;

如果某個(gè)數(shù)據(jù)缺失,它會(huì)判斷是否需要用戶上傳新資料或換分析方式;

它的行為鏈更像一個(gè)人,而不是一行腳本。


(在同等甚至更低成本下,o4-mini 實(shí)現(xiàn)更高推理效率和工具組合能力。)

這張圖說明:更“聰明”的 agent,不意味著更“貴”,o4-mini 在許多任務(wù)中性價(jià)比反超 o3-mini。

小結(jié):

過去,你得教 AI 怎么干;現(xiàn)在,它能自己決定怎么干。

這就是o3 和 o4-mini 引領(lǐng)的趨勢:

從“語言模型”,走向“任務(wù)代理模型”

AI 不只是你的工具,它正在變成“帶執(zhí)行力的隊(duì)友”。

如果你更關(guān)心圖像、咨詢、科學(xué)類任務(wù)表現(xiàn),OpenAI 也做了類似的對比,后續(xù)我們會(huì)專門拆解。


AI 從“會(huì)說話”走到“能做事”

o3 和o4-mini ,代表的不是“新一代模型”,而是新一代能力結(jié)構(gòu)。

過去,我們對大模型的認(rèn)知是:

它能回答問題、寫段子、翻譯句子……

而今天,我們看到的中 o3 文已經(jīng)具備了:

  • ? 看懂圖像并以圖思考的能力

  • ? 多步驟解決復(fù)雜任務(wù)的執(zhí)行力

  • ? 選擇合適工具并主動(dòng)調(diào)整策略的判斷力

這些能力加在一起,不是更聰明的對話機(jī)器人,而是更像人的 AI 合作者。

我們正在從“會(huì)說話的模型”,進(jìn)入“會(huì)行動(dòng)的智能體”時(shí)代。

想問你一個(gè)問題:

如果你手邊有這樣一個(gè)能看圖、會(huì)推理、能動(dòng)手干活的 AI—— 你會(huì)先用它解決什么問題?

如果你讀完這篇文章,有所收獲:

歡迎分享給那個(gè)「每天被圖、被圖表、被任務(wù)追著跑」的朋友
也歡迎關(guān)注「AI深度研究員」——

這里不是在講模型,而是講 “AI 如何真正幫你完成任務(wù)”

星標(biāo)公眾號, 點(diǎn)這里 1. 點(diǎn)擊右上角 2. 點(diǎn)擊"設(shè)為星標(biāo)" ← AI深度研究員 ? ← 設(shè)為星標(biāo)

參考資料:

https://openai.com/index/thinking-with-images/

https://openai.com/index/introducing-o3-and-o4-mini/

https://www.youtube.com/watch?v=sq8GBPUb3rk&t=475s

來源:官方媒體/網(wǎng)絡(luò)新聞

排版:Atlas

編輯:深思

主編: 圖靈

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
章子怡走了 沒有呆在北京了 而是到了美國, 換了新身份

章子怡走了 沒有呆在北京了 而是到了美國, 換了新身份

如安青何
2025-05-12 09:30:03
2024年中國對外援助1.28萬億元,躍居世界第一!

2024年中國對外援助1.28萬億元,躍居世界第一!

霹靂炮
2025-05-17 23:55:41
翻車了!584比0,美國制造沒人買,網(wǎng)友:老百姓不是傻子!

翻車了!584比0,美國制造沒人買,網(wǎng)友:老百姓不是傻子!

探史
2025-05-18 23:03:22
驟降10℃!大雨、暴雨、大暴雨,來襲!

驟降10℃!大雨、暴雨、大暴雨,來襲!

魯中晨報(bào)
2025-05-29 16:05:09
煙臺一高校校長被曝碩士論文涉嫌嚴(yán)重抄襲,山東省教育廳:已掌握其學(xué)術(shù)不端情況

煙臺一高校校長被曝碩士論文涉嫌嚴(yán)重抄襲,山東省教育廳:已掌握其學(xué)術(shù)不端情況

上游新聞
2025-05-29 13:24:37
意媒:曼聯(lián)提議用霍伊倫+錢換奧斯梅恩,那不勒斯要求補(bǔ)償4000萬

意媒:曼聯(lián)提議用霍伊倫+錢換奧斯梅恩,那不勒斯要求補(bǔ)償4000萬

直播吧
2025-05-30 01:10:04
突發(fā)!全線暴跌!特朗普被裁定越權(quán)!

突發(fā)!全線暴跌!特朗普被裁定越權(quán)!

福州晚報(bào)
2025-05-29 11:02:42
人死仇不滅:車臣人,為什么顯得特別“不好惹”?

人死仇不滅:車臣人,為什么顯得特別“不好惹”?

黃娜老師
2025-05-30 00:44:56
清明上河圖,其實(shí)是部恐怖片……

清明上河圖,其實(shí)是部恐怖片……

混知
2025-05-29 17:30:14
車模界的天花板,身材氣質(zhì)長相樣樣俱佳,這你確定不動(dòng)心

車模界的天花板,身材氣質(zhì)長相樣樣俱佳,這你確定不動(dòng)心

傲嬌的馬甲線
2025-05-28 17:55:03
繼父撿破爛將我養(yǎng)大,30年后我升為少將,婚禮上岳母見繼父愣住了

繼父撿破爛將我養(yǎng)大,30年后我升為少將,婚禮上岳母見繼父愣住了

今天說故事
2025-05-20 14:15:30
早中晚都要發(fā)生性關(guān)系,50歲頭婚男娶47歲二婚女,把妻子弄害怕了

早中晚都要發(fā)生性關(guān)系,50歲頭婚男娶47歲二婚女,把妻子弄害怕了

情感藝術(shù)家
2025-04-11 23:39:41
1950年,一夫一妻制頒布,侯寶林開家庭會(huì)議 ,選擇讓小老婆陪…

1950年,一夫一妻制頒布,侯寶林開家庭會(huì)議 ,選擇讓小老婆陪…

百態(tài)人間
2025-05-28 11:49:25
世衛(wèi)組織呼吁:停止使用電熱水壺,否則會(huì)誘發(fā)癌癥?告訴你真相!

世衛(wèi)組織呼吁:停止使用電熱水壺,否則會(huì)誘發(fā)癌癥?告訴你真相!

39健康網(wǎng)
2025-05-22 13:41:13
為什么我感受不到 1500 元的手機(jī)比四五千的差?網(wǎng)友回答太真實(shí)了

為什么我感受不到 1500 元的手機(jī)比四五千的差?網(wǎng)友回答太真實(shí)了

只只魚樂
2025-02-13 20:42:00
49歲女保姆:我可以隨叫隨到,做陪伴式保姆,但要滿足我3個(gè)要求

49歲女保姆:我可以隨叫隨到,做陪伴式保姆,但要滿足我3個(gè)要求

惟來
2025-05-28 21:48:30
該不該這般鋪張?蕭山網(wǎng)友吐槽幼兒園活動(dòng)花費(fèi),評論區(qū)炸鍋

該不該這般鋪張?蕭山網(wǎng)友吐槽幼兒園活動(dòng)花費(fèi),評論區(qū)炸鍋

蕭內(nèi)網(wǎng)
2025-05-29 21:45:36
爆一線女星與富商私生子,出國留學(xué)是幌子,網(wǎng)友:就差直接點(diǎn)名了

爆一線女星與富商私生子,出國留學(xué)是幌子,網(wǎng)友:就差直接點(diǎn)名了

曉風(fēng)說
2025-05-11 19:27:15
418米!浙江未來第一高樓“青山全球總部”新進(jìn)展

418米!浙江未來第一高樓“青山全球總部”新進(jìn)展

GA環(huán)球建筑
2025-05-29 22:32:34
德外長電話打到北京,就臺灣問題公開做出承諾,只求中方能夠信任

德外長電話打到北京,就臺灣問題公開做出承諾,只求中方能夠信任

天行艦
2025-05-30 00:00:07
2025-05-30 03:43:00
AI深度研究員 incentive-icons
AI深度研究員
一個(gè)專注于人工智能(AI)前沿技術(shù)、理論研究和實(shí)際應(yīng)用的自媒體
182文章數(shù) 132關(guān)注度
往期回顧 全部

科技要聞

英偉達(dá)財(cái)報(bào)炸裂 黃仁勛卻嘆退出中國太可惜

頭條要聞

巴西檢方宣布正在起訴比亞迪 外交部回應(yīng)

頭條要聞

巴西檢方宣布正在起訴比亞迪 外交部回應(yīng)

體育要聞

納達(dá)爾,法網(wǎng),漫長告別

娛樂要聞

辛柏青沉默8天后,這些事還是發(fā)生了

財(cái)經(jīng)要聞

若對等關(guān)稅叫停,特朗普還能怎么加關(guān)稅

汽車要聞

首搭鴻蒙座艙5 嵐圖FREE+將于6月預(yù)售

態(tài)度原創(chuàng)

時(shí)尚
藝術(shù)
手機(jī)
本地
軍事航空

這些才是適合夏天的打扮!色彩不沉悶、適當(dāng)露膚,輕盈又舒適

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

手機(jī)要聞

華為 Mate XT 三折疊手機(jī)獲鴻蒙 HarmonyOS 5.0.1.125 升級

本地新聞

云游中國 |來仰天湖大草原,一起策馬奔騰

軍事要聞

以軍承認(rèn)使用激光武器攔截?zé)o人機(jī)

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 乌鲁木齐市| 黑水县| 荆州市| 铜山县| 休宁县| 德兴市| 吉隆县| 双城市| 汨罗市| 西昌市| 泸溪县| 巴楚县| 扎兰屯市| 禄丰县| 潞城市| 浦城县| 靖边县| 突泉县| 潜山县| 福建省| 蒙山县| 浦北县| 德化县| 寿光市| 包头市| 青阳县| 阳谷县| 台州市| 岱山县| 岳普湖县| 图片| 海丰县| 明溪县| 卢龙县| 彭阳县| 天全县| 浏阳市| 铅山县| 桃园市| 宜良县| 营山县|