99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易科技 > 網易科技 > 正文

OpenAI重磅推出o3/o4-mini新模型!能"看圖思考"

0
分享至

4月17日消息,北京時間今日凌晨,OpenAI發布了兩款突破性AI模型,它們能夠通過圖像進行推理,并可獨立使用工具,專家稱它們為人工智能能力的一次飛躍。

這兩款新模型分別被稱為o3與o4-mini,它們都是OpenAI “o系列” 推理模型的最新成員,并被稱為迄今為止最智能、最強大的模型。這些系統能將圖像直接整合到推理過程中,并在單一任務流程中執行網頁搜索、代碼運行、文件分析乃至圖像生成等操作。

OpenAI總裁格雷格·布羅克曼(Greg Brockman)在發布會上表示:“有些模型會讓人覺得像是邁入未來的質變,GPT-4就是其中之一。今天也將成為這樣的歷史時刻。這是首批讓頂尖科學家都承認能產出確實優秀、實用新穎創意的模型。”

OpenAI新模型通過“圖像思維”幫助解決視覺問題

這些新模型最顯著的特征是“圖像思維”能力。它們不僅是識別圖像,還能在問題解決流程中操控并推理。

OpenAI在聲明中強調:“它們不只是看圖——而是用圖像進行思考。這解鎖了一類全新的問題求解方式,將視覺與文本推理相融合。”

在發布會演示環節,研究人員展示了o3如何分析一份來自十年前實習項目的物理海報:它能獨立解析其中復雜的圖示,甚至識別出海報本身未呈現的最終結論。

OpenAI多模態推理研究員布蘭登·麥肯錫(Brandon McKenzie)在演示中說道:“它相當于在幾秒內為我閱讀了至少10篇不同的論文。”他估計,這項任務如果由他本人完成,“光是重新熟悉當年的項目背景就要好幾天,然后可能還得幾天才能完成文獻查閱。”

人工智能在推理過程中操控圖像的能力,比如放大細節、旋轉圖像或裁剪冗余元素等,被行業分析師認為可能徹底改變從科研到教育等多個領域。

沃頓商學院研究人工智能、創新與創業公司的伊森·莫里克教授(Ethan Mollick)在社交平臺上發文稱:

我獲得了o3的早期使用權限,這款模型令人印象深刻,能力非常強大。以下為一些有趣的示例:

1?? 解構了我課堂上使用的商業案例

2?? 生成純代碼構建的SVG矢量圖

3?? 創作雙螺旋結構的約束性短篇故事

4?? 創作硬科幻太空戰斗場景

超越AI模型:o3與o4-mini如何通過先進工具集成作為完整AI系統運行

OpenAI的高管強調,這次發布的不僅僅是推理模型的升級版本,而是完整的人工智能系統,它們能夠在解決問題時獨立調用并串聯多個工具。

該公司在發布聲明中表示:“我們通過強化學習訓練模型使用工具——不僅讓它們學會如何使用工具,更讓它們學會何時使用工具。”

布羅克曼特別強調了這些模型在工具調用方面的強大能力:“它們實際上是在思維鏈中調用這些工具,以嘗試解決困難問題。例如,我們曾看到o3為了解并執行一個極其困難的任務,連續調用了大約600次工具。”

這種能力使模型能夠執行復雜的、多步驟的工作流任務,而無需用戶持續介入。比如,當被問到“加州未來的能源使用趨勢”時,人工智能系統可以搜索公用事業數據、編寫Python代碼進行分析、生成可視化圖表,并撰寫出一份全面的報告——所有步驟都作為一個流暢、連貫的過程完成。

OpenAI超越競爭對手,在關鍵AI基準測試中表現優異

OpenAI宣稱,o3在多個關鍵人工智能能力基準測試中確立全新行業標桿,包括Codeforces(編程競賽平臺)、SWE-bench(軟件工程基準)和MMMU(多模態理解評估)。

據外部專家評估,在復雜現實任務中,o3的重大錯誤率較前代模型降低20%。

而輕量級模型o4-mini在保持強大推理能力的同時,更注重速度與成本效益。配備Python解釋器時,其在2025年AIME數學競賽中取得99.5%的驚人準確率。

OpenAI研究負責人馬克·陳(Mark Chen)在發布會上說道:“我真的相信,憑借這套模型組合,o3和o4-mini,我們將會看到更多的突破。”

OpenAI發布新模型的時機也非常關鍵,該公司在兩天前剛剛推出了GPT-4.1模型,該模型在編程任務中表現優異。接連不斷的發布表明,OpenAI在競爭激烈的人工智能領域正在加速推進,并面臨來自谷歌Gemini、Anthropic Claude以及埃隆·馬斯克(Elon Musk)旗下xAI等日益激烈的競爭壓力。

上個月,OpenAI完成了歷史上最大規模的私募融資,籌集了400億美元資金,估值達3000億美元。另外,該公司還在考慮構建自己的社交網絡,可能對標馬斯克的X,并確保擁有獨立的訓練數據源。

OpenAI新模型如何通過代碼導航能力重塑軟件工程領域

新模型在軟件工程領域的表現特別出色。布羅克曼在發布會上提到,o3在“檢索OpenAI內部代碼庫時的表現比我還要出色,這真的很有用。”

作為此次發布的一部分,OpenAI還推出了Codex CLI,這是一款輕量級的編程智能體,可以直接在用戶的終端運行。這個開源工具讓開發者能夠利用這些模型的推理能力來完成編程任務,支持截圖和草圖輸入。

OpenAI在公告中寫道:“我們還分享了一個新的實驗:Codex CLI,一個可以從終端運行的輕量級編程智能體。通過將截圖或簡略草圖傳遞給模型,并結合對本地代碼的訪問,用戶可以從命令行獲得多模態推理的好處。”

為了鼓勵采用,OpenAI啟動了一項100萬美元的扶持計劃,支持使用Codex CLI和OpenAI的模型,每個項目將獲得2.5萬美元的API信用額度。

OpenAI首席執行官山姆·奧特曼(Sam Altman)發帖稱:“由于o3和o4-mini在編程領域表現優異,OpenAI還推出了一個新產品——Codex CLI,旨在簡化它們的使用。這是一款運行在你計算機上的編程智能體,完全開源,并已于今日發布;我們預計它將迅速改進。”

OpenAI強化安全協議內幕:如何防范AI濫用

OpenAI表示,已對新模型進行了廣泛的安全測試,特別是針對它們拒絕有害請求的能力。該公司的安全措施包括完全重建安全訓練數據,并開發了系統級的緩解措施來標記危險的提示。

OpenAI在公告中稱:“我們對這兩個模型進行了迄今為止最嚴格的安全測試。o3和o4-mini在生物學、網絡安全和AI自我改進能力等領域的潛在風險,仍然低于OpenAI的高風險閾值。”

在發布會上,OpenAI兩位研究人員展示了詳細的基準測試結果,并指出新模型在訓練計算量上超過了以往版本的10倍,才能實現這些強大的能力。

獲取o3和o4-mini的時機與方式:部署時間表與商業策略

OpenAI的新模型目前已立即向ChatGPT Plus、Pro和Team用戶開放,Enterprise和Education客戶將在下周獲得訪問權限。免費用戶可以通過在提交查詢前選擇“Think”來體驗o4-mini。

開發者可以通過OpenAI的Chat Completions API和Responses API試用這兩個模型,盡管部分組織需要驗證才能訪問它們。

此次發布對OpenAI來說是一個重要的商業機會,因為這些模型似乎比前代更強大且更具成本效益。該公司舉例稱,在2025年AIME數學競賽中,o3的性價比嚴格優于o1。同樣,o4-mini在成本表現上也優于o3-mini。

AI的未來:OpenAI架起推理與對話的橋梁打造下一代系統

業內分析人士認為,這些發布是人工智能能力融合的更廣泛趨勢的一部分,模型越來越多地將專業推理與自然對話能力和工具使用結合起來。

OpenAI在發布會中指出:“最新發布反映了我們的模型發展方向:我們正在將o系列的專門推理能力與GPT系列更多的自然對話能力和工具使用結合起來。”

不過,莫里克教授發帖稱,o3是“非常強大的模型,但仍有明顯短板”。

隨著人工智能領域的競爭日益加劇,谷歌、Anthropic等公司推出越來越強大的模型,OpenAI在推理能力和實際工具使用上的雙重關注表明,其戰略是旨在通過提供智能和實用性來保持領先地位。

通過o3和o4-mini,OpenAI已經跨越了一個門檻——機器開始像人類一樣感知圖像,將視覺信息的處理作為思維過程的組成部分,而不僅僅是分析它們所看到的。這種從被動識別到主動視覺推理的轉變,可能比任何基準分數都更具意義,代表著人工智能終于開始通過“思考的眼睛”來看待世界。(小小)

延伸閱讀
相關推薦
熱點推薦
“五道杠”小學生,曾因一臉“官相”而走紅,如今狀態卻令人泯然

“五道杠”小學生,曾因一臉“官相”而走紅,如今狀態卻令人泯然

趣文說娛
2025-04-23 12:01:36
爆料北京隊忍無可忍,連夜上訴,山西隊聯合裁判太過分,就是打人

爆料北京隊忍無可忍,連夜上訴,山西隊聯合裁判太過分,就是打人

宗介說體育
2025-04-30 12:45:31
太精彩了,歐冠官方發問:這場比賽為什么非要結束啊?

太精彩了,歐冠官方發問:這場比賽為什么非要結束啊?

懂球帝
2025-05-01 05:46:19
特朗普又變了!特朗普關稅“發瘋”,中國供應鏈卻笑到最后!

特朗普又變了!特朗普關稅“發瘋”,中國供應鏈卻笑到最后!

愛看劇的阿峰
2025-05-01 04:06:07
女跑者不懼走光,高開叉短褲也敢穿

女跑者不懼走光,高開叉短褲也敢穿

小腳老奶張老揣
2025-04-25 02:59:30
《蠻好的人生》胡曼黎拿下李奮斗!丁致遠的20萬,徹底打醒邱麗蘇

《蠻好的人生》胡曼黎拿下李奮斗!丁致遠的20萬,徹底打醒邱麗蘇

何訡愛捕漁
2025-05-01 06:26:37
董襲瑩以一己之力,讓網友們看到三大不公平現象

董襲瑩以一己之力,讓網友們看到三大不公平現象

清暉有墨
2025-04-29 15:03:55
笑死了!趙心童仍被中臺協禁賽,球迷:小趙奪冠中臺協還祝賀嗎?

笑死了!趙心童仍被中臺協禁賽,球迷:小趙奪冠中臺協還祝賀嗎?

小彭美識
2025-05-01 08:50:48
曝李小雙已離婚,帶美女參加侄子百日宴,女方身份曝光,年輕漂亮

曝李小雙已離婚,帶美女參加侄子百日宴,女方身份曝光,年輕漂亮

180°視角
2025-04-30 10:33:31
22歲朝鮮美女遠嫁北京,8年期間寄50萬給家里,回家探親結果傻眼了

22歲朝鮮美女遠嫁北京,8年期間寄50萬給家里,回家探親結果傻眼了

濤哥講堂
2025-04-27 10:24:36
美國發動關稅戰,中國面臨的問題非常大,最需要解決的是兩個問題

美國發動關稅戰,中國面臨的問題非常大,最需要解決的是兩個問題

阿胡
2025-04-12 11:59:35
活該!肖飛事件徹底鬧大!而肖飛老婆谷瀟雅的做法堪稱完美反擊!

活該!肖飛事件徹底鬧大!而肖飛老婆谷瀟雅的做法堪稱完美反擊!

小娛樂悠悠
2025-04-30 12:00:04
苦等3年!成都又一大商場剛剛開業!片區利好!

苦等3年!成都又一大商場剛剛開業!片區利好!

冬天來旅游
2025-05-01 10:02:42
段冉:勇士今日用替補逼回火箭首發 G6回到主場后一定會進行反撲

段冉:勇士今日用替補逼回火箭首發 G6回到主場后一定會進行反撲

直播吧
2025-05-01 10:42:22
烏克蘭空襲下諾夫哥羅德軍用機場!擊中俄軍彈藥庫

烏克蘭空襲下諾夫哥羅德軍用機場!擊中俄軍彈藥庫

項鵬飛
2025-04-30 19:10:49
美國至今想不通:一個沒留過學的中國人,憑什么造出于敏構型?

美國至今想不通:一個沒留過學的中國人,憑什么造出于敏構型?

生活新鮮市
2025-04-27 16:03:43
董襲瑩,這名字有點意思,高知父母起這名字,含意很深

董襲瑩,這名字有點意思,高知父母起這名字,含意很深

魔都姐姐雜談
2025-04-29 12:43:05
黑龍江村民在水塘挖出5米長巨型黑魚,瞬間爆火全網,網友:假的

黑龍江村民在水塘挖出5米長巨型黑魚,瞬間爆火全網,網友:假的

小胡漁記
2025-04-30 20:55:10
退休金3萬,老伴想吃車厘子,女兒:你配吃嗎?我斷供后,她急了

退休金3萬,老伴想吃車厘子,女兒:你配吃嗎?我斷供后,她急了

星羽故事集
2025-04-28 11:16:03
譴責蘇修霸權主義 要求歸還北方領土 1975年1月26日《人民日報》

譴責蘇修霸權主義 要求歸還北方領土 1975年1月26日《人民日報》

那些看得見的老照片
2025-04-28 07:00:06
2025-05-01 12:52:49

科技要聞

曝特斯拉董事會開始尋找馬斯克的繼任者

頭條要聞

牛彈琴:金磚國家沒點名批評了美國 中方則很直言不諱

頭條要聞

牛彈琴:金磚國家沒點名批評了美國 中方則很直言不諱

體育要聞

天王山的哈登,是如何迷失的?

娛樂要聞

62歲阿湯哥有新戀情 開飛機載36歲女友

財經要聞

知情人士:美方正多渠道主動與中方接觸

汽車要聞

預售32.98萬起 魏牌高山家族將于5月13日上市

態度原創

游戲
藝術
旅游
家居
公開課

《SAEKO: 女巨人戀愛模擬》登陸Steam 玩法特別

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

家居要聞

輕奢婚房 自由隨性生活

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版
×
主站蜘蛛池模板: 石首市| 新沂市| 于都县| 龙井市| 武威市| 宁德市| 廊坊市| 柳州市| 法库县| 永泰县| 金乡县| 沙河市| 磐石市| 上杭县| 正蓝旗| 抚远县| 平和县| 沂南县| 枣阳市| 嘉禾县| 武安市| 马边| 边坝县| 彰武县| 饶河县| 武宁县| 武城县| 平阴县| 芜湖市| 辽宁省| 阳朔县| 阳原县| 澎湖县| 贵阳市| 随州市| 通州市| 页游| 六枝特区| 娄底市| 花莲市| 启东市|