99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<output id="sd6rt"><kbd id="sd6rt"><form id="sd6rt"></form></kbd></output>

<thead id="sd6rt"></thead>

<thead id="sd6rt"><font id="sd6rt"></font></thead>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

GPT-4.1全網實測來襲，慘遭谷歌Gemini碾壓！大佬猜測：從GPT-4.5蒸餾的

2025-04-16 12:50:40　來源: 硅星人

北京舉報

0

分享至

文章轉載于新智元

不過兩月，GPT-4.5正式出局，前浪把后浪拍在了沙灘上。

GPT-4.1家族的出世，以更強編碼性能，百萬token上下文，更具性價比的價格，直接擊穿了4.5。

nano版的GPT-4.1性能足以媲美GPT-4o mini，而且速度更快，價格更便宜。

這些模型目前僅在API中提供，不過目前爆火編碼平臺Windsurf、Cursor開啟了福利大放送，七天免費體驗GPT-4.1。

這不，全網首波實測已經來了。

1

GPT-4.1編碼驚艷，卻打不過Gemini 2.5

這款以超強編碼著稱的模型，在實際任務表現中又如何呢？

OpenAI科學家表示，GPT-4.1是不是推理模型，卻可以在軟件工程基準測試中拿下55%高分

網友Flavio Adamo用同一個提示——讓小球在旋轉的六邊形中模擬自由落體，測試了GPT-4.1三款模型和GPT-4.5的編碼表現。

不難看出，GPT-4.1精準模擬了小球物理運動過程，GPT-4.1-mini/GPT-4.1-nano卻差了很多意思。

GPT-4.5的實力幾乎不輸GPT-4.1。

另一個類似的測試中，讓GPT-4.1挑戰旋轉正方形，模擬出球體在正方形內真實彈跳的效果。

Kaggle開發者Parul Pandey表示，用GPT-4.1創建用于教育物理模擬的過程非常有趣。

如下，用小球擊倒金字塔代碼生成過程中，模型讀取很少的不必要的文件，代碼結構也非常簡潔。

另一位工程師通過Windsurf讓GPT-4.1在30秒內，便生成了一個貪吃蛇的游戲。

微軟研究員Dimitris Papailiopoulos分別用GPT-4.1、GPT-4o、GPT-4.5去畫獨角獸，推測出4.1要比4o參數量小。

有一說一，GPT-4.1生成的獨角獸是當中最丑的那個。

沃頓商學院教授Ethan Mollick用GPT-4.1去生成飛船控制面板的p5js。他表示，相較于GPT-4，4.1進步非常大，整體上表現出色。

而且，Ethan表示GPT-4.1是第四款可以在twigl中首次運行著色器的模型。

網友讓GPT-4.1和Gemini 2.5 Pro去模擬一個霓虹燈照亮的賽博朋克城市夜景，4.1模型在這個案例中還是比谷歌模型強不少。

以上demo中，不難看出GPT-4.1的編碼性能確實非常驚艷，但從宏觀來看，仍不如Gemini 2.5 Pro、Claude 3.7 Sonnet。

Aider多語言編碼最新測試中，GPT-4.1得分為52.4%，接近Grok 3和DeepSeek V3。成本相較于o3-mini也降了一半。

網友對此吐槽到，GPT-4.1編程不如DeepSeek V3，但價格卻貴了8倍。

同樣，在最新Livebench基準評估中，也同樣印證了GPT-4.1推理、編碼、數學實力比Gemini 2.5差。

Abacus.AI創始人Bindu Reddy表示，4.1性能在GPT-4o之上，但Livebench結果表明，新模型只是對4o的一個增量更新。

哈佛科學家Pierre Bongrand更是一針見血地指出，OpenAI首次在谷歌之后發布了一個遠遠落后的模型。

在GPQA Diamond知識問答基準測試中，GPT-4.1系家族未達到人類博士級水平，更別提超越Gemini 2.5 Pro了。

網友一張惡搞圖戲稱，在OpenAI發布GPT-4和GPT-4.1期間，谷歌便將Bard進化到最強Gemini 2.5版本。

今年的AI大戰中，顯然是OpenAI與谷歌硬碰硬的終極較量。

1

谷歌包圍圈已成，OpenAI依然不可小覷

隨著GPT-4.1的發布，Ai2后訓練負責人Nathan Lambert也在第一時間發了一篇分析文章。

他表示，雖然GPT-4.1是一個小版本的更新，但這讓人們更清楚地認識到，驅動著最佳API業務的，是非常不同的模型。

如今，OpenAI正在用GPT-4.1，將API和ChatGPT分離。

它的模型正在優化每一美元的智能，我們以后還將繼續看到，ChatGPT的處理方式和API業務的不同。

最近，OpenAI 一直在進行各種小幅更新，而他們最終的愿景，就是將ChatGPT打造成一個獨立于其API的單體應用。

上周，ChatGPT的記憶功能得到了改進。

今天，OpenAI又宣布了一套僅限API的模型GPT-4.1，直接跟谷歌的Gemini形成了競爭。

單獨來看，其實最近的發布都沒有什么顛覆性的前沿突破，畢竟性能相當的模型，已經存在了。

不過，從這些更新中，卻可以看出OpenAI的戰略重心走向。

如今，它的周活躍用戶已經破了19億，此時，它需要的是ChatGPT及背后模型，與市場上任何其他AI產品都截然不同。

其他產品的中心，主要都是編碼或信息處理，與它們不同，ChatGPT則格外注重個性、氛圍感和娛樂性。

體現這一點的一個經典例子，就是GPT-4.5連同它的高昂定價一起，正從API中被棄用，不過仍會保留在ChatGPT中。

即將發布的o3、o4或開放模型，目前還讓人看不清OpenAI的宏觀戰略方向。

從下圖可以看出，OpenAI傳遞的核心信息很簡單——提供性能更好、推理速度更快的模型。

以下是新的OpenAI模型與谷歌Gemini每百萬Token的價格對比（單位為美元）。

OpenAI新模型:

GPT-4.1：輸入/輸出：2.00/8.00 | 緩存輸入：0.50
GPT-4.1 Mini：輸入/輸出：0.40/1.60 | 緩存輸入：0.10
GPT-4.1 Nano：輸入/輸出：0.10/0.40 | 緩存輸入：0.025

OpenAI舊模型:

GPT-4o：輸入/輸出：2.5/10.00 | 緩存輸入：$1.25
GPT-4o Mini：輸入/輸出：0.15/0.60 | 緩存輸入：$0.075

谷歌Gemini:

Gemini 2.5 Pro （≤200K Tokens）：輸入/輸出：1.25/10.00 | 緩存：不可用
Gemini 2.5 Pro （>200K Tokens）：輸入/輸出：2.50/15.00 | 緩存：不可用
Gemini 2.0 Flash：輸入/輸出：0.10/0.40 | 緩存輸入：0.025（文本/圖像/視頻），0.175 （音頻）
Gemini 2.0 Flash-Lite：輸入/輸出：0.075/0.30 | 緩存：不可用

雖然OpenAI的模型學術評估結果表現強勁，但這并未完全反映它們的實際情況。畢竟在實踐中，它們需要執行的是重復性的小眾任務。

顯然，這些新模型是用來直接對標Gemini Flash和Flash-Lite的（在 Gemini 2.5 Pro驚艷發布之后，備受期待的Gemini 2.5 Flash也即將面世）。

相比之下，GPT-4o-mini的性能已經落后，且不如Flash好用。

想在API業務上取得成功，OpenAI就需要在Gemini已經占據優勢的這個前沿領域實現突破。

都是從GPT-4.5蒸餾來的？

很多人已經發現了：在OpenAI的官方宣傳中，這些新模型的發布模式如出一轍——有廣泛改進，卻很少解釋具體原因。

所以幾乎可以肯定，這些五花八門的新模型，都是為了獲得更好的個性和推理能力，從GPT-4.5蒸餾而來的。

或者是在編碼和數學上，借鑒了像o3這樣的模型。

可以看出，新模型在代碼上已經取得了重大進步，要知道，曾經OpenAI早期的模型在這方面曾經差得離譜，幾乎掛0。

不過，在編碼和數學的評估上，這些新模型仍然明顯落后于Gemini 2.5（推理模型）或 Claude 3.7（可選推理模型）這樣的頂尖模型。

如今，我們正處于模型向包含推理轉變的早期階段，但究竟什么是單一的最佳模型，這個概念已經變得更為復雜了。

這些推理模型會通過消耗遠多于以往的Token，來實現性能的大幅提升。性能固然是王道，但若性能相當，則是成本更低者勝出。

但先發優勢仍難以撼動

但說到底，對大多數普通用戶來說，上面這些技術細節其實意義不大。

對他們來說，那個被戲稱為「模型投入度」的、令人頭疼的滑塊反而更直觀——

長期以來，相對于API的價格，很多人對聊天機器人的訂閱費會更感到猶豫。

但顯然，一個日漸清晰的現實就是，真正個性化的、受用戶喜愛的體驗，往往只存在于這些集成的應用程序中。

當然，開發者也可以通過API構建競品，積累用戶交互數據，但鑒于 OpenAI在產品層面已經建立起了巨大的先發優勢，想要勝過OpenAI，恐怕沒那么容易。

所有這些，都再次印證了我們的認知：產品化，是當前AI發展的重中之重。

記憶功能，以及將ChatGPT這條產品線與API服務進行更清晰的切割，都有助于OpenAI鋪平未來的發展道路。

但要完全實現這一愿景，OpenAI前方仍有很長的路要走。

參考資料：

https://x.com/bindureddy/status/1911865521504747563

https://x.com/paulgauthier/status/1911927464844304591

https://x.com/flavioAd/status/1911848067470598608

點個 “愛心”，再走吧

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

ACI.dev能一站直連600+工具，讓你的智能體秒變全能王！

機器之心Pro 2025-04-30 17:13:00
20 跟貼 20
登頂開源大模型榜首阿里Qwen3成色如何？|聚焦

財聯社 2025-05-01 19:34:10
3 跟貼 3

Deadline 前還在熬夜做圖表，DeepSeek + AI 指令上線，復雜圖表即可一鍵生成

生物學霸 2025-03-30 17:36:28
0 跟貼 0

400萬token新SOTA！英偉達UIUC聯手：兼顧長短上下文頂尖性能

新智元 2025-05-01 09:39:50
0 跟貼 0
Claude網頁版接入MCP！10款應用一鍵調用,開發者30分鐘創建新集成

量子位 2025-05-02 18:18:26
4 跟貼 4

采樣越多越聰明？隱式擴展顛覆認知，采樣搜索如何挑出完美解

新智元 2025-04-21 12:45:35
0 跟貼 0

別再卷數據了，LLM也怕「過勞死」！CMU等揭秘災難性過度訓練

新智元 2025-05-03 13:06:33
10 跟貼 10
從程序員到獨立開發者，我如何實現月入超一萬美元？

虎嗅APP 2025-03-04 03:05:06
0 跟貼 0

微軟CEO和奧特曼失了和，OpenAI被“斷糧”

量子位 2025-05-02 13:09:50
46 跟貼 46
微軟力邀馬斯克Grok AI入駐Azure

華爾街見聞官方 2025-05-02 06:06:43
14 跟貼 14
倆本科生自學3個月復刻谷歌爆款AI，Dia橫空出世

量子位 2025-05-01 12:16:10
0 跟貼 0
小米開源首個推理大模型開出百萬元年薪“招兵買馬”

每日經濟新聞 2025-05-02 00:08:14
406 跟貼 406
9個案例實測谷歌Gemini文生圖，設計行業“快變天了”

虎嗅APP 2025-03-14 05:44:32
322 跟貼 322
小鵬絕地翻盤，頭號功臣是她！

華商韜略 2025-03-28 14:19:16
0 跟貼 0
靜悄悄的餓了么，戰斗力到底有多強？

華商韜略 2025-04-30 14:18:35
0 跟貼 0
中國制造顯威力！特朗普多渠道求中！印巴戰機對峙，運20挺巴鐵

人猿星球觀察 2025-05-02 09:12:53
0 跟貼 0
特朗普硬蹭10天說11次與中聯系！中國謀定而后動，美已先眨眼！

人猿星球觀察 2025-05-02 23:22:02
0 跟貼 0
男人帶著一個布加迪汽車模型，來到當鋪就要賣500萬美刀，紀錄片

新鮮尋寶 2025-05-02 20:02:53
25 跟貼 25
GPT-4o過于諂媚，“賽博舔狗”惹爭議

虎嗅APP 2025-05-02 01:42:10
1 跟貼 1
曾毓群：如果特朗普愿意開放電動汽車供應鏈投資寧德時代將考慮在美國建廠

每日經濟新聞 2024-11-13 18:35:50
0 跟貼 0
中國打太極，特朗普急了！卡尼、空客硬杠美國！商飛歐洲大機遇？

人猿星球觀察 2025-05-02 18:49:07
0 跟貼 0
TOC版本零消費排骨實測，來看看鐵公雞一個版本能賺多少金 #大神魔獸5月創作季# #網易大神# #魔

我在右 2025-05-02 18:08:32
7 跟貼 7
OpenAI最新技術報告：GPT-4o變諂媚的原因萬萬沒想到

量子位 2025-05-03 12:02:04
44 跟貼 44
六代機群雄爭霸！中國領先群雄，美波音造淪為笑柄？

金額多少啊 2025-05-03 01:09:52
0 跟貼 0
美利堅烽煙再起：50州抗議浪潮背后的民意裂變

至今 2025-05-03 13:05:06
0 跟貼 0
擱置談判后，特朗普下令制裁5家中企，沃爾瑪“投降”：關稅我給

地理三體說 2025-05-03 14:24:37
0 跟貼 0
中方連退3架，特朗普沒耐心，24小時內通告全球：將重啟對等關稅

易老馮唐 2025-05-02 08:15:00
0 跟貼 0
Epic平臺"做慈善"：開發者前100萬美元收入分文不取!

游民星空 2025-05-02 09:11:07
3 跟貼 3
又一開源AI神器！將機器學習論文自動轉為可運行代碼庫

量子位 2025-05-01 11:42:03
14 跟貼 14
美烏礦產協議終于簽署后另一個非洲資源大國也想仿效

第一財經資訊 2025-05-03 16:00:13
6548 跟貼 6548
蔡正元：亞馬遜沃爾瑪去年預測關稅戰囤了貨物在加拿大

臺海青年 2025-05-03 00:00:00
0 跟貼 0
中國坐等白宮內斗！川皇生日要閱兵！美黃金時代吃不起麥當勞？

人猿星球觀察 2025-05-03 14:29:37
0 跟貼 0
蔡正元：阿爾斯通就是被美國搞垮的，華為也是美國的目標

全局觀 2025-05-01 08:55:16
3 跟貼 3
比亞迪版圖大起底，實力超乎你的想象

華商韜略 2025-02-11 17:11:11
88 跟貼 88
本科學歷但創造出GPT，奧特曼盛贊為「愛因斯坦級」天才

量子位 2025-01-01 14:17:10
29 跟貼 29
從游戲少女到AI女神！她用物理馴服AI，讓颶風預測快1000倍

新智元 2025-05-02 12:58:40
0 跟貼 0
不把特朗普當回事，沃爾瑪恢復從中國進口，關稅全部由美國人買單

地理三體說 2025-05-01 14:37:12
0 跟貼 0
科學家將R1技術遷移到多模態領域，只需10條數據就能提升模型性能

DeepTech深科技 2025-03-05 18:08:03
0 跟貼 0
蘋果微軟特斯拉，最大股東都是它！

華商韜略 2024-11-27 18:03:46
1 跟貼 1
菲律賓炸鍋！谷歌地圖更新，去掉了“西菲律賓海”標識

新時代精神 2025-05-02 00:26:45
0 跟貼 0

王辰：把握現在，不懼未來

王辰課堂

2025-05-03 05:05:19

DeepSeek說：人最快的減肥方法，不是運動，不是節食，而是這5種

DeepSeek說：人最快的減肥方法，不是運動，不是節食，而是這5種

簡食記工作號

2025-04-13 00:02:40

白人女性是不是很美，為什么?看網友：俄羅斯和中東易出極品美女

白人女性是不是很美，為什么?看網友：俄羅斯和中東易出極品美女

美好客棧大掌柜

2024-12-24 00:15:02

你對爸媽虛報價格最多的一次是多少？網友：160萬的馬我說幾千塊

你對爸媽虛報價格最多的一次是多少？網友：160萬的馬我說幾千塊

娛樂圈人物大賞

2025-05-02 00:10:10

蘇州直升機墜落后續！被砸男子是兩女孩爸爸，知情人曝出更多細節

蘇州直升機墜落后續！被砸男子是兩女孩爸爸，知情人曝出更多細節

謝綸郵輪攝影

2025-05-03 17:46:33

日本一姐姐彩票中了3000萬，辭職、旅行、瘋狂購物！半年后...

日本一姐姐彩票中了3000萬，辭職、旅行、瘋狂購物！半年后...

今日日本

2025-05-03 14:02:54

震驚！伊恩.卡梅倫遇刺身亡！妻子翻墻逃走，事情真的不簡單

震驚！伊恩.卡梅倫遇刺身亡！妻子翻墻逃走，事情真的不簡單

西樓知趣雜談

2024-07-17 13:55:31

飛天茅臺跌破2000元！超過5000家茅臺門店接入美團、抖音及餓了么

飛天茅臺跌破2000元！超過5000家茅臺門店接入美團、抖音及餓了么

樂酒客

2025-05-03 12:15:21

中國突然刷屏全球！韓國網友急了，這是 “輿論戰”，外網熱議

中國突然刷屏全球！韓國網友急了，這是 “輿論戰”，外網熱議

九號線人

2025-05-03 17:05:04

莫迪應感謝中國：巴基斯坦又一強援趕到，中國給了印度一個臺階下

莫迪應感謝中國：巴基斯坦又一強援趕到，中國給了印度一個臺階下

星辰故事屋

2025-04-30 17:34:33

清代名醫徐靈胎傳授：“縱欲”過度后果雖可怕，但仍有一法可破解

清代名醫徐靈胎傳授：“縱欲”過度后果雖可怕，但仍有一法可破解

一根香煙的少婦

2025-03-31 19:41:09

韓國餃子被連夜踢出中國超市，這場文化反擊戰，中國干得漂亮！

韓國餃子被連夜踢出中國超市，這場文化反擊戰，中國干得漂亮！

安珈使者啊

2025-05-01 06:50:05

營業收入5200億，股價從31元跌到15元，市凈率0.9倍淪為破凈股

營業收入5200億，股價從31元跌到15元，市凈率0.9倍淪為破凈股

投資觀

2025-05-03 08:20:08

湖南一景區推出海拔1600米懸崖睡床：對年齡、體重有要求

湖南一景區推出海拔1600米懸崖睡床：對年齡、體重有要求

封面新聞

2025-05-01 00:25:04

52球11助攻！曝皇馬爭搶26歲中鋒：僅要7000萬，曼聯慘遭無視

52球11助攻！曝皇馬爭搶26歲中鋒：僅要7000萬，曼聯慘遭無視

叁炮體育

2025-05-03 20:32:16

王楚然生圖直出，楚然美的好突出

王楚然生圖直出，楚然美的好突出

阿廢冷眼觀察所

2025-05-03 17:09:27

一個人，值不值得深交，就看這三個特征，很準

一個人，值不值得深交，就看這三個特征，很準

詩詞中國

2025-05-03 15:42:36

因尺度大爆火，這5部成人美劇建議收藏

因尺度大爆火，這5部成人美劇建議收藏

來看美劇

2025-03-16 20:38:07

許佳琪平時挺文靜，上臺是真敢！旗袍開到頂，還“大開大合”的

許佳琪平時挺文靜，上臺是真敢！旗袍開到頂，還“大開大合”的

吃瓜黨二號頭目

2025-05-03 10:09:54

遠離大腸癌，請記住，吃飯兩不要，晚上兩堅持，腸道才會更好

遠離大腸癌，請記住，吃飯兩不要，晚上兩堅持，腸道才會更好

華人星光

2025-05-03 11:12:23

硅（Si）是創造未來的基礎，歡迎來到這個星球。

2156文章數 10335關注度

往期回顧全部

科技要聞

特朗普下手，英偉達對華“特供版”要改

頭條要聞

陳芋汐完成賽季三連冠全紅嬋想實現大滿貫只能等來年

頭條要聞

陳芋汐完成賽季三連冠全紅嬋想實現大滿貫只能等來年

體育要聞

北京請神馬布里？許利民真有“玄學”！

娛樂要聞

趙又廷節目中高調撒糖大贊高圓圓超好

財經要聞

巴菲特年度盛會，六大看點前曕！

汽車要聞

易三方科技體驗日·北京站上演硬核駕控

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機

家居

藝術

健康

時尚

手機要聞

消息稱 OPPO Reno14 Pro 手機搭載天璣 8450 處理器

家居要聞

意式輕奢低飽和質感美學

輕奢婚房自由隨性生活
雅奢氛圍營造品質生活
慢度設計溫暖與沉靜的體驗

藝術要聞

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

唇皰疹和口腔潰瘍是"同伙"嗎？

虞書欣和鞠婧祎都愛上了快絕版的“撕拉片”

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：延川县| 准格尔旗| 绥滨县| 荆门市| 离岛区| 凯里市| 馆陶县| 合川市| 黑水县| 汶上县| 会理县| 隆化县| 玉屏| 哈巴河县| 富民县| 沧州市| 西城区| 海城市| 三明市| 诸暨市| 土默特右旗| 金乡县| 昆山市| 长乐市| 灵石县| 南皮县| 迁安市| 越西县| 淅川县| 郓城县| 咸丰县| 德庆县| 大冶市| 平遥县| 聊城市| 山阴县| 彭州市| 上虞市| 蓬溪县| 花莲县| 漳平市|