99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

GPT-4.1登場,實測碾壓OpenAI所有模型,但效果不如Gemini?

0
分享至

昨晚,OpenAI 推出了名為 GPT-4.1 的新模型,該系列優(yōu)先提升了編碼能力和指令跟隨能力,同時將上下文窗口擴展到了100萬個tokens,大約相當于75萬個單詞。所有這些模型的知識截止日期為2024年6月,能提供更貼合當下的上下文理解。

該系列包括標準的GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,所有版本都可以通過API使用,但無法在ChatGPT中使用。

目前,已經有不少用戶在體驗GPT-4.1的效果了。一位網友在試用后表示,“GPT-4.1可以處理所有其他OpenAI模型無法應對的大篇幅上下文。”還有網友用GPT-4.1模型繪制一只鵜鶘,并將其與Grok 3、LLama 4 和 Gemini 2.5 Pro 的生成結果進行比較,被評Gemini做得更好。 Box AI則分享了用GPT-4.1模型來研讀一份冗長的收益報告文檔、從中提取出數(shù)據(jù)字段的例子,并表示其“能夠大規(guī)模查詢、整合、分析和總結任何數(shù)據(jù)類型”。

此外,GPT 4.1現(xiàn)已接入ChatLLM。在代碼處理方面,它似乎不如Gemini 2.5 Pro和Claude 3.7 Sonnet。

OpenAI 聲稱,在包括SWE-bench在內的編碼基準測試中,完整的GPT-4.1模型的表現(xiàn)優(yōu)于其GPT-4o和GPT-4o mini模型。其中,GPT-4.1 mini和nano更高效、更快速,但也犧牲了一定準確性。GPT-4.1在SWE-bench Verified上的得分介于52%和54.6%之間,不過略低于谷歌和Anthropic在同一基準測試中報告的、分別為Gemini 2.5 Pro(63.8%)和Claude 3.7 Sonnet(62.3%)的分數(shù)。

并且,GPT-4.1在Video-MME的長視頻理解測試中達到了72%的準確率,相比GPT-4o的65.3%有了顯著提升。

OpenAI還宣布,將在7月14日之前從 API 訪問中淘汰GPT-4.5。該公司稱,GPT-4.1能夠以低成本提供“相當或更優(yōu)的性能”。有網友表示,在SimpleQA基準測試中,GPT-4.5 仍比 GPT-4.1 好得多。

也有不少網友調侃OpenAI的命名方式,“難道是擲骰子嗎?4.1怎么能算是4.5的升級版?”“為什么不直接用4.1更新4.5?這會比倒回去更新更合理。”











特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
聽我一句勸,銷量大跌40%,問界被拋棄?

聽我一句勸,銷量大跌40%,問界被拋棄?

三農老歷
2025-05-15 15:49:22
足協(xié)杯:38歲于漢超雙響!申花3-0進16強,英博5-1,玉昆2-1絕殺

足協(xié)杯:38歲于漢超雙響!申花3-0進16強,英博5-1,玉昆2-1絕殺

我愛英超
2025-05-21 17:31:15
在最后關頭談判破裂,中方拒絕簽字,馬克龍別無選擇

在最后關頭談判破裂,中方拒絕簽字,馬克龍別無選擇

趣味萌寵的日常
2025-05-19 03:12:39
從新加坡入境中國又要做核酸了?

從新加坡入境中國又要做核酸了?

新加坡眼
2025-05-21 19:13:36
為什么女性的身體對男性有很強的吸引力?

為什么女性的身體對男性有很強的吸引力?

素然追光
2025-05-15 03:50:02
3-2打哭日本張本智和,2-1贏賽點連丟2局,世乒賽遭逆轉無緣沖冠

3-2打哭日本張本智和,2-1贏賽點連丟2局,世乒賽遭逆轉無緣沖冠

全能體育柳號
2025-05-22 00:10:02
西安發(fā)布高溫紅色預警!陜西大雨、雷暴大風馬上來!西安降雨在……

西安發(fā)布高溫紅色預警!陜西大雨、雷暴大風馬上來!西安降雨在……

環(huán)球網資訊
2025-05-21 14:25:19
熱刺舊將:拿下歐聯(lián)杯本賽季就比阿森納成功,聯(lián)賽第二有啥好要的

熱刺舊將:拿下歐聯(lián)杯本賽季就比阿森納成功,聯(lián)賽第二有啥好要的

直播吧
2025-05-22 00:01:09
華為再立新功

華為再立新功

靜思有我
2025-05-21 10:19:32
汪小菲頂高溫鄭州考察 具俊曄金寶山看大S被偶遇 網友:記者咋拍不到

汪小菲頂高溫鄭州考察 具俊曄金寶山看大S被偶遇 網友:記者咋拍不到

手工制作阿殲
2025-05-22 03:24:07
掛斷普京電話后,特朗普終于承認:拜登政府對烏軍援“簡直瘋狂”

掛斷普京電話后,特朗普終于承認:拜登政府對烏軍援“簡直瘋狂”

小舟談歷史
2025-05-21 15:56:06
浙江女老板取到3萬元假錢,銀行死不承認,她一招讓柜員悔不當初

浙江女老板取到3萬元假錢,銀行死不承認,她一招讓柜員悔不當初

呼呼歷史論
2025-05-21 15:09:20
地震級補強!斯通會調整球隊的陣容,火箭將會迎來55+12大殺器

地震級補強!斯通會調整球隊的陣容,火箭將會迎來55+12大殺器

埃文凱爾
2025-05-22 00:30:28
姆巴佩閃電染紅+絕殺連轟5球 皇馬破塞維利亞鐵桶陣

姆巴佩閃電染紅+絕殺連轟5球 皇馬破塞維利亞鐵桶陣

云隱南山
2025-05-21 11:19:56
金小妹凱莉的性感魅力:超短抹胸蕾絲裙造型賞析

金小妹凱莉的性感魅力:超短抹胸蕾絲裙造型賞析

述家娛記
2025-05-19 09:29:55
消息傳來!一家三口不幸身亡

消息傳來!一家三口不幸身亡

魯中晨報
2025-05-21 16:25:27
巴西教授瑪爾塔研究137種文獻得出判斷:地獄存在,就是日本列島

巴西教授瑪爾塔研究137種文獻得出判斷:地獄存在,就是日本列島

風月觀主
2025-05-20 08:10:06
那英和老公孟桐在倫敦牽手逛街,穿著一身名牌貨,看起來歲月靜好

那英和老公孟桐在倫敦牽手逛街,穿著一身名牌貨,看起來歲月靜好

鄭丁嘉話
2025-05-21 14:06:43
三線出局,世乒賽最輸不起的是她!世界第5爆冷1-3,8強決出4席

三線出局,世乒賽最輸不起的是她!世界第5爆冷1-3,8強決出4席

求球不落諦
2025-05-21 08:27:11
現(xiàn)貨黃金剛剛跌破3310.00美元/盎司關口

現(xiàn)貨黃金剛剛跌破3310.00美元/盎司關口

每日經濟新聞
2025-05-21 15:33:09
2025-05-22 06:04:50
AI前線 incentive-icons
AI前線
面向AI愛好者、開發(fā)者和科學家,提供AI領域技術資訊。
856文章數(shù) 80關注度
往期回顧 全部

科技要聞

網易直擊IO大會:Gemini接管一切 眼鏡炸場

頭條要聞

歐洲領導人徹底失望:特朗普24小時不到就背棄我們

頭條要聞

歐洲領導人徹底失望:特朗普24小時不到就背棄我們

體育要聞

打破三大魔咒!廣廈終于將冠軍帶回浙江

娛樂要聞

中國國家話劇院發(fā)訃告:沉痛悼念朱媛媛

財經要聞

年虧百億、裁員自救!“AI四小龍”難了

汽車要聞

價格下調 2025聰明款ID.4 X限時13.99萬起

態(tài)度原創(chuàng)

旅游
藝術
游戲
親子
公開課

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

《瘋狂動物城 2》公開先導預告 / 《劍星》續(xù)作計劃 2027 年之前發(fā)售

親子要聞

小肚子大不是脂肪的鍋!是核心兜不住內臟了,產后和久坐人群必練

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 华亭县| 抚宁县| 宁波市| 五华县| 新安县| 云和县| 化德县| 揭阳市| 沁水县| 霍州市| 浪卡子县| 慈溪市| 阿拉善左旗| 文安县| 盐池县| 彭水| 普定县| 洮南市| 沙湾县| 台南市| 延吉市| 咸阳市| 芮城县| 兴海县| 岳普湖县| 龙口市| 唐河县| 侯马市| 高邮市| 嘉兴市| 台东市| 临桂县| 普宁市| 英德市| 鄯善县| 剑阁县| 南投市| 宣汉县| 望城县| 平顺县| 腾冲县|