99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

OpenAI 正式發布 GPT-4.1 系列:百萬 Token 長文本、更強編碼、價格更優!

0
分享至


OpenAI 正式發布了 GPT-4.1,這是一個以“ 強大編程能力 ”為核心的新模型系列,意在再次突破人工智能的邊界。新發布的包括主力模型 GPT-4.1,以及更小更快的 GPT-4.1 mini 和 GPT-4.1 nano。

GPT-4.1 模型系列以更低的成本提供了卓越的性能。這些模型在延遲曲線的每個點上都實現了性能的提升。

高速的GPT-4.1 mini 在小模型性能上實現了顯著飛躍,甚至在多項基準測試中超越了 GPT-4o。它在智能評估方面達到甚至超越了 GPT-4o,同時將延遲降低了近一半,成本降低了 83%。

對于需要低延遲的任務,GPT-4.1 nano 是目前速度最快、成本最低的模型。它擁有 100 萬個 token 上下文窗口,在小規模下實現了卓越的性能,甚至高于 GPT-4o mini。它是分類或自動完成等任務的理想選擇。

這一系列模型專為開發者而生,并且僅通過 OpenAI API 提供使用,展現了公司希望在競爭日益激烈的 AI 戰場中搶占開發者生態主導地位的野心。

三款模型,滿足不同開發需求

不同于面向大眾用戶、為 ChatGPT 提供支持的 GPT-4o,GPT-4.1 是專門為程序員和企業用戶打造的。主力版本 GPT-4.1 擁有驚人的 100 萬 token 上下文窗口,大致相當于 75 萬字的容量,可以一口氣“讀完”一本《戰爭與和平》,非常適合處理大體量的數據任務,比如代碼生成、法律分析、學術研究等。

Mini 和 Nano 版本則主打“快”和“省”,犧牲部分精度以換取更低延遲和更低成本,適合對響應速度和預算敏感的項目。

OpenAI 也推出了分層定價策略。完整 GPT-4.1 每百萬輸入 token 收費 2 美元,輸出 8 美元;Mini 模型的價格降低至 0.40 美元和 1.60 美元;而 Nano 版本則僅需 0.10 美元和 0.40 美元,是目前 OpenAI 最快、最便宜的模型。


這種“價格戰”姿態明顯針對 Google 的 Gemini 2.5 Pro 和 Anthropic 的 Claude 3.7 Sonnet,試圖通過低價爭奪 AI 云服務市場。

編程能力是 GPT-4.1 的主打賣點

GPT-4.1 最顯著的優勢在于其出色的編程能力。

OpenAI 表示,該模型在前端開發、格式對齊和工具調用方面表現突出。在 SWE-bench Verified 這一軟件工程任務的行業評測中,GPT-4.1 的得分在 52% (前端編碼)到 54.6% 之間,雖然比不上 Google Gemini 2.5 Pro(63.8%)和 Claude 3.7 Sonnet(62.3%),但依然具備實用價值。


OpenAI 表示,這個系列是根據真實開發者的反饋進行優化的,可以勝任從修復 bug 到生成 UI 設計等多種開發任務。

“這些模型是我們打造智能編程助手愿景的重要一步,”OpenAI 首席財務官 Sarah Friar 在倫敦一場科技峰會上表示。她強調,未來的模型將有能力完成從零開發整個應用的全流程,包括測試和文檔撰寫。

目前,像 Windsurf 、Cursor這類開發平臺,已開始使用 GPT-4.1 來提升代碼生成效率。

性能全面超越 GPT-4o

除了編碼能力以外,GPT-4.1 在多個關鍵領域展現了顯著的性能提升,尤其是在以下方面:

  • 指令遵循:模型對復雜指令的理解能力大幅提高,能夠更精準地捕捉用戶意圖,減少歧義。


  • 長文本處理:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 最多可以處理 100 萬個上下文Token,而之前的 GPT-4o 型號最多可以處理 128,000 個。得益于超大上下文窗口,GPT-4.1 在長篇寫作、翻譯和總結任務中表現出更高的連貫性和準確性。

  • 知識廣度與深度:模型在 STEM(科學、技術、工程、數學)、人文學科和專業領域(如法律、醫學)的表現均有提升。

在基準測試中,GPT-4.1 的綜合性能超越了 GPT-4o 和 GPT-4o mini,尤其在 MMLU(大規模多任務語言理解) 和 HumanEval(代碼生成) 等指標上取得了更高的分數。


多模態能力再升級

GPT-4.1 和前代 GPT-4o 一樣,是“多模態”模型,既能理解文本,也能處理圖像,部分情況下還支持視頻。

OpenAI 的測試數據顯示,該模型在 Video-MME 基準測試中對無字幕視頻的理解準確率達 72%,為目前業界領先。這意味著它在實時視頻分析和自動化內容審核方面有潛在應用價值。


不過,隨著輸入信息的增多,模型表現也會下降。從 OpenAI 的測試結果來看,模型在 8000 token 時準確率可達 84%,但當輸入擴展到 100 萬 token 時,準確率會降至 50%,說明即使是最強模型在處理超大規模信息時也仍有限制。

GPT-4.1 也繼承了 GPT-4o 的多語言能力,對 50 種語言支持更強,且知識更新至 2024 年 6 月,適應當前資訊環境。不過 OpenAI 也強調,這一模型并不屬于公司 o1 或 o3 系列的“推理型”模型,后者擅長逐步解決數學和科學問題。GPT-4.1 更注重上下文理解與直覺表達,目標是“聊得自然”,而不是“算得精準”。

競爭對手環伺,OpenAI 如何突圍?

在 GPT-4.1 發布之際,AI 領域競爭已達白熱化。Google 的 Gemini 2.5 Pro 擁有同樣的 100 萬 token 上下文窗口,并在編程性能上領先;Anthropic 的 Claude 3.7 Sonnet 擅長理解復雜指令。

而中國初創企業 DeepSeek 推出的 V3 模型性能相近,但價格更低,給 OpenAI 在新興市場的定價帶來壓力。社交平臺 X 上的開發者們一片熱議,有人將百萬上下文窗口稱為“革命性升級”,但也有人吐槽 OpenAI 的命名方式(如 o4-mini 和 4.1-mini)太容易混淆。

OpenAI 自身也面臨節奏壓力。該公司在 2 月預覽的 GPT-4.5 不久后便被棄用,顯示其產品迭代快到“追不上自己”。據消息人士透露,OpenAI 部分模型發布被推遲,是因為遭遇算力瓶頸,這也是 AI 擴展過程中普遍的問題。


此外,從通用聊天模型轉向以“代碼”為核心的專業工具,也標志著 OpenAI 的戰略轉型。正如 CEO Sam Altman 所說,他們更關注“高價值場景”,而不是僅僅做聊天機器人。

未來尚未明朗

GPT-4.1 的發布依舊展現了 OpenAI 對行業趨勢的引領能力。公司正押注于這樣一種未來:AI 將不只是出現在表面炫目的 App 中,而是深深嵌入企業的底層流程中,成為“看不見的基礎設施”。

至于 GPT-4.1 能否真的改變軟件開發的游戲規則,還要看開發者們如何在真實世界中用好它。可以肯定的是,這一次 OpenAI 又在 AI 競賽中打出了重磅一擊,行業也在屏息以待。

? AI范兒

要進“交流群”,請關注公眾號獲取進群方式

投稿、需求合作或報道請添加公眾號獲取聯系方式


GPT-4o 再更新,性能超越 4.5,成本卻只有 1/30


GPT-4o 已成為文生圖王者!


OpenAI 推出新功能,ChatGPT 將記住你每一次對話

點這里關注我,記得標星哦~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
熱搜第一!前湖南衛視女主持人官宣戀情,曾說“一輩子不結婚”,男友是小8歲素人

熱搜第一!前湖南衛視女主持人官宣戀情,曾說“一輩子不結婚”,男友是小8歲素人

魯中晨報
2025-05-14 12:44:07
破案了!方碩頂嘴許利民內訌真相大白,曾凡博深夜宣布最新決定

破案了!方碩頂嘴許利民內訌真相大白,曾凡博深夜宣布最新決定

春序娛樂
2025-05-16 10:50:53
徹底震怒!澤連斯基當全世界面怒斥普京和特朗普,把他當猴子耍

徹底震怒!澤連斯基當全世界面怒斥普京和特朗普,把他當猴子耍

樵山7988
2025-05-16 06:15:07
巴薩如何取代皇馬成為西班牙之王?解析弗里克的5大改造“魔法”

巴薩如何取代皇馬成為西班牙之王?解析弗里克的5大改造“魔法”

夜白侃球
2025-05-16 22:20:46
熱搜第一!萬元買的浪琴只剩表帶,客服也懵了?網友:浪還在琴沒了

熱搜第一!萬元買的浪琴只剩表帶,客服也懵了?網友:浪還在琴沒了

北京商報
2025-05-14 13:01:26
臺媒終于肯報道大S家被洗某劫的事了,具俊曄不回老家是有原因的

臺媒終于肯報道大S家被洗某劫的事了,具俊曄不回老家是有原因的

西樓知趣雜談
2025-05-16 06:37:50
大多數人都有情人?真相可能讓你意外

大多數人都有情人?真相可能讓你意外

野薔薇觀察所
2025-05-15 17:31:13
老年人為何摔一跤就骨折?60歲后,2種肉要舍得吃,或能養好骨骼

老年人為何摔一跤就骨折?60歲后,2種肉要舍得吃,或能養好骨骼

39健康網
2025-05-16 18:31:28
陸光祖2-0奈良岡功大晉級男單半決賽,將戰安東森

陸光祖2-0奈良岡功大晉級男單半決賽,將戰安東森

懂球帝
2025-05-16 20:42:20
英媒:梅西效應正在美國衰退,不當行為可能會讓他成為爭議球員

英媒:梅西效應正在美國衰退,不當行為可能會讓他成為爭議球員

雷速體育
2025-05-16 10:04:14
幾十塊和幾百塊的T恤:到底差哪?別只看價格!內行教你一眼辨別

幾十塊和幾百塊的T恤:到底差哪?別只看價格!內行教你一眼辨別

時尚搭配師Nicole
2025-05-11 15:02:23
他接受紀律審查和監察調查

他接受紀律審查和監察調查

錫望
2025-05-15 17:49:17
重磅!武磊的前途被毀了?

重磅!武磊的前途被毀了?

生活新鮮市
2025-05-16 16:07:09
“廣東神童”陳舒音:7歲上初中,12歲上浙大,20歲主攻癌癥醫學

“廣東神童”陳舒音:7歲上初中,12歲上浙大,20歲主攻癌癥醫學

楊哥歷史
2025-05-16 09:58:40
“4級以上就很牛了”,2025家庭收入劃分10個等級,你家在哪一檔

“4級以上就很牛了”,2025家庭收入劃分10個等級,你家在哪一檔

小羽叨叨叨
2025-05-14 14:12:01
重磅加盟!正式轉型,甜瓜安東尼又有新工作了

重磅加盟!正式轉型,甜瓜安東尼又有新工作了

球童無忌
2025-05-16 22:03:18
重大發現:早起空腹吃它,氣死癌細胞,三高降了,血管通了,睡眠好了、疫力提高10倍

重大發現:早起空腹吃它,氣死癌細胞,三高降了,血管通了,睡眠好了、疫力提高10倍

文藝天下
2025-05-16 05:14:58
老人銀行取款身亡新進展:家屬稱雙方和解,銀行“以慰問金的形式”向家屬支付10萬元

老人銀行取款身亡新進展:家屬稱雙方和解,銀行“以慰問金的形式”向家屬支付10萬元

澎湃新聞
2025-05-16 12:24:06
廣發銀行,感受到了信用卡的寒氣

廣發銀行,感受到了信用卡的寒氣

松果財經
2025-05-16 22:23:11
陳曉怕要笑失眠了!不是離婚興奮,而是陳妍希的“兒子”竟是肖戰

陳曉怕要笑失眠了!不是離婚興奮,而是陳妍希的“兒子”竟是肖戰

小娛樂悠悠
2025-05-14 09:45:37
2025-05-17 00:36:49
AI范兒 incentive-icons
AI范兒
AI范兒是一個專注于人工智能領域的資訊和學習平臺,提供最新的人工智能資訊
496文章數 128關注度
往期回顧 全部

科技要聞

雷軍:一場事故讓我們受到狂風暴雨般的質疑

頭條要聞

特朗普稱有意在本周末同中國領導人通電話 中方回應

頭條要聞

特朗普稱有意在本周末同中國領導人通電話 中方回應

體育要聞

退役8個月后喜提3冠,人生的轉折如此突然

娛樂要聞

嘉行回應黃楊鈿甜風波翻車,引發眾怒

財經要聞

一船難求,又要開始了?

汽車要聞

吉利發布最強一季報后,繼續整合、補短板是關鍵

態度原創

時尚
家居
數碼
公開課
軍事航空

張一山人設崩塌全記錄:演技爭議、感情緋聞不斷,童星光環剩多少

家居要聞

溫馨暖調 現代極簡空間

數碼要聞

AMD Zen6架構處理器詳細規格曝光 或以銳龍AI500系列命名發布

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

沒等到普京 澤連斯基走了

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 任丘市| 霍州市| 颍上县| 普宁市| 汾阳市| 锡林浩特市| 绩溪县| 鄂托克前旗| 浪卡子县| 承德市| 牡丹江市| 宁强县| 噶尔县| 科技| 清河县| 盐城市| 江永县| 布拖县| 贵州省| 璧山县| 徐闻县| 金乡县| 博白县| 双鸭山市| 宣化县| 鲜城| 南投市| 佳木斯市| 西乌珠穆沁旗| 福清市| 甘泉县| 龙里县| 木里| 伽师县| 离岛区| 蓬溪县| 全南县| 甘孜| 高唐县| 怀仁县| 崇阳县|