文章轉(zhuǎn)載自「新智元」
剛剛,OpenAI 官宣:GPT-4.1 在 ChatGPT 中上線,用戶可以直接使用。GPT-4.1 模型擅長編碼任務和遵循指令,生成速度更快,是 o3 和 o4-mini 的絕佳替代品。
一個月前,OpenAI 推出了新系列模型 GPT-4.1,在編程、指令遵循、長上下文方面表現(xiàn)優(yōu)異。
GPT-4.1 此前僅通過 API 向開發(fā)者開放,在 ChatGPT 上線后,Plus、Pro 和 Team 用戶可通過模型選擇器中的“更多模型”下拉菜單訪問 GPT-4.1。企業(yè)版和教育版用戶將在未來幾周內(nèi)獲得訪問權(quán)限。同時,OpenAI 還計劃在 ChatGPT 中引入 GPT-4.1 mini 取代 GPT-4o mini。
Founder Park 正在搭建「AI 產(chǎn)品市集」社群,邀請從業(yè)者、開發(fā)人員和創(chuàng)業(yè)者,掃碼加群:
進群后,你有機會得到:
最新、最值得關(guān)注的 AI 新品資訊;
不定期贈送熱門新品的邀請碼、會員碼;
最精準的AI產(chǎn)品曝光渠道
01
GPT-4.1,
比GPT-4.5還好?
這次放出GPT-4.1,也算響應群眾的呼聲。
早在4月底,就有用戶抱怨說:GPT-4.1簡直是自己最喜歡的OpenAI模型,可惜在ChatGPT中并不能使用。
他確定地說:使用體驗比GPT-4.5還要好!
不斷有開發(fā)者現(xiàn)身說法,表示:除了GPT-4.1的早期版本Quasar Alpha之外,它也是自己測試過的最好的編碼模型!
不斷有人表示,GPT-4.1,絕對是一個被低估的模型。
就在上個月,OpenAI專為開發(fā)者推出了GPT-4.1系列新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。
它們均擁有最高100萬Token的超大上下文窗口,在代碼、指令跟隨等核心能力上全面超越GPT-4o及GPT-4o mini,并且知識截止日期也已更新至2024年6月。
02
GPT-4.1 能力實測:
順利完成龐大代碼任務
既然很多ChatGPT用戶都能用上GPT-4.1了,現(xiàn)在全網(wǎng)已經(jīng)涌出了不少實測。
比如沃頓商學院教授Ethan Mollick,就用一道考遍了各大模型的景點難題來考驗GPT-4.1。
「請創(chuàng)建一段我可以直接粘貼到p5.js中的代碼,它要以驚人的巧思震撼我,仿佛是未來某艘星艦控制面板的呈現(xiàn)。」
GPT-4.1的表現(xiàn),可是相當優(yōu)秀。
另一位開發(fā)者實測后發(fā)現(xiàn),GPT-4.1實在令人驚喜!
當時,他正在處理一個代碼量非常龐大的任務,系統(tǒng)自動選擇的模型根本無法處理,完全沒有生成任何內(nèi)容。
結(jié)果讓GPT-4.1上場后,它不僅比默認模型更快,還準確地完成了任務。
甚至,它還給了一個額外的驚喜:竟然還把整個文件中沒用到的代碼都清理掉了。
通過實測發(fā)現(xiàn),GPT-4.1在代碼生成速度方面達到了新的高度。
比如讓GPT-4.1生成一個博客首頁,在幾秒鐘之內(nèi)就完成了輸出。
再比如,讓他用python寫一個地球飛往火星的動畫,幾乎就是在一瞬間,GPT-4.1就完成了任務的輸出。
結(jié)果看起來還行,這只是第一輪交互的結(jié)果,能夠感受到GPT-4.1的速度是得到根本性的提升。
再挑戰(zhàn)一下,讓給GPT-4.1用動畫來解釋一下量子糾纏。
初步來看,GPT-4.1還是「領會」到了什么是量子糾纏
對于推理問題,GPT-4.1表現(xiàn)的也非常優(yōu)秀。比如多步驟的年齡計算問題,GPT-4.1的求解邏輯非常嚴謹。
面對一些逆向思考、腦筋急轉(zhuǎn)彎之類的問題,GPT-4.1也能快速完成推理,當然面對這個問題得出的答案倒是非常有趣。
03
網(wǎng)友吐槽:
沒有1M上下文版本
但試用GPT-4.1后,許多網(wǎng)友表示:太失望了!
雖然OpenAI發(fā)布了GPT-4.1,卻沒有包含100萬上下文窗口的API版本。
本來大家最希望在ChatGPT中使用GPT-4.1,就是因為想要超長的上下文窗口。
現(xiàn)在,只能期望GPT-5能提供一個超長的上下文窗口了。
的確,不斷有人發(fā)現(xiàn),ChatGPT(Pro)中的GPT-4.1,最大上下文長度似乎僅為128k token,跟API中的100萬token相差甚遠。
也就是說,OpenAI并沒有在GPT-4.1中提高限制。
總之,真的讓人很失望。看來還是得用Gemini。
也有網(wǎng)友發(fā)現(xiàn)了「華點」:自己嘗試運行他們在直播演示中用來展示 ChatGPT 4.1的提示詞,但網(wǎng)頁版無法運行成功,不過在API Playground中嘗試后卻運行成功了。
也有人說,自己剛剛氛圍編程了一個使用GPT-4.1的AI助手,因為這個模型僅通過API提供,今天,ChatGPT中就能用了。
不過,他還是會用自己的助手,因為用戶界面比ChatGPT更好。
其實,OpenAI此前已經(jīng)放出GPT-4.1的prompt指南,總結(jié)了一系列內(nèi)部測試中得出的重要prompt技巧。
想實測的小伙伴,可以參考這篇用起來了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.