今天凌晨, OpenAI 發(fā)了兩款模型:
? o3 :o1 的上位替代。性能上桌、推理準(zhǔn)、能用工具,是真正的主力旗艦。
? o4-mini :o3-mini 的上位替代,很多場景打得過 o3,價格很便宜
并且,這倆模型都可以使用工具了
先有個直覺,這里我做了個圖:
o1 完成了他的歷史使命
劃重點:
→ 不想掏錢但要性能?用 o4-mini
→ 做復(fù)雜系統(tǒng)、多步規(guī)劃?用 o3
→ 還在用 o3-mini?現(xiàn)在就是換的時候
性能
o4 mini 在簡單任務(wù)(哪里簡單了..)表現(xiàn)很棒
總結(jié)幾個重點:
? 數(shù)學(xué):o4-mini > o3 > o3-mini
? 代碼:o4-mini > o3 > o3-mini
? 復(fù)雜知識:o3 > o4-mini > o3
多輪指令遵循:o3 >> o4-mini > o3
在復(fù)雜任務(wù)上,o3 還是很亮眼的 價格 o4-mini 的價格不錯
關(guān)鍵點:
? o4-mini 完美替代 o3-mini :價格一樣,但性能更強
? o3 適合復(fù)雜推理的任務(wù) ,別一上來就選它
? 還在跑 o1 的,除非你是老系統(tǒng)遷移,不然就是浪費錢
o3 是通用旗艦,復(fù)雜任務(wù)的天花板
o4-mini 是新默認(rèn),便宜又快,適合跑量任務(wù)
選擇指南
o3-mini 的用戶:別猶豫,換 o4-mini,現(xiàn)在就行
新項目:用 o4-mini 起步,性價比最高
o1 用戶:趕緊遷出,那個模型早該退休了
復(fù)雜任務(wù):需要多輪規(guī)劃的,用 o3 試試
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.