為了更積極地與 Google 等競爭對手抗衡,OpenAI 正在推出 Flex processing,這是一種 API 選項,通過降低 AI 模型的使用價格換取響應速度變慢以及“偶爾出現資源不可用”的情況。
OpenAI 表示,Flex processing 目前以 Beta 版本的形式適用于其近期發布的 o3 和 o4-mini 推理模型,并主要面向較低優先級以及“非生產”任務,例如模型評估、數據豐富以及異步工作負載。
該機制將 API 成本精確降低了 50%。對于 o3 而言,Flex processing 的定價為每百萬輸入 Token 5 美元(約 750,000 字)和每百萬輸出 Token 20 美元,而標準定價為每百萬輸入 Token 10 美元和每百萬輸出 Token 40 美元。對于 o4-mini,Flex 將價格降至每百萬輸入 Token 0.55 美元和每百萬輸出 Token 2.20 美元,相比之下標準價格分別為每百萬輸入 Token 1.10 美元和每百萬輸出 Token 4.40 美元。
Flex processing 的推出正值前沿 AI 成本持續攀升之時,同時競爭對手也推出了更便宜且更高效、面向預算用戶的模型。上周四,Google 推出了 Gemini 2.5 Flash,這是一款推理模型,在性能上可以匹配甚至超越 DeepSeek 的 R1,同時具備更低的每百萬輸入 Token 成本。
在宣布 Flex 定價的電子郵件中,OpenAI 還指出,處于其使用層級體系中第 1 至第 3 層的開發者必須完成新引入的身份驗證流程后才能訪問 o3。 (Tiers are determined by the amount of money spent on OpenAI services. ) 此外,o3 及其他模型的推理摘要和流式 API 支持也需要通過身份驗證才能使用。
OpenAI 先前曾表示,引入身份驗證流程旨在阻止不法分子違反其使用政策。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.