今天凌晨,OpenAI 宣布推出由 o4-mini 驅動的輕量版深度研究功能。
先劃重點,Plus、Team、Enterprise 和 Edu 用戶都將可以使用這項功能。每月查詢次數分別為:Pro 用戶 250 次、Plus 用戶 25 次、免費用戶 5 次。
官方表示,這一版本在智能程度上接近完整版深度研究,雖然回復更為簡潔,但依然注重內容深度,同時降低了服務成本。
Enterprise 和 Edu 賬戶將于下周獲得訪問權限,功能權限與 Team 用戶一致。一旦 Plus 等用戶達到完整版查詢上限,ChatGPT 會自動切換至輕量版。
此外,輕量版深度研究從今天起陸續向所有 Free 用戶開放。那么問題來了:
由 o4-mini 驅動的輕量版深度研究好用嗎?
它和完整版之間的體驗差異明顯嗎?
與競品相比,OpenAI 的深度研究功能到底值不值得用?
由 o4-mini 驅動的輕量版深度研究好用嗎?
先來測試最關鍵的一點:免費可用的輕量版深度研究,能不能勝任復雜查詢?
答案是不太行。來看一道測試題:
題目一:幫我查找過去 10 年內,按 GDP 排名前 10 的發達國家和前 10 的開發中國家的 iOS 和安卓用戶采納率、希望學習另一種語言的比例以及移動滲透率的變化。將這些信息以表格形式展示,并將統計數據分列,同時提供針對新推出的 iOS 翻譯應用(由 ChatGPT 提供支持)的市場推薦,重點關注 ChatGPT 目前活躍的市場。
輕量版深度研究生成速度很快,結構化輸出也還算整齊,但沒有附帶信源鏈接,追問之后,它勉強補上了幾句籠統來源,看著就不太靠譜的樣子。
再上點強度。
題目二:請調研 2018–2025 年間制造業增加值全球前 12 國、勞動年齡人口年均下降最快的前 12 國、以及老齡化比例超 20% 且最低工資上漲幅度領先的前 10 地區,圍繞這三類區域,收集人形機器人(具備五指手與負載能力)的交付量、在役存量、售價與運維成本、替代性工時比例、人工與機器人工時成本差值、工傷與節拍變化、法規適配情況等年度數據,并通過熱力圖與折線圖分析人形機器人部署速度與人口結構變遷的關系,進一步測算在汽車、3C、倉儲、醫療等行業的人機協作回報周期(Payback)與收益率(IRR),并比較不同關節結構下的總擁有成本(TCO),提出關鍵場景下的落地窗口與改造優先策略。
這道題一上,輕量版深度研究的「短板」就暴露無遺。任務明明是調研,它卻只是給了幾條建議步驟和分析思路,看似條理清晰,實則把皮球踢回了用戶手里。
不得不說,AI 也是真懂摸魚的。
作為對比,我們把這個問題交給沒開深度研究的 o4-mini 模型本體。
o4-mini 雖然也是五十步笑百步,該有的缺點都沒落下,但起碼步驟拆解比輕量版要更細致、邏輯更清楚。
它和完整版之間的體驗差異明顯嗎?
如果你啟用了完整版深度研究,體驗就立刻不同了。
同樣的問題一,完整版模型會先主動引導用戶補充更明確的細節,然后花了 6 分鐘搜索 50 個信源,輸出帶有數據來源的結構化結論,邏輯嚴密、論證扎實。
再看題目二,完整版深度研究用了 17 分鐘給出一份圖文并茂的研究報告。
從國家分類、指標收集,到機器人部署現狀與趨勢分析,再到經濟效益測算和策略建議,邏輯清晰、條理分明。引用來源涵蓋麥肯錫、世界銀行等權威機構,增強了可信度。
當然,它也不是沒有缺點。
比如提到的數據區間是 2018–2025 年,實則多為趨勢性總結,缺乏完整的年度對比數據。此外,任務要求提供熱力圖與折線圖,它也只是口頭提及,實際并未呈現這些可視化結果。
再來一道生態類題目:
題目三:請調研 2000–2025 年間,在森林覆蓋率下降超過 15% 的全球生物多樣性熱點地區、年均氣溫上升幅度超過 1.2°C 的干熱氣候區,以及轉基因作物推廣速度最快的國家中,重點分析原生植物種群密度、葉綠素含量與光合作用效率、植物種群遺傳多樣性、土壤水分和授粉昆蟲數量等生態指標的變化趨勢。
這次回答在結構上處理得不錯:分類明確,指標全面,參考來源也有附上。
但依舊有遺憾:尤其是在干熱氣候區和轉基因作物部分,多數數據缺乏具體來源,僅以「研究表明」「有研究發現」等模糊表達替代。
此外,盡管指定要重點分析「光合作用效率」,然而,實際分析深度與其他指標并無顯著差別。
與競品,OpenAI 的深度研究還有優勢嗎?
與 OpenAI 推出的「深度研究」功能相似,Gemini 的 Deep Research 和 Grok 的 Deeper Search 也都主打深度搜索。那么,它們之間究竟有何不同?
依托于強大的模型,OpenAI 的深度研究往往更強調多領域的知識整合,尤其是在科技、經濟、社會等領域的綜合性分析。
相比之下,Gemini 的 Deep ReSearch 更偏重于與搜索引擎的結合,它的優勢在于檢索速度快、精準度高,尤其在處理技術文獻或時事新聞方面表現突出。
而 Grok 的 Deeper Search 則主打「懂你」路線,專注于個性化搜索體驗。同時依托于 X 平臺,它能夠動態優化搜索策略,提升結果的相關性與命中率。
而我們最終得出的結論很明確: OpenAI 的完整版深度研究功能,值得用。 輕量版深度研究,不如不用。
后者確實是 OpenAI 在成本與性能之間的一次平衡嘗試,但對于真有研究需求的用戶來說,輕量版只能算是個「聊勝于無」的替代品。
用它做復雜任務,還不如直接上免費的競品,效果反倒更好些。
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.