此次更新提升了模型的推理和復雜任務處理能力,使其性能接近OpenAI的o3模型和谷歌的Gemini 2.5 Pro。
DeepSeek R1模型近日完成了一次小版本升級。該公司稱,此次升級主要強化了語義理解的精準性、復雜邏輯推理能力以及長文本處理的穩定性。
盡管DeepSeek未公布更多細節,但網友測評后表示,模型的理解能力顯著提升,例如在激活參數部分可以制作交互動畫展示,關鍵信息邏輯也更加清晰。此外,R1的編程能力也大幅提升,有網友稱其可以一次性生成1000多行無錯誤代碼,甚至能與編程新王;Claude 4一較高下。
此次升級是DeepSeek自今年3月發布DeepSeek-V3-0324模型后的首次更新。V3模型在數學、代碼類評測集上超越了GPT-4.5和Claude-3.7-Sonnet,性價比極高,輸入價格僅為Claude-3.7-Sonnet的1/11、GPT-4.5的1/277,且開源可免費用于商業用途。
Hugging Face的研究員Adina Yakefu表示,升級后的DeepSeek R1在減少幻覺(即提供錯誤信息)方面也有重大改進,顯示出其不僅在追趕,更是在與頂級模型競爭。
DeepSeek的R1模型自1月發布以來,曾因多項指標優于西方競爭對手而引發全球關注,并導致科技股暴跌。然而,自V3模型發布后,DeepSeek的熱度有所下降,市場更關注其R2模型的發布。此前有消息稱,R2將采用混合專家模型(MoE),參數量預計達1.2萬億,單位推理成本較GPT-4大幅降低。但截至目前,DeepSeek仍未正式確認R2的發布時間。
R1推理模型的最新版本R1-0528再次引發了全球媒體的廣泛關注。
路透社報道稱,此次發布加劇了與美國競爭對手如OpenAI的競爭。在由加州大學伯克利分校、麻省理工學院和康奈爾大學研究人員開發的LiveCodeBench排行榜中,DeepSeek的R1-0528在代碼生成方面僅略低于OpenAI的o4 mini和o3推理模型,但超過了xAI的Grok 3 mini和阿里巴巴的Qwen 3。
CNBC指出,DeepSeek此次升級模型發布低調,但其推理能力使其能夠執行更復雜的任務?!度A爾街日報》中文版則提到,DeepSeek的低成本、高性能R1模型自年初以來吸引了全球目光,推動了中國科技股的上漲,也顯示出市場對中國AI能力的樂觀預期。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.