大數據文摘受權轉載自頭部科技
文丨丁靈波
距V3、R1模型發布不到兩個月時間,DeepSeek一飛沖天成為全球第二受歡迎的AI對話機器人。
根據網站跟蹤公司SimilarWeb的數據,DeepSeek.com現在的每日訪問量已經超過了谷歌Gemini,Gemini于2023年2月6日發布,一直將OpenAI視為競爭對手,苦戰兩年才有如今的市場地位,沒料到半路殺出來一匹黑馬。
DeepSeek、OpenAI和谷歌之間的飽和競爭正在重塑開發者和AI市場的格局,它們重新定義了強大推理模型的成本和可訪問性,但隨著市場的追捧和興奮逐漸消退后,背后的技術突破對于當今構建AI的任何人或企業來說意味著什么是需要關注的重點。
市場熱度下的壓力
AI模型領域的競爭迭代非常快,無論是OpenAI、谷歌還是DeepSeek,階段性的優勢可能不會維持太久。
據SimilarWeb數據顯示,DeepSeek.com上周二訪問量達到創紀錄的4900萬次,較前一周增長614%,而且這一數字不包括基于應用程序的流量,凸顯了DeepSeek的增長極速。
一個月前,DeepSeek網站平均每天才有30萬次訪問,但到1月27日,這一數字激增至3340萬次,DeepSeek也一度在移動端超越ChatGPT成為蘋果美國應用商店評分最高的免費應用,震動了美國科技股。
DeepSeek全球訪問量現已超過谷歌的Gemini,不過,它仍大幅落后于OpenAI的ChatGPT,后者的日訪問量約為1.3億至1.4億次,此外DeepSeek的數據也低于微軟的Bing.com,后者集成了包含OpenAI技術的Copilot AI。
在美國,1月31日DeepSeek.com的日訪問量為240萬次,比Gemini網站的150萬次高出60%,OpenAI的ChatGPT則是其八倍,當天的日訪問量達1930萬次。
從今年1月開始,Deepseek迅速吸引了競爭對手的關注和流量,迅速擴張約9.2%的流量份額,引發了整個行業的變革:OpenAI的流量份額下降至79.8%,盡管谷歌的整體流量增長了10%但其份額卻下降到了4.9%,Perplexity和Claude也略有下降,與此同時,共享機器學習模型和數據集的平臺Hugging Face的流量激增了36%,成為該領域最顯著的轉變之一。
面對DeepSeek的崛起,谷歌首席執行官Pichai曾表示,DeepSeek模型的“效率”不如Gemini,而且,論打價格戰,谷歌也是財大氣粗,在日前發布的Gemini 2.0系列中,部分中低端產品直接把性價比擊穿對抗DeepSeek。
而突如其來的流量激增也給DeepSeek帶來了服務壓力。DeepSeek開放平臺近日顯示:“當前服務器資源緊張,為避免對您造成業務影響,我們已暫停API服務充值。”
此外價格優惠馬上結束,deepseek-chat模型優惠期至北京時間2025年2月8日24:00,期間API調用享歷史價格,優惠結束后將按每百萬輸入tokens2元,每百萬輸出tokens8元計費;deepseek-reasoner模型上線即按每百萬輸入tokens4元,每百萬輸出tokens16元計費。
目前,deepseek-chat模型已經升級為DeepSeek-V3,deepseek-reasoner模型為新模型DeepSeek-R1。
DeepSeek迅速走紅之后,發展勢頭能否持續是個問題,隨著市場競爭升溫,性價比PK只是其中一個維度,AI技術目前還要看誰的功能更全面更強大。
很多媒體聲音認為DeepSeek會顛覆擁有“算力霸權”的公司,但目前來看,即便能顛覆也需要時間和過程,真正的AI優勢仍被“算力霸權”巨頭所掌握。
公開消息顯示,2025年,微軟計劃投資約800億美元建設人工智能數據中心,谷歌計劃投入750億美元以擴大其AI產品線規模,建設數據中心和新的AI基礎設施,Meta計劃投資600至650億美元推動AI核心產品迭代和新數據中心建設。OpenAI、軟銀和甲骨文等計劃向星際之門AI基礎設施投資約1000億美元左右,至于DeepSeek背后的技術投資或融資規劃是怎樣的目前尚未可知。
盡管服務定價行業最貴,OpenAI最近推出的o3-mini模型和“Deep Research”等功能還是收獲了積極的市場反饋,下一步o3模型正式版的推出可能會帶來新一輪行業追隨,而在美國,DeepSeek正因數據隱私和訓練做法問題面臨被審查排斥的風險,這可能會促使用戶轉向其他選擇。
備受推崇的開源之王DeepSeek能否持續創造奇跡,研發出媲美乃至超越OpenAI下一代模型的高性價比產品是決勝的關鍵。
“智能體”或將遍地開花
DeepSeek、OpenAI、谷歌三方PK之下,更值得關注的趨勢是:企業如何運用知識蒸餾、監督微調(SFT)、強化學習(RL)以及檢索增強生成(RAG)等技術,構建更具專業性的領先AI應用程序。
“蒸餾技術”正成為一種強大的工具。與許多封閉模型不同,DeepSeek不僅性能媲美OpenAI o1模型,對其推理步驟也完全透明,企業可以將DeepSeek-R1用作 “教師模型”,創建更小的、針對特定任務的模型,這些模型能夠繼承o1級別的推理能力。實際上,這些針對企業特定領域構建的高度定制化AI模型才是大多數企業的未來發展方向。
機器學習(ML) 開發人員Sam Witteveen表示:“我們如今正進入這樣一個時代,人們會使用多種模型而非始終依賴一種模型。” 這意味著像Gemini Flash、GPT-4oMini、DeepSeek-R1這類低成本的模型,實際上能很好地滿足80%的應用場景。”
在完成知識蒸餾步驟后,企業有幾種方法來確保模型適用于其特定應用。如果公司處于非常特定的領域,其細節信息既不在網絡上,也不在書籍中,那么可以通過監督微調(SFT)將自己領域特定的數據集注入模型。
已有研究表明,利用 “數千個” 問答數據集就能很好地完成這一操作,此外,若企業希望訓練出更貼合特定偏好的模型,例如讓客戶支持聊天機器人在表達簡潔的同時聽起來富有同理心,可以另外進行一些強化學習(RL)。
沃頓商學院人工智能教授伊桑?莫利克(Ethan Mollick)認為,隨著每個模型都擅長所有事情,“個性”將變得越來越重要。
對大多數公司來說,模型的知識蒸餾加上檢索增強生成(RAG)可能會創造奇跡。協助企業開展RAG流程的供應商Vectara做的一項研究表明,目前DeepSeek產生幻覺的概率為14%,而OpenAI的o3預覽版模型這一概率數據為8%,這種方法有助于緩解與DeepSeek相關的一些幻覺問題。
DeepSeek致力于讓推理模型成本更低且更透明,OpenAI的Deep Research則代表一種不同但互補的轉變。它通過爬取網頁來進行高度定制化的研究,從而將檢索增強生成(RAG)提升到一個新高度,這項研究的成果隨后可作為輸入內容,與企業自身的數據一起,插入到企業能夠使用的RAG文檔中,讓企業開發出自己的“智能體”。
最后一點關鍵因素是:數據質量。不想錯過AI風口的企業應開始專注于清理和整理其數據中最關鍵的部分,以實現能立即產生價值的針對性AI應用。
美國運通公司CTO希拉里?帕克(Hilary Packer)表示,盡管追逐最新的模型和前沿技術頗具吸引力,但任何成功的AI應用的基礎都是干凈、結構良好的數據,無論你使用的是檢索增強生成(RAG)、監督微調(SFT)還是強化學習(RL),數據質量將決定模型的準確性和可靠性。
總結來看,DeepSeek與OpenAI、谷歌之間的競爭帶來了深刻的行業轉變,企業將能以極低的成本推出大量定制化模型,這些模型能力出色,并基于公司自身的獨有數據集和方法構建,如果不充分利用這些創新工具,企業可能會面臨落后風險。
在AI遍地開花的未來,市場看點將來自各類企業如何整理數據、運用RAG和知識蒸餾等技術,以及在預訓練階段之后進行二次創新應用。
AI芯片公司的新機會
分析師和行業專家表示,DeepSeek的成就正在推動人工智能推理以及更廣泛的人工智能芯片行業的發展。
“簡單來說,人工智能訓練是關于構建一種工具或算法,而推理則是關于實際將這種工具部署到真實應用中。” Morningstar專注于半導體領域的股票分析師Phelix Lee表示。
雖然英偉達在用于人工智能訓練的圖形處理單元領域占據主導地位,但許多競爭對手認為在 “推理” 領域仍有廣闊空間。多家AI芯片初創公司預測,隨著客戶采用并基于DeepSeek的開源模型進行開發,對推理芯片和計算的需求勢必要不斷增加。
人工智能芯片制造商Etched的聯合創始人羅伯特?瓦亨(Robert Wachen)表示,自DeepSeek發布其推理模型以來,已有數十家公司與其取得業務聯系。
在市場經濟學中有個概念叫杰文斯悖論,指的是技術進步會提高使用資源的效率,但帶來的成本降低會導致需求增加,令資源消耗的速度是上升而非減少。
隨著越來越多小型高性能模型的誕生,它們可能會催生一個推理時代,在英偉達無法向所有中小客戶供應足夠的定制算力資源時,廣泛的AI芯片公司將得到一個絕佳發展機會。
GPU算力按需租用
A100/H100 GPU算力按需租用,
秒級計費,平均節省開支30%以上!
掃碼了解詳情?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.