網易首頁 > 網易號 > 正文申請入駐

DeepSeek在企業側的落地：技術盤點與路徑解析

2025-03-05 18:46:34　來源: 北京愛分析科技有限公司

北京舉報

分享至

DeepSeek的崛起不僅是技術革新，更是一場從“機器語言”到“人類語言”的范式革命，推動了AGI時代到來。各個行業的應用場景不斷拓展，為企業數字化發展帶來了新機遇，同時也面臨諸多挑戰。不同企業在落地部署過程中存在諸多待解決的問題和實踐難點。

本文將圍繞與企業交流中所總結的部署落地路徑，并給出相關建議，與大家分享解讀以下核心觀點：

推理模型元年，新模型、新技術依然可期
推理模型使得大模型向決策場景邁出重要一步
企業為模型付費意愿下降,公有云推理支出增加

分享嘉賓｜張揚愛分析聯合創始人&首席分析師

內容已做精簡，如需獲取專家完整版視頻實錄和課件，請掃碼領取。

推理模型元年，新模型、新技術依然可期

整體技術情況是企業進行推理模型落地部署和場景探索的基礎。從技術本身而言，今年可被視為推理模型元年，在模型和技術層面，存在許多新的迭代方向，技術路線也存在競爭。

模型方面，梳理從OpenAI o1 Preview版本發布到Grok 3發布的過程，其間不僅有OpenAI和DeepSeek ，還有千問、 Google的Gemini，以及智譜、訊飛、階躍星辰、Kimi等。預計3月左右，Anthropic和OpenAI有可能發布GPT 5，不同廠商在推出不同模型。與去年下半年模型發布節奏相比，變化巨大。ChatGPT剛發布后，國內廠商基本每月迭代一個版本，2023年大部分廠商按月或按季度更新迭代大語言模型版本。2024年下半年，可能半年都未必有新版本更新，更多更新轉向多模態模型。進入2025年，由于DeepSeek開源模型發布，預計2月、3月乃至整個上半年，不同廠商都會發布推理模型，且版本迭代速度加快。Grok比DeepSeek晚發布約一個月，預計豆包、Anthropic等企業也會發布新模型。

從模型本身來看，去年下半年大語言模型的Scaling Law接近極限，但目前推理模型的Scaling Law才剛剛起步，這也是版本迭代井噴的原因之一，預計2025年還會出現大量新的模型版本。此外，DeepSeek 公開了強化學習（RL）這一技術路線，但它并非唯一可行路線。此前還有過程獎勵、蒙樹等不同技術路線，以及無需思維鏈的隱式推理技術路線等，這些技術路線仍在探索中，RL是首個跑通的，但不意味著只有它可行。

基于大量新推理模型和新技術路線的探索，當考慮將其落地到企業進行部署時，鑒于模型版本不斷迭代更新，建議企業采取由淺入深、逐步推進的方式落地推理模型。以下列出四條由淺入深的路徑：

1.API接入：這是最基礎的方式，目前許多央企已在企業內部即時通訊（IM）中嵌入推理模型，采用類似微信對DeepSeek進行灰度測試的模式。采用API接入，一是速度快，能迅速完成部署；二是可實現全員使用。相較于之前接入大廠API需高額付費，接入R1雖仍需付費，但金額大幅降低，所以多數企業選擇從API接入起步。

2.本地化部署結合知識庫RAG：這是上一波大語言模型落地較為通用的方式，目前仍廣泛應用于企業內部，尤其在金融機構和央企中。不過，各企業部署的R1版本有所不同，少數采用6000億參數版本，多數采用蒸餾后的千問32B版本。

3.對知識庫RAG中的提示詞工程進行精細化處理：部分企業會將基于思維鏈的提示詞單獨提取出來，做進一步精細化處理。當前多數企業推進速度最快也就到這一步，也是較為理想的實施階段。完成前三步后，一方面，全員參與使用有助于拓展新應用場景，企業在部署模型后，更關注投資回報率（ROI）及能否開拓新場景，通過全員探索自下而上的方式較為有效；另一方面，繼續深入則不可避免涉及監督微調（SFT）和模型蒸餾。由于推理模型不斷涌現，難以保證三個月后R1模型不因自身迭代或新廠商模型的出現而被超越，這就可能需要重新進行SFT。

4.數據相關問題：在整個過程中,R1存在一個尚不明晰的問題，即60萬思維鏈（COT）數據和20萬通用知識數據。企業在進行強化學習或蒸餾時，這60萬COT數據的獲取存在較大疑問。目前，一些新開源版本約有11萬COT數據開源，未來幾個月Grok 3是否會開源COT數據尚不確定。數據開源與模型版本持續迭代同樣重要，若這些數據開源，企業進行蒸餾和SFT時將更為順暢。

綜合考量各方面因素，建議現階段企業主要嘗試前三個要點，對于絕大部分企業而言，開展第四步進行監督微調（SFT）以及自行進行模型蒸餾，尚未達到理想的時間窗口期。不過，少部分已進行語言模型（LM）預訓練的企業提出，能否基于自身已完成預訓練的版本，開展類似R1的強化學習過程，以期將原本懂企業知識的預訓練模型，轉變為既懂企業知識、推理能力又強的企業專屬推理模型。從R1的學術論文來看，該路線比SFT更為復雜。不建議企業采用此路線。核心原因在于，在R1論文中做過類似測試。測試中，R1一方面基于千問版本進行R1 Zero強化學習，另一方面直接基于R1進行蒸餾。從最終推理效果，尤其是關鍵的通用問題回答推理效果來看，R1 Zero得分為55分，R1蒸餾后的得分為62分，蒸餾效果優于R1 Zero強化學習效果。對于32B版本或參數不到千億的版本，蒸餾效果強于強化學習。此外，蒸餾屬于SFT范疇，而強化學習所需算力更多，耗費時間更長。所以，無論是從成本、時間還是效果角度分析，蒸餾的性價比更高。這是目前不建議企業復制R1強化學習過程的關鍵所在。這屬于第五條路徑，目前來看，該路徑還沒有特別有效的調整或優化方式。

基于上述兩點，建議企業現階段更多選擇采用API接入或知識庫檢索增強生成方式，這與上一版大語言模型落地思路一致，是從推理模型落地路徑角度給出的具體建議和實施方式，同時還包含一些推薦配置。大部分企業，尤其是春節后復工的企業，在部署32B模型時，通常使用兩張A100顯卡；部署70B的Llama版本模型，大概需要四張A100顯卡。若部署遷移模型，使用A100顯卡的話，至少需要兩臺8卡機器才能運行，所需預算較高。

推理模型使得大模型向決策場景邁出重要一步

推理模型與傳統大語言模型相比，有著核心區別。若將傳統大語言模型形象地類比為高中生或本科生，那么推理模型則更像是在邏輯推理能力方面經過專項訓練的研究生。這一本質變化使得傳統大語言模型多應用于生成類場景，即當時所謂的生成式AI；而推理模型則推動生成式場景向角色場景邁進，實現了重要跨越。基于此，我們梳理了部分已知企業正在嘗試的推理模型應用場景。

在能源領域，推理模型的角色場景在去年四五月份就有體現，當時出現的AutoGPT被用于電力負荷預測、電力價格預測以及電力交易策略優化。然而，上一版本的大語言模型所支撐的AutoGPT難以滿足這些決策場景的需求，效果欠佳。如今，隨著推理能力的提升，電力企業基于DeepSeek新模型重新進行決策場景的探索，依然圍繞需求預測、價格預測以及交易優化展開，這是能源領域正在突破的決策場景。
在金融領域，由于授信風控對模型的可解釋性要求較高，因此更多通過可解釋的方式來構建角色場景。比如在反洗錢方面，傳統大語言模型主要協助反洗錢工作人員撰寫報告，而現在推理模型能夠智能識別反洗錢可能存在的新模式。此外，新型反欺詐識別、財務對賬與分析等，對于傳統大語言模型而言復雜度較高的場景，也成為銀行重點探索的新方向。金融和能源領域是目前重點突破的決策場景。
在制造和醫療領域，相關企業也在進行嘗試，不過預期所需時間比金融和能源領域更長。例如，制造領域持續探索的智能排查、工藝自適應，以及醫療領域的疾病預測、風險預測等，這些普遍是大部分企業正在嘗試的與決策高度相關的新場景。

從企業內部場景來看，推理模型的核心發展方向是向決策場景邁進。形象地說，推理模型就像是從本科生成長為推理能力較強的研究生，這是其最大的變化。這一變化帶來的結果是，上一波提及的Copilot模式，在這一波基于推理模型的場景應用中，演變為co-creator，即共創模式。在這個共創過程中，產研和科研領域的價值將得到更大程度的釋放。在研發設計階段，傳統大語言模型僅扮演知識問答的Copilot角色，而現在融入了推理邏輯，能夠從知識庫問答的方式，全面參與到整個產研過程中，相當于成為了另一位專家。

推理模型在決策場景中帶來的最大變化，是推動企業從生成場景向角色場景轉變。除此之外，端側場景也發生了顯著變化，其核心的滲透變化首先體現在消費級端側模型的成熟。今年新上市的手機，基本上將AI大模型作為標配。這些大模型不僅局限于云端模型，更多的是在端側直接部署小參數模型，這已成為今年手機的普遍配置。在此過程中，模型量化問題以及芯片設計適配問題均已得到解決。DeepSeek帶來的更大價值在于，端側小參數模型能夠直接基于蒸餾大幅提升推理能力，這使得手機廠商此前已開發的端側芯片模型在推理能力上實現了重大突破，對手機廠商而言是一大利好。

同樣，端側場景也逐漸滲透到企業領域，主要分為三大類場景。第一類是人員作業場景，第二類是設備作業場景，這兩類場景作業量通常較大，使用Pad終端是提升終端作業效率的有效方式，這和手機的應用原理相似，容易理解。另外，端側還存在許多決策分析場景，這得益于端側模型推理能力的提升。設備維修、生產質檢、能耗管理這三個場景，將成為2025年企業在邊緣端重點落地的場景。所以，從場景角度來看，決策場景和邊緣端場景是2025年企業目前重點推行的方向。

03?

企業為模型付費意愿下降，公有云推理支出增加???????

最后，談談預算相關的變化。先說開源模型，以DeepSeek為代表的開源模型帶來的最大變化是推理能力的增強，過去閉源模型的推理能力領先開源模型一個代際。例如，側重深度推理的閉源模型原本優勢約為50% ，目前已縮小至6%。隨著今天Grok 3發布，其在未來幾個月預計會開源，屆時大量場景的分數將被重新刷新，開源模型和閉源模型在推理層面的能力基本拉平。

在過去的語言理解層面，各類模型的表現本就不相上下。對于我們已交流過的絕大部分企業而言，為閉源模型付費的意愿已降至最低點。目前我們判斷，模型費用預算總體不會減少，只是預算分配發生轉移。一方面，許多企業采用推理模型的API調用，這是預算轉移的一個方向；另一方面，基于開源模型的部署運維以及應用搭建，成為另一個預算流向。此外，過去企業中可能僅有10%的人使用大模型應用，如今則幾乎全員都在使用，這必然導致推理算力服務預算增長。所以，從企業角度來看，今年原本預留給閉源模型的付費，基本轉移到了開源模型生態、API調用以及推理算力方面，這就是模型預算的變化。另外，由于DeepSeek的出現，整個大模型市場的支出遠超此前預期。

盡管目前企業尚未重新調整整體IT預算，畢竟2025年整體IT預算仍呈微降態勢，但AI大模型在其中所占比例以及企業投入意愿，相較于2024年末做規劃時明顯增強。目前我們預計，企業若對大模型進行支出，基本會安排在整個企業IT支出的5% - 10%，而2023年、2024年這一比例約為3% - 5%，可見有明顯增長。此外，今年除了企業側落地，過去多為私有化部署帶來費用增長，今年基于公有云支出的費用會有大幅增長，這也是今年295億支出中核心的增長方向。

畢業于清華大學及香港中文大學，杭州市金融科技創新項目應用案例專家評委，原投中集團副總裁。十余年金融行業從業經驗，在愛分析媒體平臺發文超過 500 篇，有很深的行業影響力。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.