99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek在企業側的落地:技術盤點與路徑解析

0
分享至

DeepSeek的崛起不僅是技術革新,更是一場從“機器語言”到“人類語言”的范式革命,推動了AGI時代到來。各個行業的應用場景不斷拓展,為企業數字化發展帶來了新機遇,同時也面臨諸多挑戰。不同企業在落地部署過程中存在諸多待解決的問題和實踐難點。

本文將圍繞與企業交流中所總結的部署落地路徑,并給出相關建議,與大家分享解讀以下核心觀點:

  • 推理模型元年,新模型、新技術依然可期

  • 推理模型使得大模型向決策場景邁出重要一步

  • 企業為模型付費意愿下降,公有云推理支出增加

分享嘉賓|張揚 愛分析聯合創始人&首席分析師

內容已做精簡,如需獲取專家完整版視頻實錄和課件,請掃碼領取。

01

推理模型元年,新模型、新技術依然可期

整體技術情況是企業進行推理模型落地部署和場景探索的基礎。從技術本身而言,今年可被 視為推理模型元年,在模型和技術層面,存在許多新的迭代方向,技術路線也存在競爭。

模型方面,梳理從OpenAI o1 Preview版本發布到Grok 3發布的過程,其間不僅有OpenAI和DeepSeek ,還有千問、 Google的Gemini,以及智譜、訊飛、階躍星辰、Kimi等。預計3月左右,Anthropic和OpenAI有可能發布GPT 5,不同廠商在推出不同模型。與去年下半年模型發布節奏相比,變化巨大。ChatGPT剛發布后,國內廠商基本每月迭代一個版本,2023年大部分廠商按月或按季度更新迭代大語言模型版本。2024年下半年,可能半年 都未必有新版本更新,更多更新轉向多模態模型。進入2025年,由于DeepSeek開源模型發布,預計2月、3月乃至整個上半年,不同廠商都會發布推理模型,且版本迭代速度加快。Grok比DeepSeek晚發布約一個月,預計豆包、Anthropic等企業也會發布新模型。


從模型本身來看,去年下半年大語言模型的Scaling Law接近極限,但目前推理模 型的Scaling Law才剛剛起步,這也是版本迭代井噴的原因之一,預計2025年還會出現大量新的模型版本。此外,DeepSeek 公開了強化學習(RL)這一技術路線,但它并非唯一可行路線。 此前還有過程獎勵、蒙樹等不同技術路線,以及無需思維鏈的隱式推理技術路線等,這些技術路線仍在探索中,RL是首個跑通的,但不意味著只有它可行。

基于大量新推理模型和 新技術路線的探索,當考慮將其落地到企業進行部署時,鑒于模型版本不斷迭代更新,建 議企業采取由淺入深、逐步推進的方式落地推理模型。以下列出四條由淺入 深的路徑:

1.API接入:這是最基礎的方式,目前許多央企已在企業內部即時通訊(IM)中嵌入推理模 型,采用類似微信對DeepSeek進行灰度測試的模式。采用API接入,一是速度快,能迅速完成部署;二是可實現全員使用。相較于之前接入大廠API需高額付費,接入R1雖仍需 付費,但金額大幅降低,所以多數企業選擇從API接入起步。

2.本地化部署結合知識庫RAG:這是上一波大語言模型落地較為通用的方式,目前仍廣泛應用于企業內部,尤其在金融機構和央企中。不過,各企業部署的R1版本有所不同,少數采用6000億參數版本,多數采用蒸餾后的千問32B版本。

3.對知識庫RAG中的提示詞工程進行精細化處理:部分企業會將基于思維鏈的提示詞單獨提取出來,做進一步精細 化處理。當前多數企業推進速度最快也就到這一步,也是較為理想的實施階段。完成前三步后,一方面,全員參與使用有助于拓展新應用場景,企業在部署模型后,更關注投資回 報率(ROI)及能否開拓新場景,通過全員探索自下而上的方式較為有效;另一方面,繼續深 入則不可避免涉 及監督微調(SFT)和模型蒸餾。由于推理模型不斷涌現,難以保證三個月后R1模型不因自身迭代或新廠商模型的出現而被超越,這就可能需要重新進行SFT。

4.數據相關問題:在整個過程中,R1存在一個尚不明晰的問題,即60萬思維鏈(COT)數據和20萬通用 知識數據。企業在進行強化學習或蒸餾時,這60萬COT數據的獲取存在較大疑問。目前,一些新開源版本約有11萬COT數據開源,未來幾個月Grok 3是否會開源COT數據尚不確定 。數據開源與模型版本持續迭代同樣重要,若這些數據開源,企業進行蒸餾和SFT時將更為順暢。


綜合考量各方面因素,建議現階段企業主要嘗試前三個要點,對于絕大部 分企業而言,開展第四步進行監督微調 (SFT)以及自行進行模型蒸餾,尚未達到理想的時間窗口期。不過,少部分已進行語言模型(LM)預訓練的企業提出,能否基于自身已完成預訓練的版本,開展類似R1的強化學習過程,以期將原本懂企業知識的預訓練模型,轉變為既懂企業知識、推理能力又強的企業專屬推理模型。從R1的學術論文來看,該路線比SFT更為復雜。 不建議企 業采用 此路線。 核心原因在于,在R1論文中做過類似測試。 測試中,R1一方面基于千問版本進行R1 Zero強化學習,另一方面直接基于R1進行蒸餾。從最終推理效果,尤其是關鍵的通用問題回答推理效果來看,R1 Zero得分為55分 ,R1蒸餾后的得分為62分 ,蒸餾效果優于R1 Zero強化學習效果。對于32B版本或參數不到千億的版本,蒸餾效果強于強化學習。此外,蒸餾屬于SFT范疇,而強化學習所需算力更多,耗費時間更長。所以,無論是從成本、時間還是效果角度分析,蒸餾的性價比更高。這是目前不建 議企業復制R1強化學習過程的關鍵所在。這屬于第五條路徑,目前來看,該路徑還沒有特別有效的調整或優化方式。

基于上述兩點,建議企業現階段更多選擇采用API接入或知識庫檢索增強生成方式,這與上一版大語言模型落地思路一致,是從推理模型落地路徑角度給出的具體建議和實施方式,同時還包含一些推薦配置。大部分企業,尤其是春節后復工的企業,在部署32B模型時,通常使用兩張A100顯卡;部署70B的Llama版本模型,大概需要四張A100顯卡。若部署遷移模型,使用A100顯卡的話,至少需要兩臺8卡機器才能運行,所需預算較高。

02

推理模型使得大模型向決策場景邁出重要一步

推理模型與傳統大語言模型相比,有著核心區別。若將傳統大語言模型形象地類比為高中生或本科生,那么推理模型則更像是在邏輯推理能力方面經過專項訓練的研究生。這一本質變化使得傳統大 語言模型多應用于生成類場景,即當時所謂的生成式AI;而推理模型則推動生成式場景向角色場景邁進,實現了重要跨越。基于此,我們梳理了部分已知企業正在嘗試的推理模型應用場景。

  • 在能源領域,推理模型的角色場景在去年四五月份就有體現,當時出現的AutoGPT被用于電力負荷預測、電力價格預測以及電力交易策略優化。然而,上一版本的大語言模型所支撐的AutoGPT難以滿 足這些決策場景的需求,效果欠佳。如今,隨著推理能力的提升,電力企業基于DeepSeek新模型重新進行決策場景的探索,依然圍繞需求預測、價格預測以及交易優化展開,這是能源領域正在突破的決策場景。

  • 在金融領域,由于授信風控對模型的可解釋性要求較高,因此更多通過可解釋的方式來構建角色場景。比如在反洗錢方面,傳統大語言模型主要協助反洗錢工作人員撰寫報告,而現在推理模型能夠智能識別反 洗錢可能存在的新模式。此外,新型反欺詐識別、財務對賬與分析等, 對于傳統大語言模型而言復雜度較高的場景,也成為銀行重點探索的新方向。金融和能源領域是目前重點突破的決策場景。

  • 在制造和醫療領域,相關企業也在進行嘗 試,不過預期所需時間比金融和能源領域更長。例如,制造領域持續探索的智能排查、工藝自適應,以及醫療領域的疾病預測、風險預測等,這些普遍是大部分企業正在嘗試的與 決策高度相關的新場景。

從企業內部場景來看,推理模型的核心發展 方向是向決策場景邁進。形象地說,推理模型就像是從本科生成長為推理能力較強的研究生,這是其最大的變化。這一變化帶來的結果是,上一波提及的Copilot模式,在這一波基于推理模型的場景應用中,演變為co-creator,即共創模式 。在這個共創過程中,產研和科研領域的價值將得到更大程度的釋放。在研發設計階段,傳統大語言模型僅扮演知識問答的Copilot角色,而現在融入了推理邏輯,能夠從知識庫問答的方式,全面參與到整個產研過程中,相當于成為了另一位專家。


推理模型在決策場景中帶來的最大變化,是推動企業從 生成場景向角色場景轉變。除此之外,端側場景也發生了顯著變化,其核心的滲透變化首先體現在消費級端側模型的成熟。今年新上市的手機,基本上 將AI大模型作為標配。這些大模型不僅局限于云端模型,更多的是在端側直接部署小參數模型,這已成為今年手機的普遍配置。在此過程中,模型量化問題以及芯片設計適配問題均已得到解決。DeepSeek帶來的更大價值在于,端側小參數模型能夠直接基于蒸餾大幅提升推理能力,這使得手機廠商此前已開發的端側芯片模型在推理能 力上實現了重大突破,對手機廠商而言是一大利好。

同樣,端側場景也逐漸滲透到企業領域,主要分為三大類場景。第一類是人員作業場景,第二類是設備作業場景,這兩類場景作業量通常較大,使用Pad終端是提升終端作業效率的有效方式,這和手機的應用原理相似,容易理解。另外,端側還存在許多決策分析場景,這得益于端側模型推理能力的提升。設備維修、生產質檢、能耗管理這三個場景,將成為2025年企業在邊緣端重點落地的場景。所以,從場景角度來看,決策場景和邊緣端場景是2025年企業目前重點推行的方向。

03?

企業為模型付費意愿下降,公有云推理支出增加???????

最后,談談預算相關的變化。先說開源模型,以DeepSeek為代表的開源模型帶來的最大變化是推理能力的增強,過去閉源模型的推理能力領先開源模型一個代際。例如,側重深 度推理的閉源模型原本優勢約為50% ,目前已縮小至6%。隨著今天Grok 3發布,其在未來幾個月預計會開源,屆時大量場景的分數將被重新刷新,開源模型和閉源 模型在推理層面的能力基本拉平。


在過去的語言理解層面,各類模型的表現本就不相上下。 對于我們已交流過的絕大部分企業而言,為閉源模型付費的意愿已降至最低點。目前我們判斷,模型費用預算總體不會減少,只是預算分配發生轉移。一方面,許多企 業采用推理模型的API調用,這是預算轉移的一個方向;另一方面,基于開源模型的部署運維以及應用搭建,成為另一個預算流向。此外,過去企業中可能僅有10%的人使用大模型應用,如今則幾乎全員都在使用,這必然導致推理算力服務預算增長。所以,從企業角度來看,今年原本預留給閉源模型的付費,基本轉移到了開源 模型生態、API調用以及推理算力方面,這就是模型預算的變化。另外,由于DeepSeek的出現,整個大模型市場的支出遠超此前預期。

盡管目前企業尚未重新調整整體IT預算,畢竟2025年整體IT預算仍呈微降態勢,但AI大模型在其中所占比例以及企業投入意愿,相較于2024年末做規劃時明顯增強。目前我們預計,企業若對大模型進行支出,基本會安排在整個企業IT支出的5% - 10%,而2023年、2024年這一比 例約為3% - 5%,可見有明顯增長。此外,今年除了企業側落地,過去多為私有化部署帶來費用增長,今年基于公有云支出的費用會有大幅增長,這也是今年295億支出中核心的增長方向。


畢業于清華大學及香港中文大學,杭州市金融科技創新項目應用案例專家評委,原投中集團副總裁。十余年金融行業從業經驗,在愛分析媒體平臺發文超過 500 篇,有很深的行業影響力。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
天水家長講述血鉛異常幼兒治療過程:每天輸液6個多小時,在空調房都滿頭大汗

天水家長講述血鉛異常幼兒治療過程:每天輸液6個多小時,在空調房都滿頭大汗

極目新聞
2025-07-08 00:09:19
低種姓女性見到高種姓必須露乳,印度“乳房稅”究竟有多離譜?

低種姓女性見到高種姓必須露乳,印度“乳房稅”究竟有多離譜?

紅夢史說
2025-07-05 14:54:43
江蘇女孩愛上杭州富豪,戀愛8年才結婚

江蘇女孩愛上杭州富豪,戀愛8年才結婚

嘆為觀止易
2025-07-09 09:11:58
值!切爾西獎金已“報銷”佩德羅+德拉普引援費90%,雙雙驗貨成功

值!切爾西獎金已“報銷”佩德羅+德拉普引援費90%,雙雙驗貨成功

直播吧
2025-07-09 09:30:17
改款DeepSeek,亂了華為心態

改款DeepSeek,亂了華為心態

源媒匯
2025-07-08 15:27:40
陳行甲可惜了!當年同獲表彰的全國優秀縣委書記,有人已官至副部

陳行甲可惜了!當年同獲表彰的全國優秀縣委書記,有人已官至副部

張嘴說財經
2025-07-08 17:33:28
越南簽完美國協議轉頭要中國580億修鐵路!商務部6字回應暗藏雷霆

越南簽完美國協議轉頭要中國580億修鐵路!商務部6字回應暗藏雷霆

愛意隨風起呀
2025-07-09 01:10:13
張雪峰:今年高考,釋放了一個殘酷信號,600分,已經不再是高分

張雪峰:今年高考,釋放了一個殘酷信號,600分,已經不再是高分

前沿天地
2025-07-07 01:55:48
杭州姑娘想退充電寶,快遞全拒收!有3C認證也不行,什么原因?

杭州姑娘想退充電寶,快遞全拒收!有3C認證也不行,什么原因?

都市快報橙柿互動
2025-07-09 07:52:26
新劇|《掃毒風暴》《利劍·玫瑰》定檔央八

新劇|《掃毒風暴》《利劍·玫瑰》定檔央八

澎湃新聞
2025-07-09 10:30:31
一名中國游客涉嫌違反美國法律 在米蘭機場被捕

一名中國游客涉嫌違反美國法律 在米蘭機場被捕

奮斗在意大利
2025-07-08 22:24:59
王晶又曝大瓜:古天樂偷偷在美國結婚,你都不知道,那隨時能離婚

王晶又曝大瓜:古天樂偷偷在美國結婚,你都不知道,那隨時能離婚

冷紫葉
2025-07-08 16:19:28
審計報告一出全傻眼!16省175縣截用惠農補貼超40億,全還債了!

審計報告一出全傻眼!16省175縣截用惠農補貼超40億,全還債了!

青青子衿
2025-06-30 16:55:52
北京市平均工資公布,漲幅創歷史新低!今年退休的將受影響?

北京市平均工資公布,漲幅創歷史新低!今年退休的將受影響?

興史興談
2025-07-09 08:49:10
利用完再背刺!王陽被孫菲菲怒斥虛偽,蔣欣的話終于有人信了

利用完再背刺!王陽被孫菲菲怒斥虛偽,蔣欣的話終于有人信了

娛樂小丸子
2025-07-08 22:00:47
724分河南女狀元,清北不要就奔軍裝?官網錄取通知書掛出來了!

724分河南女狀元,清北不要就奔軍裝?官網錄取通知書掛出來了!

手工制作阿愛
2025-07-08 15:42:30
男孩高考575分,被父母掃地出門,知道學校后 網友卻都在同情父母

男孩高考575分,被父母掃地出門,知道學校后 網友卻都在同情父母

觀察鑒娛
2025-07-09 08:39:50
美國大滿貫:混雙8強出5,世界亞軍的組合出局,張本美和組合橫掃

美國大滿貫:混雙8強出5,世界亞軍的組合出局,張本美和組合橫掃

清游說娛
2025-07-09 09:52:25
張雪峰靈魂拷問:30歲程序員年入百萬,30歲醫學生還在實習。如果讓你選擇,你選哪條路?

張雪峰靈魂拷問:30歲程序員年入百萬,30歲醫學生還在實習。如果讓你選擇,你選哪條路?

純潔的微笑
2025-07-08 12:23:29
KD:在籃網只有我和納什是全身心投入 其他人似乎并非如此

KD:在籃網只有我和納什是全身心投入 其他人似乎并非如此

直播吧
2025-07-08 22:50:08
2025-07-09 12:44:49
北京愛分析科技有限公司
北京愛分析科技有限公司
愛分析致力于成為中國領先的數字化市場專業服務平臺,為企業用戶提供數字化規劃與落地全流程服務。
1064文章數 138關注度
往期回顧 全部

科技要聞

效力27年!蘋果"喬布斯軍團"又一位元老退休

頭條要聞

"最悲催乘客"因暴雨備降貴陽 起飛后又備降成都

頭條要聞

"最悲催乘客"因暴雨備降貴陽 起飛后又備降成都

體育要聞

開了16年F1,他終于第一次站上領獎臺

娛樂要聞

郭富城追“子”成功,方媛孕肚被拍

財經要聞

金店業績分化 為何"一口價"賣得更好了?

汽車要聞

享界品牌車標發布 余承東:享界S9旅行版秋季上市

態度原創

親子
藝術
家居
手機
公開課

親子要聞

幼兒園血鉛事件真相曝光,人心竟如此歹毒!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

家居要聞

以光為境 國寶花園別墅

手機要聞

谷歌 Pixel 10 Pro 手機工程樣機和主板曝光

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 昌邑市| 新郑市| 昭苏县| 阿城市| 连山| 大同市| 杭锦后旗| 博野县| 都匀市| 长岛县| 遵义市| 大石桥市| 长乐市| 图木舒克市| 晋江市| 鄂托克前旗| 岳普湖县| 太和县| 虞城县| 友谊县| 迭部县| 南阳市| 昭平县| 莱西市| 中阳县| 普格县| 宜兴市| 凌海市| 广元市| 七台河市| 隆尧县| 行唐县| 凤翔县| 岢岚县| 铜川市| 绥滨县| 伊川县| 兴业县| 孝义市| 浏阳市| 民和|