小葳 | 智能進化論
2025年開年,憑借與頂尖模型相當?shù)男阅堋O高的成本效益與開源模式,DeepSeek系列模型成為攪動全球AI行業(yè)的新星。DeepSeek應用上線僅20天,日活就突破了2000萬,這讓其超越ChatGPT成全球增長最快的AI應用。
DeepSeek的橫空出世,并沒有改變模型爭霸的本質(zhì)——頂尖模型不斷刷新性能、成本、速度的極限,不斷為全球頭部大模型的比拼按下快進鍵。
在用戶端,使用DeepSeek模型很簡單,下載APP或在網(wǎng)頁端直接使用就可以了。然而DeepSeek在企業(yè)端的應用,還需要跨越很多挑戰(zhàn)。幫助企業(yè)解決DeepSeek在生產(chǎn)場景的應用,更像一場看不見硝煙的隱形戰(zhàn)場。
過去一周,全球各大云計算廠商紛紛上線DeepSeek模型,通過更靈活、安全、穩(wěn)定的云端部署方式,試圖拉平DeepSeek與企業(yè)應用之間的鴻溝。比如,1月31日亞馬遜云科技率先宣布DeepSeek-R1模型已在Amazon Bedrock Marketplace和Amazon SageMaker JumpStart全面上線,并提供四種部署方式。
由此看出,模型爭霸只是表面,企業(yè)級AI真正的競爭在于工程化落地能力,而云服務商將成為關鍵推動者。
企業(yè)要真正用好DeepSeek,需要跨越哪些挑戰(zhàn)?云端部署大模型又能帶來哪些價值?我們不妨以亞馬遜云科技對DeepSeek R1模型的支持為例,做個拆解。
工程化能力
從模型到企業(yè)應用的挑戰(zhàn)
當AI大模型從消費者端走向產(chǎn)業(yè)戰(zhàn)場,工程化能力成為決定勝負的關鍵壁壘。智能進化論認為,企業(yè)部署DeepSeek等頂尖模型時,需要跨越性能適配、成本懸崖和安全鴻溝三重挑戰(zhàn)。
性能適配:從通用智能到垂直場景的最后一公里
模型性能的工程化考驗首先體現(xiàn)在場景適配層面。以DeepSeek為例,其技術迭代速度已超越傳統(tǒng)AI模型的演進周期。
從2014年12月推出的 DeepSeek-V3模型;到2025年1月20日發(fā)布的參數(shù)規(guī)模達6710億的DeepSeek-R1、DeepSeek-R1-Zero模型,以及參數(shù)范圍覆蓋15億至700億的DeepSeek-R1-Distill系列模型;再到2025年1月27日最新發(fā)布的多模態(tài)模型Janus-Pro-7B,DeepSeek家族短時間內(nèi)迅速壯大,企業(yè)如何根據(jù)不同類型、不同參數(shù)模型,完成場景最佳適配是挑戰(zhàn)。
除了模型版本、尺寸管理難題,企業(yè)還面臨不同智能體協(xié)同調(diào)度、根據(jù)自身私有數(shù)據(jù)進行定制優(yōu)化等系統(tǒng)工程。
成本懸崖:從百萬硬件到彈性算力的范式革命
AI模型本地化部署的成本門檻正在倒逼企業(yè)轉向云端彈性架構。
如果要完整部署DeepSeek R1并實現(xiàn)完美推理和響應,需要如Amazon EC2 P5e性能級別的硬件和配套工具。以Amazon EC2 P5e的48xlarge型號為例,單個實例包含8顆H200 GPU,僅算力成本就需要至少上百萬人民幣。在算力之外,大模型要實現(xiàn)高階水平的推理效果,所需的網(wǎng)絡、數(shù)據(jù)存儲成本亦不容小覷。
安全鴻溝:從傳統(tǒng)安全到負責任AI的系統(tǒng)工程
安全可控是大模型在企業(yè)深度應用的首要原則。大模型安全已超越傳統(tǒng)網(wǎng)絡安全范疇,形成包含數(shù)據(jù)隱私、可信度、可解釋性、倫理合規(guī)在內(nèi)的立體安全體系。這一完整的安全體系,僅靠單一企業(yè)自身的力量很難實現(xiàn)。
三大優(yōu)勢
企業(yè)用好DeepSeek的路徑拆解
針對上述工程化挑戰(zhàn),亞馬遜云科技通過全棧式創(chuàng)新構建三大優(yōu)勢,為企業(yè)運用全球領先模型提供三大獨特優(yōu)勢。
第一, 為企業(yè)級AI量身定制的云端基礎設施
云是企業(yè)運用生成式AI最好的方式。
在基礎設施層,亞馬遜云科技提供從芯片、網(wǎng)絡到開發(fā)平臺在內(nèi)的全棧創(chuàng)新。基于自研芯片Amazon Trainium2的EC2 Trn2實例,實現(xiàn)比同時期GPU實例性價比高30%-40%。第二代UltraCluster網(wǎng)絡架構,支持超過20,000個GPU協(xié)同工作,帶寬達10Pb/s,延遲低于10ms,可將模型訓練時間縮短至少15%。
新一代Amazon SageMaker將快速SQL分析、PB級大數(shù)據(jù)處理、數(shù)據(jù)探索和集成、模型開發(fā)和訓練以及生成式AI等功能一站式集成,非常適合進行高級定制、訓練和部署模型的企業(yè)。
第二, 多樣化的模型選擇
目前,多模型混用已經(jīng)成為企業(yè)使用生成式AI的主流方式。企業(yè)會根據(jù)不同的場景需求,根據(jù)不同的延遲、成本、微調(diào)能力、知識庫協(xié)調(diào)能力、多模態(tài)支持能力等,對模型進行取舍。顯然,強如DeepSeek也不是萬能的。
“不會有一個模型一統(tǒng)天下”,也是亞馬遜在技術發(fā)展歷程上的洞察。
亞馬遜CEO Andy Jassy在此前的演講中表示:“就像數(shù)據(jù)庫領域,探討了10年,大家會使用各種各樣的關系型數(shù)據(jù)庫或者非關系型數(shù)據(jù)庫。當我們讓開發(fā)者自由選擇他們想要使用的模型時,模型的多樣性顯而易見。我們一次又一次地學到同樣的教訓:永遠不會有單一的工具能夠統(tǒng)治世界。”
目前Amazon Bedrock平臺已支持AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI和poolside等公司的領先模型。Amazon Bedrock Marketplace功能能夠為客戶提供100多個熱門、新興及專業(yè)模型,其中就包括DeepSeek-R1。
第三, 企業(yè)級AI工具全家桶
解決模型的工程化問題需要大量專業(yè)工具,亞馬遜云科技提供的工具集全家桶幾乎涵蓋企業(yè)級AI創(chuàng)新的方方面面,包括四類:
優(yōu)化效果、延遲和成本:如低延遲優(yōu)化推理、模型蒸餾、提示詞緩存等功能。以模型蒸餾功能為例,它能夠將特定知識從功能強大的大模型轉移到更小、更高效的模型,運行速度最快可提高500%,成本降低75%。
基于企業(yè)自有數(shù)據(jù)的定制優(yōu)化:模型微調(diào)功能,知識庫功能現(xiàn)已支持GraphRAG等圖數(shù)據(jù)。Amazon Bedrock Data Automation功能可以從非結構數(shù)據(jù)中提取信息,并將其轉換為結構化格式。
負責任AI的安全和審查:Amazon Bedrock和Amazon SageMaker中的企業(yè)級安全功能,保障企業(yè)數(shù)據(jù)不會與模型提供商共享,也不會被用于改進模型。Amazon Bedrock Guardrails功能提供自動推理檢查功能,幫助企業(yè)識別生成內(nèi)容的事實性錯誤,提升生成回答的準確性。
實現(xiàn)復雜功能的多智能體功能:Amazon Bedrock多智能體協(xié)作功能,使客戶能夠輕松地構建和協(xié)調(diào)專業(yè)智能體來執(zhí)行復雜的工作流程,通過編排多個并行工作的智能體來加速任務。
極簡部署
降低企業(yè)AI創(chuàng)新門檻
目前針對DeepSeek-R1模型的云端部署,亞馬遜云科技提供以下4種方式:
第一, 在Amazon Bedrock Marketplace部署DeepSeek-R1模型
通過Amazon Bedrock Marketplace部署DeepSeek-R1,可選實例包括EC2 P5e的48xlarge型號,單個實例包含8顆H200 GPU,以及3200Gbps的網(wǎng)絡帶寬,充分滿足DeepSeek-R1的性能需求。
用戶只需提供一個端點名稱、選擇實例數(shù)量、選擇實例類型,就可以直接部署DeepSeek-R1模型。
第二, 通過Amazon SageMaker JumpStart部署DeepSeek-R1模型
Amazon SageMaker JumpStart是一個機器學習中心,提供基礎模型、內(nèi)置算法以及預構建的機器學習解決方案,用戶只需點擊幾次即可完成模型部署。
第三,利用Amazon Bedrock的自定義模型導入功能部署DeepSeek-R1-Distill模型
這種方式支持自定義導入?yún)?shù)規(guī)模在15億到700億之間的DeepSeek-R1-Distill Llama模型,可以利用6710億參數(shù)的大型DeepSeek-R1模型,也可以蒸餾訓練更小、更高效的模型。
第四, 使用Amazon Trainium和Amazon Inferentia部署DeepSeek-R1-Distill模型
此外,在價格方面,無論Amazon Bedrock Marketplace、Amazon SageMaker JumpStar以及Amazon EC2任何一種部署方式,用戶僅需支付基于所選推理實例小時數(shù)的基礎設施費用。
結語
在大模型爭霸的時代浪潮下,DeepSeek 的異軍突起與云服務商的深度賦能,共同勾勒出企業(yè)級 AI 應用的嶄新藍圖。
基礎模型性能的競賽固然重要,但真正決定 AI 能否在企業(yè)應用場景開花結果的,是工程化落地能力與AI云服務的堅實支撐。
本文為「智能進化論」原創(chuàng)作品
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.