過去兩個月里,大模型產(chǎn)業(yè)出現(xiàn)了兩個現(xiàn)象級熱點(diǎn):
一個是DeepSeek催生的大模型開源浪潮,用工程創(chuàng)新和技術(shù)平權(quán)的方式加速了AI普惠化的進(jìn)程。
另一個是AI Agent產(chǎn)品的出圈,讓AI從被動響應(yīng)走向主動規(guī)劃和執(zhí)行,甚至是跨場景的復(fù)雜任務(wù)。
傳遞到產(chǎn)業(yè)端,“2025年將是AI Agent元年”的說法漸漸成為共識,業(yè)界對于大模型落地的態(tài)度從“觀望”轉(zhuǎn)向了行動。同時也在深度影響產(chǎn)業(yè)的競爭邏輯,進(jìn)入到了技術(shù)摸高和落地應(yīng)用的并行模式。
在不久前落幕的昇騰人工智能伙伴峰會上,一直走在AI產(chǎn)業(yè)最前沿的昇騰與科大訊飛強(qiáng)強(qiáng)聯(lián)手,為AI在千行萬業(yè)的加速落地開辟出一條“新航路”。
01 跨越落地鴻溝,首先要懂大模型
大模型的產(chǎn)業(yè)圖景不可謂不誘人,但和業(yè)務(wù)場景之間仍存在一條鴻溝。
根據(jù)Gartner、埃森哲、波士頓咨詢等權(quán)威咨詢機(jī)構(gòu)的報告:當(dāng)前僅有25%的AI試點(diǎn)項(xiàng)目能夠規(guī)模化推廣、60%的企業(yè)在AI項(xiàng)目中技術(shù)與實(shí)際場景需求脫節(jié)、60%的中型企業(yè)因算力不足或云服務(wù)成本過高,無法支撐模型訓(xùn)練……這些問題不被解決,大模型的落地應(yīng)用就無從談起。
首先需要厘清的是:為什么會存在落地鴻溝?
可以找到的答案似乎有很多。對大模型認(rèn)識不全面乃至有認(rèn)識誤區(qū),難以挖掘出對大模型的應(yīng)用需求;由于保密、隱私保護(hù)等需要,缺少高質(zhì)量的行業(yè)數(shù)據(jù);接入大模型需要對現(xiàn)有系統(tǒng)進(jìn)行改造,增加了實(shí)施的復(fù)雜性;將大模型融入現(xiàn)有業(yè)務(wù)流程和系統(tǒng)架構(gòu),涉及大量的開發(fā)和測試工作……
原因不一而足,但指向了同一個癥結(jié):對許多企業(yè)來說,大模型還是一個陌生的“新物種”。這為大模型產(chǎn)業(yè)中的賦能者們提出了一個基本要求——想做“擺渡人”,首先要懂大模型。
而昇騰和科大訊飛恰恰是其中的佼佼者。
在昇騰人工智能伙伴峰會上,科大訊飛副總裁婁超深度解讀了雙方從模型訓(xùn)練到推理過程中攻克的一個又一個技術(shù)難題。
比如2023年10月發(fā)布的首個國產(chǎn)智能算力集群“飛星一號”,就解決了大規(guī)模集群訓(xùn)練的諸多“疑難雜癥”。特別是在超大規(guī)模集群網(wǎng)絡(luò)通信帶寬利用率方面,昇騰和科大訊飛的聯(lián)合攻關(guān),讓“飛星一號”的網(wǎng)絡(luò)通信帶寬利用率達(dá)到了95%,有效提升了大模型訓(xùn)練過程中卡間數(shù)據(jù)和模型權(quán)重傳輸?shù)男省?/p>
當(dāng)長思考能力將scaling延展到推理,Tokens已經(jīng)成為衡量推理系統(tǒng)的唯一標(biāo)準(zhǔn),集群推理成為大模型推理系統(tǒng)的標(biāo)配,系統(tǒng)既要確保用戶的低時延響應(yīng),又需要提高整體吞吐,以最大化推理的經(jīng)濟(jì)價值。
為了實(shí)現(xiàn)大模型推理的極致效率,昇騰從算子到推理系統(tǒng)全面創(chuàng)新。針對MoE架構(gòu),國內(nèi)首創(chuàng)大規(guī)模專家并行方案,通過將MoE模型的多專家權(quán)重數(shù)據(jù)分散部署到更多的卡上,降低單卡權(quán)重加載時延,讓模型解碼輸出更快,同時解決了吞吐性能、通信開銷等挑戰(zhàn)。
2025年3月中旬,昇騰與科大訊飛率先實(shí)現(xiàn)了MoE模型的大規(guī)模專家并行集群推理,將深度推理類模型端到端的訓(xùn)練效率提升了30%,超大規(guī)模集群網(wǎng)絡(luò)通信帶寬的利用率提升至95%,單卡靜態(tài)內(nèi)存占用僅為雙機(jī)部署的1/4,推理吞吐性能提升了3.2倍,端到端時延降低了50%。
窺一斑而知全豹。
作為國內(nèi)為數(shù)不多走完了大模型訓(xùn)練到落地全流程的企業(yè),昇騰和科大訊飛踩過了大模型訓(xùn)練到推理部署的每一個坑,積累了從數(shù)據(jù)清洗到算力調(diào)度,再到高效部署、推理加速的全流程經(jīng)驗(yàn),趟出了一條從技術(shù)創(chuàng)新到場景融合的新路線。
02 場景化一體機(jī):讓落地更加便捷
對于中小型企業(yè)而言,可能沒有訓(xùn)練行業(yè)大模型的需求,怎么才能拉近他們和新質(zhì)生產(chǎn)力的距離呢?
時間回到2025年2月末,科大訊飛聯(lián)合昇騰發(fā)布了全新升級的訓(xùn)推一體機(jī)和推理一體機(jī),可兼容訊飛星火和DeepSeek雙模型,同時內(nèi)置了模型微調(diào)工具鏈、知識蒸餾工具鏈、精品智能體等工具,進(jìn)一步縮短了大模型的落地流程,加速了大模型能力到產(chǎn)業(yè)生產(chǎn)力的轉(zhuǎn)化。
對比其他落地方式,大模型一體機(jī)提供的是“開箱即用”的選項(xiàng),無需花費(fèi)大量時間精力配置和優(yōu)化硬件環(huán)境,無需深入了解底層的算法和框架細(xì)節(jié),無需擔(dān)憂“數(shù)據(jù)上云”帶來的安全問題……在很大程度上縮短了部署周期、降低了落地門檻。
不過問題也出現(xiàn)了,大模型和場景的融合,不是簡單部署一套大模型就可以了,而是要明確場景,把數(shù)據(jù)用好。往往因缺少模型選型、場景落地的經(jīng)驗(yàn),企業(yè)在大模型實(shí)際落地應(yīng)用中常常會遇到“最后一公里”的障礙。
昇騰和科大訊飛深諳其中的道理,解題的思路可以歸納為一句話——圍繞目標(biāo)場景需求做創(chuàng)新、做產(chǎn)品。
聚焦政務(wù)辦公場景,科大訊飛和昇騰創(chuàng)合作推出的AI政務(wù)辦公一體機(jī),內(nèi)置公文寫作、政策文件解讀、數(shù)據(jù)分析、中英互譯等4種大模型場景應(yīng)用,目前已經(jīng)在安徽、湖北等地落地應(yīng)用;AI政務(wù)綜窗一體機(jī)內(nèi)置了超過4500個辦事項(xiàng)語料、2000個辦事相關(guān)政策法規(guī),事項(xiàng)推薦準(zhǔn)確率高達(dá)90%,咨詢回答準(zhǔn)確率高達(dá)95%,大幅提升了政務(wù)效率。
面向法院的庭審場景,科大訊飛和昇騰聯(lián)合推出了星火法律筆錄精簡一體機(jī),學(xué)習(xí)了數(shù)萬書記員的筆錄資料,并基于海量法律數(shù)據(jù)訓(xùn)練模型,打造了集智能筆錄規(guī)整、語義理解、自動校對、重點(diǎn)提取的一站式解決方案。截至目前,星火法律筆錄精簡一體機(jī)已經(jīng)在全國100多個法院試點(diǎn),合作深化庭審場景的深度應(yīng)用。
不只是對單一場景的滿足,還有城市級的綜合解決方案。
面向城市AI應(yīng)用的訊飛星火塔式一體機(jī),通過訊飛星火、DeepSeek和Qwen三擎模型驅(qū)動,依托行業(yè)大模型解決方案,可滿足政務(wù)、警務(wù)、司法、社工等城市智能應(yīng)用需求;集行業(yè)模型“資源池”、生態(tài)場景“集聚地”、大模型開發(fā)“服務(wù)站”、產(chǎn)業(yè)供需“鏈接器”于一體的城市人工智能公共服務(wù)平臺,深入賦能城市產(chǎn)業(yè)的發(fā)展。
正如科大訊飛董事長劉慶峰多次在公開場合提及的:“無論大模型如何演進(jìn),最后一公里的產(chǎn)品體驗(yàn)和應(yīng)用落地,才是真正的挑戰(zhàn)。”
就結(jié)果來看,昇騰和科大訊飛已然找到了解決路徑,從云端的大模型服務(wù)到打造行業(yè)大模型的全套工具鏈,再到面向不同場景的一體機(jī),大模型正在深入解放生產(chǎn)力、解放每一家企業(yè)的想象力。
03 寫在最后
杰弗里·摩爾在《跨越鴻溝》中將“技術(shù)采用生命周期”的客戶群體分成了五類,分別是創(chuàng)新者、早期采用者、早期大眾、后期大眾和落后者。
目前的大模型正處于從早期采用者向早期多數(shù)過渡的階段,也就是“鴻溝”所在的階段。相較于模型層的你追我趕,一場更重要的博弈在于怎么將創(chuàng)新迅速“擴(kuò)散”到產(chǎn)業(yè)中,乃至可以說比創(chuàng)新更重要的,是創(chuàng)新的擴(kuò)散。
樂觀的是,昇騰、科大訊飛等行業(yè)領(lǐng)跑者,正在各個維度開放合作,驗(yàn)證大模型的落地應(yīng)用進(jìn)程,持續(xù)向千行百業(yè)輸出新質(zhì)生產(chǎn)力,有望形成“模型越強(qiáng)、落地越多、用戶越廣、算力越大”的增長飛輪,掀起一股不可逆的產(chǎn)業(yè)革命。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.