99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

誰還會從DeepSeek的連鎖反應中受益?

0
分享至

作者|周雅

DeepSeek的V3模型的最后一輪訓練,僅用557.6萬美元的GPU使用成本,就訓練出了全球前沿模型,并在后續發布與OpenAI o1推理模型能力不相上下的DeepSeek R1,這股神秘東方力量就像蝴蝶扇動了翅膀,在全球引發連鎖反應至今已經整整1個月。

此前,AI產業的發展邏輯似乎還很簡單:模型參數越大越好、算力投入越多越好。但DeepSeek R1的橫空出世,改寫了這一認知,約束條件反而可以推動創新,沒有大算力,還可以優化算法。所以現在科技圈普遍出現了一種聲音:一個開源、高性能、低部署推理成本的大模型也能帶來整個AI產業生態的繁榮,是大家抓緊上車的門票。

那么,究竟接下來產業鏈中還有誰能從DeepSeek的沖擊波中受益?

在2025財年第一季度財報電話會議中,高通公司總裁兼CEO安蒙提到,“DeepSeek R1及其他類似模型表明,AI模型正在向更快、更小、更強大、更高效的方向發展,并且可以直接在終端側運行。DeepSeek R1的蒸餾模型在發布僅幾天內,就能在搭載驍龍平臺的智能手機和PC上運行。”

緊接著,高通發布了最新白皮書《AI變革正在推動終端側推理創新》(下稱《白皮書》),首次闡述了終端AI推理迎來突破的深層邏輯。


范式之變:為何現在是終端AI的拐點?

大模型的規模競賽推動了底層技術創新,同時也讓業界思考AI部署的多元路徑。

今年年初的時候,高通中國區研發負責人徐晧接受科技行者專訪時提到,AI發展現在遵循兩個主要軌跡:云端AI、終端側AI。

首先,大部分人看到的、聽到的AI都是云端訓練的AI模型,例如Meta的LLaMA、OpenAI的ChatGPT、Anthropic的Claude、谷歌的Gemini等,它們都是用非常多的GPU堆起來,擁有很大的算力,能夠處理海量數據,從而訓練出的大模型。這些大模型部署在云端,也只能在云端運行。(現在1000億參數甚至更大的模型只能在云端運行。)

其次,另一個主要趨勢是終端側AI。任何技術要落地到每個人手中,都需要下沉到智能終端,比如手機、PC、汽車、工業物聯網等,這些萬物智能的設備占據更大規模,且可以實現云端AI所無法實現的隱私、效率、個性化用戶體驗。

安蒙在財報電話會議中還明確指出,“隨著我們進入AI推理時代,模型訓練仍將在「云端」進行,但推理將更多在「終端側」運行,讓AI變得更便捷、可定制且高效,那將促進更多專用模型和應用的開發和采用,并因此推動各類終端對高通平臺的需求。”

高通還在《白皮書》中,詳細介紹了推動終端側AI變革的四大關鍵趨勢:

第一,當前先進的AI小模型已具有卓越性能。模型蒸餾、AI網絡架構優化等新技術,能夠在不影響質量的情況下簡化開發流程,讓新模型的表現超越一些僅在云端運行的大模型。

第二,模型參數規模正在快速縮小。得益于先進的量化和剪枝技術,開發者現在能夠在不影響模型準確性的前提下,顯著縮減模型參數規模。

(編者注:也就是說,當一個小模型能夠做到大模型前兩年能做的事情,那么把這個小模型放到終端上就足夠了,比如汽車上可以放100個億-1000億參數的模型,現在大多數手機已經可以支持30億參數的模型,在這個維度上,小模型能做越來越多的事情。該趨勢解決了終端部署的計算負擔問題,為大規模商用部署掃清了技術障礙。

第三,開發者能夠在邊緣側打造更豐富的應用。高質量AI模型快速激增,意味著文本摘要、編程助手和實時翻譯等特性在智能手機等終端上的普及,讓AI能夠支持跨邊緣側規模化部署的商用應用。

第四,AI正在成為新的UI。個性化多模態的AI智能體(Agent)將簡化交互,高效地跨越各種應用完成任務。

此處引用徐晧當時在對談中舉例而言,比如我們現在要出去旅行,就需要在手機上操作:定機酒-看日程安排-看當地天氣-看當地攻略等,這就要調用不同的APP來完成這些事情。但是如果有了AI智能體,那么就能一步到位,只需要告訴AI智能體:“看看我下周哪天有空,我想去某地旅游,幫我訂某星際酒店,最好是能夠在海邊,順便看看當地天氣和功率”。我們和終端的交互只需要通過自然語言和AI智能體,AI智能體會去調用后臺所有App來把事情搞定。那么這個UI就完全不是以前的UI了。

市場格局:誰將受益于這一變革?

一、毫無疑問,芯片廠商將成為最直接受益者。終端側AI對處理器的算力和能效都提出了更多要求,這將催生新一輪硬件升級周期。

二、模型開發商將迎來新機遇。DeepSeek的成功表明,通過技術創新,小型團隊同樣可以在AI領域實現突破,隨著終端部署門檻降低,將會涌現更多面向特定場景的專業化模型。

三、應用開發者將獲得更大施展空間。高質量、小模型的普及,使得文本處理、代碼輔助、實時翻譯等AI功能可以輕松部署到終端設備,這將激發新一輪應用創新。

以高通為例。無論是AI訓練正在向大規模推理轉型,還是AI計算處理從云端向邊緣側擴展方面,高通都具有戰略優勢,作為終端側AI的引領者,高通的解決方案涵蓋了數十億臺智能手機、汽車、XR頭顯和眼鏡、PC以及工業物聯網終端等。

徐晧告訴我,“高通正在用最節能的方式、最小的芯片面積來做最有效的人工智能應用。”其中有幾種有效的方案,可以將大模型縮小或提高不同模型的適應性。

· 首先是對模型本身的簡化。

第一種叫“剪枝”(Pruning),就像修剪花草一樣。把AI模型中不太重要的“枝節”剪掉,保留最核心的部分,這樣模型體積變小了,但依然能保持原有的聰明才智。第二種方法叫“學生-教師模型”(Student-Teacher Model),像是“師徒傳藝”,把一個“經驗豐富”的大模型當作老師,讓它去教導一個“年輕”的小模型,通過不斷學習和驗證,小模型最終也能掌握老師的本領,但所需的計算資源卻少得多。第三種方法叫“LoRA”(Low-Rank Adaptation),可以理解為“化整為零”,把一個龐大的AI任務,分解成幾個小任務,用更小的模型來分別處理,這就像是把一個大工程分派給幾個小團隊,每個團隊專注于自己的部分,最終一起完成大任務。

這些技術創新讓AI模型變得更加節能和輕量級,不僅能在手機等終端設備上流暢運行,還保持了優秀的性能,為AI的普及應用打開了新的可能。

· 其次是用蒸餾(Distillation)的方法,用大模型訓練小模型。

蒸餾是開發高效小模型的一項關鍵技術,它能夠讓大模型“教學”小模型,保持準確性的同時遷移知識。蒸餾技術的使用,促使小型基礎模型激增,包括眾多面向特定任務調優的模型。

高通在《白皮書》中展示了蒸餾的強大能力。下圖比較了Llama 3.3 700億參數模型和同類DeepSeek R1蒸餾模型的LiveBench平均測試結果,顯示出在相同參數規模下,蒸餾能夠在推理、編程和數學任務中顯著提高性能。


圖:Meta Llama 700億參數模型和DeepSeek對應蒸餾模型的LiveBench AI基準測試平均結果對比。來源:LiveBench.ai,2025年2月。

此外,得益于蒸餾和上述其他技術,小模型正在接近前沿大模型的質量。下圖顯示了DeepSeek R1蒸餾版本與其他領先模型的基準測試結果對比。基于通義千問模型和Llama模型的DeepSeek蒸餾版本展現了諸多明顯優勢,尤其是在GPQA基準測試中,與GPT-4o、Claude 3.5 Sonnet和GPT-o1 mini等先進模型相比,取得了相似或更高的分數。(GPQA是一個關鍵評估指標,因其涉及解決復雜問題的深層次、多步驟的推理,這對許多模型頗具挑戰性。)


圖:數學和編程基準測試。來源:DeepSeek,2025年1月。

《白皮書》中特別指出,將大型基礎模型縮減為更小、更高效的版本,不僅能實現更快的推理速度、更少的內存占用和更低的功耗,同時可以保持較高的性能水平,從而使此類模型適合在智能手機、PC和汽車等終端上部署。

挑戰猶存:變革之路并非坦途

盡管前景可期,終端側AI推理仍面臨諸多挑戰一是性能與效率的平衡問題,如何在有限算力下實現更好的推理效果;二是生態建設問題,需要更完善的開發工具和框架支持;三是標準化問題,不同平臺間的模型部署仍缺乏統一標準。

仍以高通為例。首先在硬件層面,高通長期致力于開發定制CPU、NPU、GPU和低功耗子系統,同時擁有封裝技術和熱設計的技術專長,構成了其行業領先系統級芯片(SoC)產品的基礎。

這些SoC能夠直接在終端側提供高性能、高能效的AI推理,通過緊密集成這些核心組件,高通的平臺可在保持電池續航和整體能效表現的同時,處理復雜AI任務,這對邊緣側用例至關重要。

其次在軟件層面,高通還構建了強大的AI軟件棧,旨在賦能軟件開發者。高通AI軟件棧包括庫(libraries)、SDK和優化工具,可簡化模型部署并提升性能。開發者可以利用這些資源,面向高通平臺高效進行模型適配,縮短AI賦能應用的上市時間。

最后,作為高通面向各行各業規模化擴展AI戰略的核心,高通與全球AI模型廠商積極合作,并提供高通AI Hub等服務。

高通《白皮書》中介紹,在高通AI Hub上,僅需三步,開發者即可:1)選擇模型,或引入自主模型又或基于他們的數據創建模型;2)選擇任意框架和runtime,在基于云的物理設備場(cloud-based physical device farm)上撰寫和測試AI應用;3)使用工具商業化部署其應用。高通AI Hub支持主流大語言模型和多模態大模型(LLM、LMM)系列,讓開發者可在搭載高通平臺的終端上部署、優化和管理推理任務。借助預優化模型庫和支持定制模型優化與集成等特性,高通賦能加速開發周期,同時增強了與廣泛AI生態的兼容性。

從技術演進規律看,AI計算正在經歷與互聯網相似的分布式變革。就像是云計算無法完全替代終端計算一樣,終端側AI也將與云端AI形成互補。當前我們正處于這一變革的起點,未來終端AI的應用場景可能遠超預期。

DeepSeek事件也給業界提了個醒,AI產業正在進入一個新階段。在這個階段,技術創新的重點將從突破模型規模上限,轉向提升計算效率和部署靈活性。

或許AI的下一波創新,不僅是比拼誰的模型更大,還要看誰能讓AI更輕便、更普及、更貼近生活。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
王思聰帶懶懶逛富士急被偶遇,腳上粉色鞋子搶鏡,懶懶背影黑又壯

王思聰帶懶懶逛富士急被偶遇,腳上粉色鞋子搶鏡,懶懶背影黑又壯

跳跳歷史
2025-06-21 14:24:40
MLB記者:若湖人新老板認為有更好的選擇 他愿意解雇成功的員工

MLB記者:若湖人新老板認為有更好的選擇 他愿意解雇成功的員工

直播吧
2025-06-20 21:45:08
小米SU7 Ultra車主提車3個月后轉手:貶值15萬元

小米SU7 Ultra車主提車3個月后轉手:貶值15萬元

三言科技
2025-06-20 11:58:10
一覺醒來,復讀生的天塌了!2025年考再差,都不要復讀,真的嗎?

一覺醒來,復讀生的天塌了!2025年考再差,都不要復讀,真的嗎?

菊學姐
2025-06-21 09:00:10
譚嗣同被斬首前,妻子大喊:我想為你生孩子!他卻說了句“狠話”

譚嗣同被斬首前,妻子大喊:我想為你生孩子!他卻說了句“狠話”

文史道
2025-06-19 17:16:14
以外交部:“伊朗導彈擊中以科研大樓”

以外交部:“伊朗導彈擊中以科研大樓”

參考消息
2025-06-21 14:06:07
大灣區大學正式獲批設立 : 首批設置5個普通本科專業 , 預計2034年達到在校生10000人左右

大灣區大學正式獲批設立 : 首批設置5個普通本科專業 , 預計2034年達到在校生10000人左右

每日經濟新聞
2025-06-21 10:57:45
廣西一男子曬出96平的家,因太漂亮而走紅,全屋那叫一個獨特

廣西一男子曬出96平的家,因太漂亮而走紅,全屋那叫一個獨特

時尚舒適家
2025-05-24 10:00:02
A股:不用等下周一開盤了,不出意外,股市很可能要變盤了?

A股:不用等下周一開盤了,不出意外,股市很可能要變盤了?

財經大拿
2025-06-21 07:00:12
《撈女游戲》制作人B站賬號被封,靠性別對立“撈”流量只會一塌到底

《撈女游戲》制作人B站賬號被封,靠性別對立“撈”流量只會一塌到底

極目新聞
2025-06-20 10:26:59
28歲日本主婦驚艷出道!已婚身份+164cm完美身材引爆網絡熱議

28歲日本主婦驚艷出道!已婚身份+164cm完美身材引爆網絡熱議

云端小院
2025-06-21 09:28:20
那爾那茜同學發聲:高考是579分,留學沒花家里一分錢!忽悠傻子

那爾那茜同學發聲:高考是579分,留學沒花家里一分錢!忽悠傻子

愛下廚的阿椅
2025-06-18 06:26:17
剛來湖人就搞大交易!你比珍妮豪爽!誰都喜歡不差錢,詹姆斯狂贊

剛來湖人就搞大交易!你比珍妮豪爽!誰都喜歡不差錢,詹姆斯狂贊

張家大院趣說天下事
2025-06-21 10:15:03
意甲球衣品牌贊助TOP5:尤文4610萬歐斷層領跑,米蘭第二國米第三

意甲球衣品牌贊助TOP5:尤文4610萬歐斷層領跑,米蘭第二國米第三

直播吧
2025-06-21 07:23:31
汪峰牽手寧靜后,森林北評論區淪陷,她僅用一個舉動,表明了態度

汪峰牽手寧靜后,森林北評論區淪陷,她僅用一個舉動,表明了態度

洲洲影視娛評
2025-06-21 12:10:35
毛主席派醫生去看望林彪,發現林彪房間里掛滿了白色紙條

毛主席派醫生去看望林彪,發現林彪房間里掛滿了白色紙條

【歷史客棧】
2025-06-21 09:02:17
安徽女農機手率隊沖進火場搶收2萬斤小麥!當事人回應

安徽女農機手率隊沖進火場搶收2萬斤小麥!當事人回應

環球網資訊
2025-06-21 08:03:27
從邊境沖突到打嘴炮,泰國和柬埔寨對掐背后是稀土爭奪和大國博弈

從邊境沖突到打嘴炮,泰國和柬埔寨對掐背后是稀土爭奪和大國博弈

阿胡
2025-06-21 11:27:46
32歲楊紫轉變風格,將波點裙帶斷貨,斜劉海造型簡直美神降臨

32歲楊紫轉變風格,將波點裙帶斷貨,斜劉海造型簡直美神降臨

蓓小西
2025-05-31 08:37:18
千呼萬喚的公務員裁員來了,最先下崗的卻是這類人

千呼萬喚的公務員裁員來了,最先下崗的卻是這類人

細說職場
2025-06-19 07:04:09
2025-06-21 16:00:49
科技行者 incentive-icons
科技行者
科技正在如何變革商業世界
5416文章數 527關注度
往期回顧 全部

科技要聞

Siri有救了?蘋果被曝正討論史上最大收購

頭條要聞

貴州一落馬女干部被通報搞權色交易、公器私用

頭條要聞

貴州一落馬女干部被通報搞權色交易、公器私用

體育要聞

文班品嘗水席 "很享受在中國的時光"

娛樂要聞

70歲寇振海跳舞,網友:和依萍搶飯碗

財經要聞

租金大撤退!房東正在批量跑路!

汽車要聞

扔掉"舊地圖”一汽-大眾大眾品牌要找"新大陸"

態度原創

健康
藝術
手機
房產
時尚

呼吸科專家破解呼吸道九大謠言!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

手機要聞

榮耀 AI 折疊屏實現自主多任務并行,Magic V5 首發搭載

房產要聞

坑慘2000多人!恒大財富海南高管被曝非吸12.6億元!

30度高溫天穿啥?葉童高圓圓的答案可以抄作業

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 克什克腾旗| 筠连县| 高邑县| 广东省| 海林市| 木里| 罗甸县| 瑞丽市| 历史| 浮山县| 东丽区| 晋中市| 德令哈市| 武清区| 札达县| 河西区| 祁连县| 宣威市| 惠来县| 江西省| 肥东县| 廊坊市| 芒康县| 兴宁市| 都昌县| 讷河市| 乳源| 屯昌县| 启东市| 巴里| 山丹县| 墨脱县| 大丰市| 宜良县| 宣城市| 张北县| 鲁甸县| 南靖县| 丁青县| 武乡县| 南充市|