文|魏琳華
編|王一粟
大模型落地如火如荼,從上一代AI浪潮中殺出來的商湯,嗅到了這里面新的機會。
在最火的具身智能賽道,這兩年誕生了許多明星創業公司。這些創業公司的創始人往往擁有技術明星的光環,不少都是在學術界中某個技術領域中響當當的領頭人。
這些初創公司雖然在某一個單點技術上遙遙領先(大腦、小腦或者本體),但在機器人落地過程中,要突破從單一技術到整體復雜產品的整合。
比如,機器人要做到“能聽會看”,就要深度集成AI大模型的能力,需要與AI服務商有密切的合作。
“大家不需要從頭再去做視覺算法研發,這樣效率比較低。”商湯科技聯合創始人、大裝置事業群總裁楊帆對光錐智能稱,“比如在一些特定的任務抓取識別上,只要能快速滿足需求,廠商可能就多賣出去幾十臺機器人。”
商湯科技聯合創始人、大裝置事業群總裁楊帆
除了AI模型,不少具身智能公司也面臨“數據缺失”“模擬物理規則”等難點。“商湯有這方面的能力和積累,比如之前做自動駕駛就會有一些歷史的數據和解決方案,這些和具身智能是相通的。”楊帆稱。
“不只是基礎設施,算力之外,還有很多相關服務。”在具身智能行業的實踐,體現出商湯在生成式AI時代的新商業思考——要圍繞AI做從模型、數據、算力等多個方面的技術服務商。
包括具身智能在內,加上AIGC、AI4S(AI 科學)、傳統企業智能化轉型,商湯在4月10日的技術交流日上給出了四個行業的解決方案。這些方案,并不是商湯一廂情愿的臆想,而是過去兩年中,在行業中淬煉出的“金丹”。
扎根行業,商湯的AI 基礎設施——大裝置落地就成了有根之木,有源之水。
一個不懂模型的AI 基礎設施廠商,不是一個好服務商。商湯用大裝置證明了這一點,也希望利用這一點賺取新時代的“技術溢價”。
受夠了傳統企業服務的苦,對商湯而言,從上一代項目制的業務中脫身,轉而做含金量更高的AI技術服務,才能真正體現技術的商業價值。
低門檻、高性價比,AI基礎設施怎么做?
直到今天,“性價比”仍然是AI大模型的生死線。
雖然DeepSeek在年初極大地推動了大模型的普及和成本降低,但在如何讓大模型變得便宜好用的命題上,AI 基礎設施的潛力還遠遠沒有挖掘完畢。
“今天,AI 基礎設施供應商對客戶的需求滿足度還遠遠不夠。”楊帆說,“今天最優秀、效果最好的模型,廠商還沒辦法拿到市場上直接提供服務,因為它的性價比太低。”
平衡大模型的性能和成本,卻不是一個簡單的命題。一個不同的選擇,會造成截然相反的效果。
楊帆舉了一個例子:
一家廠商需要做一個基于DeepSeek的對話產品,并根據自有數據庫再進行定制化訓練。但對于這樣一個模型來說,在調用量高和低兩種情況下,如果都采用分布式部署架構,兩者的性價比相差極大。
由于分布式架構本身硬件成本較高,在QPS(每秒查詢數)高的情況下,它可以高效利用資源,實現極致性價比;但在QPS低的情況下,反而會造成硬件資源閑置過多,從而讓成本比傳統部署更高。
所以,AI基礎設施從來不是一門只靠硬件就能做好的生意,從算力到模型,每一層都有無數個細小的選擇會決定最終的成果。
商湯正在做的,就是通過AI基礎設施和模型訓練的配合,結合AI基礎設施的三要素:算力、算法和數據,將大模型的性價比壓縮到極致。
作為底層架構的硬件端,商湯算力充足。到2024年底,商湯大裝置的算力規模比去年翻了近一倍,達到23000PetaFlops,超過了整個北京的公共智能算力。
商湯臨港智算中心(AIDC)
同時,商湯算力的構成一部分來自于國產芯片,避免被單一GPU“卡脖子”風險。但多種芯片難免會降低數據處理效率,商湯國產芯片異構訓練效率為同構的95%,保持效率的同時,商湯還能做到保持算力穩定、充足,其算力利用率高達80%。
在優化算力的基礎上,商湯通過算法優化策略,實現大模型訓練、推理兩部分的性能大幅提升。以推理為例,針對DeepSeek V3等第三方模型,商湯每秒處理Token數(TGS)已達1600+,在未做專項優化下,訓練效率竟然能優于DeepSeek的官方成績,要知道,DeepSeek可是以效率和成本著稱。
除了把性價比壓到極致,商湯的另外一個努力方向,就是把大模型業務做到更加易用。
當開源成為行業主流,商湯擁抱開源,是為了讓廠商能夠自由調用開源工具,降低大模型訓練門檻。
“今天有很多好的開源產品,它們幫助廠商更快地迭代自己的模型。”楊帆舉了個例子:
一個做模型同時做應用的極客團隊,在研發階段先用純開源的工具體系做快速搭建,驗證PMF(Product Market Fit,產品市場匹配度),但在業務上量的情況下,企業就需要選擇一個能幫助商業化的AI基礎設施服務商。在這個過程中,客戶希望繼續使用原來的開源工具,但服務平臺往往接口無法對齊,需要重新實現。
針對一系列開源衍生的需求,商湯升級的大裝置2.0版本給出了三個能力支持:開源兼容接口幫助廠商實現零成本遷移;模型廣場讓用戶自由選擇多種開源大模型并提供調用,實現零門檻使用;商湯的SenseCore平臺還提供優化過的各種開源組件,讓用戶可以根據自己的需求來自由調用。
當千行百業對于大模型的需求提高到“拿來即用”的標準上,商湯想做的,就是把模型的性價比打下來,同時讓廠商自身業務融入大模型的門檻降得更低。
懂客戶,商湯怎么做差異化壁壘?
不過,在競爭激烈的AI基礎設施供應商賽道中,商湯要想把營收做到第一梯隊,它面臨的競爭壓力依然不小。
面對硬件資源更加充沛,同時靠邊際效應把成本打得更低的云廠商來說,商湯們難以燒錢奉陪打價格戰。
競爭密切的領域,商湯怎么廝殺出重圍?
除了懂模型,更要懂客戶。
在和千行百業的客戶探索AI技術落地的十年中,商湯在無數個實踐結果后,最終推出了目前需求密切、落地更成熟的四大行業解決方案——具身智能、AIGC、AI4S(AI for Science)和傳統企業智能化轉型。
作為既做模型,也做AI基礎設施的服務商,商湯內部的產品、技術部門擁有成熟技術,把具體行業需要的對應能力直接“復制粘貼”提供給用戶,免去后者從頭鉆研的時間和精力成本。
以具身智能行業為例,針對數據短缺的問題,商湯能通過“仿真+真機”雙通道的解決方式,生成大量可用數據,直接用到模型的訓練中。將這些能力整合到一起,商湯針對具身智能行業拿出了“端到端”式的方案,從數據生產、工具支撐到模型研發,都能一手包辦。
這種“拿來即用”的產品在商湯內部還有很多。比如具身智能同樣需要應用的視覺算法,再到自動駕駛的歷史數據,還有模型訓練中需要的適配工具。
除了具身智能行業外,商湯還把這種能力延伸到了其他行業。
“實際上,無論是互聯網類客戶,還是一些線下傳統行業客戶,他們除了資源、平臺、訓練和推理的成本和性價比之外,還有很多不同的需求。”楊帆列舉了很多來自客戶的具體需求:
比如,有的廠商需要做模型定制,但模型需要在網信辦備案審核,但整體流程對于廠商來說復雜耗時,商湯可以把審核能力開放給用戶;有的廠商需要數據私有化,不僅要保護數據安全,甚至可能需要國密認證,商湯也能提供對應關鍵能力。
拿出成熟技術、打出“更懂客戶”旗幟的商湯,并未止步于基礎的MaaS服務,而是選擇再加碼人才,幫客戶走完落地的每個關鍵點。
在技術交流日中,楊帆提及,商湯在2023年專門成立了一個子業務板塊“AI專家服務”。
“其實在給產業智能化客戶提供服務時,我們發現,追求一鍵式部署、無代碼編輯等自動化功能對于這些廠商來說意義甚微。”楊帆說。
企業一般的需求是希望基于一個基礎模型,根據自己已有的數據做定制化模型,并且要求推理能夠滿足他們對性價比的要求。
對于需求明確,但對AI技術不夠熟悉的客戶來說,標準化的解決方案沒辦法解決所有問題。在這種情況下,商湯往往需要在配置AI基礎服務的基礎上加上服務能力,派出專家提供支持。
靠著人才服務的支持和技術know-how的輸出,商湯擁有了超越其他AI企業的差異化壁壘。
抓住生成式AI浪潮,商湯蝶變
技術的浪潮滾滾向前,一個殘酷的事實是,能真正穿越周期的企業是極少數。
2016年的深度學習浪潮中,如今留下還能堅持做通用大模型的已經寥寥無幾;2023年的大模型浪潮中,六小虎也開始分化,不少已經退出通用大模型的研發。
在巨頭之外,商湯是一個幸運兒。
目前,商湯自己一邊做模型,一邊把這個過程中習得的能力和優勢復制給客戶,把經驗做成真正有用的商品,成為了AI基礎設施服務中價值更高的附屬品。
在AI基礎設施服務+大模型服務的配合下,商湯的轉型已經初見成效。
根據IDC報告,2024年H1,商湯以14.8%的市場份額位居中國大模型解決方案市場第二。
目前,生成式AI也成為了商湯營收的中流砥柱,這代表了營收質量的提升。據財報,2024年,商湯生成式AI相關業務收入超過24億元,同比增長103%;其收入占總業務比例從2023年的34.8%,升至2024年的63.7%。商湯董事長兼CEO徐立曾表示,生成式AI也是商湯最快突破20億元規模的業務。
從AI 1.0時代到2.0時代,生存超過十年的商湯,一直埋頭做AI技術,保證核心技術在第一梯隊。
大裝置業務,是商湯“反向求解”的一次實踐。
早在2018年,由于做感知智能時遇到了海量數據處理的問題,商湯基于技術需求,打造了國內首個AI千卡集群原型機。2020年,商湯又建立了國內首個智算中心。彼時,這樣的重資產投入對于商湯來說,是一筆不小的成本。
但正如英偉達為了游戲的極致視覺體驗鉆研GPU,從而在深度學習的時代“無心插柳柳成蔭”,成為當下AI時代的最大贏家。商湯在AI 1.0時代的資產投入,變成了AI大模型訓練的“礦井”。
再以AI基礎的三要素算力、算法和數據作為維度評判,商湯在擁有充足算力的基礎上,既有底層硬件優化、自研大模型的經驗,又有合成數據的能力和歷史數據沉淀。這就使商湯從一般的AI基礎設施供應商中脫穎而出。
技術交流日上,商湯大裝置面向具身智能、AIGC、AI4S以及傳統企業智能化轉型推出四大行業解決方案,則又是一次“反向求解”的成果。
對于一家公司而言,高舉高打的戰略固然重要,但貼地飛行的經驗總結才是制勝關鍵。畢竟,實踐出真知。
商湯在和客戶合作的過程中,能深度洞察到行業的痛點和需求,再根據自身落地的實踐成果,把成功的經驗重點做批量復制,最終完成商業的閉環。
重技術的商湯,在一次次反向求解中,終于找到了屬于技術主義者的勝利。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.