4月23日,商湯發布日日新SenseNova5.0,性能一舉超越GPT4,全面對標GPT4 Turbo。
次日,商湯港股僅一上午暴漲31.15%直接暫停交易,截至發稿連漲三天。
在一眾對股價的分析討論中,絕大多數觀點認為商湯暴漲的主因是其大模型能力的飛躍,誠然國產大模型超越GPT4確實令人振奮,但或許,更重要的原因,是商湯在AI時代的定位——
提供全套AI落地,實現降本增效的解決方案。
相比于各類AI公司創造一個全新場景,或許對于人工智能尚未普及的當下,利用大模型改造現存場景以提升生產力,才是產品視角下更現實的思路。
一臺AI,等于一個初級程序員的年薪
大摩此前一份研報顯示,中國生成式AI應用的日活正在飛速增長,但平均每日的使用時間大多只有短短的6-8分鐘。
這正說明對于普通人而言,本該成為先進生產力的AI工具,仍舊處于“嘗鮮”階段。
這不僅僅是AI所遇到的問題,絕大多數生產力工具在普通人手中都難逃“買前生產力買后愛奇藝的命運”, 平板電腦的沒落,Vision Pro遇冷都是如此 。
目前大多數引爆社交平臺的AI應用,也都是娛樂為主,比如之前的“決戰拜年之巔”“舔狗模擬器”。
這些利用AI創造出的全新場景幾乎沒有發揮其作為先進生產力的能力,更好的思路或許還是應該利用AI提升現有場景的效率。
譬如辦公應用。
對于絕大多數企業而言,使用Saas,甚至是外包等服務的出發點都出奇的類似:它能為我省多少錢?
這筆賬很好算, 人力外包財務外包等公司大行其道,請一個外包和招三五個專員之間的人力費用差能夠清楚落在每年的財務報表中,但購買人力軟件或是財務軟件到底能省多少錢則是見仁見智的問題 。
企業大多將其歸類在IT費用中,而這筆費用通常只占公司運營成本的2%~5%,再怎么折騰也是螺螄殼里做道場。
因此對于Saas軟件而言,如何將自己的定位從“IT成本”轉換到“人力成本”,是當下最迫切的難題。而提供先進生產力的AI,與之高度契合,起到一個“10個人用AI工具,能夠帶來12個人的產出”的效果。
商湯給出的解決方案,是一臺一體機。
簡單而言,商湯一體機系列產品就是一臺部署在本地,預置搭載各類適用于不同場景的大模型,一方面是為了提供辦公場景使用AI提效的方案,另一方面則是出于數據需要私有化部署的安全問題做出的考量。
一個典型案例就是商湯日前推出的“小浣熊家族”。
以代碼小浣熊為例,它依托日日新基礎模型,專注于智能編程助手功能,支持Python、Java、JavaScript、C++、Go、SQL等30+主流編程語言和VS Code、IntelliJ IDEA等主流IDE,實際應用中,可幫助開發者提升編程效率超50%。
并以此為基礎,同步推出代碼小浣熊推理一體機輕量版,與代碼小浣熊相同的編程助手功能,但部署于本地,主打高性價比、開箱即用、數據安全以及能夠完成國產化芯片的適配。
有意思的是,這臺代碼小浣熊一體機售價35萬元,差不多正好是一個初級程序員的年薪。
在醫療、政務、金融等行業,商湯同樣推出了相應的一體機產品,這些產品其實解決的都是同一個問題,即利用AI的信息數據處理能力,實現更高效的決策。
它們最終都依托于商湯的基礎模型能力之上。
大算力+大模型雙輪驅動
商湯的模型能力,首先依托于其“大裝置”,也就是算力。
在今年3月的一次訪談中,山姆阿爾特曼明確指出算力將會成為未來的貨幣,并且成為全球最寶貴的資源。
假如算力價格異常高昂,那么從商業角度考慮可能只會被用來解決癌癥治療或者發射火箭之類的重大事件,反之如果算力價格低廉,那么大家才會用它來解決日常問題。
從這個角度來看,AI的落地和普及首先需要的是低成本的算力。
目前,商湯大裝置總算力規模在超過4.5萬塊GPU的加持下,達到12000 petaFlOPS。
量化來看,這個算力可以支撐超過20個千億級參數大模型同時訓練,并支持萬億參數大模型的全生命周期生成。
龐大的算力只是基礎,用戶真正需要的是低價的算力,多卡集群的效率就是算力成本的關鍵,兩張GPU互聯往往會產生1+1<2的結果,這種損耗往往導致了算力成本的激增。
而商湯實現了萬卡的超大集群互聯,并保持90%的加速效率。
在訓練穩定性上,商湯實現了超30天穩定訓練不間斷的能力,而出現訓練間斷時的診斷恢復時長也優化到了半小時。
在大模型推理服務上,商湯也實現了領先業界的推理極致優化,過去一年內推理服務的性價比提升了3倍,為客戶提供了業界性價比最優的大規模彈性推理服務。
在提供算力這項基礎設施之外,商湯為解決重復造輪子的問題,推出了云端、端側、邊緣側全棧基礎大模型矩陣。
用戶可以按照自己的需求選擇最適合自身場景的大模型進行微調,做到即取即用、開箱即用。
云端大模型即商湯日日新5.0,在一眾評測基準中對標GPT-4 Turbo,并以此為基礎開發出一系列模型,例如對話模型SenseChat、多模態大模型SenseVision、擬人大模型SenseChat-Character、以及營銷、醫療、文生圖等一系列模型。
數量眾多的模型看似散亂,但其實商湯只是在當下最常見的一些AI應用場景中“打樣”,其目的則是說明在日日新基礎模型之上,可以輕松微調出一系列適合企業自身場景所需的形態。
與之類似,端側模型SenseChat-Lite面向手機平板智能汽車等輕量場景,邊緣側產品“一體機”則是部署在本地,提供給數據需要保存在本地,有隱私需求的企業使用。
通過大裝置+大模型的雙輪驅動,給予不同企業最匹配自身情況的解決方案,最終實現“模型即服務”的商業模式。
每個行業都可以有一套“商湯模式”
商湯在商業化落地上的嘗試早已開始。
近日商湯發布的2023年年報顯示,其生成式AI業務收入短短一年從零達到12億元,這塊收入主要來自于一些2B的場景,為企業提供AI解決方案。
例如小米的小愛同學,是一個典型的B2B2C的場景。
此前與小愛同學的對話基本停留在操控智能家居,和簡單的知識檢索型的問答,能力非常有限,還經常出錯,比如那個經典段子:“我有21萬,小愛讓我買本田思域”。
在這個過程中想讓小愛變得更加智能有三個難點:響應速度、信息收集、輸出內容處理。
商湯與小米小愛的合作正是基于這三個問題。
首先在接入商湯大模型后,小愛在用戶說完話之后能夠在兩秒內完成響應。其次在商湯大模型的信息檢索能力輔助下,小愛生成的回答都會由明確的引用來源。最后在保證了時效性的同時,商湯大模型可供微調的能力保證了小愛不會攻擊友商。
另一個典型案例是商湯醫療領域大模型“大醫”。
面向醫生端,其拓展了臨床輔助決策、醫學文獻解讀、醫學統計助手等一系列全新使用場景。
不僅支持智能分析解讀論文PDF文件,還可幫助醫生在“0代碼”條件下完成復雜醫學數據統計并獲取可視化醫學統計圖表,成為醫生診療、科研工作的得力助手。
面向患者端,商湯科技推出健康管理小程序,在移動端實現用藥咨詢、體檢報告解讀、檢查檢驗結果分析、健康檔案管理等多樣化功能,為用戶打造“專屬AI健康管家”,實現全周期個人健康管理。
類似的場景涉及各個行業,比如在辦公場景中,商湯與金山辦公達成合作,內置在WPS 365各個場景中,譬如代碼生成工具和文檔表格管理。
又比如在金融領域,商湯與海通證券合作,在智能客服、合規風控、代碼輔助、展業辦公助手等領域助推業務落地,并共研智能投顧、輿情監控等行業前沿場景。
去年9月,紅杉資本曾發表過一篇文章,認為AI浪潮正轉向“第二幕”,即利用新技術端到端地解決現實社會中的問題。
但當時的紅杉認為,進展效果并不理想,大模型仍需要證明價值。
而商湯如今所做的,正是在各個行業深入合作,將大模型與產業、應用場景結合,探索出一套解決現實問題的方案。
編輯:李墨天
視覺設計:疏睿
責任編輯:李墨天
封面圖片來自ShotDeck
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.