文|孫靜
上線15年,蘋果應用商店的App數量達到180萬個。繁榮的應用生態,直接為蘋果帶來的運營利潤率據信超過70%。
生成式AI的熱浪涌動以來,構建一個繁榮的應用生態、成為下一個App Store甚至iOS成為眾多科技巨頭追求的目標。不過從目前進展來看,從基礎大模型走向AI原生應用的爆發,這個過程障礙重重。
底層IT基礎設施重構、大模型使用成本、應用研發范式,環環皆門檻。
在AI原生時代的「憤怒的小鳥」出現之前,位于變革底層的云計算產業以及云服務商應該如何自我重構、如何磨平大模型的準入門檻去加速AI原生應用生態的繁榮?面對大模型浪潮,企業客戶訴求又發生了哪些變化?
在2023百度云智大會·智算大會期間,《降噪NoNoise》對話了百度集團副總裁侯震宇。
在國內云計算廠商中,百度智能云是最早進行大模型「適配」的一家。今年3月27日,百度智能云基于剛上線的文心一言,推出面向企業客戶的千帆大模型平臺;8月31日,千帆平臺全面開放,近4個月內的大模型日調用量增長了10倍。
作為百度智能云事業群云計算產研以基礎技術工程團隊的負責人,侯震宇向我們分享了百度智能云的最新業務布局,以及百度內部對于行業發展趨勢的最新判斷和思考。
01
降模型成本
2024年非常關鍵的事
今年以來,算力已經被公認為是大模型競爭的「軍火庫」。這不僅讓英偉達的市值超過英特爾,也讓其財報中的GPU收入超過了手機芯片之王高通。
但算力的另一面是GPU供應緊張、價格昂貴。成本壓力是會層層傳導的。
比如AWS首席執行官Adam Selipsky前不久在談到整個行業時曾直言:「我接觸過的很多客戶都對運行其中一些模型的成本感到不滿。」
在這個問題上,中美企業所面臨的挑戰并無不同。在同《降噪NoNoise》交流時,侯震宇提到他的一個判斷——預計2024年整體算力資源供應的不確定性或者說緊張程度仍然比較大,所以云計算廠商面臨的共性問題是如何更高效地使用算力資源。
其實不僅是算力資源昂貴,目前人力資源、數據資源(如數據標注),本身成本也很高?!复_保大家用足夠少的錢能訓練出來想要的模型,以及用一個客戶可接受的成本使其真的把AI大模型用起來,這些會是2024年非常關鍵的事?!?/p>
目前,國內云計算廠商的思路大多是在保證同等效果前提下,通過推理優化、模型訓練工具鏈優化等,以縮短算力使用時間。
以百度智能云為例,其主要通過基礎設施層的異構計算平臺「百舸」、大模型平臺層的「千帆」互相打配合,以實現算力性價比。
追求算力性價比的方向無非兩個:一是提高GPU利用率,縮短使用時間。比如在大模型訓練環節,百度通過分布式并行訓練策略和微秒級互聯,讓萬卡規模集群訓練的加速比達到95%、萬卡集群有效訓練時間占比達到98%。
「百舸」升級到3.0版本后,訓練和推理場景的吞吐量據稱可提高30%-60%,這些意味著原來要用100天的訓練,現在可能只用70天,節約時間等于間接省錢。
二是適配成本更低的AI芯片,除英偉達外,千帆平臺還兼容昆侖芯、昇騰、海光DCU、英特爾等國內外主流AI芯片。畢竟不是所有訓練都需要動用H800這種頂格待遇。
通過組合選項,理論上客戶可以用最小的切換成本完成算力適配。這種屬于直接省錢。
不過再怎么省錢,前提還是要保證AI模型的效果。若達不到客戶的預期效果,云服務商對算力資源「算計」再多,也是沒有意義的。
02
AI原生應用生態,需要先“松土”
今年下半年以來,李彥宏在多次在公開場合奮力疾呼:別再卷基礎大模型了,跑偏了,現在應該去卷AI原生應用。
對于李彥宏所提建議,外界并不意外。AI原生應用是構建大模型生態繁榮的重中之重,也是百度等AI巨頭在大模型商業變現路上的核心變量。
未來的大模型變現,一部分將通過模型生產獲取收益,更多還是通過原生應用調用模型API帶來的算力消費,這部分將會是規模更大的收入來源。所以說,僅有算力未必能搞定一切,孵化生態更為重要。
反映到百度智能云,一是千帆平臺的「既要又要」——作為大模型層平臺,千帆上不僅有百度「文心大模型4.0」,還先后上架了50多個第三方基礎大模型和行業大模型,相當于搞了個「大模型商店」;二是「賣鏟子」——為企業提供大模型開發的全流程工具鏈和整套環境。
在AI原生應用層,為降低開發門檻,百度智能云宣布AI原生應用開發工作臺——「千帆AppBuilder」全面開放,將開發大模型應用的常見模式、工具、流程,沉淀成一個工作臺。通過上面的應用組件和應用框架,開發者、企業可以快速搭建AI原生應用。
這就好比一名想要出租房屋的房東,他不僅要把毛坯變成精裝,還要提供床、沙發等生活基本套件,最好能做到租客拎包入住,只有這樣,房屋的出租、流轉效率才有可能提高。
我們從交流中獲悉,百度智能云早期并沒有意識到一個問題——許多開發者還不擅長使用大模型做應用開發。
他們訪問了一批開發者,想要知道當這些人想到了一個檢索增強的框架、希望用一個Agent的時候,自己知不知道一個Agent該怎么搭建?
結果發現,很多人真的以為只用大模型Prompt接口,就可以完成應用開發。
這也說明,要構建一個百萬級的原生應用生態,平臺需要率先為開發者松松「土壤」、掃除各種障礙,而不是等后者直接被研發新范式「勸退」。
畢竟開發者是應用爆發的主要推動力量。
「如果沒有應用調用,意味著你做出來這個模型效果不夠好或者大家用不起,意味著這個產業就有問題?!购钫鹩钐嵝?,只有行業客戶的場景里有更多的AI原生應用落地,構建出新的應用生態,才能真正實現大模型的價值。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.