導讀:從云棲大會2023,看懂阿里云在大模型時代的生態位。
AIGC時代,大模型已經成為云服務商的核心賽道。
作為亞太地區最大的云服務商,阿里云在2023云棲大會公布了其在大模型領域的最新進展:發布自研大模型通義千問2.0版本和8個行業(場景)大模型,以及一站式大模型應用開發平臺百煉。
在國內“百模大戰”不斷升級的格局下,阿里云處在一個什么樣的生態位?
表面上看,在基礎大模型能力方面,通義千問可能不是最近距離追趕GPT4的。2023云棲大會上發布的通義千問2.0,綜合性能超過GPT3.5,而隔壁百度文心一言4.0已宣稱綜合水平“與GPT-4相比毫不遜色”。
在自家行業模型落地方面,阿里云也不是動作最快的。云棲大會上,通義千問剛剛發布了通義聽悟、通義靈碼等8個行業大模型。相比之下,截止今年9月,華為云盤古大模型已經積累了20多個行業大模型和400多個AI應用場景。
那么,“百模大戰”中阿里云的差異化競爭力在哪?阿里巴巴董事局主席蔡崇信在云棲大會上明確表示:阿里云要做AI時代最開放的一朵云。
開源開放,就是阿里云在AIGC時代找到的錨點。自2023年4月發布通義千問正式入局大模型賽道以來,可以看出,阿里云一直在圍繞開源開放布局大模型技術生態。
2023年8月-9月,通義千問開源7B、14B參數大模型后,阿里云在云棲大會上宣布通義千問72B模型即將開源,屆時將成為中國參數最大的開源模型。開源社區魔搭ModelScope已聚集2300多款AI模型,AI模型下載量突破1億,成為中國規模最大、開發者最活躍的AI社區。目前中國80%的科技企業和一半的大模型公司都跑在阿里云上,包括百川智能、智譜AI、零一萬物、昆侖萬維、vivo、復旦大學等企業及機構。
在AIGC時代,任何科技企業包括OpenAI,要做到基礎大模型的領先與先發優勢難度都非常高。作為云服務商,阿里云積極擁抱開源生態不失為一種優勢策略。
云計算第三次浪潮
針對此輪AIGC浪潮,黃仁勛等業內大佬紛紛拋出“AI的iPhone時刻、互聯網時刻”等評價,那么如何評估GPT浪潮對云計算的影響?
阿里云創始人、中國工程院院士王堅博士認為,“2023年,人工智能與云計算在60年后自然地走在一起,是云計算的第三次浪潮”(自約翰·麥卡錫在1956年首次提出人工智能概念算起),前兩次分別是互聯網企業上云和傳統企業上云。
2000年美國工程院評選的《二十世紀最偉大20項工程技術成就》榜單中,排在第一名的是電氣化??梢哉f,電氣化催生了其余19項成就的出現,包括無線電與電視、電話、家用電器、計算機、因特網等等。
王堅博士認為,云計算就像電,兩者都是“你每分每秒都在用,但不會感覺到它的存在?!?/p>
如果將當前的人工智能革命類比100多年前的電氣化革命,云計算與大模型的關系,就像電和電機的關系。
根據工信部數據,電機能耗約占整個工業能耗的65%以上,占全國總耗電的60%。未來,云計算大部分基礎資源將被大模型消耗掉。
這一判斷與很多業內觀點不謀而合,比如2023年8月,一向專注硬件創新的英偉達發布生成式AI和超級計算云服務。這背后是黃仁勛對未來的判斷,智能時代“所有計算,都將以云的方式提供。”
圍繞“電與電機”這樣的趨勢判斷,阿里云已經在為智能時代的云底座做準備:
在電(云端算力等基礎設施)的部分,目前阿里云提供了國內公共云市場三分之一左右的算力,其中也包括大模型所需的先進異構算力資源。
在電機(大模型)部分,阿里云保持著自研大模型處在第一梯隊的領先性,更重要的是為更開放的大模型生態構建全棧AI基礎設施。
大模型不是僅靠算力資源堆積就能做好的,而是一個系統工程。阿里云早在2009年就提出過“數據中心是一臺計算機”的理念,現在大模型正是這種理念的最佳應用場景。
不僅底層計算、存儲、網絡能力需要針對智算場景進行優化,還要融入容器、Serverless、數據庫、大數據領域的智算創新。此外,云與用戶的交互形態也在向“自動駕駛”進化,比如阿里云上已經有超過30款云產品接入了大模型能力。
在家用電器(智能應用)部分:借助開放的AI基礎平臺和工具,千行百業企業利用自身私域數據與個性化場景,將大模型能力為我所用。
錨定開源一路狂飆
ChatGPT 一騎絕塵后,GPT4選擇閉源,不再公布技術細節,模型架構、參數量、數據集、token數、成本都成為黑箱,但業界卻不斷有爆料信息發出。
今年Meta的LLaMA系列大模型用開源為大模型生態撕開一個口子。在開源勢力中瘋長的還有Hugging Face這樣的社區。
被稱為AI領域的GitHub的Hugging Face是全球最大的大模型開源社區。2023年9月,Hugging Face獲得谷歌、亞馬遜、英偉達、Salesforce、AMD、英特爾、IBM 和高通的共同投資,估值達到45億美元。目前,Hugging Face上的預訓練模型數量超過30萬個,數據集5.8萬個。
國內大模型開源陣營中,不乏昆侖萬維、百川等頭部玩家,但阿里云是云計算大廠中率先開源的。
2023年8月,通義千問開源兩款70億參數模型QWen-7B 和QWen-7B-Chat,開發者可以在在Hugging Face和魔搭ModelScope平臺上免費使用。目前,Qwen-7B等模型累計下載量已接近100萬。
據悉,這兩款模型在多個測評基準中取得了超過業界同尺寸開源模型的效果,在部分測評中甚至“躍級”趕超了部分更大尺寸模型。不少開發者在公開平臺分享認為,通義千問開源模型更具普惠性,能夠以較小成本、較高性能滿足大部分開發者的需求,這對于硬件投入預算不高的中小企業和個人開發者非常友好。
9月25日,阿里云再次開源通義千問140億參數模型Qwen-14B,Qwen-14B在多個權威評測中遠超現有同規模模型,部分指標甚至接近llama2-70B。
接下來,通義千問72B模型也將開源,屆時將成為中國參數最大的開源模型。
魔搭社區ModelScope也是阿里云大模型開源生態的重要一環。目前魔搭社區匯聚了280萬AI開發者,模型下載量超過1億,是中國規模最大、開發者最活躍的AI社區。魔搭社區還免費為開發者提供超3000萬小時的GPU算力。
目前,包括百川智能、智譜AI、上海人工智能實驗室、IDEA研究院等都選擇在魔搭社區首發自己的開源大模型。
大模型開源的前提
開源的前提一定是技術領先。
隨著開源大模型日漸增多,開源大模型同樣面臨著激烈的競爭,在全球AI開發者用腳投票下,模型下載量和口碑都是公開的考題。
“從阿里云創辦的第一天開始,企業就堅信,不開放,就沒有生態。沒有生態,就沒有未來。這些年,我們始終在攀登技術的高峰,因為只有站在更先進更穩定的技術能力之上,才有開放的底氣?!睆牟坛缧旁谠茥髸闹v話可以看出,阿里云對開源大模型的投入力度。
阿里云如何保持大模型的領先性,這離不開底層的人工智能平臺PAI。通義千問就是通過人工智能平臺PAI訓練而來。
今年云棲大會,阿里云全新升級了人工智能平臺PAI,底層采用HPN 7.0新一代AI集群網絡架構,支持高達10萬卡量級的集群可擴展規模,超大規模分布式訓練加速比高達96%,遠超業界水平;在大模型訓練任務中,可節省超過50%算力資源,性能全球領先。
更重要的是,其他大模型企業也可以借助PAI平臺的訓練和推理能力,打造領先的專屬大模型。
目前,百川大模型、智譜AI ChatGLM、零一萬物大模型等都在借助超高性能分布式模型訓練平臺PAI靈駿,與超低延時模型推理與服務平臺PAI靈積,加速自身大模型的創新。零一萬物聯合創始人馬杰表示:“阿里云PAI靈駿智算服務為零一萬物提供了高性能AI訓練集群和工程平臺,助力零一萬物自研大模型,推動其AI-first的技術和應用生態?!?/p>
結語
從國外云巨頭的財務數據上看,云計算第三次浪潮已經開始顯現。
今年第三財季,微軟智能云Azure和其他云服務的收入增長29%。微軟管理層認為,高于預期的AI消費推動了Azure的收入增長。
亞馬遜CEO Andy Jassy近日也表示,預計生成式AI所帶來的機遇將在未來幾年為亞馬遜云服務(AWS)帶來“數百億美元”的收入。
在國內云服務廠商中,AIGC增量帶來的財務體現還沒有那么快到來。
王堅博士認為,“云計算的第三次浪潮可能要幾十年才能到高峰?!?/strong>
幸運的是,我們都有機會成為這次浪潮的見證者??梢灶A見,在人工智能開啟的云計算新時代中,開源力量一定會有一席之地。
文中圖片來自攝圖網
本文為「智能進化論」原創作品。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.