生成式AI發展的瓶頸在算力,已經成為越來越多企業的共識。
根據IDC聯合多方發布的《2022-2023全球計算力指數評估報告》,全球 AI 計算市場規模將從 2022 年的 195.0 億美元增長到 2026 年的 346.6 億美元,其中生成式 AI 計算市場規模將從 2022 年的 8.2 億美元增長到 2026 年的 109.9 億美元。
生成式AI的算力挑戰不僅體現在硬件和資金投入力度,而是一個軟硬件協同的系統工程。作為生成式AI的底層基礎設施,云計算在破解算力挑戰方面有著先天的優勢。在不久前的中國峰會上,亞馬遜云科技向外界分享了其應對算力挑戰的策略。
各行各業都在爭搶AI算力
生成式AI正在為各行各業帶來巨大變革。亞馬遜全球副總裁、亞馬遜云科技大中華區執行董事張文翊認為,生成式AI將從四個方面為企業帶來價值:創造全新的客戶體驗、提高企業內部員工的生產力、幫助企業提升業務運營效率、以及提升企業在內容創作方面的效率。
正是由于生成式AI應用維度的廣泛性和普適性,不少機構預測,各行各業未來數年間運用生成式AI的比例都將大幅提升,由此導致對AI算力需求的井噴。
比如在營銷領域,Gartner預計到2025年,大型企業機構對外營銷信息中的合成信息比例將從2022年的不到2%上升到30%。
在游戲行業,AIGC可以用于游戲開發中的角色生成、場景設計和任務生成等場景。根據Market.us發布的《生成式AI游戲市場》調查顯示,生成式AI在全球游戲市場的規模將以23.3%的復合年增長率增長,到2032年將帶來71億美元的增量收入。
在制造行業,到2027 年,30%的制造商將使用生成式AI 提高產品研發的效率。
亞馬遜云科技大中華區產品部總經理陳曉建認為,生成式AI導致的算力需求井噴呈現三個特點:
首先,企業需要更高性價比的軟硬件解決方案以應對算力資源緊缺。
第二, 云服務需要提供快速高效的彈性資源供給,以應對生成式AI的迅速發展和快速變化的業務需求。
第三, 云服務需要進一步降低使用門檻,讓客戶能快速上手。
應對算力挑戰的三大抓手
針對這一輪各行業對AI算力需求的痛點,亞馬遜云科技從三大維度,自研芯片創新、彈性的計算存儲組合以及Serverless架構,幫助客戶簡化運維,以更高性價比滿足多樣算力需求。
第一, 聚焦自研芯片,通過全面深入的基礎設施能力,打造算力“加速器”。
芯片性能和高質量訓練既是生成式AI爆發的基礎。亞馬遜云科技的算力基礎設施中,不僅涵蓋來自Intel、AMD、英偉達等品牌頂尖的芯片產品,其自研芯片體系也在日益完善和壯大。目前,已經形成了Nitro、Graviton、Trainium和Inferentia在內的完整產品線。
Nitro是云服務器虛擬化引擎,通過硬件虛擬化,可將物理服務器的系統資源占用降低至不到1%,并實現了網絡和存儲在硬件級別的隔離機制,最大限度保證用戶數據通信的安全。
在AI芯片方面,亞馬遜云科技不斷加速訓練芯片Trainium和推理芯片Inferentia的迭代,以滿足企業對大模型高效訓練與推理的需求。
比如,基于Trainium的Trn1實例和通用的GPU實例對比,在訓練的吞吐率上面,單節點的吞吐率可以提升1.2倍,而多節點集群的吞吐率可以提升1.5倍。基于增強型Trn1n實例的網絡帶寬躍升至1.6Tbps,可將萬余個Trainium芯片構建在一個超大規模集群上,實現對超大模型進行并行訓練。
推理芯片Inferentia目前已經進化到第二代,適合大規模部署復雜的模型,例如大型語言模型(LLM)和Diffusion類模型。基于Inferentia芯片,亞馬遜云科技推出了專門為大型Transformer模型分布式推理建立的實例Inf2。以Stable Diffusion 2.1的版本為例,Inf2實例可實現50%的成本節約。
第二, 通過豐富靈活的計算實例的資源,滿足多種不同算力的要求。
“很多客戶都跟我們談到,‘我們知道這是潛力巨大的方向,但是我們也不知道在什么時候需要多少計算資源’,這就要求云服務公司能夠隨時隨地提供高度彈性化的資源供給。”陳曉建表示。
亞馬遜云科技提供600多種不同的計算實例,企業可以按需靈活配置處理器、網絡和存儲等資源,滿足多種不同算力的要求。
以存儲為例,數據規模到達PB級別時存儲方式變得非常重要,“熱、溫、冷、凍”不同類型的存儲方式,成本和性能都有很大差別。Amazon S3對象存儲提供8種存儲層級,同時提供智能分層,自動選擇最適合的存儲層級。
第三, 針對簡化算力應用,亞馬遜云科技推動云服務全面邁向Serverless。
Serverless技術可以將云的彈性、敏捷性、按需付費的特性發揮到極致。目前,亞馬遜云科技已經實現了全棧數據服務的Serverless化,開啟了云服務全面Serverless的時代,讓客戶無需預置或管理基礎設施,就可以運行幾乎任何類型的應用程序或后端服務代碼。在瞬息萬變的大模型時代,Serverless也將成為越來越多企業快速應對不確定性,以最低成本進行AI技術創新的利器。
生成式AI時代,算力就是生產力,它對企業業務創新的價值從未像今天這樣重要。亞馬遜云科技以先進的性能、更優的性價比和全面的服務,不斷降低生成式AI的算力成本和使用門檻,力圖做到讓生成式AI觸手可及。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.