生成式 AI 已成為全球云計算廠商競相逐鹿的戰略高地。其中,基礎設施、模型平臺、應用生態成為頭部玩家競相發力的三大細分戰場。
不久前的2024 re:Invent上,亞馬遜云科技向外界展示了其在這三大領域的最新進展。
在基礎設施層,亞馬遜云科技更強調數據與AI的無縫融合,解決大模型落地過程中資源利用和數據分析等難題。
在模型層,Amazon Nova 系列模型是一大亮點,其強調多模態、低成本和實時性,這與當前企業對基礎模型的需求高度契合。
在應用層,以Amazon Q為代表的生成式AI應用,不斷加快智能體與編程助手、數據分析、企業辦公等應用場景的深度結合。
在近日舉行的re:Invent 2024中國行活動中,亞馬遜云科技進一步向國內媒體解讀了其生成式AI戰略與技術創新背后的思考。
“我們不僅在云的核心服務層面持續創新,更在從芯片到模型,再到應用的每一個技術堆棧取得突破,讓不同層級的創新相互賦能、協同進化。”亞馬遜云科技大中華區產品部總經理陳曉建表示。
亞馬遜云科技大中華區產品部總經理 陳曉建
基礎設施層:持續發力自研芯片,數據+AI融合
在基礎設施層,自研機器學習芯片與Amazon SageMaker平臺的迭代最為引人關注。
Trainium是亞馬遜云科技2022年推出的自研機器學習訓練芯片,其專為大型、前沿的生成式AI工作負載設計,目前已經迭代到第二代。基于Amazon Trainium2的EC2 Trn2實例已正式可用,較當前GPU實例性價比提升30-40%。
隨著模型規模的不斷擴大,更多企業希望以更快的速度和更低的成本訓練大模型。這正是兼具性能與成本優勢的Trainium芯片的機會。
數據和AI公司Databricks計劃使用Trainium2為客戶提供更優的性能,并將總體擁有成本降低多達30%。AI開源平臺Hugging Face為了讓開發者更快地開發和部署模型,已將亞馬遜云科技推理和訓練芯片Amazon Inferentia和Amazon Trainium集成到Optimum Neuron開源庫中。
Claude背后的初創公司Anthropic將成為Trainium最大的客戶。亞馬遜云科技與Anthropic正攜手打造名為Project Rainier的EC2 UltraCluster計算集群,其包含數十萬顆Trainium2 芯片,算力超越以往集群5倍以上。據悉,該集群有望成為迄今為止公開的最大 AI 計算集群。目前Anthropic已開始優化Claude模型,以便在Trainium2上運行。
亞馬遜云科技還預告了3納米工藝的Amazon Trainium3將在2025年晚些時候推出,其計算性能將會提升到Amazon Trainium2的兩倍,能效最高可以提高40%。
本屆大會,Amazon SageMaker升級為數據+AI的統一平臺,致力于一站式解決生成式AI的數據分析、模型訓練、資源成本等關鍵難題。新一代Sagemaker涵蓋快速SQL分析、PB級大數據處理、數據探索和集成、模型開發和訓練以及生成式AI等功能。
“之前大家熟悉的Amazon SageMaker,現在升級為Amazon SageMaker AI。新一代Amazon SageMaker的邏輯是,客戶在構建生成式AI業務時,需要的不只是模型,更多的是數據加AI的統一。我們希望通過統一平臺為客戶提供從數據到AI的一體化體驗。”亞馬遜云科技大中華區數據分析與生成式AI的產品總監崔瑋表示。
Amazon SageMaker AI新推出新訓練配方功能、靈活訓練計劃和任務治理等功能。
比如,新訓練配方功能Amazon SageMaker HyperPod現在提供30多個精選的模型訓練配方,可適用于時下熱門的一些公開可用模型,包括Llama 3.2 90B、Llama 3.1 405B和Mistral 8x22B。HyperPod任務治理功能通過自動化管理AI任務的優先級,可最大限度提高計算資源利用率,降低40%的成本。
模型層:自研模型與模型平臺大升級
在模型層,亞馬遜云科技推出Amazon Nova六款基礎模型,Amazon Bedrock新接入100多款模型,并推出AI防護、多智能體協作和模型蒸餾等重磅更新。
包括Nova Micro、Nova Lite、Nova Pro和Nova Premier基礎模型,以及圖像生成模型Nova Canvas和視頻生成模型Nova Reel。低成本、低延遲是Amazon Nova強調的優勢。在各自智能類別中,Amazon Nova Micro、Lite和Pro應用成本比Amazon Bedrock中表現最佳的模型至少降低75%,同時也是Amazon Bedrock中對應類別速度最快的模型。
“除模型本身外,亞馬遜云科技在各層級進行了創新。例如使用Trainium2 自研芯片,以及基于該芯片的Amazon EC2 Trn2實例和Amazon EC2 Trn2 UltraServers 服務器,還有Amazon Bedrock優化的低延遲推理選項等。這些共同幫助客戶在部署生成式AI應用時降低成本、提高效率。”崔瑋表示。
模型平臺Amazon Bedrock致力于“提供最多大模型選擇、滿足客戶所有場景需求”,其升級體現在幾個方面:
第一,更豐富的模型選擇。
目前Amazon Bedrock承載的第三方主流模型包括AI21 Labs、Anthropic、Cohere、Meta、Mistral AI以及Stability AI等。新推出的Amazon Bedrock Marketplace功能為提供100多個熱門、新興及專業模型。
第二,頭部模型首發或最新發布。
Anthropic與亞馬遜云科技的合作不斷加深,其計劃使用亞馬遜云科技自研AI芯片訓練和部署基礎模型。據悉,合作雙方將攜手為亞馬遜云科技的客戶提供早期訪問權限,可讓亞馬遜云科技的客戶在一段時間獨享Claude新模型。
Stable Diffusion 3.5是Stability AI目前最強大的圖像生成模型,該模型基于Amazon SageMaker HyperPod訓練,即將在Amazon Bedrock上線。
此外,Amazon Bedrock還是首家提供視頻生產模型Luma AI和軟件開發模型poolside的平臺。
第三,提升模型推理效率。
Amazon Bedrock新推出了低延遲優化推理、模型蒸餾、提示詞緩存等功能,大幅提升推理效率。比如,憑借低延遲優化推理能力,Claude 3.5 Haiku模型在亞馬遜云科技上的運行速度具有領先優勢。
應用層:Amazon Q加速深入商業場景
在應用層,AI助手Amazon Q致力于讓每個人都快速使用生成式AI工具。今年,Amazon Q系列服務更加深入軟件開發和商業應用場景。
軟件開發AI助手Amazon Q Developer增加三款新的智能體,能自動執行單元測試、文檔編制和代碼審查流程,并通過與GitLab深度集成,擴展應用場景。全球范圍的客戶,如澳大利亞聯邦銀行、英國電信集團、美聯航都使用Amazon Q Developer加速開發。
Amazon Q Business支持超過50種新操作,比如在Asana中創建任務或者在Teams中發送私人消息,這些操作覆蓋了當今廣受歡迎的第三方應用程序。此外,它還具備了使用智能體執行復雜工作流的新能力。
Amazon Q Business幫助用戶輕松連接到企業的數據和信息,通過回答問題、提供總結、生成內容來提高員工工作效率。美國國家橄欖球聯盟NFL基于Amazon Q Business構建的系統,將新員工培訓時間縮短了67%,員工可以在10秒內獲得問題答案。
結語
透過本屆re:Invent大會,我們可以看出,生成式AI時代亞馬遜云科技始終把自身定位在技術普惠和降低門檻的平臺型生態角色。
通過升級基礎設施、模型和應用三層技術棧,亞馬遜云科技加速數據與 AI 的無縫融合,加快自研模型步伐,推出具有競爭力的 Nova 系列基礎模型,并在應用層積極探索,正逐步構建起自身在生成式 AI 領域的差異化優勢。
本文為「智能進化論」原創作品。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.