在云廠商自研芯片的浪潮中,亞馬遜云科技無疑是最早踐行這一趨勢的先驅。自其邁出自研芯片的第一步起,便如同一顆石子投入平靜的湖面,激起了層層漣漪,引領著云服務和云上算力向著更高性能、更低成本的方向演進。
早在2012年,自研Amazon Nitro系統的計劃已經開啟。目前亞馬遜云科技已推出四大自研芯片產品家族:六代Amazon Nitro系統、四代通用處理器芯片Amazon Graviton、兩代機器學習訓練芯片Amazon Trainium和兩代機器學習推理芯片Amazon Inferentia。
自2018 re:Invent 上推出第一代芯片以來,Amazon Graviton家族已經歷了四代迭代。在企業降本增效的大趨勢下,基于Amazon Graviton的Amazon EC2實例以及托管服務正成為越來越多客戶的選擇。
目前,亞馬遜云科技基于Amazon Graviton的Amazon EC2實例種類達150多個,在全球已經部署的的Amazon Graviton處理器數量超過200萬個,并擁有超過50,000客戶,其中也涵蓋了Amazon EC2前100客戶90%以上。
今天我們就來看看Amazon Graviton在性能、商業落地方面的最新進展。
很多人可能好奇,作為云計算開創者的亞馬遜云科技為什么要自己做芯片?我們可以從一個側面探尋其動因。
在2022年的亞馬遜云科技芯片創新日(Silicon Innovation Day)活動上,亞馬遜高級副總裁兼杰出工程師James Hamilton回顧了亞馬遜云科技自2012年開始的自研芯片歷程。
Hamilton 表示,“最終,單臺服務器的核心功能將集成為一個芯片系統。如果服務器上所有的創新將全部集中在芯片上。而我們不制造芯片,那么我們就沒有創新。”
Hamilton強調了亞馬遜云科技將繼續加大在硬件研發方面的投入,推動下一代處理器的創新,以滿足全球客戶日益增長的需求。他堅信,隨著技術的不斷發展,亞馬遜云科技將繼續保持在云計算和硬件設計的前沿,引領行業走向更加高效、智能的未來。
回到Amazon Graviton,經過5年多的迭代,這一系列通用處理器芯片已經在技術、場景、商業各方面展現出日趨成熟的表現。
技術成熟:性能提升功耗下降無止盡
很多人不知道的是,在云計算廠商的身份外,亞馬遜云科技自主完成所有自研芯片的開發工作,所有芯片均由Annapurna Labs團隊設計和制造。
Annapurna Labs是亞馬遜云科技于2015年收購的半導體微電子公司。早在收購之前,雙方就在Nitro系統的開發方面緊密合作。對Annapurna Labs的收購加速了Nitro系統的開發,并加強了亞馬遜云科技在硬件領域的創新實力。
目前,Annapurna Labs團隊成員分布在全球多個地點,包括以色列的特拉維夫、加拿大的多倫多,以及德克薩斯州奧斯汀的實驗室。
“我們的宗旨是為客戶提供更多選擇、更低成本和更高性能。” Annapurna Labs芯片工程總監Rami Sinno表示。“通過自主完成所有芯片的開發,避免依賴第三方,我們能夠加速產品的交付進程。”
亞馬遜云科技首席工程師Ali Saidi負責Amazon Graviton系列處理器的技術開發
負責Amazon Graviton技術開發的亞馬遜云科技首席工程師Ali Saidi及其團隊在Graviton系列的設計、制造和包裝方面不斷創新。譬如,在Graviton3中,研發團隊將七個小型定制晶片和約550億個晶體管整合到一個中央處理器(CPU)中。
圍繞更佳性價比這一目標,每一代的Amazon Graviton都會比上一代有兩位數的性能提升,且實現單位算力功耗的持續下降。譬如:
2021年推出的Amazon Graviton3,單核性能比Amazon Graviton2提升25%,浮點性能提升2倍,與同類型其他Amazon EC2實例相比,可節省60%的能源消耗。同時還首次在云計算芯片中采用性能更強、功耗更低的DDR5內存。
2023年推出的Amazon Graviton4較上一代產品性能提升高達30%,獨立核心增加50%以上,內存帶寬提升75%以上。
此外,通過Amazon Graviton4,亞馬遜云科技實現首次面向實際應用設計CPU架構,即從傳統的MicroBenchmark基準測試評價體系,轉向以實際工作負載進行評價標準。通過真實工作負載雷達圖,可以更好地衡量實際工作負載的優化效果。
場景成熟:支撐廣泛的應用場景
歷經四代產品迭代,目前Amazon Graviton支持廣泛的應用場景,包括高性能計算、機器學習、人工智能、容器化應用構建、數據分析等等。比如:
在機器學習領域,Amazon Graviton在運行TensorFlow、PyTorch等深度學習框架時有出色表現,適合模型訓練和推理任務,尤其在需要大量數據處理和矩陣計算的場景下。
在容器化應用構建領域,Amazon Graviton對多種容器編排工具(如ECS、EKS、Kubernetes等)和鏡像倉庫(如ECR、Docker Hub等)的支持,方便用戶在Amazon Graviton上部署和管理容器化應用,適合微服務架構和DevOps環境。
在數據分析領域,Amazon Graviton可以在EMR、Spark等大數據分析框架上運行,支持批處理和流式數據分析等場景,適合實時數據分析和處理大規模數據集。流行的Spark框架在Graviton3上可以獲得16.7%的成本節約。
亞馬遜自身也是Amazon Graviton芯片的典型用戶之一。2021年Prime Day期間,亞馬遜首次使用Amazon Graviton2支持的Amazon EC2實例。2024年Prime-Day期間,亞馬遜使用了超過25萬個Graviton芯片為超過5800種不同的亞馬遜電商服務提供支持。
商業成熟:新實例中“三分天下有其一”
第三方數據顯示,在2023年推出的M7g系列實例中,采用Amazon Graviton的實例已經與英特爾、AMD三分天下,這進一步驗證了Graviton芯片在通用實例中的受歡迎程度。
根據云成本管理和優化平臺Vantage的一項調查,2024第一季度,在Amazon EC2 M7系列通用實例的成本支出方面,采用Graviton的M7g系列已經超過三分之一(34.5%)。
2024年第二季度,在Amazon RDS、Amazon ElastiCache和Amazon OpenSearch托管服務中,客戶選擇使用基于Amazon Graviton已超越了英特爾,越來越多客戶選擇基于Graviton的托管服務。
由于Amazon Graviton系列芯片對性價比的不斷提升和廣泛的應用場景,其也深受中國企業的青睞。
比如,全球領先IoT云平臺涂鴉智能已經將整個公司40%以上的工作負載遷移到Amazon EC2 M6g和C6g新一代實例。跟上一代同配置的X86實例相比,CPU性能提升了100%,服務器單價降低20%,整體性價比提升2.5倍。
加速出海的互聯網科技公司大宇無限通過使用 Amazon EMR on EKS,以及亞馬遜云科技基于 ARM 架構的 Graviton2 實例,將運行大數據作業的整體性能提升了 30%,成本降低了 20%。
如今,亞馬遜云科技的自研芯片之路已經走過十余年。透過已經全面成熟的Amazon Graviton系列芯片,亞馬遜云科技實現深度整合硬件與軟件,不僅大幅提升了云服務的體驗與效率,更為全球用戶帶來了前所未有的云端算力性價比,開啟了云計算領域的新篇章。
本文為「智能進化論」原創作品。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.