亞馬遜對開源的態度,與其對軟件生態的認知密不可分。
文|錢麗娜
ID | BMR2004
2024 財年亞馬遜云科技業務銷售額為 1076 億美元,與 2023 財年的 908 億美元相比增長 19%。
亞馬遜云科技業務的誕生,背景可追溯到互聯網泡沫破裂前的1998年,當時亞馬遜已經成為全球最大的在線書店。爆炸式增長的業務需求和電商大促流量洪峰等技術挑戰迫使亞馬遜在分布式系統、數據庫管理、網絡安全和高可用架構等方面進行了大量技術投入和探索,為今天AWS (Amazon Web Services,以下稱“亞馬遜云科技”)的誕生奠定了技術基礎。
2002 年 7月,亞馬遜推出了其第一個版本的“Amazon.com Web Services”,該平臺用于創建專門為開發人員和網站所有者設計的創新Web解決方案和服務,彼時云計算概念還鮮有人知。2003年,Benjamin Black 與人合著論文,幫助啟動了 Amazon Web Services 和 IaaS 云計算市場。當時亞馬遜管理網站工程團隊的Black與 Chris Pinkham 共事,Pinkham 敦促 Black 考慮如何更有效地擴展亞馬遜的基礎設施,他們探索了應用程序與基礎設施的抽象和解耦,意識到將基礎設施作為服務出售可能有很大價值,并將想法告知創始人杰夫·貝索斯,得到了他的批準。
2006年,亞馬遜云科技正式發布 Amazon EC2(計算)和 Amazon S3(存儲)服務,開創了云計算時代。這兩個服務的高可用性、高持久性、高擴展性設計理念以及按需付費模式,為數據的驅動創新提供了堅實后盾,并為大數據和人工智能時代的到來鋪平了道路。亞馬遜云科技秉持 API - first的理念,所有服務通過API提供,方便開發者集成和使用,為亞馬遜云科技的發展和生態系統建設奠定了基礎。
01
積極擁抱開源
開源軟件的出現早于亞馬遜,并在一定程度上成就了亞馬遜。像Linux 操作系統這樣的開源軟件,為如今包括亞馬遜云科技在內的大多數數據中心提供了支持,云計算、數據和開源軟件相互融合。
隨著云計算格局的成熟,亞馬遜開始認識到開源技術的戰略重要性,并更積極地擁抱開源,提供基于廣泛使用的開源技術托管服務。
亞馬遜云科技為PostgreSQL和MySQL 等各種開源數據庫推出了亞馬遜關系數據庫服務(Amazon RDS)。這使各組織能夠利用這些數據庫的強大功能,同時將維護任務交給亞馬遜云科技處理。此外,亞馬遜云科技還推出了彈性Kubernetes 服務(Amazon EKS),通過支持 Kubernetes,亞馬遜云科技與行業領先的容器編排平臺保持一致,以便與充滿活力的開發者和貢獻者社區進行互動。Amazon Lambda 允許開發者根據事件運行代碼,進一步集成了無服務器框架等開源工具,這種靈活性吸引了欣賞開源優勢的開發者。
除了提供托管服務外,亞馬遜云科技還開始直接為多個開源項目作出貢獻。這種參與有助于在社區內重建信任,并展示了亞馬遜云科技對協作的承諾。
比如亞馬遜云科技一直是 Kubernetes 的重要貢獻者,發布了許多開源工具,如亞馬遜云科技軟件開發工具包(SDKs)、Amazon Amplify 和云開發工具包Amazon CDK。這些工具使開發者能夠在遵循開源原則的同時在亞馬遜云科技上構建應用程序。
亞馬遜云科技新推出的 Amazon Bedrock 服務讓客戶能夠使用基礎模型,甚至 Amazon Bedrock 服務所提供的一些模型也是開源的,比如 Stability AI 公司的 StableLM 和 Stable Diffusion,以及DeepSeek公司發布的DeepSeek-R1。這一新策略使亞馬遜云科技得以創建一種全新的商業模式。
02
不會只有一個模型“一統天下”
亞馬遜對開源的態度,也與其對軟件生態的認知密不可分。
亞馬遜CEO Andy Jassy在2024 re:Invent大會上提出了亞馬遜自身部署人工智能中的三項關鍵洞察:首先,隨著生成式AI應用規模的擴大,計算成本變得至關重要。人們非常渴望獲得更高的性價比;其次,構建一個真正優秀的生成式AI應用實際上非常困難。最后,當讓開發者自由選擇他們想要使用的模型時,模型的多樣性顯而易見。
Jassy說:“這并不讓我們感到意外,因為我們一次又一次地學到同樣的教訓,即永遠不會有單一的工具能夠統治世界。”
同樣,也“不會只有一個模型‘一統天下’”,這是亞馬遜在技術發展歷程上的洞察。Jassy在一次演講中曾表示:“就像數據庫領域,探討了10年,大家會使用各種各樣的關系型數據庫或者非關系型數據庫。在分析領域也是如此,曾經大家覺得TensorFlow會成為唯一的AI框架,最終PyTorch成為了最受歡迎的那個。”
在基于大模型構建應用時,不同的應用場景需要的技術指標也各不相同,延遲、成本、微調能力、知識庫協調能力、多模態支持能力等等,都會因場景需求的不同而被取舍。
以快速響應場景為例,DeepSeek-R1的深層思考模式顯然不太合適,據了解其生成首個token的用時超過30秒,而Amazon Nova則只需要數百毫秒即可生成響應。目前的DeepSeek-V3模型是文生文模型,并不支持圖形等多模態信息的輸入。顯然,即便是DeepSeek也不是萬能的。
基于這一理念,亞馬遜云科技在提供領先的模型如Amazon Nova系列之外,更加致力于為企業用戶提供豐富的模型“選擇”,為此構建了輕松接入全球領先模型的Amazon Bedrock,并不斷擴展其模型“朋友圈”,現已有AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI和poolside等廠商入駐。
近期Amazon Bedrock正式上線了Luma AI Ray 2 模型。該模型是一款由Luma AI推出的最新版本視頻生成模型,可以廣泛用于內容創建、娛樂、廣告和媒體使用案例,從而簡化從概念到執行的創意流程。亞馬遜云科技還推出了Amazon Bedrock Marketplace功能,為客戶提供100多個熱門、新興的專業模型。
今年3月11日,亞馬遜云科技宣布,DeepSeek-R1現已作為完全托管的無服務器大語言模型(LLM)在Amazon Bedrock上正式可用,亞馬遜云科技是首個將該模型作為完全托管服務推出的云服務提供商。這次的發布堪稱在亞馬遜云科技上使用DeepSeek-R1的最佳打開方式,同時也是最省心的方式,集各種優勢于一身:滿血版的強大性能、完全托管的省心省力及極致彈性,同時盡享Amazon Bedrock的各種強大的構建工具與企業級的安全防護功能。
03
構建“全家桶”技術能力
基于場景選擇合適的模型只是構建應用旅程的第一步,隨著構建的深入,解決工程化難題的能力成為能否實現快速創新的關鍵。
Amazon Bedrock聚焦企業應用AI的實際需求,在模型選擇之外,增添了一系列重磅功能。借助Amazon Bedrock,包括DeepSeek-R1在內的領先模型都能輕松獲取這些實用功能,并由此進入構建應用的快車道。這些實用型功能幾乎涵蓋企業級AI創新的方方面面,可以簡要概括為以下4種工具類型:
優化效果、延遲和成本:如低延遲優化推理、模型蒸餾、提示詞緩存等功能,大幅提升推理效率。以模型蒸餾功能為例,它能夠將特定知識從功能強大的大模型轉移到更小、更高效的模型,運行速度最快可提高500%,成本降低75%。
基于企業自有數據的定制優化:模型微調功能和知識庫功能不斷豐富,現已支持GraphRAG等圖數據,并能夠快速且經濟高效地從文檔、圖像、音頻以及視頻中提取信息,并將其轉換為結構化格式的Amazon Bedrock Data Automation功能等。
負責任AI的安全和審查:Amazon Bedrock不斷豐富其Guardrails功能,以簡化企業實施負責任AI的投入,例如為其加入自動推理檢查功能,從而能夠輕松識別事實性錯誤,以提升生成回答的準確性。
實現復雜功能的多智能體功能:Amazon Bedrock不但提供智能體功能,還針對智能體的快速發展,進一步推出了多智能體協作功能,使客戶能夠輕松地構建和協調專業智能體來執行復雜的工作流程。憑借多智能體協作功能,客戶可以通過為項目的特定步驟創建和分配專用智能體,從而獲得更準確的結果,并通過編排多個并行工作的智能體來加速任務。
亞馬遜云科技大中華區解決方案架構總經理代聞說,從2006年3月14日亞馬遜云科技推出第一款產品發展到如今,亞馬遜云科技已擁有超過240項全功能的服務。亞馬遜云科技的核心軟件開發邏輯采用的是逆向工作法,即只有客戶有需求才會去進行相應開發,分析客戶所提問題背后的根本原因,進而開展創新。“客戶往往只會說需要更快、更便宜的GPU(圖形處理器),卻不會講實際上需要像ASIC(定制芯片)這種更具體的東西,因為后者才能真正為用戶解決它的痛點問題。在這種情況下,我們就會通過創新辦法來解決這類隱藏需求。”
亞馬遜云科技的創新呈現出矩陣式、全棧式的創新形態。從基礎的硬件到Amazon Bedrock平臺軟件,再到“speech to speech”的模型發布,其能力還會不斷增強。
對于開箱即用的服務,作為大型云服務提供商,亞馬遜云科技能夠實現全棧創新,而且每個層面的創新之間還存在聯動。基礎設施層面,要求提供更快、更高性價比的服務;平臺軟件層面,用戶通常會關心輸出能否可控,模型能否進行更好的比較;在模型能力層面,目標是要打造更具性價比、多模態、更高精準度且具備負責任AI特性的模型;在開箱即用服務層面,要考慮能否接入更多軟件。
“計算機科學先驅”Alan Kay曾說過“真正認真對待軟件的人應該打造自己的硬件”。當上層的軟件系統有了新的需求標準,底層就該以新的硬件方式去加速軟件運行效率。實際上,這個決定在最初時備受爭議,很多人并不看好一個云服務廠商能夠成功研發CPU。從2018年至今,亞馬遜走過了從0開始的ARM處理器發展歷程。幾個月前,亞馬遜推出了迄今為止最強大的Amazon Graviton芯片的第四代產品——Amazon Graviton4,其單核計算性能提升了30%,虛擬CPU數量和內存容量都是上一代的3倍。到如今新增的處理器中,超過半數都是Amazon Graviton芯片。這意味著在新增的處理器芯片里,Amazon Graviton芯片的數量比其他任何一款處理器芯片都要多,足以見得在云計算創新的大環境下,硬件創新的速度之快。“當下大家對于獲取高性能、低延遲且高性價比的硬件系統有了新需求。并且隨著生成式AI框架不斷發展,這給底層硬件帶來諸多創新契機。”代聞說,“為什么我們能為某些應用場景提供數十萬片芯片組成的集群,其性能相較于此前的GPU集群還能提升5倍以上,核心原因就在于這些硬件是專為構建大型生成式模型而打造的。這本質上是一種軟件驅動硬件創新、硬件服務軟件需求的基本構想。”
來源 | 2025年4月刊
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.