面對如火如荼的生成式AI大戰,全球電商老大亞馬遜、云計算老大亞馬遜云科技又雙叒發力了。就在12月4日舉辦于美國拉斯維加斯、6萬人現場參會的2024亞馬遜云科技re:Invent全球大會上,亞馬遜CEO Andy Jassy親自出馬,發布了亞馬遜自研的新一代基礎模型Amazon Nova。
比星巴克的中杯/大杯/超大杯更進一步,Amazon Nova一出手就是“四大杯”:
- Amazon Nova Micro:僅限文本對話,主打一個低價格和低延遲;
- Amazon Nova Lite:低成本的多模態大模型,處理圖像、視頻和文本輸入的速度極快;
- Amazon Nova Pro:高性能的多模態大模型,精度、速度和成本最佳“配方”,可處理廣泛的任務;
- Amazon Nova Premier:系列中最強多模態大模型,可處理復雜的推理任務,也可用于蒸餾客戶定制化的模型。
在現場,Andy還曬出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等各大權威AI榜單上的分數,雖然不能說是屠榜,不過確實在檢索增強生成(RAG)、函數調用和智能體應用等關鍵指標處于領先地位。
目前,Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro已全部正式可用,Amazon Nova Premier預計將在2025年第一季度可用。
你以為這就夠了嗎?緊接著,Andy Jassy又發布了兩個全新模型:用于生成高質量圖像的Amazon Nova Canvas和用于生成高質量視頻的Amazon Nova Reel。
亞馬遜云科技還計劃在2025年第一季度推出“語音到語音”(Speech to Speech)Amazon Nova模型,預計在2025年中旬推出具備“任意到任意”(Any to Any)模態能力的Amazon Nova模型。
總之,別人家有的模型,我亞馬遜云科技也都有,用Andy Jassy的話來說就是,“萬物皆可生成”。
這是否意味著,接下來亞馬遜云科技將“鼓勵”用戶們都轉用Amazon Nova?當然不是。在這次大會上,Andy Jassy還說了一句意味深長的話:“選擇決定一切!需要用模型的時候,最關鍵的是,有很多可選的自由!”
從2024亞馬遜云科技re:Invent全球大會上的表現,老冀認為:亞馬遜給用戶提供的最大價值,恰恰就是選擇的自由。而且,這種選擇的自由不僅僅只限于模型,也不只是AI架構的中間層,而是涵蓋了基礎架構層、中間層、應用層的方方面面。
中間層:一百多個模型一站式服務
在發布Amazon Nova之后,亞馬遜云科技CEO Matt Garman表示,Amazon Nova將與AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI等多個大模型一起,全部放到Amazon Bedrock當中,供用戶選擇使用。
實際上,亞馬遜云科技自己就是大模型的深度使用者,目前公司內部使用的生成式AI應用超過1000個。亞馬遜云科技深知,用戶要的是能夠解決自己針對性問題的大模型,而不是只有通用能力的、或者只能炫技的大模型。
在這次大會上我們看到,亞馬遜云科技成為首家向用戶提供Luma AI最先進的Luma Ray 2模型(其著名視頻模型的第二代)的云服務提供商。用戶可以通過Amazon Bedrock使用Ray 2,依據文本和圖像高效生成電影級質感的高質量、逼真視頻。
亞馬遜云科技還成為首家提供poolside的malibu和point模型訪問權限的云服務提供商,這兩個模型在代碼生成、測試、文檔編制以及實時代碼補全方面表現出色,能夠幫助工程團隊提高生產力,更快編寫出更優質的代碼,并加速產品開發周期。
Stability AI可謂如今最熱的文生圖大模型開發商之一。如今,Stability AI旗下最先進的文本轉圖像模型Stable Diffusion 3.5 Large也即將進駐Amazon Bedrock,為媒體、游戲、廣告以及零售領域的客戶創建概念藝術、視覺效果以及詳細的產品圖像。
有了如此多當紅大模型的加入,亞馬遜云科技仍然覺得不夠——雖然Amazon Bedrock中的模型能夠支持眾多任務,但是許多客戶仍希望將新興的專用模型融入到他們的應用程序中,為其獨特的用例如分析財務文檔或生成新型蛋白質等提供支持。
有鑒于此,在2024亞馬遜云科技re:Invent全球大會上,亞馬遜云科技繼續放出大招,推出Amazon Bedrock Marketplace,直接給用戶一個模型市場。
如今,用戶已經能夠從100多個模型中進行查找與選擇,這些模型可部署在亞馬遜云科技上,并能通過Amazon Bedrock中的統一體驗進行訪問。這100多個模型中,既有Mistral AI的Mistral NeMo Instruct 2407、Technology Innovation Institute的Falcon RW 1B以及NVIDIA NIM微服務等熱門模型,還有用于金融行業的Writer的Palmyra-Fin、用于翻譯的Upstage的Solar Pro、Camb.ai的文本轉音頻MARS6以及用于生物學的EvolutionaryScale的ESM3生成模型等眾多專業模型。無論你想要什么模型,直接到Amazon Bedrock Marketplace上面來找就對了。
實際上,一些用戶已經享受到了這種一站式服務的好處。在這次大會上,Zendesk這家全球服務軟件公司,就在Amazon Bedrock中訪問用于翻譯的Widn.AI等專用模型,通過電子郵件、聊天、電話以及社交媒體對客戶服務請求進行個性化和本地化處理,從而為客服人員提供其所需的數據,比如客戶母語表達中的情緒或意圖等,最終提升客戶服務體驗。
為了讓大家用好生成式AI,亞馬遜云科技可謂操碎了心。這次大會上,Amazon Bedrock還發布了一系列的新技術和新功能:
- 全新的提示詞緩存功能和Amazon Bedrock Intelligent Prompt Routing提示詞智能路由功能,幫助客戶更輕松、更經濟地擴展推理業務。
- Amazon Bedrock Knowledge Bases現已提供對結構化數據和GraphRAG的支持,進一步拓展了客戶利用自身數據提供定制化生成式AI體驗的途徑。
- Amazon Bedrock Data Automation功能能夠在無需編寫代碼的情況下,自動將非結構化、多模態的數據轉換為結構化數據,以幫助客戶將更多數據應用于生成式AI及分析工作中。·
- 模型蒸餾:創建更快、更具成本效益的模型,經過蒸餾的模型速度最高提升500%,成本最高降低75%。
- Automated Reasoning checks:防止因幻覺產生的事實性錯誤,提供糾正建議。
- Multi-agent collaboration:構建、部署和編排多個agent,協同處理復雜的多步驟任務。
亞馬遜云科技人工智能和數據部門副總裁Swami Sivasubramanian博士表示:“通過此次新發布的一系列新功能,我們將幫助客戶開發出更智能的AI應用程序,讓他們為其最終用戶創造更大價值。”
既提供了豐富的模型,又給了好用的功能,難怪有數以萬計的客戶通過Amazon Bedrock運行其生成式AI應用程序。僅僅在過去一年,使用Amazon Bedrock的客戶量就增長了4.7倍。如今,Adobe、Argo Labs、寶馬集團、Octus、Symbeo、Tenovos和Zendesk等公司,都已經采用了Amazon Bedrock的最新技術。
基礎設施層:三大領域一個都不能少
我們都知道,生成式AI要想獲得更廣泛的應用,基礎設施肯定少不了。從2024亞馬遜云科技re:Invent全球大會上,老冀發現亞馬遜云科技在這方面同樣不含糊,在全面覆蓋基礎設施的計算、存儲、數據庫三大領域,為用戶提供全家桶的產品和服務。
先說計算。在這次大會上,亞馬遜云科技發布了以自研芯片Trainium搭建的AI算力。其中,Amazon Trainium2 Server采用16顆Trainium2 芯片,FP8算力達20.8PFLOPS;Amazon Trainium2 UltraServer則將4個Trn2實例通過NeuronLink互連,搭載64顆Trainium2 芯片,FP8算力達83.2PFLOPS。
在AI算力的超級競賽中,亞馬遜云科技正在加速創新。在本次大會上,亞馬遜云科技還宣布將與AI大模型的“當紅炸子雞”Anthropic合作構建一個名為“Project Rainier”的新集群,它將配備數十萬個亞馬遜云科技最新的AI訓練芯片Trainium 2,建成后將比Anthropic當前最強大模型的集群大五倍,成為全球最大的AI超級計算機之一,加入“十萬卡集群”的競爭。
亞馬遜云科技在計算上的強大實力,已經吸引了很多重量級客戶的關注,蘋果公司AI和機器學習高級總監Benoit Dupin也專程趕到2024亞馬遜云科技re:Invent全球大會站臺。他表示,蘋果與亞馬遜云科技在AI和機器學習生命周期的“幾乎所有階段”都展開了合作。如今,蘋果正在對Trainium 2芯片進行初步測試,以幫助訓練正在逐漸提供全面服務的Apple Intelligence。
此外,亞馬遜云科技還宣布將在2025年推出更先進的自研Trainium3芯片,它將采用3nm先進工藝,性能是上一代的2倍,功耗則只有上一代的40%。
有了自研的Trainium系列芯片,是不是就不再需要英偉達的GPU了?當然不是。要知道,亞馬遜云科技始終從用戶的角度來考慮這個問題。Matt Garman表示:“今天,在GPU方面真的只有一個選擇,那就是英偉達。我們認為客戶會欣賞有多個選擇。希望Trainium能夠開辟出一個良好的細分市場,我認為它將成為部分工作負載的極佳選擇,當然不是所有工作負載。”因此,在這次大會上,Matt Garman同樣發布了EC2 P6實例,它基于英偉達最先進的Blackwell架構GPU,是上一代性能的2.5倍。
用戶希望用什么架構的計算,就給它好了;至于是自研還是合作伙伴的,并不那么重要。
在存儲上,亞馬遜云科技同樣也是用戶邏輯,在這次大會上發布了Amazon S3 Tables,將Apache Iceberg表的查詢性能提升3倍,每秒事務處理量提升10倍,還發布了Amazon S3 Metadata,提供S3中管理元數據最簡單快捷的方式。
用戶更大的驚喜,則來自于數據庫。我們知道,在分布式數據庫系統中,存在一個“CAP魔咒”——跨區域一致(Consistency)、高可用性(Availability )、低延遲(Partition Tolerance)這三大要求,一般只能滿足兩個。
而在這次大會上發布的新型無服務器分布式數據庫Amazon Aurora DSQL卻告訴用戶:三個要求都可以有!它結合了傳統關系數據庫的強一致性和NoSQL數據庫的分布式擴展能力,提供了以下幾大關鍵優勢:
- 跨區域強一致性和低延遲:采用了全新的架構,使其能夠在多個地理區域中同時運行,而保持強一致性。
- 無限擴展:能夠處理數TB到數PB級的數據集,適用于任何規模的企業。
- 超高可用性:提供99.999%的可用性,這對于許多需要高可用性和無縫運行的企業級應用至關重要。
- 性能優越:其跨區域的讀寫操作比Spanner快了四倍。
從2024亞馬遜云科技re:Invent全球大會上,老冀看到了亞馬遜云科技對用戶的寵愛模式:說吧,你想要什么?我全都給你!
應用層:軟件開發流程一步步搞定
作為一家平臺級公司,亞馬遜云科技從來都非常重視開發者的重要作用。在2024亞馬遜云科技re:Invent全球大會上, Matt Garman深情地回顧,今年6月他就任CEO之后的第一件頭等大事,就是與亞馬遜云科技Heroes交流,聽取這些技術專家們的意見。此時,臺下傳來了一陣陣歡呼聲。
這一次,為了讓開發者們把AI更好地用起來,亞馬遜云科技針對軟件開發功能強大的生成式AI助手Amazon Q Developer繼續發力,推出一系列創新增強功能,包括能夠實現自動執行單元測試、文檔生成和代碼審查流程的智能體,可大幅提升開發人員在整個軟件開發流程中的效率;以及能夠在極短時間內幫助用戶解決運營難題的能力。
編寫單元測試對于保障代碼按預期運行并及早發現潛在問題至關重要。Amazon Q Developer能夠自主識別并生成單元測試,通過全面的測試覆蓋,以更少時間幫助開發人員及早發現問題并顯著提升代碼的可靠性。
開發人員在代碼編寫和測試階段之后,通常需要編寫文檔來闡述代碼的功能與運行機制。如今,開發人員可以使用 Amazon Q Developer 生成和維護其所有項目文檔,確保他們始終掌握項目的最新信息;同時讓他們能夠快速上手新代碼,為團隊成員抓取關鍵的項目細節,并提升舊文檔的可讀性。
代碼正式部署之前,往往需要另一位開發人員對代碼進行細致檢查,確保其符合企業要求的質量、風格與安全標準。Amazon Q Developer具備自動檢查代碼質量、查重和識別安全漏洞的能力,從而簡化代碼審查流程。它能夠迅速向開發人員提供反饋,讓開發人員在當前工作流程下,加速部署高質量的代碼。
當應用程序編寫完畢并投入生產環境后,運營團隊便肩負起監控其運行狀況、迭代優化及解決問題的重任,以確保應用性能達到預期標準。基于亞馬遜云科技豐富的運營經驗及對企業和組織的云資源關系的深入理解,Amazon Q Developer現在可以幫助不同經驗水平的用戶,以更短的時間調查并解決其在亞馬遜云科技環境中的運營問題,確保企業應用程序的正常運行。
正如亞馬遜云科技下一代開發者體驗副總裁Deepak Singh所言,亞馬遜云科技的客戶正廣泛通過Amazon Q Developer,在軟件開發生命周期各階段提升開發人員的生產力。如今,埃森哲、Boomi、BT Group、Cedar Gate Technologies、德勤、FINRA、Genesys、Netsmart、培生、SmugMug以及Tata Consultancy Services等眾多企業,都正在使用Amazon Q Developer來提升開發人員的工作效率,并快速解決運營挑戰。
看完2024亞馬遜云科技re:Invent全球大會的直播之后,老冀突然發現,即使是在日新月異的生成式AI領域,亞馬遜云科技仍然能夠憑借自身多年的積累,為企業客戶提供豐富多樣的全家桶產品和服務,幫助企業把AI用起來,用成功。這樣的亞馬遜云科技,必然也將成為企業客戶應用生成式AI的首選合作伙伴。
*前述特定亞馬遜云科技生成式人工智能相關的服務僅在亞馬遜云科技海外區域可用,亞馬遜云科技中國僅為幫助您發展海外業務和/或了解行業前沿技術選擇推薦該服務。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.