金磊 假裝發自 紐約
量子位 | 公眾號 QbitAI
80分鐘的一場活動,Agent的“出鏡次數”竟能高達217次。
解鎖平均20多秒就提一次Agent的,正是云計算一哥,亞馬遜云科技。
為何會如此?
因為就在剛剛的紐約峰會上,亞馬遜云科技可以說是重新定義了部署AI Agent到生產環境中的方式——
正式發布Amazon Bedrock AgentCore,一個企業級的AI Agent搭建工具包。
如果說以往的AI Agent要部署到實際生產中,其結果更像是一個“毛坯房”,其間有太多問題亟需解決。
比如你想開發一個智能客服、個人助手或者業務流程自動化工具,這個過程都需要整合大語言模型、連接數據庫、調用各種API,并讓系統能夠智能決策。
AgentCore就像是為這些應用提供的“智能大腦”,可以幫你統一管理和協調所有組件,讓復雜的AI應用開發變得簡單高效。
之前的Amazon Bedrock提供的能力更加聚焦在基礎大模型本身,比如調用Claude、Meta、Nova、Mistral等大模型,有點類似于“租用大腦”。
而AgentCore則是在這個基礎上提供一個“智能體搭建工具包”,讓你能把這些大腦組合起來完成具體任務。
具體而言,它是涵蓋7大核心服務的一套組合拳,把部署AI Agent到生產過程中的各種細節內容都照顧到位了,有一種直接“拎包入住精裝房”的感覺:
- AgentCore Runtime:
提供低延遲的無服務器環境,支持會話隔離,兼容任何代理框架(包括開源框架),能夠處理多模態工作負載和長期運行的Agent。通過AgentCore SDK在代碼中添加幾行代碼,指定入口點函數,即可將代理部署到云端。
- AgentCore Memory:
管理會話和長期記憶,為模型提供上下文信息,幫助Agent從過去的交互中學習。對于短期記憶,通過create_event存儲Agent交互,通過list_events加載最近的對話內容;對于長期記憶,支持語義記憶策略(如用戶偏好、總結和事實捕獲),數據以加密形式存儲,并支持基于命名空間的數據分割。
- AgentCore Observability:
提供代理執行的逐步可視化,包括元數據標記、自定義評分、軌跡檢查和故障排除/調試過濾器。可以幫助開發者調試、審計和監控Agent性能,內置儀表板用于跟蹤關鍵操作指標(如會話數、延遲、錯誤率等),支持OpenTelemetry以集成現有可觀測性平臺。
- AgentCore Identity:
使AI Agent能夠安全地訪問亞馬遜云科技服務和第三方工具(如GitHub、Salesforce、Slack),支持基于用戶身份或預授權用戶同意的操作。通過創建工作負載身份和憑證提供者(如OAuth2、API密鑰),Agent可以使用這些憑證安全地訪問資源。
- AgentCore Gateway:
將現有的API和Lambda函數轉換為可用于代理的工具,提供跨協議(包括MCP)的統一訪問和運行時發現,提供雙重身份驗證模型以確保安全。
- AgentCore Browser:
提供托管的網頁瀏覽器實例,擴展Agent的Web自動化工作流。可以用于訪問沒有程序化API的系統或需要通過Web界面訪問的資源。
- AgentCore Code Interpreter:
提供隔離環境以運行代理生成的代碼。用于執行需要計算的任務,例如客戶支持Agent需要進行的計算。
這些服務既可以單獨使用,也經過優化能夠無縫協作,開發者不用再花時間去拼湊各種組件了。
AgentCore是首個提供完全開發靈活性的企業級無服務器AI代理運行時平臺,支持任何框架、模型和協議,具備8小時工作負載支持、嚴格安全邊界和按需付費的可組合服務架構。
一言蔽之,再大規模的AI Agent,現在AgentCore這里,都可以安全操作和部署。
由此作為最為關鍵的發布,亞馬遜云科技在今天的活動中,不論是在基礎設施、模型架構,亦或是應用上,均圍繞著Agent來展開。
之所以如此,亞馬遜云科技Agentic AI副總裁Swami Sivasubramanian的話來說就是:
- 未來的關鍵在于讓所有Agents和工具協同工作。
不僅要方便,還要夠靠譜
為了更方便操作,基于AgentCore,亞馬遜云科技還推出了Marketplace中的AI Agents和工具,只需要通過自然語言搜索,客戶就可以輕松描述使用場景并找到相關解決方案(目前已經有數百種)。
除此之外,亞馬遜云科技在Amazon SageMaker AI中還推出了Amazon Nova定制化的功能。
客戶現在可以在模型訓練生命周期中對Nova Micro、Nova Lite和Nova Pro進行定制,包括預訓練、監督微調和對齊。
據了解,這些技術作為現成的Amazon SageMaker配方提供,并支持無縫部署到Amazon Bedrock,滿足按需和預置吞吐量推理的需求。
針對AI Agent許多功能過分依賴API的問題,亞馬遜云科技還推出了Amazon Nova Act來打破這一局限——
創建能夠在網頁瀏覽器中執行任務的AI Agent。
與此同時,亞馬遜云科技一道還發布了Amazon Nova Act SDK的研究預覽版,用這個SDK,開發者就可以很方便地創建能夠自動執行網頁任務的AI Agent。
為了進一步提高準確性,SDK支持通過Playwright進行瀏覽器操作、API調用、Python集成以及并行線程處理,以克服網頁加載延遲。
在內部評估中,Amazon Nova Act針對特定能力取得了超過90%的高分,例如在ScreenSpot Web文本基準測試中得分0.939。
由此可見,亞馬遜云科技在打造AI Agent這件事上,不僅追求可用度,更加注重可靠性。
數據庫也很AI Agent
亞馬遜云科技針對AI Agent這個主旋律,還在數據層上下足了功夫。
眾所周知,向量(Vectors)可以說是AI的語言,它可以把文字、圖像等內容轉成大模型能理解的數字格式。
對于現代企業來說,AI Agent將向量用于兩個關鍵功能,一個是用于從過去的互動中構建上下文,另一個是發現海量數據集中的相似性內容。
但現在面臨的一個問題是,目前的知識、數據規模變得越來越大,它們不再僅僅是臨時資源,更是必須長期保存的戰略資源。
為此,亞馬遜云科技推出了Amazon S3 Vectors——首個原生支持存儲大規模向量數據集、并提供亞秒級查詢性能的云對象存儲服務。
它最大的亮點,就是直接把上傳、存儲和查詢向量的總成本降低多達90%!
從技術角度來看,S3 Vectors推出了一種叫“向量桶”(vector buckets)的新存儲類型,它有專門的API接口,讓我們可以存儲、訪問和查詢向量數據,而且不需要自己搭建任何基礎設施。
當創建一個S3向量桶時,我們的向量數據會被組織在“向量索引”(vector index)中,這樣就能很簡單地對數據集進行相似性搜索。
據了解,每個向量桶最多可以有10000個向量索引,每個向量索引可以存儲數千萬個向量。
在創建向量索引后,當我們往索引里添加向量數據時,還可以給每個向量附加一些元數據(以鍵值對的形式),這樣一來查詢時就能根據特定條件進行過濾,比如按日期、類別或用戶偏好來篩選。
隨著時間推移,當你對向量進行寫入、更新和刪除操作時,S3 Vectors會自動優化這些向量數據,確保在向量存儲方面達到最佳的性價比,即使數據集規模不斷擴大和變化也是如此。
S3 Vectors還與Amazon Bedrock Knowledge Bases(包括Amazon SageMaker Unified Studio)原生集成,用于構建成本效益高的檢索增強生成(RAG)應用。
通過與Amazon OpenSearch Service的集成,我們可以把不常查詢的向量放在S3 Vectors中來降低存儲成本,然后在需求增加時快速將它們轉移到OpenSearch,或者用于支持實時、低延遲的搜索操作。
亞馬遜云科技的AI Agent之道,已經改變了AI編程
除了基礎設施和模型層面之外,亞馬遜云科技在應用上還拿出了一款全新的免費AI編程工具,Kiro。
若是用一句話概括Kiro的亮點,那就是只要你有想法,它就能幫你把這個想法變成實際可用的軟件,而且是從項目啟動、設計、編程到最終維護,全程都有專業級的Agent深度參與。
例如我們要給電商網站添加一個評論系統,現在就只需要三步即可。
第一步,把一句話需求變成詳細計劃:
- 為產品添加評論系統。
可以看到,Kiro秒懂了你的意圖,馬上把這句簡單的話,分解成一個個具體的用戶場景和需求。
比如,它會想到“用戶要能看評論”、“用戶要能寫評論”、“用戶可以篩選評論”、“用戶可以給評論打分”等等。
并且,Kiro會把每個需求的驗收標準都寫得清清楚楚,就像一份詳細的需求文檔,避免了后續理解上的偏差。
第二步,根據計劃自動生成“施工圖紙”。
在咱們確認了第一步的需求計劃后,Kiro就會自己去研究現有的項目代碼;然后,它會自動生成一份技術“施工圖紙”。
這份圖紙非常專業,包括數據怎么流動、需要哪些新的數據接口和數據庫設計等等。
比如,它會設計好“評論”這個東西具體應該包含哪些信息(如評論內容、評分、用戶ID等)。
第三步,把“圖紙”變成一個個具體的“施工任務”。
在這個步驟中,Kiro會根據上一步的“施工圖紙”,把整個開發工作拆分成一個個小任務,并且按照“先做什么后做什么”的依賴關系排好順序。
每個小任務都寫得非常具體,比如“寫單元測試”、“做集成測試”、“考慮加載時的頁面狀態”、“適配手機版”、“保證無障礙使用”等等。
或許此時你就要問了,Kiro和其它的編程AI有什么區別?
其實從剛才的展示過程中應該也能或多或少地感受到,在亞馬遜云科技開辟的AI Agent新生產范式之下,正如網友所說:
- Kiro規范化了AI編程的工作流程。
以上便是此次發布的主要內容了,整體來看,亞馬遜云科技再一次從基礎設施、模型框架以及應用三個層面來了個“大煥新”,而這一次的主角,毫無疑問就是AI Agent。
而這一切,所影射的實則是云計算一哥下的一盤大棋。
Why AI Agent?Why 亞馬遜云科技?
對于第一個問題,若是用Swami Sivasubramanian在現場所陳述的愿景來解釋,那就是:
- 讓亞馬遜云科技成為構建世界上最有用的AI Agents的最佳場所。
在亞馬遜云科技看來,AI Agent的意義不僅僅是一個技術概念,更是企業組織效率的躍遷工具。
借助Agentic AI,企業可以將重復性強、邏輯明確的任務交由智能體完成,讓員工專注于更具創造力與戰略性的事務。
通過AI Agent,亞馬遜云科技可以幫助客戶簡化流程、提升響應速度,并釋放團隊潛能,從而改變業務運作方式。
而縱觀今天所有的新發布,雖然它們的細分功能各有側重,但小目標均是劍指于此。
例如為了讓更多企業快速找到、試用并部署Agent,亞馬遜云科技在其Marketplace市場中新增了“AI Agents & Tools”分類。
再如為了解決許多AI Agent只能停留在原型驗證階段,缺乏可擴展性與安全保障的問題,亞馬遜云科技推出的Amazon Bedrock AgentCore就專門為生產級AI Agent而設計。
以及面向開發者,諸如Kiro這樣的AI編程應用,更是重新規范了AI Agent在編程任務中的流程,目標依舊是能夠保障“生產級”。
如此考量的背后,也有市場發展的預期所支撐。根據最新調查數據,AI Agents正迅速成為企業主流應用。
LangChain調查顯示,超過50%的公司已在生產環境中部署agent,近80%正在開發中。Gartner預測到2028年,33%的企業軟件將包含Agentic AI(相比2024年不到1%),15%的日常工作決策將由其自主完成,并將取代20%的人類店面互動。
企業更青睞能查詢多個任務特定模型的Agentic AI功能而非單一基礎模型,這種多語言模型方法具有更強的跨領域擴展性。目前,軟件開發、客戶服務、理賠處理和IT流程自動化是Agentic AI的主要早期應用場景。
并且從技術發展的角度來看,目前幾乎所有的生成式AI產品或應用,均離不開AI Agent這個關鍵詞。
由此,就不難理解為什么亞馬遜云科技如此關注AI Agent了,正如CEO Matt Garman所說:
- AI Agent將改變我們所有人的工作和生活方式,其影響力堪比互聯網的誕生。
大趨勢已經指向AI Agent,科技巨頭又以“all in”之勢發力于此,雙重認證之下已然證明了AI Agent的重要性;但更重要的一點是,云計算一哥已然給業界交付了“快好省”投入生產的新范式。
One More Thing:
上海峰會余溫猶在,紐約峰會新品已來。亞馬遜云科技已經把兩場頂級盛會的精華內容,濃縮進城市限時巡演活動中。8 月 8 日起,福州、合肥、青島、廣州、重慶、成都、長沙七城聯動,每站駐留 3 小時,聚焦最熱門的 AI 場景,現場拆解、即時體驗,為城市伙伴帶來零距離的前沿洞察。
感興趣的小伙伴可以前往亞馬遜云科技官方小程序注冊現場參會哦~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.