機(jī)器之心報道
作者:澤南、陳陳
Code is cheap, show me the talk.
最近,很多 AI 大佬一反常態(tài),對未來做出了超出預(yù)期的樂觀預(yù)測。
諾貝爾獎獲得者、AI 先驅(qū) Geoffrey Hinton 表示,人工智能將在多個領(lǐng)域「取代所有人」,只有頂尖技能人才能夠找到 AI 無法處理的工作。
特斯拉前負(fù)責(zé)人 Andrej Karpathy 在演講中也認(rèn)為,我們正在進(jìn)入「軟件 3.0」時代,自然語言在成為新的編程接口,大模型會完成剩下的工作。
正在讓 AI 能力大幅提升的技術(shù)被稱為智能體(Agentic AI),它能夠長時間獨立運行、感知環(huán)境,自主使用各種工具來完成復(fù)雜任務(wù)。最近有研究甚至證明,智能體也遵循大語言模型的測試時擴(kuò)展(Test-Time Scaling)規(guī)律,能夠通過強(qiáng)推理不斷提升解題能力。
事實上,智能化發(fā)展的過程比我們想象得還要快。正在上海舉行的亞馬遜云科技中國峰會上,我們看到了一系列基于大模型、Agentic AI 的創(chuàng)新和案例,讓我們眼花繚亂。
「通俗說來,Agentic AI 就是讓基于大模型的 AI 從『我問 AI 答』、『我說 AI 寫』發(fā)展到『我說 AI 做』。AI 驅(qū)動的數(shù)字員工能將像人一樣在各行各業(yè),為企業(yè)帶來新的生產(chǎn)力,」亞馬遜云科技大中華區(qū)總裁儲瑞松說道。
手搓 Agentic AI 應(yīng)用
僅需不到 30 行代碼
如今想用 AI Coding 來開發(fā)一個抽獎的小應(yīng)用,到底有多簡單?
在 Amazon Q Developer 上,你只需要先與 AI 進(jìn)行聊天交互,了解需求,AI 會自動生成一份有關(guān)后端代碼的技術(shù)文檔,進(jìn)而生成執(zhí)行計劃。在讀取執(zhí)行計劃后,Q 能夠自動生成一系列提示詞,幫助我們生成代碼,生成的代碼可以一鍵修正錯誤。
前端代碼就更簡單了,直接輸入一個截圖,Q 就可以把界面轉(zhuǎn)換成代碼。生成內(nèi)容出錯的地方,只需要用自然語言指出并一鍵修復(fù)即可。在程序完成之后,我們也可以用 Q 進(jìn)行部署、測試,并在上線之前解決安全問題。最后在這個項目中,有 90% 的代碼是由 Q 生成的。
AI 也可以幫助架構(gòu)師改造項目適用的環(huán)境版本。比如想把 Windows 的應(yīng)用轉(zhuǎn)換成 Linux 的,使用 Amazon Transform,不到一分鐘,5000 多行代碼就修改了 4800 多行,還立即在 GitHub 上自動提交了分支。
圍繞 Bedrock Agents,人們可以圍繞大量內(nèi)部數(shù)據(jù)快速構(gòu)建,轉(zhuǎn)換不同工具執(zhí)行任務(wù)。我們可以調(diào)用 Lambda 查看游戲發(fā)行生成的內(nèi)容,也可以調(diào)用非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行相關(guān)內(nèi)容的生成。
在一些簡單任務(wù)上,我們可以使用開源的 Strand Agents,由它幫助構(gòu)建的 AI 采購助手使用亞馬遜云科技托管的 Claude 3.7 Sonnet 大模型作為大腦,用戶使用自然語言在前端提問,Agent 就能理解用戶需求,調(diào)出相應(yīng)的 MCP 工具進(jìn)行具體操作,瀏覽網(wǎng)頁、篩選、進(jìn)行推薦并以自然語言的形式返回結(jié)果。
這樣的智能體工具,我們可以在一天之內(nèi)完成原型開發(fā)驗證,代碼不超過 30 行。
多 Agent 之間也可以進(jìn)行交互。中央?yún)f(xié)調(diào)器的大模型(Claude 4)在獲取需求后自動指定相應(yīng)的不同 Agent 進(jìn)行編排,搜索并調(diào)用 MCP 服務(wù)形成報告,自動解析 PDF 和形成報告生成行程推薦。
以上的實現(xiàn)都基于亞馬遜云科技提供的工具,它們分別針對特定場景、軟件開發(fā)全流程,以及多智能體輕量級開發(fā)。
亞馬遜云科技大中華區(qū)解決方案架構(gòu)總經(jīng)理代聞表示,由于智能體能力的提升,多模型混合使用的應(yīng)用將成為常態(tài);如今大家對于 AI 的關(guān)注點已經(jīng)從模型性能的跑分,轉(zhuǎn)變成為 AI 的應(yīng)用;另外,大模型帶來的 Text to Action 正在重新定義交互內(nèi)容和能力邊界。
基于此種能力,已有不少企業(yè)跨越了實驗階段,將生成式 AI 的解決方案應(yīng)用于實際運營,并在三個關(guān)鍵領(lǐng)域取得了切實的效益 —— 提高生產(chǎn)力、降低成本和加快創(chuàng)新周期。
作為一家 AI 公司,合合信息從成立以來一直專注于文本圖像領(lǐng)域的 AI 算法和應(yīng)用研究,它基于亞馬遜云科技實現(xiàn)業(yè)務(wù)出海,構(gòu)建了支撐掃描全能王、名片識別等核心產(chǎn)品,為全球 200 多個國家的用戶提供高可用、低延時、安全合規(guī)的服務(wù)。
為了更好地利用企業(yè)文檔數(shù)據(jù)資源,基于 Amazon Bedrock 和 OCR 大模型,合合信息還構(gòu)建了一個文檔處理 Agent:DocFlow。只需要分鐘級的時間就能從云存儲中快速地讀取各類文檔,并且自動完成優(yōu)化、分類、信息抽取和審核,從而大大提升數(shù)據(jù)處理效率。
Agentic AI 在知識信息密集的領(lǐng)域也發(fā)揮了巨大的作用。舉例來說,在醫(yī)學(xué)撰寫方面,一個典型的創(chuàng)新藥項目需要以 10 萬份文獻(xiàn)數(shù)據(jù)以及數(shù)千的患者臨床記錄為輸入,需要輸出多達(dá) 200 多份的文檔,總體的頁數(shù)超過了 5000 頁。這個工作量占據(jù)了研發(fā)工作量的 30~50%。
針對這一挑戰(zhàn),復(fù)星醫(yī)藥和亞馬遜云科技展開了合作,將整個醫(yī)學(xué)寫作的場景進(jìn)行了解構(gòu)。借助生成式 AI 的能力,一鍵式完成實驗報告檢查,把長達(dá)一周的工作縮短到 5 分鐘。另外,在醫(yī)學(xué)翻譯領(lǐng)域,借助亞馬遜云科技技術(shù),復(fù)星醫(yī)藥用 6 個月的時間已經(jīng)完成了 1.6 個億字的翻譯,直接降本超過了 30%。
還有很多國內(nèi)外公司,都在亞馬遜云科技的這套 Agentic AI 體系上提升了效率,開啟了前所未有的業(yè)務(wù)。這不由得讓我們想起今年初人們喊出「AI 智能體爆發(fā)元年」的預(yù)測:從 AI 輔助到 AI 協(xié)作,再到數(shù)字同事,智能體最終可以構(gòu)建成軟件公司,幫助我們完成絕大多數(shù)任務(wù)。「一人公司」距離我們其實并不遙遠(yuǎn)。
Agentic AI 最令人興奮的或許將是商業(yè)模式的創(chuàng)新 —— 就像 Uber、 Airbnb 創(chuàng)造了共享經(jīng)濟(jì)模式,Netflix 開創(chuàng)了訂閱制內(nèi)容消費模式那樣,隨著 AI 的快速發(fā)展,現(xiàn)在處于正在進(jìn)行時的,是深度集成 AI 的代碼工具 Cursor、AI 實時搜索引擎 Perplexity……
「我們身處在 AI 時代,恰似置身于 30 米高的巨浪之中。AI 的發(fā)展已經(jīng)來到了一個拐點。現(xiàn)在是時候行動了,」亞馬遜云科技全球技術(shù)總經(jīng)理 Shaown Nandi 表示。「堅信未來一年所做的事會為新的時代打下基礎(chǔ)。」
打造 Agentic AI
亞馬遜云科技擁有一套完整技術(shù)棧
但另一方面,生成式 AI 的落地并不是件容易的事。
今年 1 月,DeepSeek R1 成為了全球爆款應(yīng)用,很多人在向它提問后遭遇了系統(tǒng)頻頻回復(fù)的「服務(wù)器繁忙,請稍后再試」;3 月份,ChatGPT 在提供原生圖像生成功能后不到 72 小時就宣告臨時下架,OpenAI CEO 山姆?奧特曼不得不宣布進(jìn)行限流,并表示「GPU 在融化」。
不少爆款 AI 應(yīng)用在走出陡峭增長曲線之后,面臨著服務(wù)器容量飽和、安全合規(guī)、技術(shù)迭代困難等一系列挑戰(zhàn)。為了能夠跟上 AI 發(fā)展的加速度,企業(yè)需要正確的技術(shù)和全棧的工具。
此前,Amazon Bedrock 平臺上提供的 Amazon Bedrock Agent 框架作為一款快速部署工具在業(yè)內(nèi)已獲得了人們的認(rèn)可。它是一個全托管式的服務(wù),支持集成 Bedrock 內(nèi)置的安全、可用性機(jī)制、RAG 等能力,也集成亞馬遜云科技各種服務(wù),新增的 Multi-Agent 協(xié)作則可以應(yīng)對復(fù)雜工作流程編排需要。
它大大簡化了標(biāo)準(zhǔn)低級任務(wù)流程復(fù)雜性,如調(diào)用 LLM、定義和解析工具以及鏈接調(diào)用,從而簡化了工作流程。
其實,在能力層、基礎(chǔ)設(shè)施、編排層、體驗層等應(yīng)用生命的全流程里,亞馬遜云科技都提供了大量實操性的策略和實用工具,能夠幫助你快速構(gòu)建 Agentic AI。
首先是多種先進(jìn)模型的選擇。現(xiàn)在的 AI 發(fā)展速度驚人,而且我們知道不可能有一個模型可以適用于所有任務(wù)。Amazon Bedrock 不但集成了 DeepSeek R1、Anthropic Claude、Meta Llama、AI21 Labs、Cohere 等頂尖模型,亞馬遜云科技自主研發(fā)的 Amazon Nova 系列基礎(chǔ)模型也包含在內(nèi),在速度和成本方面提供更多不同選擇,涵蓋理解、圖像、語音、視頻等工作,新款 Amazon Nova Act 模型也即將上線 Amazon Bedrock 平臺。
第二點是模型定制能力。將自己的數(shù)據(jù)引入模型,是釋放 AI 價值其中最重要的一步。現(xiàn)在 Amazon Bedrock 支持端到端的全托管 RAG 功能。該功能允許企業(yè)直接將模型與內(nèi)部數(shù)據(jù)源(如數(shù)據(jù)庫、文檔庫)安全連接,無需自行搭建復(fù)雜的檢索管道,即可生成基于企業(yè)私有數(shù)據(jù)的精準(zhǔn)回答。
第三點是信任與安全。這是所有生成式 AI 應(yīng)用的核心。Amazon Bedrock 提供的 Guardrails(安全護(hù)欄) 功能,可以幫助用戶屏蔽有害或不合規(guī)的輸入與輸出,并且這些 Guardrails 是可以繼承的。
此外,為了解決大模型幻覺現(xiàn)象,Bedrock Guardrails 率先推出了自動化推理(Automated Reasoning)功能,其中 Reasoning Checks(推理校驗)能基于邏輯驗證和可證明的依據(jù),有效防止生成式 AI 出現(xiàn)事實性錯誤和幻覺內(nèi)容。目前,只有亞馬遜云科技提供這一功能。
自動化推理驗證原理。
第四點是成本效益。亞馬遜云科技一直致力于幫助客戶優(yōu)化成本,同時不犧牲結(jié)果質(zhì)量。為了達(dá)到此目的,他們在 Amazon Bedrock 中引入了模型蒸餾,蒸餾后的模型最多可提升 500% 的響應(yīng)速度,成本降低 75%。
針對更廣泛的應(yīng)用場景,Amazon Bedrock 還提供了智能提示詞路由功能。用戶可以為一個應(yīng)用配置多個模型,Amazon Bedrock 會根據(jù)請求內(nèi)容自動選擇最適合的模型來響應(yīng),從而在保證準(zhǔn)確率的前提下,將成本降低高達(dá) 30%。
可以看出,從靈活的模型選擇,到節(jié)省資源的優(yōu)化策略,Amazon Bedrock 已內(nèi)建了生成式 AI 應(yīng)用所需的完整能力,為企業(yè)帶來性能與成本的雙重優(yōu)勢。
為了讓更多開發(fā)者能夠靈活地探索 Agent 能力,亞馬遜云科技也提供了更加開放、自主的方式。
- 圍繞特定場景,圍繞 Amazon Q Agents 的開箱即用工具可以涵蓋代碼開發(fā)、IT 運維、應(yīng)用現(xiàn)代化等步驟,覆蓋生命全周期;
- 在基礎(chǔ)模型之上,Amazon Bedrock Agents 可以實現(xiàn)強(qiáng)大的工作流程編排能力;
- 對于輕量級任務(wù),Strands Agents 開源框架可以構(gòu)建出靈活的多智能體應(yīng)用。
對于那些傾向于自己動手、深入定制的開發(fā)者來說,你不妨試試 Strands Agents—— 一款開源 Python SDK,只需寥寥數(shù)行代碼就能構(gòu)建智能 Agent。Strands Agents 通過集成最先進(jìn)的模型,為開發(fā)者省去了復(fù)雜的 Agent 編排工作。
如何賦能開發(fā)者,如何為應(yīng)用奠定在 Amazon Bedrock 上成功運行生成式 AI 的基礎(chǔ)?那么接下來的關(guān)鍵問題是 —— 怎樣真正把生成式 AI 應(yīng)用構(gòu)建出來?
這就需要借助亞馬遜云科技的一款生成式 AI 助手 Q Developer,其擁有較高的代碼接受率。一般而言,大多數(shù)開發(fā)者平均每天真正寫代碼的時間只有 1 小時,其余時間都花在團(tuán)隊協(xié)作、撰寫文檔、項目規(guī)劃等各類任務(wù)上。
與其他 AI 助手不同,Q Developer 能在整個軟件開發(fā)生命周期中為你賦能。你可以與 Q Developer 對話,了解其能力、架構(gòu)解決方案,你也可以在 IDE 內(nèi)直接與 Q Developer 聊天,共同生成代碼、拆分任務(wù)、集成 API ,還能點擊一下進(jìn)行測試,掃描那些難以發(fā)現(xiàn)的安全漏洞。可以說,Q Developer 是一位全天候的 AI 助手。
另外,很多開發(fā)者更喜歡通過命令行工作,因此亞馬遜云科技發(fā)布了全新的 Q Developer CLI Agent。它能結(jié)合 Q Developer CLI 環(huán)境中的信息,執(zhí)行讀寫文件、編寫代碼、自動調(diào)試等任務(wù)。
Q Developer 可以幫助你自動化日常開發(fā)任務(wù),但開發(fā)者的大量時間其實并不在構(gòu)建新應(yīng)用上,而在于維護(hù)舊系統(tǒng) —— 包括管理、現(xiàn)代化改造、打補(bǔ)丁等。
利用 Amazon Q 能力 ,亞馬遜云科技找了五人團(tuán)隊在兩天內(nèi)將 1000 個 Java 應(yīng)用程序從 Java 8 升級到 Java 17。平均每個應(yīng)用耗時約 10 分鐘,而傳統(tǒng)方式可能需要兩天。
現(xiàn)在,亞馬遜云科技已經(jīng)成功遷移數(shù)萬個生產(chǎn)應(yīng)用,年度開發(fā)工時節(jié)省 4500+,實現(xiàn)了 2.6 億美元的年化成本節(jié)約。
這也給我們帶來了思考,生成式 AI 如何變革整個 IT 系統(tǒng)?據(jù)估計,目前有 70% 的工作負(fù)載仍在本地運行,而 70% 的傳統(tǒng) IT 系統(tǒng)已有近 20 年歷史。對于財富 500 強(qiáng)公司來說,應(yīng)用遷移是一項長期工程。
Amazon Transform —— 首個為加速 .NET、大型機(jī)和 VMware 工作負(fù)載的企業(yè)現(xiàn)代化而開發(fā)的代理式人工智能服務(wù)。Amazon Transform 可以幫助各個組織同時對數(shù)百個應(yīng)用程序進(jìn)行現(xiàn)代化改造,并保持高質(zhì)量和控制力。
比如湯森路透利用 Amazon Transform,現(xiàn)代化升級速度比原計劃快了 4 倍。
亞馬遜云科技認(rèn)為,Agentic AI 能夠在三個方面帶來組織方式的變革:1、統(tǒng)一的 AI 就緒的基礎(chǔ)設(shè)施;2、聚合并治理過的 AI 就緒的數(shù)據(jù);3、明確的策略和高效率的執(zhí)行。
目前已經(jīng)有超過 10 萬客戶在亞馬遜云科技上進(jìn)行機(jī)器學(xué)習(xí)工作,在中國的生成式人工智能創(chuàng)新中心,也有超過 1000 個深度合作客戶。
宏觀來看,亞馬遜云科技已經(jīng)把智能體放在了極其重要的位置,其 CEO Matt Garman 最近表示,Agentic AI 有機(jī)會成為亞馬遜云科技下一個數(shù)十億美元的規(guī)模業(yè)務(wù)。對此亞馬遜云科技 3 月份已經(jīng)成立了專門的智能體團(tuán)隊,直接向 CEO 報告,很快就會有重磅發(fā)布。
在 AI 時代,我們不止要創(chuàng)新,還要加速創(chuàng)新。亞馬遜云科技正在成為加速創(chuàng)新可信賴的合作伙伴。
生成式 AI
實踐出真知
在中國峰會主論壇上,亞馬遜云科技正式發(fā)布了 Agentic AI 應(yīng)用實踐指南。其中包括智能體開發(fā)的基本范式、實踐方案的示例,以及對于智能化轉(zhuǎn)型的展望。基于該指導(dǎo),任何人都可以在亞馬遜云科技的平臺上構(gòu)建 AI 應(yīng)用。
預(yù)計到 2028 年,15% 的日常工作決策將由 Agentic AI 自主完成,而這一比例在 2024 年幾乎為零。這不僅僅是技術(shù)的迭代,更是軟件應(yīng)用本質(zhì)的重新定義。
最近,OpenAI CEO 山姆?奧特曼在接受訪談時說道,通用人工智能(AGI)是一個動態(tài)的目標(biāo),或許更有意義的里程碑會是 ASI,即 AI 能夠?qū)崿F(xiàn)自主的科學(xué)發(fā)現(xiàn)。如果 AI 可以基于可靠的數(shù)據(jù),理解復(fù)雜的需求,進(jìn)行長期推理和規(guī)劃,可靠地使用工具并及時糾正錯誤,那么我們就可以在更加重要的任務(wù)上,實現(xiàn)前所未有的自動化。
亞馬遜云科技的能力,正在讓我們距離這個愿景更進(jìn)一步。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.