如今的大模型產(chǎn)業(yè)正進入一個關鍵時刻:泡沫破裂,還是落地改變世界。
Gartner數(shù)據(jù)顯示,2024 年僅有 41% 的生成式 AI 試點項目能夠成功進入生產(chǎn)階段,更直觀來說,59%的生成式AI落地,都死在了路上。這是一個尷尬的數(shù)據(jù)。
亞馬遜全球副總裁、亞馬遜云科技大中華區(qū)總裁儲瑞松也有提到,從技術能力與現(xiàn)實來看,過去一年,生成式AI真的爆發(fā)了。
但技術爆發(fā)的量變,到引起產(chǎn)業(yè)的質(zhì)變,有一道關于落地的鴻溝。如果繼續(xù)維持現(xiàn)狀,那么大概率產(chǎn)業(yè)的演化,會如同過往Gartner曲線的走勢,短暫的泡沫之后,進入又一次漫長衰退。前進一步,則大模型可以造福一半企業(yè),成為新的社會基礎設施。
為了避免AI的故事一次又一次重蹈覆轍,早在2023年亞馬遜云科技就成立了一個秘密組織,生成式AI創(chuàng)新中心,讓350 位戰(zhàn)略顧問、應用科學家、數(shù)據(jù)科學家、開發(fā)人員和專家?guī)椭蛻糁贫ㄉ墒?AI 戰(zhàn)略,并協(xié)助他們構建生成式 AI 解決方案,以實現(xiàn)業(yè)務成果。
而這個秘密組織,如今已經(jīng)來自不同行業(yè)的客戶提出的超過 1500 個項目需求,推動82%+客戶從 PoC 到量產(chǎn)。
也就是說,在亞馬遜云科技上,生成式AI已經(jīng)率先翻過了技術的Gartner死亡谷,進入產(chǎn)業(yè)發(fā)展的穩(wěn)步增長期。
那么亞馬遜云科技憑什么翻過Gartner死亡谷?秘密組織生成式AI創(chuàng)新中心的經(jīng)驗是什么?
所有答案都藏在正在進行中的2025 亞馬遜云科技中國峰會上。
Gartner死亡谷里藏著什么?
在儲瑞松看來:歷史上蒸汽機放大和解放了人的肌肉,落地紡織、交通、采礦和冶煉,帶來了工業(yè)革命;如今,機器智能放大和解放人的大腦智力,帶來下一場革命。
而且,與歷史上的前幾輪AI泡沫不同,2023年崛起的生成式AI浪潮中,技術的成熟度,早已跨過了從實驗室到工業(yè)生產(chǎn)的門檻。峰會現(xiàn)場儲瑞松展示,無論測試多個學科領域的MMLU、測試科學領域的GPQA、測試真實世界軟件工程相關問題的SWE-bench還是推出的HLE — Humanity’s Last Exam(人類的最終考試),模型的能力早已隱約展現(xiàn)出了巨大的潛力。
既然技術不是問題,那么為什么市面上59%的項目,都倒在了爆發(fā)的前夜。
兩年多的實踐經(jīng)驗,優(yōu)秀的生成式 AI成功原因百花齊放,但是黃掉的項目,卻大多教訓雷同。總結來說有四點
教訓一:場景選錯,不是所有問題都值得用AI解決
許多企業(yè)在AI項目啟動時,犯的第一個錯誤就是“為AI而AI”。高頻詞是“增強效率”“提升智能化”“優(yōu)化工作流程”,但缺乏對場景價值的量化認知。
一個很典型的例子是:很多公司希望通過大模型提升客服效率,于是部署了GPT接口替代基礎問答模塊,但因缺少專有數(shù)據(jù)增強與業(yè)務上下文處理,模型表現(xiàn)甚至不如原有基于規(guī)則的FAQ系統(tǒng)。結果就是大模型胡說八道,人類跟在身后補鍋道歉。不僅沒有如愿達到成本降低,反而帶來了不少的不必要麻煩。
教訓二:模型錯配,大模型唯參數(shù)、唯最優(yōu)論
亞馬遜云科技全球技術總經(jīng)理 Shaown Nandi觀察到,基礎模型的進展以周為單位,永遠會有層出不窮的更強大、更具成本效益和更快速的模型發(fā)布。但不會存在一個模型能適用于所有用例的情況。更多企業(yè)需要的其實是定制模型的能力,以及有選擇的權利,因此在Amazon Bedrock中,亞馬遜云科技托管了全球各大主流大模型企業(yè)的基礎模型,從數(shù)千億甚至萬億參數(shù)的巨型模型到只有幾百萬參數(shù)的小型模型均有覆蓋。
亞馬遜云科技全球技術總經(jīng)理 Shaown Nandi
但現(xiàn)實中,往往很多團隊都會盲目擁抱市面上最大、最貴、指標最亮眼的模型,忽略了實際業(yè)務對時延、成本和精度的多維需求,導致項目盲目上馬之后,最后又潦草下臺。
教訓三:ROI不可控,沒人知道項目值不值,導致不敢上馬
事實上,多數(shù)生成式AI項目失敗的最終歸宿,往往不是技術掛了,而是領導覺得看不到價值。在技術團隊視角里,模型能跑通、響應速度OK、可以調(diào)優(yōu)就意味著項目完成;但在業(yè)務部門眼中,沒有明確指標提升、沒有看得見的成本優(yōu)化,項目就等于實驗室玩具。
過程中,基礎模型、使用場景的數(shù)量和負載特征、模型的定制和調(diào)優(yōu)策略能做到什么水平,需要讓決策層有概念,執(zhí)行層有目標;最終帶來了什么效果,不僅要肉眼可見,也需要數(shù)據(jù)可量化,成本能算清。
教訓四:沒有完善的成果檢測閉環(huán),項目靜默暴斃
基于前三個問題的背景,最后導致的結果就是很多生成式AI項目上馬之后,做出來沒人用,也找不到原因,沒辦法升級迭代,導致陷入靜默暴斃狀態(tài)。尤其是項目后期維護需要成本,怎么說服老板繼續(xù)投入,很多團隊連個評估框架都沒有。
一句話總結來說,如今的生成式AI已經(jīng)度過了認知普及階段,但大部分項目黃在了前期不會選,中期不會用,后期沒閉環(huán)上。
爬出死亡谷,亞馬遜云科技的兩重準備與四大秘籍
關于如何爬出死亡谷,見證了亞馬遜云科技幫助國內(nèi)上千項目落地后,儲瑞松將問題拆解成了自上而下與自下而上兩個角度。
“在我與很多客戶的溝通中能觀察到,越來越多的企業(yè)都想擁抱AI 、Agentic AI,但卻不知道從何開始。我認為,企業(yè)需要做好雙重準備。”
自上而下,是管理。高層擁抱生成式AI和Agentic AI時需要有明確的認知和頂層設計,要在機制和人才上做準備,要認清之前企業(yè)信息化、數(shù)字化的工作和時代的關系。
自下而上,是技術。技術又可以被分為三點,其一是統(tǒng)一的AI就緒的基礎設施,過去一度甚囂塵上的多云策略,其有限的連接性會導致企業(yè)出現(xiàn)業(yè)務孤島、數(shù)據(jù)孤島,導致最終體驗大打折扣。其二是聚合的、經(jīng)過治理的數(shù)據(jù),如今模型調(diào)用已經(jīng)沒有門檻,企業(yè)獨有的差異化的來源只有數(shù)據(jù),數(shù)據(jù)只有通過聚合與高效管理,才能產(chǎn)生價值。其三則是高效的策略和快速高效地執(zhí)行。
而多數(shù)項目之所以最終靜默暴斃,除了已經(jīng)客觀存在的管理、企業(yè)基礎設施以及數(shù)據(jù)之外,最大的問題就出在策略與執(zhí)行上。
圍繞策略與執(zhí)行,亞馬遜云科技還把過往項目執(zhí)行中的四大“爬坑”經(jīng)驗做了總結:
首先是針對場景,亞馬遜云科技給出七大評估維度與十一大場景總結,七大評估維度包括團隊、時間節(jié)點、可行性、預算、風險、ROI、數(shù)據(jù)是否支持;場景則包括翻譯、運營、寫作、角色扮演、教輔、辦公、客服、開發(fā)、審核、知識助手、運維。也就是說,團隊只有滿足了七大維度評估標準,項目上馬才會更安全,圍繞十一大成熟場景做落地,成功的概率也會更高。此外,圍繞場景,亞馬遜云科技還給出了成熟案例參考,加速團隊的創(chuàng)新。
確定了項目可以上馬后,接下來常見的問題是選型階段的技術錯配。亞馬遜云科技的實踐經(jīng)驗,技術選型需要從模型層、數(shù)據(jù)層和技術方案層三個維度進行系統(tǒng)性考慮。
在數(shù)據(jù)層,企業(yè)需要考慮:如何做分析、如何做管理、如何做切分和優(yōu)化;技術層,企業(yè)應該善于使用MCP、多Agent工具調(diào)用框架等方案,提升開發(fā)效率。最重要的是模型層,通常來說,企業(yè)在速度/時延、成本、精度這三大因素中,往往只需要三選其二即能滿足需求。
一個正面案例是,F(xiàn)reeWheel在廣告識別場景中對比評估了Nova Lite、GPT-4 mini與Claude 3 Haiku等多個模型。結果顯示,在延遲、輸出穩(wěn)定性與推理成本的綜合對比下,精度反而不是唯一決定因素。最終他們選擇了精度中上、推理速度極快、成本可控的方案,以實現(xiàn)批量部署與高頻調(diào)用的目標。
選型過程定好方案后,項目正式開始落地,此時的關注重點應該是ROI。為避免ROI不可控,亞馬遜云科技給出了六大階段、三個層面不同解決思路。圍繞六大階段,關于如何做用例、評估、POC、生產(chǎn)、規(guī)模化、治理,亞馬遜云科技都進行了細化。三層則是模型層、提示詞層、基礎設施層,亞馬遜云科技也給出了專門的優(yōu)化策略。
上馬之后,團隊需要繼續(xù)關注的是是否完成成果檢測閉環(huán),亞馬遜云科技同樣給出了質(zhì)量評估、性能評估、應用效果等不同維度的數(shù)據(jù),幫助企業(yè)衡量系統(tǒng)在實際場景中的效果、成本與用戶接受度。
總結來說,讓項目前期有預期,中期有選擇,后期有優(yōu)化,每一步都有憑有據(jù)有效果,是多數(shù)成功生成式AI項目落地的共同經(jīng)驗。而過程中,亞馬遜云科技就是那個保駕護航和幫助提供選擇和指標的加速器。
為什么是亞馬遜云科技
為什么多數(shù)企業(yè)都選擇亞馬遜云科技成為其生成式AI轉型路上的加速器?
不同企業(yè)的答案,各有千秋。
比如在咨詢公司德勤看來。 他們使用Amazon Q Developer來評估架構決策、檢查和記錄代碼、生成代碼、創(chuàng)建單元測試,并持續(xù)審查和執(zhí)行安全實踐,不止讓開發(fā)的速度提高了40%,測試時間減少了70%,代碼質(zhì)量有了很大提升,更是解放了開發(fā)人員不用再做那些枯燥的工作,讓工作變得更加有價值。
再比如,在WPS看來,WPS AI(海外版)通過Amazon Bedrock,進行語義檢查與文檔潤色,模型的快速響應大幅提升了修改速度,減少用戶等待時間,還實現(xiàn)了PPT一鍵生成、一句話擴寫PPT大綱、文檔轉PPT大綱、自動模板匹配等特色功能,解決了其出海過程中的研發(fā)、成本、用戶體驗多個困擾。
但總結來說,亞馬遜云科技帶給企業(yè)的,不只是一朵云,更是基于這一朵云的更低成本、更高水平安全合規(guī)、更多經(jīng)驗、與更多AI能力的提供。
眾所周知,云服務的本質(zhì)是一個講究規(guī)模效應的產(chǎn)業(yè)。而對生成式AI落地來說,更是如此,實驗室創(chuàng)新需要天馬行空,量產(chǎn)需要大量經(jīng)驗積累,大力出奇跡。而亞馬遜云科技作為全球第一大云,已經(jīng)覆蓋全球245個國家和地區(qū),與下一大云服務提供商相比,擁有三倍以上的數(shù)據(jù)中心數(shù)量。此外,亞馬遜云還以99.99%的超高可用性,成為中國唯一達到“四個九”標準的云服務提供商。
不只是規(guī)模大,亞馬遜云科技的另一大特點在于能力更全。現(xiàn)實中,多數(shù)企業(yè)都有轉型意識,卻沒有轉型能力,甚至更夸張來說,只有數(shù)據(jù),沒有能力。而亞馬遜云科技過去18個月推出的機器學習和生成式AI功能數(shù)量較全球主要云服務提供商的總和多出近兩倍。同時,提供覆蓋企業(yè)生成式AI創(chuàng)新所需的基礎設施、構建工具以及開箱即用型應用程序的全棧能力。
僅僅算力側,亞馬遜云科技除了能為客戶提供來自Nvidia的最新GPU計算實例,還能提供亞馬遜云科技自研的高性價比、低能耗自研AI芯片Trainium。
數(shù)據(jù)側,亞馬遜云科技提供的全面大數(shù)據(jù)能力,包括數(shù)據(jù)湖、數(shù)據(jù)倉庫、數(shù)據(jù)流、實時分析,能夠幫助客戶打破數(shù)據(jù)孤島,統(tǒng)一治理異構數(shù)據(jù),實現(xiàn)基于數(shù)據(jù)的業(yè)務洞察。
而在最重要的AI層面,亞馬遜除了是全球Gen AI轉型的先行者,同時亞馬遜云科技還能提供領先的模型和工具,包括Amazon Bedrock平臺,Amazon Q,Amazon Transform,Strands Agents SDK等簡單易用、功能完善強大的開發(fā)工具。此外,亞馬遜云科技還宣布2025年投入約1000億美元用于其人工智能項目的研發(fā)。其中大部分將用于AI相關項目,涵蓋AWS的數(shù)據(jù)中心、網(wǎng)絡設備、AI硬件以及生成式AI服務能力建設。
事實上,亞馬遜云科技能夠常年保持龍頭地位,除了更早的投入與更專注之外,另一大公開秘籍其實是善于分享。
對內(nèi)是生成式AI創(chuàng)新中心幫助伙伴成功;對外則是在中國峰會中分享經(jīng)驗,幫助更多企業(yè)順利轉型。讓企業(yè)生成式AI落地從59%的死亡率,變成82%的成功率,讓更多企業(yè)基于亞馬遜云科技,加速創(chuàng)新的發(fā)生,用整體的進步來做大蛋糕。
本內(nèi)容為作者獨立觀點,不代表虎嗅立場。未經(jīng)允許不得轉載,授權事宜請聯(lián)系 hezuo@huxiu.com
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4484340.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.