“生成式AI,正在讓大家重新認識云的價值。”
近日,在亞馬遜云科技生成式AI構建者大會上,亞馬遜云科技大中華區產品部總經理陳曉建這樣表示。
近兩個月,亞馬遜云科技在生成式AI領域動作密集。9月,斥40 億美元投資AI初創公司Anthropic,該公司研發的Claude大模型被認為是 GPT-4 的重要競品。隨后,宣布全托管服務Amazon Bedrock與Amazon Titan Embeddings模型正式可用,AI編程助手Amazon CodeWhisperer功能升級,Amazon QuickSight推出生成式BI創作功能……
目前,Amazon Bedrock已接入6款主流大模型,包括Anthropic Claude2,Stability AI Stable Diffusion XL,AI21 Labs Jurassic- 2,Cohere Command,Meta Llama 2,以及亞馬遜自研的Amazon Titan。
本次AI構建者大會還邀請到了LeptonAI CEO賈揚清、百川智能聯合創始人茹立云、愛詩科技CEO王長虎等業界大咖共同進行高峰對話。透過本次大會,我們不僅可以了解亞馬遜云科技的生成式AI技術在中國市場應用的最新進展,還能收獲各界大咖關于生成式AI的最新見解。
云計算,生成式AI的冰山底部
“生成式AI不僅僅是大模型。如果用冰山來比喻,露在海面上方的冰山一角就是基礎模型。而在冰山的底部,需要大量的基礎模型以外的服務來支撐,如加速芯片,數據庫,數據分析,數據安全服務等等。”對于生成式AI時代云計算的價值,陳曉建做了一個簡潔易懂的比喻。
透過今年云計算廠商在生成式AI領域的布局可以看出,從亞馬遜云科技,到百度智能云、阿里云,在自家模型能力的基礎上,各家都在強調生成式AI的基礎設施和開放平臺能力。
在冰山的底部,在亞馬遜云科技提供了完整的端到端的生成式AI技術堆棧,從底層的加速層如加速芯片,存儲優化,到中間層模型構建工具和服務,再到最上層的生成式AI相關應用,每一層都在針對客戶的不同需求持續創新。
“云計算本身是企業去運用生成式AI最好的方式。同時需要強調的一點是,如果考慮到整個生態、工具集和性能、規模等等,私有云和公有云應該是不可同日而語的,企業要充分利用云在模型、數據、算力等等方面的優勢,應該考慮的是公有云的環境。”陳曉建表示。
亞馬遜云科技大中華區產品部總經理 陳曉建
當算力成為生成式AI和大模型訓練的最大成本時,高性價比的基礎設施就是構建生成式AI應用的關鍵。
在基礎設施層面,亞馬遜云科技提供了豐富的算力解決方案。比如,基于英偉達H100 Tensor Core的Amazon EC2 P5實例,與上一代相比速度快6倍,訓練成本節省40%;基于亞馬遜云科技自研推理芯片Amazon Inferentia2的Amazon EC2 Inf2實例,與其他類似的EC2實例相比性價比高40%。
借助云平臺加速生成式AI創新,已經成為頭部AIGC初創公司的共同選擇。LeptonAI CEO賈揚清表示,LeptonAI自創立之初就建立在亞馬遜云科技的云服務之上。
“今天其實很多AIGC公司都還處于一種手拉肩扛的模式,自己建集群,自己管機器,自己手工部署模型等等。企業更應該關注,應該怎樣提升試錯的速度,用標準化的工具和服務迅速的把今天所見到的各種各樣的新模型很快拉起來,很快的對接用戶和場景。一個好的云的平臺,其實能夠讓企業的生產力提升數倍。”賈揚清強調。
百川智能聯合創始人茹立云認為,無論是調用API對基礎模型進行微調,還是進行生成式AI的私有化部署,“云廠商和模型廠商之間是強聯動的關系,云可以提供豐富的算力和工具,模型更多地在提供大腦(算法),兩方結合在一起,才能夠真正的變成一個可應用的產品。”
在中國,共創生成式AI應用落地
企業應該如何選擇基礎模型,又該如何結合自身業務,快速構建生成式AI應用,亞馬遜云科技從服務眾多企業的經驗中提取了一套方法論,包括五大層面:選擇合適的應用場景;借助專門構建的生成式AI工具和基礎設施;夯實數據基座;基于云原生服務加速構建AI原生應用;使用開箱即用的生成式AI服務。
在中國市場,已經有大批企業借助Amazon Bedrock、Amazon SageMaker、Amazon CodeWhisperer等AI平臺和工具加速業務創新,包括金山辦公、西門子、海爾、沐瞳科技、易點天下等等。
僅用3個月時間,西門子中國就與亞馬遜云科技合作推出了基于生成式人工智能技術的智能會話機器人“小禹”。作為西門子中國專屬智能知識庫,“小禹”可以快速回答與解決40%的IT支持問題,以及產品研發中大約30%跟編碼,測試,調試和文檔編制相關的任務。“小禹”上線后,首周就有超過4000位內部用戶參與使用,超過12000個問題被提出并解答。
“小禹”的亮點在于采用了“檢索增強生成RAG架構+向量數據庫”設計。“小禹”的核心主體知識庫以向量方式構建,能夠存儲超大規模的向量數據。
在知識庫場景下,針對提示工程效果不理想,模型微調又會導致成本較高現狀,亞馬遜云科技提供了檢索增強生成(RAG,Retrieval Augment Generation)方案,極大地拓展了大模型的可用性。普通情況下當知識庫新增內容時,相應的大模型必須進行微調,甚至是重新訓練。而 RAG 允許對新增部分使用相同的模型處理,無需調整模型。
“在亞馬遜云科技的幫助下,我們僅僅用了三個月時間就上線了生成式 AI 對話機器人‘小禹’。通過定制增強亞馬遜云科技所提供的以向量數據庫服務和大語言模型為基礎的知識庫原型,在短期內實現了快速、精準的查詢和回復。”西門子 IT經理李朝明表示。
在辦公軟件領域,金山辦公一直致力于將人工智能技術融入在辦公套件中。亞馬遜云科技客戶團隊聯合數據實驗室團隊和快速原型團隊,為金山辦公的 AI 創新探索提供新思路和建議,協助完成了向量搜索、Stable Diffusion 打包方案的 POC 測試。同時,金山辦公也率先投入了對Amazon Bedrock測試試用中。
在游戲行業,出海游戲公司沐瞳科技正在試用Amazon Bedrock,用于優化游戲開發領域的業務流程。在工業領域,海爾創新設計中心利用生成式AI能夠實現文生圖、圖生圖、定量圖和全場景圖四個方面的提效,上線后,自動化設計系統應用讓相關業務的操作周期縮短了20%。
在開箱即用的生成式AI工具方面,Amazon CodeWhisperer能夠讓軟件開發人員完成任務的速度平均快57%,成功率高27%。近期Amazon CodeWhisperer新增自定義功能,它允許客戶使用私有代碼庫安全地定制 CodeWhisperer代碼建議,這些私有代碼庫可涵蓋內部API、數據庫、最佳實踐和架構模式等。
據介紹,目前像Amazon CodeWhisperer這樣開箱即用的生成式AI服務及工具,已幫助1000+中小企業和初創公司快速實現生成式AI創新,已賦能10萬+中國開發者。
文中圖片來自攝圖網
本文為「智能進化論」原創作品。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.