8月30日,上海市國(guó)資委發(fā)布2024上海國(guó)資國(guó)企數(shù)字化轉(zhuǎn)型應(yīng)用場(chǎng)景清單,覆蓋了40家企業(yè)集團(tuán)的308個(gè)場(chǎng)景。場(chǎng)景清單中對(duì)前沿科技、數(shù)字技術(shù)需求旺盛,其中AI大模型等新技術(shù)場(chǎng)景需求金額接近12億元,占到總需求金額近1/3,308個(gè)場(chǎng)景中涉及行業(yè)典型應(yīng)用示范101個(gè),行業(yè)級(jí)應(yīng)用場(chǎng)景需求覆蓋交通、金融、新消費(fèi)等多個(gè)行業(yè)。此外,由上海市國(guó)資委、經(jīng)信委、數(shù)據(jù)局共同揭牌成立的上海國(guó)資國(guó)企數(shù)字化轉(zhuǎn)型創(chuàng)新基地還大力支持支持企業(yè)落地垂類大模型應(yīng)用。
產(chǎn)業(yè)需求旺盛,大模型正在加快重塑諸多行業(yè)的應(yīng)用場(chǎng)景,引發(fā)新一輪產(chǎn)業(yè)變革。中國(guó)信息通信研究院人工智能所主任曹峰說(shuō)“大模型產(chǎn)業(yè)化落地已進(jìn)入關(guān)鍵階段,已經(jīng)在多個(gè)通用場(chǎng)景取得了較好的效果,當(dāng)前正處于從通用場(chǎng)景向?qū)I(yè)場(chǎng)景拓展的關(guān)鍵期,專業(yè)場(chǎng)景是應(yīng)用拓展的核心方向,企業(yè)“研產(chǎn)供銷服”全業(yè)務(wù)場(chǎng)景均有大量高價(jià)值場(chǎng)景待與AI深度融合。”
大模型產(chǎn)業(yè)的發(fā)展現(xiàn)狀如何,落地應(yīng)用面臨的挑戰(zhàn)有哪些,企業(yè)落地AI大模型的問(wèn)題有哪些以及破局之道是什么?針對(duì)這些當(dāng)下大模型產(chǎn)業(yè)落地的核心話題,本周二,中國(guó)信息通信研究院人工智能所主任曹峰、北京智源人工智能研究院行業(yè)應(yīng)用團(tuán)隊(duì)專家于龍斌、首都醫(yī)科大學(xué)科技成果轉(zhuǎn)化部技術(shù)轉(zhuǎn)移辦公室主任郜文等行業(yè)專家代表、AI大模型解決方案單位代表齊聚北京,展開(kāi)深入的探討與交流。
01
大模型技術(shù)快速演進(jìn)
中國(guó)信息通信研究院人工智能所主任曹峰談道,大模型參數(shù)規(guī)模從最初的百億級(jí)迅速發(fā)展到千億級(jí)甚至萬(wàn)億級(jí),規(guī)模擴(kuò)張紅利仍然持續(xù),模型規(guī)模增大能有效提升任務(wù)效果;混合架構(gòu)和多模態(tài)為大模型算法演進(jìn)開(kāi)辟新方向。
曹峰指出,基礎(chǔ)設(shè)施作為支撐人工智能實(shí)現(xiàn)突破的基座,主要集中在訓(xùn)練、推理及應(yīng)用開(kāi)發(fā)三個(gè)方面。模型雖然作為AI的核心的技術(shù),但是它在落地仍然會(huì)遇到一系列的問(wèn)題,首先要解決如何進(jìn)行高效低成本的訓(xùn)練,所以在訓(xùn)練側(cè),分布式框架技術(shù)的突破,集群擴(kuò)張,芯片的優(yōu)化就是在推動(dòng)高效低成本訓(xùn)練。推理側(cè)的核心的問(wèn)題也是降低成本,架構(gòu)優(yōu)化、技術(shù)優(yōu)化和芯片優(yōu)化持續(xù)降低了推理成本及兼容性應(yīng)用成本,今年年中開(kāi)始大模型廠商都在降價(jià)就是得益于推理成本的持續(xù)降低。此外圍繞模型的全生命周期在創(chuàng)新,大模型的工程落地架構(gòu)逐漸清晰,分為基礎(chǔ)設(shè)施層、平臺(tái)工具層、模型庫(kù)和數(shù)據(jù)集層、應(yīng)用開(kāi)發(fā)平臺(tái)層,大模型主要?jiǎng)?chuàng)新方向是降低應(yīng)用門檻,豐富應(yīng)用場(chǎng)景和模式。
北京科智咨詢有限公司研究總監(jiān)弓瑞峰表示,技術(shù)突破讓大模型越過(guò)夭折線進(jìn)入成長(zhǎng)期,開(kāi)始產(chǎn)業(yè)化。
目前AI大模型產(chǎn)業(yè)算力及應(yīng)用兩翼迅猛發(fā)展,截至2024年8月底有400個(gè)智算中心正在建設(shè)中,截至今年4月,已上線的大模型超過(guò)260個(gè),其中面向行業(yè)及業(yè)務(wù)場(chǎng)景的垂類大模型占比近80%。
02
落地應(yīng)用面臨的挑戰(zhàn)有哪些
曹峰指出,大模型在通用場(chǎng)景的落地已取得較好效果,例如表格處理、會(huì)議轉(zhuǎn)錄等,這些應(yīng)用能夠有效提升辦公效率,降低人工成本。然而,在專業(yè)場(chǎng)景,例如工業(yè)質(zhì)檢、金融風(fēng)控等,大模型的落地仍然面臨著挑戰(zhàn)。這些場(chǎng)景往往需要更高的準(zhǔn)確性和更強(qiáng)的專業(yè)知識(shí),對(duì)大模型的泛化能力和魯棒性提出了更高的要求。
曹峰強(qiáng)調(diào),大模型的落地需要強(qiáng)大的算力、數(shù)據(jù)和算法支撐,這對(duì)許多企業(yè)來(lái)說(shuō)是一個(gè)巨大的挑戰(zhàn),不同行業(yè)和場(chǎng)景對(duì)大模型的需求差異很大,需要進(jìn)行定制化開(kāi)發(fā),才能滿足特定場(chǎng)景的需求。
北京智源人工智能研究院行業(yè)應(yīng)用團(tuán)隊(duì)專家于龍斌表示,今年大家都在講卷應(yīng)用,如何才能真正讓大模型在行業(yè)應(yīng)用落地,需要關(guān)注大小模型協(xié)同、模型高效化和小型化、數(shù)據(jù)質(zhì)量、算力適配與優(yōu)化、多模態(tài)大模型發(fā)展以及復(fù)合型人才培養(yǎng)等這幾方面的關(guān)鍵問(wèn)題。
展開(kāi)來(lái)說(shuō),大模型與小模型協(xié)同發(fā)展,端側(cè)小模型采集敏感數(shù)據(jù),后端大模型進(jìn)行分析,通過(guò)模型量化、壓縮、剪枝等技術(shù)降低模型參數(shù)量級(jí),提升效率并降低資源消耗,讓模型高效化,智源和中國(guó)衛(wèi)星的合作就是用來(lái)一個(gè)0.3B參數(shù)的多模態(tài)模型。高質(zhì)量的數(shù)據(jù)是模型訓(xùn)練的關(guān)鍵,數(shù)據(jù)的匯聚、清洗、分類等處理至關(guān)重要。此外還要積極適配國(guó)產(chǎn) GPU,優(yōu)化網(wǎng)絡(luò)架構(gòu),提升算力利用效率。現(xiàn)在行業(yè)都在卷模型卷應(yīng)用,但針對(duì)于又懂業(yè)務(wù)又懂技術(shù)的復(fù)合型人才,是比較短缺的,這也是技術(shù)方和應(yīng)用方合作時(shí)產(chǎn)生的共識(shí)。
針對(duì)大模型應(yīng)用落地在某一特定行業(yè),首都醫(yī)科大學(xué)科技成果轉(zhuǎn)化部技術(shù)轉(zhuǎn)移辦公室主任郜文從大模型在醫(yī)療場(chǎng)景的應(yīng)用展開(kāi)了更深入的分享。
郜文談道,醫(yī)學(xué)具有不確定性,大模型的知識(shí)積累并不能代替醫(yī)生的經(jīng)驗(yàn)和判斷。醫(yī)療領(lǐng)域需要明確大模型的定位和應(yīng)用場(chǎng)景,避免資源浪費(fèi)。醫(yī)療大模型的應(yīng)用定位應(yīng)該是大型醫(yī)院醫(yī)生的助手,來(lái)幫助醫(yī)生管理病人,提升溝通效率;基層醫(yī)生的指導(dǎo)老師,為基層醫(yī)生提供便捷的知識(shí)和經(jīng)驗(yàn)支持。
關(guān)于大模型在醫(yī)療領(lǐng)域的落地也有許多難題,首先醫(yī)生是一個(gè)謹(jǐn)慎的群體,需要積極溝通并取得他們的信任和合作。其次是醫(yī)療數(shù)據(jù)問(wèn)題,醫(yī)療數(shù)據(jù)是一個(gè)很大的資產(chǎn),關(guān)于數(shù)據(jù)資產(chǎn)的確權(quán)非常難,郜文指出,個(gè)體醫(yī)療數(shù)據(jù)看似屬于個(gè)人,但海量數(shù)據(jù)的聚合卻使得權(quán)屬變得模糊,究竟是屬于病人、醫(yī)院還是數(shù)據(jù)處理公司,目前尚無(wú)定論,這種權(quán)屬的不確定性也會(huì)導(dǎo)致許多公司在處理醫(yī)療數(shù)據(jù)時(shí)面臨法律風(fēng)險(xiǎn)。此外,醫(yī)療領(lǐng)域的技術(shù)產(chǎn)品還面臨著嚴(yán)格的行政監(jiān)管,例如基因編輯技術(shù),雖然是領(lǐng)先的技術(shù),但也必須符合倫理規(guī)范和政策管理制度,否則就無(wú)法應(yīng)用。
郜文認(rèn)為,在醫(yī)療領(lǐng)域應(yīng)用大模型或開(kāi)展相關(guān)研究時(shí),必須充分重視數(shù)據(jù)確權(quán)和政策合規(guī)性問(wèn)題,在政策允許的范圍內(nèi)開(kāi)展工作,才能確保項(xiàng)目的順利進(jìn)行并避免潛在的法律和倫理風(fēng)險(xiǎn)。
而針對(duì)大模型產(chǎn)業(yè)發(fā)展的限制因素,北京科智咨詢有限公司研究總監(jiān)弓瑞峰認(rèn)為,一是場(chǎng)景應(yīng)用不夠豐富,國(guó)外大模型應(yīng)用場(chǎng)景和行業(yè)覆蓋范圍更廣,國(guó)內(nèi)應(yīng)用落地仍需拓展。二是共生生態(tài)建設(shè)不夠完善,高校、科研機(jī)構(gòu)、AI 服務(wù)商之間缺乏有效協(xié)同,產(chǎn)學(xué)研合作有待加強(qiáng)。三是智能算力供應(yīng)受限,高端訓(xùn)練芯片仍受制于國(guó)外廠商,國(guó)產(chǎn)芯片在訓(xùn)練芯片領(lǐng)域仍需突破。
03
企業(yè)如何落地AI大模型
曹峰認(rèn)為,企業(yè)落地AI應(yīng)從工程思維出發(fā),構(gòu)建體系化的 “架構(gòu)圖”和“方法論”。曹峰建議,企業(yè)落地大模型需要明確技術(shù)指標(biāo)和評(píng)估方法,選擇適合自身需求的模型,并構(gòu)建一整套支撐模型運(yùn)行和應(yīng)用的工程架構(gòu),包括硬實(shí)力建設(shè)和軟體系建設(shè)。
曹峰還總結(jié)了企業(yè)落地大模型的八大關(guān)鍵技術(shù)。
1.構(gòu)建高可用、高性能、可擴(kuò)展的智算設(shè)施,大模型的訓(xùn)練和推理對(duì)算力基礎(chǔ)設(shè)施提出了更高的要求,企業(yè)需要建設(shè)高質(zhì)量的智算中心,具備高能效的算力供給、高性能的存力保障和高可靠的運(yùn)力承載能力。
2.夯實(shí)企業(yè)面向人工智能的數(shù)據(jù)治理和供給體系,企業(yè)需要構(gòu)建面向 AI 的數(shù)據(jù)治理體系,解決業(yè)務(wù)數(shù)據(jù)“高量低質(zhì)”、數(shù)據(jù)管理體系不成熟以及數(shù)據(jù)和模型流水線匹配度不夠等問(wèn)題,為大模型提供高質(zhì)量的數(shù)據(jù)支持。
3.構(gòu)建人工智能中臺(tái),企業(yè)需要構(gòu)建 AI 中臺(tái),打通數(shù)據(jù)、業(yè)務(wù)和 AI 能力,重塑智能化轉(zhuǎn)型能力底座,并與現(xiàn)有 IT 基礎(chǔ)設(shè)施和業(yè)務(wù)平臺(tái)深度融合。
4.建立大模型評(píng)測(cè)體系,大模型評(píng)測(cè)需要貫穿企業(yè)智能化全生命周期,從模型選型、上線到持續(xù)優(yōu)化,都需要通過(guò)評(píng)測(cè)體系來(lái)保障應(yīng)用質(zhì)量。
5.構(gòu)建模型服務(wù)體系,企業(yè)需要構(gòu)建模型服務(wù)體系,支撐模型的高效構(gòu)建、部署、監(jiān)控和調(diào)用,實(shí)現(xiàn)模型即服務(wù)(MaaS),為業(yè)務(wù)部門提供便捷的模型服務(wù)。
6.開(kāi)發(fā)人工智能原生應(yīng)用,企業(yè)需要開(kāi)發(fā) AI 原生應(yīng)用,例如智能體(AI Agent)、檢索增強(qiáng)生成(RAG)等,提升大模型應(yīng)用的易用性,并解決可信可控等問(wèn)題。
7.構(gòu)建企業(yè)人工智能管理體系,企業(yè)需要構(gòu)建 AI 管理體系,對(duì) AI 資產(chǎn)、流程和團(tuán)隊(duì)進(jìn)行統(tǒng)一管理,提高 AI 應(yīng)用的效率、質(zhì)量和安全性。
8.建立企業(yè)人工智能應(yīng)用成熟度體系,企業(yè)需要進(jìn)行 AI 應(yīng)用成熟度評(píng)估,客觀評(píng)價(jià) AI 應(yīng)用水平,促進(jìn) AI 產(chǎn)業(yè)的健康穩(wěn)健長(zhǎng)久發(fā)展。
以“探索AI邊界 重構(gòu)數(shù)字場(chǎng)景”為主題2024數(shù)字開(kāi)物系列活動(dòng)將于9月25日在北京正式召開(kāi)。
會(huì)議完整議程
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.