過去一年,關(guān)于“大模型”的討論越過了研究圈、產(chǎn)業(yè)圈,走進(jìn)了政府文件、上市公司財報,也出現(xiàn)在越來越多企業(yè)的年終目標(biāo)中。無論是面向C端的智能助手,還是B端行業(yè)應(yīng)用的垂類模型,AI正在被一部分企業(yè)寄予“重構(gòu)工作流程”的厚望。
但在所有關(guān)于大模型能力的敘述背后,一個問題正變得越來越重要——誰來為它們提供持續(xù)、可用的數(shù)據(jù)支撐?
主流模型廠商的訓(xùn)練任務(wù),已進(jìn)入TB到PB級的數(shù)據(jù)量級。數(shù)據(jù)調(diào)度、訪問頻率、傳輸穩(wěn)定性和讀取延遲,成為影響模型效果甚至商業(yè)化效率的變量。可以這樣說:“大模型的能力上限,一部分取決于它‘吃’了什么數(shù)據(jù),另一部分取決于它‘怎么吃’。”
傳統(tǒng)的存儲系統(tǒng),習(xí)慣于服務(wù)于結(jié)構(gòu)化數(shù)據(jù)和面向人類使用場景的查詢請求;但現(xiàn)在它們要面對的是參數(shù)動輒千億、需要并行讀取、多模態(tài)理解的大模型。存儲從后臺系統(tǒng)走到了模型前臺,需要兼顧性能、成本和靈活性;而這些,本不是為其設(shè)計的核心目標(biāo)。
與此同時,存儲也不是單方面“供血”的角色。在部分高頻推理、邊緣部署和多語言模型場景中,模型反過來開始影響數(shù)據(jù)訪問方式和存儲架構(gòu)。過去那種“訓(xùn)練完模型再看怎么部署”的線性鏈條,正在被打破。一種新的協(xié)同邏輯正在出現(xiàn):模型與數(shù)據(jù)之間不再是供需,而是博弈與優(yōu)化。
更現(xiàn)實的難題是安全。大模型應(yīng)用于企業(yè)內(nèi)部數(shù)據(jù)后,訪問權(quán)限、數(shù)據(jù)歸屬和模型泄密風(fēng)險變成了繞不過去的問題。一些領(lǐng)先企業(yè)已經(jīng)開始探索“雙網(wǎng)絡(luò)”“數(shù)據(jù)隔離”“最小權(quán)限”等機(jī)制,但仍缺乏成體系的行業(yè)標(biāo)準(zhǔn),也尚未形成明確的監(jiān)管路徑。
那這些難題怎么破解呢?為了回答這個問題,數(shù)據(jù)猿策劃了一場線上直播對話,邀請業(yè)界專家,來共同探討這個話題。
本次線上直播論道中,就以下熱點展開討論:
? AI大模型商用,對數(shù)據(jù)存儲提出了哪些“新剛需”?
? 大模型如何“用好”數(shù)據(jù)存儲能力,加速商用落地?
? 數(shù)據(jù)安全、隱私保護(hù),如何在模型與存儲協(xié)同中落地?
? 共建“模型+數(shù)據(jù)”協(xié)同生態(tài),廠商如何形成可持續(xù)合作機(jī)制?
田稼豐丨中國信通院云計算與大數(shù)據(jù)研究所高級業(yè)務(wù)主管
長期研究大數(shù)據(jù)、數(shù)據(jù)存儲、數(shù)據(jù)智能等,牽頭編寫大數(shù)據(jù)白皮書、數(shù)據(jù)智能研究報告、下一代數(shù)據(jù)存儲技術(shù)等研究報告,編寫內(nèi)存數(shù)據(jù)庫、全文檢索、對象存儲、數(shù)據(jù)災(zāi)備等標(biāo)準(zhǔn)。持續(xù)推動企業(yè)數(shù)智化能力相關(guān)測試評估工作,具有豐富的產(chǎn)業(yè)研究、標(biāo)準(zhǔn)制定、評測及評估經(jīng)驗。
曹羽中丨華瑞指數(shù)云聯(lián)合創(chuàng)始人兼CTO
現(xiàn)負(fù)責(zé)華瑞指數(shù)云產(chǎn)品及研發(fā)工作,具備長期的分布式系統(tǒng)架構(gòu)和系統(tǒng)軟件研發(fā)經(jīng)驗,廣闊和前瞻的技術(shù)視野和產(chǎn)業(yè)視野,豐富的技術(shù)規(guī)劃和產(chǎn)品研發(fā)端到端的技術(shù)管理經(jīng)驗。專注于云計算、軟件定義存儲、存算分離等領(lǐng)域的技術(shù)創(chuàng)新。
何征宇丨傳神語聯(lián)副總裁兼研究院院長
2007年加入傳神語聯(lián),現(xiàn)擔(dān)任傳神語聯(lián)網(wǎng)研究院院長,同時兼任湖北省軟件行業(yè)協(xié)會人工智能專業(yè)委員會副主任職務(wù)。擁有豐富的系統(tǒng)架構(gòu)設(shè)計、大數(shù)據(jù)處理和人工智能的技術(shù)及實踐經(jīng)驗,目前主要負(fù)責(zé)語聯(lián)網(wǎng)平臺大語言模型、機(jī)器翻譯以及區(qū)塊鏈等技術(shù)在語言服務(wù)行業(yè)的應(yīng)用落地。
張艷飛丨數(shù)據(jù)猿聯(lián)合創(chuàng)始人兼主編
擁有十多年科技互聯(lián)網(wǎng)行業(yè)媒體從業(yè)經(jīng)歷,曾在艾瑞、網(wǎng)易等業(yè)內(nèi)知名企業(yè)負(fù)責(zé)媒體內(nèi)容及運營層面相關(guān)工作,并于2015年聯(lián)合創(chuàng)立大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新服務(wù)媒體——數(shù)據(jù)猿。
張艷飛也是中關(guān)村數(shù)智人工智能產(chǎn)業(yè)聯(lián)盟理事,曾獲科特勒咨詢集團(tuán)榮譽(yù)顧問、大中華區(qū)艾菲獎實效觀察員、騰訊云社區(qū)優(yōu)秀講師等榮譽(yù)。
張艷飛在大數(shù)據(jù)、人工智能、云計算等新技術(shù)的產(chǎn)業(yè)應(yīng)用,以及數(shù)字營銷、金融科技、工業(yè)互聯(lián)網(wǎng)、智能制造等領(lǐng)域均擁有豐富的第三方機(jī)構(gòu)及媒體從業(yè)經(jīng)驗。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.