近日,IEEE面向全球正式推出《知識圖譜技術(shù)要求和評估標(biāo)準(zhǔn)》,標(biāo)志著知識圖譜領(lǐng)域迎來首個國際通用規(guī)范。在工信部電子工業(yè)標(biāo)準(zhǔn)化研究院牽頭下,浪潮信息攜手北京大學(xué)、阿里巴巴等單位共同參編,為知識圖譜的構(gòu)建、性能指標(biāo)與測試方法劃定統(tǒng)一坐標(biāo)系。這一標(biāo)準(zhǔn)將助力知識圖譜與大語言模型深度融合,降低“幻覺”風(fēng)險,推動AI從單純的數(shù)據(jù)驅(qū)動邁向“知識驅(qū)動”新時代,浪潮信息也借此進(jìn)一步夯實其在智能計算生態(tài)中的關(guān)鍵地位。
大模型發(fā)展亟需標(biāo)準(zhǔn)化的知識圖譜
知識圖譜是一種結(jié)構(gòu)化的語義網(wǎng)絡(luò),用于描述現(xiàn)實世界中的實體及其相互關(guān)系,將實體和關(guān)系抽象成圖形結(jié)構(gòu)。它以圖數(shù)據(jù)結(jié)構(gòu)的形式表示知識,既符合人類認(rèn)知習(xí)慣又對機(jī)器計算友好。
知識圖譜此前主要應(yīng)用于全球各個互聯(lián)網(wǎng)搜索引擎中,在LLM興起后,知識圖譜迎來新一輪發(fā)展機(jī)遇。知識圖譜可為LLM提供準(zhǔn)確背景知識、輔助推理和理解、提升可解釋性,解決LLM的“幻覺”問題,并支持領(lǐng)域適配和個性化應(yīng)用,對提升LLM的性能和應(yīng)用價值具有重要作用。因而,越來越多的研究者將知識圖譜與LLM相結(jié)合,知識圖譜與預(yù)訓(xùn)練模型的融合、基于知識圖譜的預(yù)訓(xùn)練模型、混合預(yù)訓(xùn)練模型等三種不同的融合方式,都取得了很好的成果,例如BERT-based模型通過引入知識圖譜中的關(guān)系,大幅度擴(kuò)展模型的表示能力。
但是知識圖譜一直缺乏統(tǒng)一標(biāo)準(zhǔn),知識難以實現(xiàn)跨系統(tǒng)的聚合,在數(shù)據(jù)、推理、應(yīng)用等多個層面給大模型帶來系統(tǒng)性問題,如數(shù)據(jù)層面的語義歧義與處理效率低下、推理層面的邏輯斷層與可解釋性缺失、應(yīng)用層面的跨領(lǐng)域融合困難與行業(yè)落地受阻等等,這些問題不僅影響模型性能,還阻礙著其在垂直領(lǐng)域的深度落地。
知識圖譜,有了系統(tǒng)化的技術(shù)框架
《知識圖譜技術(shù)要求和評估標(biāo)準(zhǔn)》涵蓋了知識圖譜的構(gòu)建、應(yīng)用、性能測試及評估,適用于各類計劃、設(shè)計、開發(fā)、實施和應(yīng)用知識圖譜的組織,以及為知識圖譜提供技術(shù)支持、工具和服務(wù)的機(jī)構(gòu)。
知識圖譜構(gòu)建與應(yīng)用系統(tǒng)測試流程
該標(biāo)準(zhǔn)提出了一個系統(tǒng)化、細(xì)致的質(zhì)量評估框架,詳細(xì)說明了各項評估指標(biāo),并且規(guī)定了硬件、軟件和網(wǎng)絡(luò)等詳盡的測試環(huán)境要求,以及不同模塊的性能測試方法。僅是應(yīng)用模塊的評估,就包括響應(yīng)性、友好性、可靠性、可移植性、安全性和場景支持等多個具體要求和量化性能指標(biāo)。
知識圖譜應(yīng)用模塊質(zhì)量評估指標(biāo)體系
標(biāo)準(zhǔn)更加強調(diào)實時性、安全性、多模態(tài)支持等現(xiàn)代知識圖譜應(yīng)用的核心需求。標(biāo)準(zhǔn)要求知識圖譜在更新內(nèi)容時不影響查詢服務(wù),并支持實時融合新知識。同時,標(biāo)準(zhǔn)要求本體模型支持多種硬件環(huán)境、操作系統(tǒng)、數(shù)據(jù)庫和編程語言,確保其在不同環(huán)境中的兼容性和可移植性。
賦能大模型,從數(shù)據(jù)驅(qū)動到知識驅(qū)動
《知識圖譜技術(shù)要求和評估標(biāo)準(zhǔn)》為不同的知識圖譜系統(tǒng)提供了統(tǒng)一規(guī)范,使得不同系統(tǒng)和領(lǐng)域的知識可以聚合、融合,讓AI從 “數(shù)據(jù)驅(qū)動” 向 “知識驅(qū)動” 升級。
以智慧城市場景為例,交通部門的“道路擁堵-事故”圖譜與醫(yī)療部門的“急救資源-醫(yī)院”圖譜如果沒有統(tǒng)一空間坐標(biāo)系,大模型就無法直接關(guān)聯(lián) “擁堵路段” 與 “最近醫(yī)院”,需集成工具軟件或者以人工方式進(jìn)行坐標(biāo)數(shù)據(jù)轉(zhuǎn)換,費時費力。如果兩個圖譜采用統(tǒng)一標(biāo)準(zhǔn),那么大模型可以直接將兩個圖譜中的知識融合,把“道路擁堵-交通事故-醫(yī)院”進(jìn)行關(guān)聯(lián)處理,輸出最優(yōu)的路線規(guī)劃,效率倍增。
融合的知識圖譜將推動大模型降低幻覺、提高智能水平,為AI產(chǎn)業(yè)打開新的發(fā)展局面。知識圖譜標(biāo)準(zhǔn)化后,可以最大程度上聚合領(lǐng)域?qū)I(yè)知識,并實現(xiàn)多領(lǐng)域、多組織知識的融合,形成豐富強大的知識圖譜系統(tǒng),從而解決大模型在專業(yè)領(lǐng)域或者具體應(yīng)用場景面臨的知識語料頻次過低的問題。強大的知識圖譜系統(tǒng)不僅可以通過結(jié)構(gòu)化知識對大模型輸出進(jìn)行校驗,確保事實準(zhǔn)確性,也可以通過預(yù)定義的領(lǐng)域知識框架讓大模型能理解概念間的深層關(guān)聯(lián),更好的解決幻覺問題,提高模型智力水平。更為重要的是,可以讓模型更好發(fā)展某一領(lǐng)域的專業(yè)能力,走向不同的應(yīng)用場景。
標(biāo)準(zhǔn)化開啟產(chǎn)業(yè)化新機(jī)遇
自2012年Google提出概念以來,知識圖譜從無到有,已經(jīng)形成了初步的技術(shù)體系,標(biāo)準(zhǔn)化將加速知識圖譜的產(chǎn)業(yè)化進(jìn)程,帶來新一輪發(fā)展機(jī)遇。不僅是LLM領(lǐng)域,知識圖譜在傳統(tǒng)企業(yè)用戶中也有著廣泛應(yīng)用前景,如客戶關(guān)系管理和精準(zhǔn)營銷、供應(yīng)鏈優(yōu)化與風(fēng)險管理、財務(wù)合規(guī)與風(fēng)控等,標(biāo)準(zhǔn)化將讓更多的傳統(tǒng)企業(yè)開始部署知識圖譜系統(tǒng)。
要讓標(biāo)準(zhǔn)真正落地,產(chǎn)業(yè)力量至關(guān)重要。作為參編企業(yè),浪潮信息已將完整的知識圖譜開發(fā)與運維套件嵌入自家AI軟件棧,使企業(yè)能像管理固定資產(chǎn)一樣高效積累和運營知識資產(chǎn)。符合《知識圖譜技術(shù)要求和評估標(biāo)準(zhǔn)》的工具鏈,為用戶帶來標(biāo)準(zhǔn)化、自動化優(yōu)勢。憑借在服務(wù)器與開放計算標(biāo)準(zhǔn)上的深厚積累,浪潮信息不僅參與制定240余項標(biāo)準(zhǔn),更在OpenRack、冷板液冷、OAM等方向推動大規(guī)模產(chǎn)業(yè)化,為知識圖譜生態(tài)注入可持續(xù)動力。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.