作者簡介
蔡躍洲 劉悅欣
中國社會科學院數(shù)量經(jīng)濟與技術經(jīng)濟研究所
中國社會科學院大學商學院
發(fā)表于《China Economist》2022年第6期
摘要
社會各界高度關注數(shù)據(jù)要素及其流動交易,但過于聚焦個人行為數(shù)據(jù)和數(shù)據(jù)交易所模式。為更為全面地反映數(shù)據(jù)流動交易狀況,在對不同視角數(shù)據(jù)要素分類歸納的基礎上,按照數(shù)據(jù)涉及行為主體,從個人數(shù)據(jù)、企業(yè)數(shù)據(jù)、公共數(shù)據(jù)三個方面對數(shù)據(jù)流動交易模式進行系統(tǒng)梳理,并綜合不同來源的資料,對全球主要經(jīng)濟體當下數(shù)據(jù)資源和數(shù)據(jù)市場交易規(guī)模及其趨勢特征進行了估算分析。研究結果表明:(1)豐富的現(xiàn)實場景決定了數(shù)據(jù)分類的多樣性,而不同類型數(shù)據(jù)的涉及主體、權屬劃分、信息密度等特征存在較大差異,由此帶來流動交易模式及收益分配的復雜性。(2)全球數(shù)據(jù)流動交易呈現(xiàn)產(chǎn)品化、服務化和平臺化趨勢特征。(3)全球主要經(jīng)濟體都存在數(shù)據(jù)生成規(guī)模與數(shù)據(jù)存儲規(guī)模失衡,中國的情況尤為突出。(4)全球數(shù)據(jù)交易市場處于初期快速發(fā)展階段,成交規(guī)模數(shù)量級大致為千億美元,中國的數(shù)據(jù)要素市場發(fā)育更不充分,規(guī)模僅為全球的10%左右。社會各界應充分意識到數(shù)據(jù)要素分類和數(shù)據(jù)流動交易的多樣性、復雜性以及相關制度體系構建的艱巨性、長期性,并順應這些特點著力健全數(shù)據(jù)分級分類、加強存力算力基礎設施建設、培育數(shù)據(jù)交易開發(fā)專業(yè)機構、完善數(shù)據(jù)治理體系。
數(shù)據(jù)要素;數(shù)據(jù)分類;流動交易模式;生成存儲規(guī)模;交易成交規(guī)模
JEL分類號:D83, O25
一、引言
隨著移動互聯(lián)網(wǎng)、3G/4G/5G通信、云計算、人工智能等新一代信息技術的大規(guī)模商業(yè)化應用,數(shù)據(jù)的生產(chǎn)、收集、傳輸、處理、分析發(fā)生了全方位革命性變化,產(chǎn)生并積累了大量數(shù)據(jù)資源。豐富的數(shù)據(jù)資源為更多數(shù)據(jù)分析應用場景提供了基礎,催生出以平臺經(jīng)濟(共享經(jīng)濟)為代表的各種新業(yè)態(tài)、新模式,成為重構經(jīng)濟社會生產(chǎn)生活組織模式的關鍵要素。2019年,黨的十九屆四中全會通過的《中共中央關于堅持和完善中國特色社會主義制度、推進國家治理體系和治理能力現(xiàn)代化若干重大問題的決定》提出“健全勞動、資本、土地、知識、技術、管理、數(shù)據(jù)等生產(chǎn)要素由市場評價貢獻、按貢獻決定報酬的機制”,明確將數(shù)據(jù)列為第七大生產(chǎn)要素。這表明,數(shù)字經(jīng)濟時代數(shù)據(jù)在微觀生產(chǎn)運營、宏觀經(jīng)濟增長及發(fā)展中所發(fā)揮的作用得到廣泛認可。
數(shù)字經(jīng)濟時代的比特數(shù)據(jù)具有非競爭性、非排他性、低成本復制、網(wǎng)絡外部性、即時性等技術-經(jīng)濟特征,能夠提高微觀運行效率,并在宏觀層面實現(xiàn)價值創(chuàng)造的倍增效應(蔡躍洲、馬文君,2021)。而發(fā)揮數(shù)據(jù)要素效率提升和價值倍增作用的一個重要前提在于實現(xiàn)其安全、有序、充分流動。為此,宏觀調(diào)控部門針對數(shù)據(jù)流動交易和要素市場建設,先后出臺多個文件予以指導。2021年12月,國務院辦公廳發(fā)布《要素市場化配置綜合改革試點總體方案》強調(diào),完善公共數(shù)據(jù)開放共享機制、建立健全數(shù)據(jù)流通交易規(guī)則、拓展規(guī)范化數(shù)據(jù)開發(fā)利用場景、加強數(shù)據(jù)安全保護,探索建立數(shù)據(jù)要素流通規(guī)則,并提出“原始數(shù)據(jù)不出域、數(shù)據(jù)可用不可見”的交易范式和數(shù)據(jù)使用“可控可計量”原則。2022年6月22日,中央全面深化改革委員會通過《關于構建數(shù)據(jù)基礎制度更好發(fā)揮數(shù)據(jù)要素作用的意見》,明確指出要加快構建數(shù)據(jù)基礎制度體系,推進數(shù)據(jù)產(chǎn)權、流通交易、收益分配和安全治理,以促進數(shù)據(jù)流通使用,賦能實體經(jīng)濟。2016年以來先后通過的《中華人民共和國網(wǎng)絡安全法》《中華人民共和國數(shù)據(jù)安全法》《中華人民共和國個人信息保護法》則著重從數(shù)據(jù)安全角度對數(shù)據(jù)流動活動進行規(guī)范。
自2015年貴陽大數(shù)據(jù)交易所成立以來,地方政府紛紛著手推動數(shù)據(jù)交易所(中心)建設,作為規(guī)范數(shù)據(jù)流動交易的具體舉措。目前,包括北京、上海、深訓、廣州、福建、鄭州等地都陸續(xù)成立了數(shù)據(jù)交易所(中心)。政府推動加上媒體報道和道染,使得當下社會公眾乃至學術界的注意力更多集中在個人行為數(shù)據(jù)和數(shù)據(jù)交易所模式上,相關的學術探討和制度建設也隨之傾斜。
然而,數(shù)字經(jīng)濟實踐中所產(chǎn)生的數(shù)據(jù)類型眾多,其流動交易模式也存在很大差別?;谙M互聯(lián)網(wǎng)產(chǎn)生的個人行為數(shù)據(jù)僅僅是全社會海量數(shù)據(jù)資源的一部分,而數(shù)據(jù)交易所撮合交易也只是數(shù)據(jù)交易的一種具體實現(xiàn)方式,更多交易可以由供需雙方通過點對點以數(shù)據(jù)產(chǎn)品/服務方式來達成。建立健全數(shù)據(jù)相關基礎制度體系,切實發(fā)揮數(shù)據(jù)作為關鍵生產(chǎn)要素在效率提升、價值倍增中的支撐作用,有必要在數(shù)據(jù)內(nèi)涵辨析和分類基礎上,全面梳理數(shù)據(jù)流動交易模式、掌握數(shù)據(jù)資源規(guī)模結構等情況,歸納其特性趨勢。為此,本文后續(xù)各部分將從數(shù)據(jù)相關基礎概念辨析出發(fā),系統(tǒng)梳理并分析不同類型數(shù)據(jù)流動交易模式,充分展示當下不同類型數(shù)據(jù)實際交易模式全貌,總結提煉特征及趨勢,以期糾正認識上偏頗乃至誤區(qū);從存量數(shù)據(jù)資源和數(shù)據(jù)流動交易量兩方面對數(shù)據(jù)生成、存儲規(guī)模和特定數(shù)據(jù)交易方式下的成交金額進行展示及進一步估算,為考察數(shù)據(jù)資源和數(shù)據(jù)要素市場結構性特征提供更具體的量化支撐;從政策制定角度給出相應建議,以期為完善數(shù)據(jù)要素市場體制機制、促進數(shù)據(jù)流動交易共享提供基礎性的參考。
二、數(shù)據(jù)相關概念辨析與數(shù)據(jù)分類
豐裕的數(shù)據(jù)資源既是數(shù)字技術大規(guī)模商業(yè)化應用的產(chǎn)物,也是支撐數(shù)字經(jīng)濟發(fā)展的新關鍵要素。數(shù)字經(jīng)濟豐富的實踐場景使得數(shù)據(jù)呈現(xiàn)出多種不同分類方式。有必要在辨析“數(shù)據(jù)”內(nèi)涵和外延基礎上,對數(shù)據(jù)分類進行系統(tǒng)性梳理,作為分析數(shù)據(jù)流動交易模式、開展數(shù)據(jù)規(guī)模估算的基礎。
(一)比特數(shù)據(jù)、數(shù)據(jù)資源與數(shù)據(jù)要素
從物理和技術角度來看,數(shù)字時代的“數(shù)據(jù)”被廣泛地界定為以二進制進行編碼、作為信息載體的字符串,即比特數(shù)據(jù)(蔡躍洲、馬文君,2021;Farboodi and Veldkamp, 2021)。比特數(shù)據(jù)的產(chǎn)生是基于數(shù)字技術對經(jīng)濟社會現(xiàn)實運行狀況的觀察和記錄,因此,某種意義上可以看作是經(jīng)濟活動的副產(chǎn)品(Veldkamp and Chung,2019)。OECD(2021)則提出“數(shù)據(jù)是通過訪問和觀察現(xiàn)象而產(chǎn)生,以數(shù)字格式記錄、組織、存儲、處理或進行訪問的信息內(nèi)容”,將數(shù)據(jù)看作是一種特殊的信息表現(xiàn)形式,即以二進制比特形式呈現(xiàn)的信息。加拿大統(tǒng)計局(Statistics Canada,2019)出于測算的需要,將“數(shù)據(jù)”定義為已經(jīng)被轉化為數(shù)字/數(shù)碼形式的觀察結果,可以存儲、傳輸或處理并從中獲取知識;該定義旨在將“數(shù)據(jù)”的范圍限定為某個時點對特定事物的觀察,并且作為數(shù)字化記錄能夠被存儲、檢索、分析和調(diào)查,從而將數(shù)字化音樂、影視資料等排除在外。事實上,“數(shù)據(jù)”歷來都被看作是一種信息(或事實),而數(shù)字時代“數(shù)據(jù)”與信息的關聯(lián)更為密切,很多語境下等同于“信息”(蔡躍洲、馬文君,2021)。
當然,以二進制字符串形式存在的比特數(shù)據(jù)與有效信息之間還存在差別,需要借助數(shù)據(jù)分析技術才能提煉出有效信息。經(jīng)初次采集、以比特形式存儲的海量原始數(shù)據(jù),在未經(jīng)處理、分析、提煉其內(nèi)在有效信息之前無法直接應用于生產(chǎn)消費場景;因此,原始數(shù)據(jù)還不是能直接參與價值創(chuàng)造的生產(chǎn)要素/數(shù)據(jù)要素,而只是具備價值創(chuàng)造潛力或者說潛在價值的“數(shù)據(jù)資源”(Varian,2018;UNCTAD,2021)。原始數(shù)據(jù)經(jīng)過清洗、聚合、處理、分析所形成數(shù)據(jù)集、數(shù)據(jù)庫、信息報告、數(shù)據(jù)服務等不同形式的數(shù)據(jù)產(chǎn)品/數(shù)據(jù)服務,則可以根據(jù)現(xiàn)實需要應用于經(jīng)濟社會運行的不同場景,如市場營銷、風險控制或是人員搜索(FTC,2014)。應用于不同場景的數(shù)據(jù)產(chǎn)品/數(shù)據(jù)服務,發(fā)揮了生產(chǎn)要素的作用,直接參與生產(chǎn)經(jīng)營中的價值創(chuàng)造,是數(shù)據(jù)要素的具體呈現(xiàn)形式。
數(shù)據(jù)資源所具有的非競爭性、部分排他性、低成本復制等技術-經(jīng)濟特征,使得數(shù)據(jù)在理論上可以被大規(guī)模重復利用,從而緩解其他有形資本稀缺性帶來的增長限制,實現(xiàn)宏觀倍增效應(蔡躍洲、馬文君,2021)。然而,企業(yè)生產(chǎn)經(jīng)營實踐中,需要投入大量的人力、物力對原始數(shù)據(jù)清洗、處理、分析,才能從中提取有效信息并將其切實轉化成數(shù)據(jù)要素;這種轉化能力本身對于企業(yè)來說也是非常稀缺的(OECD,2013a)。當然,由于原始數(shù)據(jù)是有效信息的源頭,而且有的原始數(shù)據(jù)也能直接提供有效信息,因此,包括原始數(shù)據(jù)、加工數(shù)據(jù)、數(shù)據(jù)產(chǎn)品、數(shù)據(jù)服務在內(nèi)的各種數(shù)據(jù)資源,都可以算作是廣義的數(shù)據(jù)要素。
(二)不同視角的數(shù)據(jù)分類與數(shù)據(jù)類型
數(shù)字技術的廣泛滲透性和經(jīng)濟社會活動的復雜性決定了數(shù)據(jù)作為經(jīng)濟社會活動的數(shù)字化記錄必然呈現(xiàn)出多樣性特征。為了促進數(shù)據(jù)資源/數(shù)據(jù)要素的流動交易,更好地發(fā)揮其對經(jīng)濟社會運行活動的支撐作用,有必要從不同視角對數(shù)據(jù)分類進行梳理。
數(shù)據(jù)作為經(jīng)濟社會活動的數(shù)字化記錄,可以從記錄對象的特征/類型入手梳理數(shù)據(jù)的分類。由于經(jīng)濟社會活動的復雜性,圍繞被記錄對象分類的維度可以有很多種。比較常見的方式是根據(jù)數(shù)據(jù)生成和應用場景所屬領域進行分類,例如,比照既有的國民經(jīng)濟行業(yè)分類,將數(shù)據(jù)劃分為通信大數(shù)據(jù)、金融大數(shù)據(jù)、醫(yī)療大數(shù)據(jù)、農(nóng)業(yè)大數(shù)據(jù)、交通大數(shù)據(jù)、電力大數(shù)據(jù)等行業(yè)數(shù)據(jù)。也可以從經(jīng)濟社會活動角度,按照數(shù)據(jù)記錄對應的每個具體環(huán)節(jié)隨其進行分類,例如,2020年工業(yè)和信息化部辦公廳引發(fā)的《工業(yè)數(shù)據(jù)分類分級指南(試行)》,將工業(yè)企業(yè)生產(chǎn)經(jīng)營各環(huán)節(jié)進行細分,各環(huán)節(jié)對應的數(shù)據(jù)記錄則劃分為研發(fā)數(shù)據(jù)、生產(chǎn)數(shù)據(jù)、運維數(shù)據(jù)、管理數(shù)據(jù)和外部數(shù)據(jù)等。
更為常見的是根據(jù)數(shù)據(jù)記錄對象涉及的行為主體進行分類,具體可分為“個人行為數(shù)據(jù)”“企業(yè)生產(chǎn)運營數(shù)據(jù)”和“政府公共部門數(shù)據(jù)”三大類。個人行為數(shù)據(jù)主要是各種互聯(lián)網(wǎng)平臺上,用戶進行測覽、搜索、互動、交易等活動,被平臺實時記錄而形成的數(shù)據(jù),如淘寶、京東的購物記錄,微信、微博等社交媒體的互動交流內(nèi)容等。企業(yè)生產(chǎn)運營數(shù)據(jù)是企業(yè)在生產(chǎn)經(jīng)營過程中,對各環(huán)節(jié)、各流程狀況進行記錄、監(jiān)測而形成的數(shù)據(jù),如制造企業(yè)通過傳感器實時監(jiān)測反債智能化生產(chǎn)線運行狀況而收集沉淀的數(shù)據(jù)。政府公共部門數(shù)據(jù)則是各級政府部門、具有管理公共事務職能的組織和電力、公交、燃氣、熱力、給排水等公共服務運營單位,在提供公共基礎設施、公共服務等過程中收集、產(chǎn)生沉淀形成的所有數(shù)據(jù)資源,如稅務、海關等部門數(shù)據(jù)、企業(yè)經(jīng)營相關資質(zhì)和信用信息、自然資源數(shù)據(jù)、交通路況信息、電力供需調(diào)度數(shù)據(jù)、市政道路管網(wǎng)分布及運行狀態(tài)數(shù)據(jù)等等。UNCTAD(2021)類似分類則將數(shù)據(jù)區(qū)分為消費者數(shù)據(jù)、商業(yè)數(shù)據(jù)、政府及公開數(shù)據(jù)。與行為主體分類密切關聯(lián)的是數(shù)據(jù)收集、維護的資金來源以及數(shù)據(jù)權屬等問題。按照數(shù)據(jù)創(chuàng)建、維護和持有所需資金來源,可將其分為私人部門數(shù)據(jù)和公共部門數(shù)據(jù);而根據(jù)所有權和使用權等法律權屬,則可劃分為公共數(shù)據(jù)和專有數(shù)據(jù),其中專有數(shù)據(jù)特指所有權明確,受知識產(chǎn)權或其他類似法律效力保護的數(shù)據(jù)(Swedish National Board of Trade, 2015; Nguyen and Paczos, 2020)。
除了記錄對象外,還可以著眼于數(shù)據(jù)自身特征進行分類。從數(shù)據(jù)所提供信息含量特征來看,可以將數(shù)據(jù)劃分為原始數(shù)據(jù)、加工數(shù)據(jù)、數(shù)據(jù)產(chǎn)品/數(shù)據(jù)服務以及元數(shù)據(jù)。而從數(shù)據(jù)流動范圍來看,則可以分為境內(nèi)流動數(shù)據(jù)和跨境流動數(shù)據(jù)。需要特別強調(diào)的是上述數(shù)據(jù)分類方式并不互斥,在不同分類標準下,同一數(shù)據(jù)(集合)可以同時歸屬于多個類型。
三、數(shù)據(jù)流動交易模式
充分流動是數(shù)據(jù)發(fā)揮其關鍵要素作用,提高運行效率、實現(xiàn)價值倍增效應的重要前提。數(shù)據(jù)流動的方式與數(shù)據(jù)類型密切相關。涉及的行為主體和權益歸屬不同,所包含的有效信息(及信息強度)的差異,都會影響數(shù)據(jù)流動的方式。在數(shù)字經(jīng)濟運行實踐中,數(shù)據(jù)流動交易模式呈現(xiàn)出復雜且多樣的特征,而數(shù)據(jù)交易所僅僅是一種高社會關注度的模式。高效規(guī)范數(shù)據(jù)流動交易活動需要全面系統(tǒng)把握其流動模式、特征及趨勢。為此,我們將依據(jù)上述行為主體分類,對個人數(shù)據(jù)、企業(yè)數(shù)據(jù)和公共數(shù)據(jù)三類數(shù)據(jù)的流動交易模式分別進行梳理和分析。需要特別指出的是,數(shù)據(jù)流動包括數(shù)據(jù)交易,后者是非公共部門數(shù)據(jù)流動所采取的方式,而公共數(shù)據(jù)通常是通過開放共享方式實現(xiàn)流動。
(一)個人行為數(shù)據(jù)交易模式
個人行為數(shù)據(jù)主要是指與個人消費行為相關活動的數(shù)據(jù)記錄,即消費行為數(shù)據(jù)。對個人消費行為的記錄在互聯(lián)網(wǎng)出現(xiàn)之前已經(jīng)存在,但大多散落于不同商家手中。往往需要第三方數(shù)據(jù)中介多方收集才可能形成相對完整的個人行為記錄,并由此誕生了數(shù)據(jù)產(chǎn)業(yè)和“數(shù)據(jù)經(jīng)紀人”等概念雛形。20世紀90年代中后期,個人電腦的大范圍推廣和互聯(lián)網(wǎng)熱潮的興起,催生出以電子商務為代表的消費互聯(lián)網(wǎng)模式,個人行為數(shù)據(jù)開始被(平臺)系統(tǒng)性地收集,個人行為數(shù)據(jù)及其流動交易也開始進入學界研究的視野(Laudon,1996)。經(jīng)過20多年的持續(xù)高速發(fā)展,眾多細分領域的消費互聯(lián)網(wǎng)平臺,在徹底改變了人們生活消費模式的同時,也為個人數(shù)據(jù)的收集和生成創(chuàng)造了良好條件,并成為個人行為數(shù)據(jù)最主要的收集者。
從行為主體/數(shù)據(jù)當事人的角度來看,互聯(lián)網(wǎng)平臺對個人行為數(shù)據(jù)的收集和生成大致可以分為三種情形:(1)個人主動或接受條款進行分享的那些涉及其自身及第三方的數(shù)據(jù),如產(chǎn)生的社交網(wǎng)絡畫像、在線購物刷卡記錄等;(2)在記錄用戶活動過程中,無需用戶授權即可合法觀察和捕捉的數(shù)據(jù),如網(wǎng)頁測覽數(shù)據(jù)、移動電話使用時的定位數(shù)據(jù)等;(3)基于個人數(shù)據(jù)分析推斷得到的衍生數(shù)據(jù),個別情況下個人數(shù)據(jù)也可以從幾條看似“匿名”的數(shù)據(jù)中推斷出來。而從渠道和來源來看,消費互聯(lián)網(wǎng)平臺收集的個人行為數(shù)據(jù)又可以分為兩大類:一類是指在線平臺基于自己的(數(shù)字)產(chǎn)品和服務而直接采集的一手數(shù)據(jù);另一類是用戶在平臺之外的活動并由其他第三方記錄收集的數(shù)據(jù)(OECD,2013)。數(shù)據(jù)當事人與數(shù)據(jù)收集者的分離使得個人行為數(shù)據(jù)的交易更為復雜,至少涉及三方主體和兩重交易。
對個人行為數(shù)據(jù)的記錄和收集可以看作是第一重交易。交易雙方分別是行為主體(平臺消費者用戶)和數(shù)據(jù)收集者(互聯(lián)網(wǎng)平臺),數(shù)據(jù)收集者作為買方免費或者以提供特定應用服務(免費使用App)作為對價獲得收集記錄用戶個人(消費)行為的權利,并由此沉淀積累相應的原始數(shù)據(jù)資源。由于消費行為記錄包含了消費者個人的隱私信息,這一重交易的本質(zhì)也可以看作是消費者用戶以其個人隱私為代價換取互聯(lián)網(wǎng)平臺的免費服務;這也使得有關隱私定價的研究通常都與消費者個人行為數(shù)據(jù)聯(lián)系在一起(FTC,2014; Acquistietal.,2016)。另外,第一重(數(shù)據(jù))交易是消費者用戶與互聯(lián)網(wǎng)平臺之間“數(shù)據(jù)”和“數(shù)字化服務”的互換,屬于“復合交易(composite transaction)”(Malgieri and Custers,2018)。
數(shù)據(jù)收集者/互聯(lián)網(wǎng)平臺與其他第三方之間的數(shù)據(jù)交易是第二重交易。在此過程中,數(shù)據(jù)收集者通常既扮演買方角色從第三方獲得額外的數(shù)據(jù)來豐富既有的個人行為數(shù)據(jù),以實現(xiàn)產(chǎn)品創(chuàng)新、優(yōu)化供應鏈結構和提高營銷效率,據(jù)此提升平臺對外的服務質(zhì)量;也可以扮演賣方角色,向第三方提供原始數(shù)據(jù)或數(shù)據(jù)產(chǎn)品/數(shù)據(jù)服務,如營銷服務、信用評價等,通過更廣泛的數(shù)據(jù)流動和應用充分挖掘數(shù)據(jù)的潛在價值。而第三方既可以是其他數(shù)據(jù)平臺,也可以是數(shù)據(jù)集成商,還可能是其他具有特定數(shù)據(jù)需求的微觀經(jīng)營主體或公共部門。
在第二重交易中,根據(jù)被交易數(shù)據(jù)的不同形態(tài)又分為直接交易和間接交易(田杰棠、劉露謠,2020;Bergemann and Bonatti, 2019;Veldkamp and Chung, 2019)。在直接交易模式下,售賣方(供給方)僅對原始數(shù)據(jù)進行初步加工,而不是深入挖掘潛在信息,產(chǎn)品主要以數(shù)據(jù)集的形式對外出售。而在間接交易模式下,售賣方對原始數(shù)據(jù)進行清洗、整理、分析挖掘后,以定制數(shù)據(jù)產(chǎn)品或數(shù)據(jù)服務的形式對外銷售。間接交易模式基本不涉及原始數(shù)據(jù)交換。此外,隱私計算(包括聯(lián)邦學習、安全多方計算等技術)和區(qū)塊鏈技術使得多方數(shù)據(jù)聯(lián)合分析能夠在數(shù)據(jù)不泄露的前提下進行,在技術上實現(xiàn)了數(shù)據(jù)可用不可見,其在多場景下的應用能提升對個人隱私信息的保護,因此成為間接交易模式的有益補充。
(二)企業(yè)數(shù)據(jù)交易共享模式
具有一定數(shù)字化基礎的企業(yè),在日常生產(chǎn)經(jīng)營過程中能夠產(chǎn)生并累積大量監(jiān)測記錄數(shù)據(jù),主要包括基于傳感器、物聯(lián)網(wǎng)捕捉記錄的機器設備運行狀況數(shù)據(jù)和基于企業(yè)內(nèi)部IT業(yè)務系統(tǒng)生成的生產(chǎn)、銷售、物流等信息數(shù)據(jù)。同個人行為數(shù)據(jù)相比,企業(yè)數(shù)據(jù)的權屬關系相對簡單。大多數(shù)情況下,企業(yè)既是數(shù)據(jù)行為主體也是數(shù)據(jù)收集者,因此數(shù)據(jù)權屬一般不存在爭議。
從理論上講,企業(yè)數(shù)據(jù)的流動和重復使用,不僅有利于增強產(chǎn)業(yè)鏈上下游的協(xié)同性,帶來企業(yè)效益的提升,并在更大范圍內(nèi)提高社會整體福利。但實踐中企業(yè)之間的數(shù)據(jù)交易共享并不一定會自發(fā)形成。事實上,企業(yè)出售或共享數(shù)據(jù)的意愿還要受到企業(yè)之間競爭行為的影響。只有當數(shù)據(jù)重復利用場景和數(shù)據(jù)來源企業(yè)的原始使用場景相互獨立或形成互補時,企業(yè)才有意愿共享數(shù)據(jù)。具體來說,企業(yè)作為數(shù)據(jù)收集者和所有者出售或共享其數(shù)據(jù)資源/數(shù)據(jù)產(chǎn)品的動機大致可分為三種:(1)直接出售數(shù)據(jù)產(chǎn)品或數(shù)據(jù)服務以獲得營業(yè)收入;(2)提高同關聯(lián)企業(yè)之間的協(xié)同,優(yōu)化產(chǎn)業(yè)鏈供應鏈,開發(fā)產(chǎn)品、改善服務、創(chuàng)新商業(yè)模式;(3)實現(xiàn)更高效的供需匹配。另外,從數(shù)據(jù)需求角度來看,購買方獲取企業(yè)數(shù)據(jù)的主要目的包括開發(fā)新產(chǎn)品或改進既有產(chǎn)品、提高企業(yè)生產(chǎn)效率、改善客戶關系、優(yōu)化企業(yè)內(nèi)部管理結構、精確定位市場目標等(European Commissionetal., 2018)。
數(shù)字經(jīng)濟實踐中,現(xiàn)有的企業(yè)數(shù)據(jù)交易共享模式主要有以下幾類:(1)數(shù)據(jù)企業(yè)主導的直接交易模式,即數(shù)據(jù)所屬企業(yè)直接向數(shù)據(jù)購買方出售相關數(shù)據(jù)產(chǎn)品或提供數(shù)據(jù)服務,并從中獲得一定收益;交易實施的具體方式通常是由數(shù)據(jù)所屬企業(yè)向購買方提供數(shù)據(jù)接口并授權訪問。(2)基于數(shù)據(jù)平臺的中介交易模式,即數(shù)據(jù)平臺將數(shù)據(jù)供給方和數(shù)據(jù)需求方聚集在一起,由其充當可信第三方中介機構對接數(shù)據(jù)供需雙方,促成交易并從每筆達成的數(shù)據(jù)交易中獲得傭金收入。從交易實踐來看,充當?shù)谌街薪榈臋C構,既可以是諸如亞馬遜AWS這樣的綜合性云服務平臺(AWSDataExchange數(shù)據(jù)交易平臺),也可以是Dawex、大數(shù)據(jù)交易所等專業(yè)數(shù)據(jù)交易平臺,還可以是鄧白氏(Dun&Bradstreet)這樣的專業(yè)數(shù)據(jù)集成商。(3)基于產(chǎn)業(yè)互聯(lián)網(wǎng)的數(shù)據(jù)共享模式,即接入產(chǎn)業(yè)互聯(lián)網(wǎng)平臺的上下游企業(yè),在相對安全的環(huán)境中自愿接入平臺,并在一定范圍內(nèi)交換共享相關數(shù)據(jù),以促進新產(chǎn)品開發(fā)或運營效率提升。接入企業(yè)通常會向產(chǎn)業(yè)互聯(lián)網(wǎng)平臺(運營方)免費開放共享數(shù)據(jù),同時也從平臺獲得由其提供的服務或積累的其他數(shù)據(jù)。例如,空客公司于2017年建立了一家航空領域的產(chǎn)業(yè)互聯(lián)網(wǎng)平臺“Skywise(智慧天空)”,對用戶(航空公司)提供的數(shù)據(jù)進行集成并匿名化后,免費向各航空公司提供基于其匯集數(shù)據(jù)形成的全球機隊基準報告,并為航空公司和制造商提供數(shù)據(jù)接口獲取上述集成的匿名化航空數(shù)據(jù),以助力航空公司和制造商提高運營效率、改進飛機的軟硬件設備。需要指出的是,盡管基于產(chǎn)業(yè)互聯(lián)網(wǎng)的數(shù)據(jù)共享以業(yè)務創(chuàng)新和效率提升為主要目標因而更多采取免費方式,但它本質(zhì)上還是一種復合交易;數(shù)據(jù)企業(yè)向產(chǎn)業(yè)互聯(lián)網(wǎng)平臺免費提供數(shù)據(jù),作為獲得平臺免費服務的對價。另外,平臺基于集成數(shù)據(jù)提供更高級數(shù)據(jù)產(chǎn)品和數(shù)據(jù)服務時,往往采用收費方式。
(三)公共數(shù)據(jù)流動模式
公共數(shù)據(jù)在時間、空間和樣本覆蓋范圍方面具有顯著的完備性,而其對政府公共部門和公用事業(yè)運行狀況的記錄,提供了個人、企業(yè)等微觀主體相關活動的外部環(huán)境信息,與私人部門數(shù)據(jù)形成互補,成為數(shù)據(jù)挖掘和大數(shù)據(jù)分析不可或缺的數(shù)據(jù)資源,社會各界對于獲取公共數(shù)據(jù)有著強烈的需求。實踐中,公共數(shù)據(jù)流動主要采用數(shù)據(jù)開放的方式,通常由掌握公共數(shù)據(jù)資源的政府部門或公用事業(yè)機構,在充分評估數(shù)據(jù)安全等因素前提下,有選擇地向公眾開放數(shù)據(jù)(蔡躍洲、馬文君,2021)。
從數(shù)據(jù)流動共享范圍來看,公共數(shù)據(jù)流動又可以細分為公共部門之間的數(shù)據(jù)交換和面向社會各界的數(shù)據(jù)開放。一方面,構建涵蓋不同政府部門和公共事業(yè)機構的統(tǒng)一數(shù)據(jù)平臺,將分散于各部門、各機構的零散數(shù)據(jù)通過跨部門數(shù)據(jù)交換予以集成,能夠形成更為統(tǒng)一完備的信息集,進而為政府部門迅速發(fā)現(xiàn)經(jīng)濟社會運行中存在的問題、及時采取應對措施政策、開展動態(tài)監(jiān)測和事后評估提供全面系統(tǒng)的一手信息。另一方面,公共部門積累的海量社會運行狀況數(shù)據(jù),涉及實時道路交通、水文氣象、生態(tài)環(huán)境、公共安全等與生產(chǎn)經(jīng)營活動密切相關的數(shù)據(jù)信息。如果能在安全有序前提下實現(xiàn)其中部分數(shù)據(jù)的共享和流動,將極大提升私人部門運營效率、促進私人部門開展創(chuàng)新活動。
開放政府數(shù)據(jù)歷來是各國政府加快數(shù)字化轉型的重要內(nèi)容之一。早在2009年,美國一些地方政府便率先建立統(tǒng)一公共數(shù)據(jù)開放平臺,英國、法國、加拿大、新加坡等國家緊隨其后。2015年10月,“十三五”規(guī)劃建議中明確提出實施“國家大數(shù)據(jù)戰(zhàn)略”后,中國也自上而下著手推進公共數(shù)據(jù)平臺建設和數(shù)據(jù)開放相關工作。在開放級別上,根據(jù)涉及內(nèi)容的敏感性和安全性可以將公共數(shù)據(jù)劃分為三類:無條件共享數(shù)據(jù)、受限共享數(shù)據(jù)和不共享數(shù)據(jù)。無條件開放的公共數(shù)據(jù),通??梢詮慕y(tǒng)一的公
共數(shù)據(jù)開放通道(如公共信息門戶平臺)中獲取,而受限開放公共數(shù)據(jù)的獲取則需要向數(shù)據(jù)主管部門提出申請,經(jīng)審核并簽訂協(xié)議和安全承諾。
公共數(shù)據(jù)對社會各界的開放原則上講是免費的。不過,考慮到數(shù)據(jù)的收集、存儲、加工整理,需要由數(shù)據(jù)科學專業(yè)技術人員完成,涉及大量人力和財力投入,僅靠政府部門或公共事業(yè)機構自身難以完成。為此,在國內(nèi)外實踐中,公共部門往往會引入商業(yè)機構參與公共數(shù)據(jù)的加工整理,涉及的部分數(shù)據(jù)服務也會采用收費方式。例如,英國將公共部門信息的持有者(PublicSectorInformationHolders,PSIHs)劃分為三類:(1)免費提供未經(jīng)信息精煉的PSI機構;(2)使用PSI數(shù)據(jù)改進或支持內(nèi)部活動的機構;(3)具有商業(yè)激勵的PSI創(chuàng)收機構。其中,第(3)類機構在對第三方提供基于原始公共數(shù)據(jù)形成的數(shù)據(jù)產(chǎn)品或數(shù)據(jù)服務時往往會采取收費模式。
目前,中國各地公共部門也在積極探索公共數(shù)據(jù)授權運營方式,以充分挖掘公共數(shù)據(jù)的潛在價值。如《上海市數(shù)據(jù)條例》提出,促進公共數(shù)據(jù)社會化開發(fā)利用。《浙江省公共數(shù)據(jù)條例》提出,縣級以上人民政府可以授權符合相關規(guī)定的法人組織或非法人組織運營公共數(shù)據(jù),授權運營單位應當依托公共數(shù)據(jù)平臺對授權運營的公共數(shù)據(jù)進行加工,對加工形成的數(shù)據(jù)產(chǎn)品和服務,可以向用戶提供并獲取合理收益。上述授權運營在性質(zhì)上類似于公共服務的特許經(jīng)營,其收費標準應以彌補公共服務提供必要成本為限(常江和張震,2022)。
(四)數(shù)據(jù)流動交易模式特點
從前述個人數(shù)據(jù)、企業(yè)數(shù)據(jù)和公共數(shù)據(jù)三類不同行為主體數(shù)據(jù)的流動交易模式梳理可以看出,各類模式都是基于數(shù)據(jù)流動交易現(xiàn)實需要而自發(fā)形成的,總體呈現(xiàn)以下特點。
一是流動交易模式多樣化,涉及主體關系復雜化。現(xiàn)實中數(shù)據(jù)需求和應用場景千差萬別,而不同類型數(shù)據(jù)的記錄對象、涉及主體和權屬關系也各不相同;這些因素相互交織,使得數(shù)據(jù)流動交易的實現(xiàn)方式和供需雙方及第三方的對價支付、收益分配呈現(xiàn)出紛繁復雜的局面。另外,數(shù)據(jù)流動交易不可避免會衍生出個人隱私和信息安全等問題,如何確定交易共享的范圍、程度,需要在效率和安全之間不斷權衡。
二是交易(流動)對象/標的呈產(chǎn)品化、服務化趨勢。從流動交易客體來看,盡管以原始數(shù)據(jù)為標的的直接銷售模式和以數(shù)據(jù)產(chǎn)品/數(shù)據(jù)服務為標的的間接銷售形式都占據(jù)一定比例,但后者有望成為未來數(shù)據(jù)交易市場的主要形式。畢竟基于買方需求提供經(jīng)過加工的數(shù)據(jù)產(chǎn)品/數(shù)據(jù)服務,不會涉及原始數(shù)據(jù)復制轉移,從而規(guī)避了由此帶來的權屬糾紛,同時也有利于保護個人隱私安全和國家信息安全。
三是平臺或中介在數(shù)據(jù)流動交易中越來越發(fā)揮主導作用。盡管也有數(shù)據(jù)供需雙方點對點直接交易的情形,但越來越多的數(shù)據(jù)流動特別是數(shù)據(jù)交易都是基于平臺多邊市場,由數(shù)據(jù)中介主導完成的。數(shù)據(jù)中介既可以是平臺企業(yè),也可以是數(shù)據(jù)集成商,或者數(shù)據(jù)經(jīng)紀人:(1)一種情況下,數(shù)據(jù)經(jīng)紀人通常只是撮合交易,買賣雙方交易成功后從成交額中提取一定比例傭金;這種模式可替代性較高,數(shù)據(jù)中介/經(jīng)紀人的作用有限,現(xiàn)實中交易雙方甚至可以避開數(shù)據(jù)經(jīng)紀人達成協(xié)議。(2)數(shù)據(jù)集成商不僅對外提供數(shù)據(jù)(產(chǎn)品/服務),自身也是數(shù)據(jù)的需求方。例如在消費金融領域,通常是銀行和金融機構收集消費者數(shù)據(jù)(如個人賬戶信用歷史等),這些公司將數(shù)據(jù)提供給征信機構的同時,也向征信機構購買關于自身客戶和潛在新客戶的額外信息(BergemannandBonatti,2019)。數(shù)據(jù)集成商由于自身業(yè)務的特性匯集了大量數(shù)據(jù),在數(shù)據(jù)質(zhì)量、內(nèi)容或范圍或是核心算法技術等方面具有一定的競爭優(yōu)勢,一般很難被取代。(3)作為數(shù)據(jù)中介的平臺企業(yè),不僅僅提供撮合交易平臺,同時在自身平臺上提供數(shù)據(jù)交易所需的其他增值服務,例如,AWS數(shù)據(jù)交易平臺和上海大數(shù)據(jù)交易平臺,都可以提供數(shù)據(jù)交易的一站式服務,并充分保障數(shù)據(jù)安全。
四、數(shù)據(jù)資源及其流動交易規(guī)模估算
數(shù)據(jù)要素分類和流動交易模式的復雜多樣性決定了數(shù)據(jù)要素涵蓋范圍可以有多種不同口徑。客觀認識數(shù)據(jù)資源和數(shù)據(jù)要素市場運行的特征規(guī)律需要科學準確估算數(shù)據(jù)要素規(guī)模,這就必須界定清楚估算對象所對應的口徑標準。根據(jù)前述數(shù)據(jù)要素內(nèi)涵分類和流動交易模式的梳理,估算數(shù)據(jù)要素規(guī)模,既可以圍繞數(shù)據(jù)要素(資源)的規(guī)模進行,也可以針對數(shù)據(jù)流動交易的規(guī)模進行。前者從生產(chǎn)和存儲角度反映數(shù)據(jù)要素規(guī)模,而后者則可以從流量角度間接反映數(shù)據(jù)要素使用的情況。由于數(shù)據(jù)類型和流動交易模式都較為繁雜,而現(xiàn)行國民經(jīng)濟統(tǒng)計體系也無法提供直接對應的數(shù)據(jù),為此本部分將從生產(chǎn)存儲和流動交易兩個方面,綜合多渠道數(shù)據(jù)信息,嘗試對數(shù)據(jù)要素不同口徑的規(guī)模進行估算,據(jù)此對數(shù)據(jù)要素規(guī)模呈現(xiàn)的結構性特征進行分析歸納。
(一)數(shù)據(jù)資源規(guī)模估算
伴隨新一代信息技術的大規(guī)模商業(yè)化應用,數(shù)據(jù)生產(chǎn)(收集)成本大幅降低,邊際成本接近于零,數(shù)據(jù)資源則呈爆炸式增長。根據(jù)IDC等機構的估算,2000年,全球生成數(shù)據(jù)總量約為1000~2000PB;到2010年生成數(shù)據(jù)總量已達2ZB,增加1千倍以上。與此相對應,每年存儲下來的數(shù)據(jù)也同樣持續(xù)高速攀升,但其增速與生成數(shù)據(jù)增速之間卻存在較大差距。根據(jù)IDC與希捷共同發(fā)布的研究報告《數(shù)字化世界——從邊緣到核心》,2020年全球數(shù)據(jù)存儲介質(zhì)的出貨容量大約為2ZB,而同年全球新產(chǎn)生的數(shù)據(jù)總量達到64ZB。這意味著,2020年全球實際被存儲下來的數(shù)據(jù)大約僅占當年新生成數(shù)據(jù)總量的3.4%(見表1)。
雖然我們并不能確切統(tǒng)計每年新增的存儲數(shù)據(jù)規(guī)模,但可以通過全球存儲介質(zhì)出貨容量予以間接住證IDC的上述判斷。當前,數(shù)據(jù)主要是存儲于機械硬盤和固態(tài)硬盤兩類介質(zhì)。近年來,在數(shù)據(jù)產(chǎn)量爆發(fā)式增長趨勢下,固態(tài)硬盤在存取速度等技術層面展現(xiàn)出顯著優(yōu)勢,其市場規(guī)模和存儲容量也穩(wěn)步攀升。然而,從技術升級選代到實現(xiàn)最終替換本身需要較長時間,而且機械硬盤在價格和容量方面還具備絕對優(yōu)勢;因此,機械硬盤年出貨容量占據(jù)全球數(shù)據(jù)存儲出貨容量比重仍保持在60%以上(Reinseletal.,2017)。全球機械硬盤的生產(chǎn)供給主要集中于希捷、西部數(shù)據(jù)和東芝三家廠商。根據(jù)調(diào)研機構Trendfocus統(tǒng)計,2020年上述三家廠商機械硬盤出貨容量分別達到479.99EB、422.23EB和116.1EB。據(jù)此,利用企業(yè)財務報告數(shù)據(jù)和前述60%比例結構,可以大致估算全球新增存儲介質(zhì)容量,并間接反映數(shù)據(jù)資源每年新增存量規(guī)模。相關估算數(shù)據(jù)與IDC報告數(shù)據(jù)從趨勢到規(guī)模都較為接近,二者可以相互形成印證。
需要特別指出的是,每年新增存儲介質(zhì)容量與當年新存儲數(shù)據(jù)之間并不會完全重合。一方面,當年新增存儲介質(zhì)的利用率不可能達到100%;另一方面,每年存量數(shù)據(jù)中會有一定比例被刪除,由此騰出的存儲空間也會被用于新增數(shù)據(jù)的存儲。因此,每年生成數(shù)據(jù)被存儲的比例與表2中第四列比例相比會有一定出入??紤]到存儲介質(zhì)購置和維護都是有成本的,存儲介質(zhì)購置規(guī)模(出貨量)加上少量既有數(shù)據(jù)刪除所形成的新增存儲空間,相對于每年的實際新增存儲數(shù)據(jù)不會有過多冗余。假定冗余比例、刪除比例相對穩(wěn)定,數(shù)據(jù)存儲介質(zhì)出貨容量規(guī)?;究梢苑从吵鲂略龃鎯?shù)據(jù)規(guī)模。
2022年,華為公司聯(lián)合羅蘭貝格發(fā)布的《數(shù)據(jù)存力,高質(zhì)量發(fā)展的數(shù)字基石》報告,提出了“數(shù)據(jù)存力”概念,并將“區(qū)域內(nèi)數(shù)據(jù)存儲設備容量與當年生成數(shù)據(jù)總量之比”作為衡量數(shù)據(jù)存力充足性的指標。報告對全球各國數(shù)據(jù)存力充足性進行測算,結果顯示:美國數(shù)據(jù)存力充足性指數(shù)高達19.4%,排名全球第一;而中國數(shù)據(jù)存力充足性指數(shù)為8.9%,遠低于美國,位列第11位。中美兩國同為數(shù)據(jù)生產(chǎn)大國,每年新生成數(shù)據(jù)量穩(wěn)居世界前2位,數(shù)據(jù)存力充足性的差距主要源于中國以往在存儲方面投資的不足。近年來,各方也在加大存儲領域投資力度以彌補前期投資不足;2017~2019年中國存儲領域投資年均增長率高達45.4%(見表2)。
另外,根據(jù)《數(shù)字中國發(fā)展報告(2021年)》,2017~2021年,中國每年新生成數(shù)據(jù)從2.3ZB增長至6.6ZB,平均年增長率30.2%。含結合華為報告給出的數(shù)據(jù)存力充足性指數(shù),2020年中國存量的數(shù)據(jù)存儲設備容量大約為0.59ZB;再考慮一定的冗余量,當年累計存儲下來的數(shù)據(jù)資源應該在0.5ZB左右。而中國信息通信研究院(2022)最新公布的估算數(shù)據(jù)顯示,2021年中國存儲總量容量達到800EB,此外,《國家數(shù)據(jù)資源調(diào)查報告(2020)》指出,2019年底中國數(shù)據(jù)總存量為332EB,a這兩項數(shù)據(jù)在量級上正好驗證了上述推算結果。如果新增存儲數(shù)據(jù)占比以40%計算,例那么2020年新增數(shù)據(jù)存儲量大約在0.2ZB左右,在5.1ZB新生成數(shù)據(jù)規(guī)模中的比重大約為3.9%。該比重與表1中基于數(shù)據(jù)存儲介質(zhì)出貨容量計算出的全球比重大致相當,形成相互印證。
(二)數(shù)據(jù)流動交易規(guī)模估算
從前述第二部分可知,數(shù)據(jù)交易流動模式繁雜多樣,不同模式對應著不同的統(tǒng)計口徑,很難就各種模式對應流動交易數(shù)據(jù)規(guī)模一一進行估算。然而,除了公共數(shù)據(jù)共享外,大多數(shù)的數(shù)據(jù)流動都是通過交易方式實現(xiàn)的,其中很大一部分交易會以貨幣形式支付對價。每年數(shù)據(jù)交易的成交金額也不失為反映數(shù)據(jù)流動交易規(guī)模的一種方式。
現(xiàn)有的行業(yè)統(tǒng)計資料將大數(shù)據(jù)市場定義為廣義的數(shù)據(jù)產(chǎn)業(yè)市場,涵蓋范圍包括了大數(shù)據(jù)相關硬件、大數(shù)據(jù)分析軟件和大數(shù)據(jù)專業(yè)服務。其中,大數(shù)據(jù)專業(yè)服務主要是數(shù)據(jù)交易服務,其涵蓋范圍與本文的數(shù)據(jù)交易市場更為接近。從全球不同機構給出的統(tǒng)計數(shù)據(jù)來看,雖然統(tǒng)計覆蓋的范圍可能存在差異,數(shù)據(jù)市場規(guī)模的口徑也有所不同,但基本都圍繞與數(shù)據(jù)相關的交易和服務開展規(guī)模估算。
Statista和Wikibon兩個機構針對全球數(shù)據(jù)市場的收入規(guī)模進行了估算和預測(見表3)。兩個機構對于全球大數(shù)據(jù)市場規(guī)模的估算基本一致。其中,Wikibon還專門估算并預測了“專業(yè)服務規(guī)模”。根據(jù)兩個機構的界定,“大數(shù)據(jù)市場”是涵蓋大數(shù)據(jù)相關硬件、軟件和大數(shù)據(jù)專業(yè)服務的廣義大數(shù)據(jù)產(chǎn)業(yè)市場;而大數(shù)據(jù)專業(yè)服務主要就是數(shù)據(jù)交易服務,其業(yè)務規(guī)模大致對應于數(shù)據(jù)交易服務收入總額。根據(jù)預測結果,2021年全球數(shù)據(jù)交易服務收入大約為220億美元,結合數(shù)據(jù)交易服務收入占成交額的大致比重,則可以進一步估算數(shù)據(jù)要素的成交規(guī)模。如果假定數(shù)據(jù)交易服務收入占成交額的比重為20%~25%,那么對應的數(shù)據(jù)要素成交規(guī)模大致為880億~1100億美元。
2022年,IDC和TheLisbonCouncil主導的歐盟數(shù)據(jù)市場檢測工具報告針對全球主要經(jīng)濟體的數(shù)據(jù)市場交易規(guī)模進行了估算和預測。該報告將“數(shù)據(jù)市場”定義為“將數(shù)據(jù)作為產(chǎn)品或服務進行交換的市場”(IDCandTheLisbonCouncil,2022),其涵蓋范圍包括與大數(shù)據(jù)相關的信息和IT服務、研究、商業(yè)活動及大數(shù)據(jù)分析服務,與Statistica和Wikibon界定的“數(shù)據(jù)市場”存在較大差異。IDC和LisbonCouncil報告對數(shù)據(jù)市場規(guī)模的估算參考了數(shù)據(jù)相關企業(yè)在本地區(qū)總收入以及從其他地區(qū)進口數(shù)據(jù)產(chǎn)品/服務的價值,因此,在一定程度上反映了數(shù)據(jù)要素(產(chǎn)品/服務)的交易規(guī)模。
報告公布的2019~2021各年估算結果見表4。其中,2021年美國的數(shù)據(jù)市場交易規(guī)模為2399.6億歐元,在前四大市場中的占比約64%,遠高于第2名歐盟27國的636.3億歐元,約為中國的8倍;而中國的數(shù)據(jù)市場交易規(guī)模僅為316.5億歐元,低于日本的399.7億歐元,僅排名第四;美國、歐盟、日本、中國的數(shù)據(jù)市場交易總規(guī)模大約為3752億歐元,由此推斷全球數(shù)據(jù)市場交易總規(guī)模在4000億歐元左右。
需要指出的是,上述數(shù)據(jù)市場交易規(guī)模涵蓋范圍,既包括大數(shù)據(jù)相關的軟硬件服務,也包括諸如直接出售數(shù)據(jù)等大數(shù)據(jù)相關的商業(yè)活動。IDC和The Lisbon Council報告還首次披露了歐盟數(shù)據(jù)相關企業(yè)通過直接出售數(shù)據(jù)(Data Monetization)所得。2020年,這部分收入達到116.1億歐元,占歐盟整體數(shù)據(jù)市場規(guī)模的19%。如果比照該比例推算,2021年全球數(shù)據(jù)相關軟硬件服務、研發(fā)以及大數(shù)據(jù)分析活動等業(yè)務規(guī)模則應該在3000億歐元左右;而數(shù)據(jù)企業(yè)直接出售數(shù)據(jù)所得,或者說全球數(shù)據(jù)要素成交規(guī)模應該在800億歐元左右,中國的數(shù)據(jù)要素成交規(guī)模則在60億歐元左右。
從增長速度來看,2019~2021年,中國、美國、日本均保持了高速成長的態(tài)勢,年均名義增長率都在10個百分點以上,分別為14.3%、13.9%和10.2%;相比之下,歐盟的增速僅為4.35%,明顯低于其他三大經(jīng)濟體。高成長速度從側面反映出當前全球數(shù)據(jù)交易市場仍處于初期快速成長階段。
國際數(shù)據(jù)服務商OnAudience對全球27個國家在線市場營銷領域(主要為數(shù)字廣告)的數(shù)據(jù)交易規(guī)模進行了追蹤和測算。表5展示了2017~2021年全球及排名前三在線營銷數(shù)據(jù)市場交易規(guī)模及其在全球占比。從中可以看出,2021年,全球在線營銷數(shù)據(jù)交易規(guī)模達到523億美元,其中,美國市場規(guī)模為306億美元,位居全球第一,占比高達58.51%;中國市場雖排名全球第三,但市場規(guī)模僅為73億美元,全球占比13.96%,遠低于美國。
需要特別指出的是,基于現(xiàn)有可獲取資料對數(shù)據(jù)交易規(guī)模/成交金額的估算,不僅由于資料來源、覆蓋口徑的不同而存在較大差距,更無法完全反映出數(shù)據(jù)流動交易的整體規(guī)模。一方面,大部分公共數(shù)據(jù)的流動共享以及基于平臺的雙重交易,本身并不采取交易或貨幣支付的方式,但也是數(shù)據(jù)流動交易的重要組成部分;另一方面,現(xiàn)有的統(tǒng)計資料以及可公開查詢的企業(yè)財務數(shù)據(jù),遠不能涵蓋所有以貨幣方式支付的數(shù)據(jù)交易,例如,眾多企業(yè)微觀主體間點對點的數(shù)據(jù)交易活動一般很難從公開渠道找到對應信息。因此,當下有關數(shù)據(jù)交易市場的統(tǒng)計,涵蓋范圍主要是那些依托公開交易平臺達成的數(shù)據(jù)交易活動;而且成交金額往往還需要通過平臺提供交易服務所獲得收入進行間接推算。
(三)數(shù)據(jù)要素規(guī)模結構性特征分析
本部分著眼于生產(chǎn)存儲和流動交易兩個方面,基于不同渠道的公開資源,從數(shù)據(jù)資源體量和交易成交貨幣價值兩個角度對數(shù)據(jù)要素規(guī)模進行了估算。盡管由于資料來源、范圍口徑等因素使得估算結果存在較大差異,但在此基礎上仍可以提煉出當前數(shù)據(jù)要素規(guī)模方面的一些結構性特征。
首先,近年來全球數(shù)據(jù)生成規(guī)模和數(shù)據(jù)存儲規(guī)模都在持續(xù)快速增長,但每年新增數(shù)據(jù)存儲規(guī)模遠小于數(shù)據(jù)生成規(guī)模,僅有4%左右的新生成數(shù)據(jù)能夠被存儲下來。另外,從存儲能力來看,各主要經(jīng)濟體的數(shù)據(jù)存力充足性普遍偏低,排名最高的美國也不足20%,中國更是不足10%。
第二,中國數(shù)據(jù)生成規(guī)模與數(shù)據(jù)存儲規(guī)模間的失衡更為明顯。得益于超大規(guī)模市場和豐富應用場景,中國數(shù)據(jù)生產(chǎn)能力逐年大幅提升,數(shù)據(jù)生成規(guī)模與美國一起居世界前兩位,但數(shù)據(jù)存儲率僅為3%左右,明顯低于世界平均水平。從存力充足性指標來看,中國在全球排名僅為11,與排名第1的美國存在顯著差距。
第三,數(shù)據(jù)要素交易市場尚處于初期快速發(fā)展階段,成交規(guī)模與數(shù)字經(jīng)濟規(guī)模相比顯得微不足道。受到涵蓋范圍、統(tǒng)計口徑以及資料獲取等諸多因素的影響,全球數(shù)據(jù)流動交易規(guī)模估算目前尚無公認的準確測算結果,但不同測算結果在數(shù)量級上基本能相互印證。綜合不同機構公布的測算結果推斷,全球公開交易數(shù)據(jù)的成交規(guī)模數(shù)量級大致為千億美元,與全球數(shù)字經(jīng)濟增加值規(guī)模相差兩個數(shù)量級。巨大差距背后既有統(tǒng)計漏算的原因,更源于數(shù)據(jù)要素市場發(fā)展尚處于初期成長階段。
第四,相比美國、日本等國家,中國的數(shù)據(jù)要素市場發(fā)育更不充分。一方面,數(shù)據(jù)市場交易規(guī)模、在線營銷領域數(shù)據(jù)交易在全球占比均為10%左右,低于歐盟、日本,在主要經(jīng)濟體中排名第4。另一方面,相比美國、歐盟和日本,中國數(shù)據(jù)市場成交規(guī)模保持著更高的增長率,在四大經(jīng)濟體中位居第一。當然,中國數(shù)據(jù)要素成交規(guī)模在四大經(jīng)濟體中的占比可能存在較大幅度的低估,畢竟豐富應用場景必然帶來充足的數(shù)據(jù)要素交易需求。
五、總結性評論及建議
社會各界高度關注數(shù)據(jù)要素及其流動交易,但存在過于聚焦個人行為數(shù)據(jù)和數(shù)據(jù)交易所模式的誤區(qū)。為此,本文前述各部分以數(shù)據(jù)相關基本概念辨析為出發(fā)點,區(qū)分比特數(shù)據(jù)、數(shù)據(jù)資源和數(shù)據(jù)要素的內(nèi)涵,并對數(shù)據(jù)分類的不同視角進行歸納。綜合既有研究文獻和相關實踐,針對不同類型數(shù)據(jù)系統(tǒng)梳理其流動交易模式及特點,并綜合不同來源的資料,對全球主要經(jīng)濟體當下數(shù)據(jù)資源規(guī)模和數(shù)據(jù)交易規(guī)模進行了估算和分析。旨在通過我們的分類、梳理和估算,盡可能客觀全面地呈現(xiàn)數(shù)字要素流動交易的基本狀況及趨勢特征。具體來說有如下幾點判斷:
第一,豐富的現(xiàn)實場景決定了數(shù)據(jù)分類的多樣性,而不同類型數(shù)據(jù)的涉及主體、權屬劃分、信息密度等特征存在較大差異,由此帶來數(shù)據(jù)流動交易模式及收益分配的復雜性。促進數(shù)據(jù)要素安全、有序、充分流動,巫需順應多樣性和復雜性特點,從分級分類等基礎性工作入手,結合數(shù)據(jù)流動交易實踐需要,逐步構建完善數(shù)據(jù)分類和流動交易相關制度。
第二,數(shù)據(jù)流動交易呈現(xiàn)出產(chǎn)品化、服務化和平臺化趨勢特征。原始數(shù)據(jù)轉移的流動交易模式依然存在,但對于數(shù)據(jù)需求方來說,原始數(shù)據(jù)并不能直接滿足其特定應用場景的需要。數(shù)據(jù)供給方為需求方提供定制化的數(shù)據(jù)產(chǎn)品或數(shù)據(jù)服務,既省去了需求方自身加工數(shù)據(jù)的繁瑣,又實現(xiàn)了數(shù)據(jù)增值,更為重要的是還能降低原始數(shù)據(jù)轉移帶來的隱私和信息泄露風險。至于數(shù)據(jù)交易平臺化則更是體現(xiàn)了數(shù)字經(jīng)濟運行實踐最重要的特征,提高了數(shù)據(jù)流動交易的效率。
第三,現(xiàn)行統(tǒng)計核算體系是工業(yè)經(jīng)濟時代的產(chǎn)物,沒有也不可能針對數(shù)據(jù)資源/數(shù)據(jù)要素提前預設專門的統(tǒng)計分類,不同機構給出的數(shù)據(jù)要素規(guī)模估算,受到資料來源、范圍口徑以及估算方法等因素的影響,存在較大差異。加強數(shù)據(jù)要素規(guī)模估算方面的探索,既是健全完善數(shù)據(jù)要素流動交易制度的一項基礎性工作,也是數(shù)字經(jīng)濟研究特別是數(shù)字經(jīng)濟測算領域的前沿課題。
第四,全球新生成數(shù)據(jù)中僅有約4%能夠被存儲,主要經(jīng)濟體都存在數(shù)據(jù)生成規(guī)模與數(shù)據(jù)存儲規(guī)模失衡,美國情況相對較好,而中國的數(shù)據(jù)生產(chǎn)與存儲結構性失衡尤為突出。中美兩國所擁有的數(shù)據(jù)資源和數(shù)據(jù)生產(chǎn)能力遠遠領先于其他經(jīng)濟體,但中國的存力充足性指標僅為全球第11,相比美國還有很大差距,數(shù)據(jù)存儲能力提升空間巨大。
第五,全球數(shù)據(jù)交易市場整體還處于初期快速發(fā)展階段,數(shù)據(jù)公開交易的成交規(guī)模數(shù)量級大致為千億美元,與數(shù)字經(jīng)濟增加值規(guī)模相差達兩個數(shù)量級。在主要經(jīng)濟體中,中國的數(shù)據(jù)要素市場發(fā)育更不充分,成交規(guī)模占比不足10%,不僅遠小于美國,也低于歐盟和日本。
要促進數(shù)據(jù)要素充分流動,切實發(fā)揮數(shù)據(jù)作為新關鍵要素對經(jīng)濟增長和社會發(fā)展的支撐作用,社會各界都應提高對數(shù)字經(jīng)濟和數(shù)據(jù)要素的認知水平。在認識到數(shù)據(jù)要素重要性的基礎上,更要充分意識到數(shù)據(jù)要素分類和數(shù)據(jù)流動交易的多樣性、復雜性以及相關制度體系構建完善的艱巨性、長期性,并順應這些特點從基礎制度建設入手,對數(shù)據(jù)流動交易活動進行引導和規(guī)范。
第一,圍繞數(shù)據(jù)要素本身,完善分類分級、權屬界定等制度建設,為促進數(shù)據(jù)充分流動交易提供基礎性的制度保障。由行業(yè)主管部門牽頭,結合數(shù)據(jù)生產(chǎn)和數(shù)據(jù)應用的具體實踐,比照工業(yè)和信息化部辦公廳引發(fā)的《工業(yè)數(shù)據(jù)分類分級指南(試行)》,針對重點領域、重要場景陸續(xù)出臺相應的分類分級標準(或指南),不斷健全數(shù)據(jù)分級分類制度體系。完善數(shù)據(jù)要素權屬劃分相關的制度建設,在數(shù)據(jù)分類分級、確權授權使用基礎上,細化、明確不同類型數(shù)據(jù)持有權、使用權、經(jīng)營權等相關權屬邊界,為數(shù)據(jù)共享流動各環(huán)節(jié)參與者、利益相關者的正當權益提供法律和制度保障。
第二,加強存儲中心、算力中心等數(shù)字基礎設施建設,提高存力、算力充足性水平,保障數(shù)據(jù)資源的收集、存儲。以“東數(shù)西算”等國家級戰(zhàn)略為基礎,對算力中心和存儲中心建設規(guī)劃進行細化;除了現(xiàn)有的8個國家級樞紐節(jié)點外,還可以考慮在其他具備氣候、電力等相對優(yōu)勢的西部地區(qū)布局建設更多存儲中心。
第三,培育一批數(shù)據(jù)要素交易和開發(fā)利用的專業(yè)化機構,充分發(fā)揮企業(yè)的市場主體作用及技術優(yōu)勢。數(shù)據(jù)要素的市場化配置及價值挖掘,對技術能力、專業(yè)積累等要求較高,應充分調(diào)動數(shù)據(jù)企業(yè)的積極性。一方面鼓勵企業(yè),特別是互聯(lián)網(wǎng)巨頭企業(yè)更多參與數(shù)據(jù)交易環(huán)節(jié),通過提供數(shù)據(jù)產(chǎn)品和服務,更好盤活數(shù)據(jù)資源,推動數(shù)據(jù)要素市場規(guī)模增長。另一方面,借助企業(yè)在數(shù)據(jù)資源、數(shù)字技術、應用場景等方面的專業(yè)積累,為政府部門和各類市場主體提供專業(yè)化的產(chǎn)品和服務,提升數(shù)據(jù)要素市場的交易和服務質(zhì)量。
第四,建設并完善數(shù)據(jù)治理體系,統(tǒng)籌好數(shù)據(jù)流動中的安全與發(fā)展。充分保護數(shù)據(jù)信息安全、推動數(shù)據(jù)相關行業(yè)領域健康發(fā)展,需要參與各方加強對關鍵領域數(shù)據(jù)的保護,事前、事中、事后做好風險預警、安全評估和事后追溯;市場監(jiān)管部門、行業(yè)主管部門和司法部門發(fā)揮數(shù)據(jù)治理主導作用,確保司法和執(zhí)法全面到位,在鼓勵和引導數(shù)據(jù)新興商業(yè)模式創(chuàng)新發(fā)展的同時,防止出現(xiàn)數(shù)據(jù)壟斷、價格歧視等問題。此外,健全數(shù)據(jù)跨境流動相關的安全審查制度和雙邊多邊合作機制,為實現(xiàn)數(shù)據(jù)在更大范圍內(nèi)的流動交易保駕護航。
第五,支持并鼓勵數(shù)字相關核心關鍵技術創(chuàng)新和突破。數(shù)據(jù)實現(xiàn)安全、有序、充分流動不僅需要制度和相關產(chǎn)業(yè)政策的保障和支持,更需要核心技術提供堅實的物質(zhì)基礎。一方面,守住數(shù)據(jù)安全底線,實現(xiàn)數(shù)據(jù)可靠溯源、安全存儲和傳輸以及數(shù)據(jù)可用不可見,在數(shù)據(jù)流動交易中維護國家數(shù)據(jù)安全、防止個人隱私和商業(yè)機密泄露,需要安全多方計算、區(qū)塊鏈等較為成熟可靠的技術提供保障。另一方面,數(shù)據(jù)資源的開發(fā)利用需要充足的數(shù)據(jù)存儲能力和算力,存儲介質(zhì)方面固態(tài)硬盤占據(jù)主導的趨勢已經(jīng)形成,而其核心的閃存顆粒目前被國外寡頭壟斷。唯有切實解決好此類核心關鍵技術卡脖子問題,才能更好地發(fā)揮數(shù)據(jù)要素支撐經(jīng)濟發(fā)展作用。
參考文獻
[1] 蔡躍洲、馬文君,2021,《數(shù)據(jù)要素對高質(zhì)量發(fā)展影響與數(shù)據(jù)流動制約》,《數(shù)量經(jīng)濟技術經(jīng)濟研究》第3期。
[2] 常江、張震,2022,《論公共數(shù)據(jù)授權運營的特點、性質(zhì)及法律規(guī)制》,《法治研究》第2期。
[3] 田杰棠、劉露謠,2020,《交易模式、權利界定與數(shù)據(jù)要素市場培育》,《改革》第7期。
[4] 中國信息通信研究院,2022,《中國存力白皮書(2022年)》。
[5] Acquisti,A.,C.Taylor,and L.Wagman.2016.“The Economics of Privacy.” Journal of Economic Literature,54(2):442–92.
[6] Bergemann, D. and A. Bonatti. 2019. “Markets for Information: An Introduction.” Annual Review of Economics,11:85–107.
[7] CAICT and Chinese Academy of Cyberspace Studies(CACS). 2021. National Data Resources Survey Report(2020).
[8] European Commission, Directorate-Generalfor Communications Networks, Contentand Technology, Scaria,E., Berghmans, A., Pont, M., etal. 2018. Study on Data Sharing between Companies in Europe: Final Report, Publications Office.
[9] Farboodi, M., and Veldkamp L. 2021. “A Growth Model of the Data Economy.” NBER Working Paper, No.28427.
[10] Federal Trade Commission. 2014. “Data Brokers: A Call for Transparency and Accountability.”
[11] IDC and The Lisbon Council. 2022. European Data Market Study 2021-2023(D2.1 First Report on Facts and Figures). Luxembourg: Publications Office of the European Union.
[12] Laudon, K. C. 1996. “Markets and Privacy.” Communications of the ACM, 39(9):92–104.
[13] Malgieri, G., and Custers B. 2018. “Pricing Privacy-The Right to Know the Value of Your Personal Data.” Computer Law & Security Review, 34(2):289-303.
[14] Mitchell, John, Daniel Ker a nd Molly Lesher. 2021. “Measuring the Economic Value of Data.” OECD Going Digital Toolkit Note, No.20.
[15] Nguyen, D. and M. Paczos. 2020. “Measuring the Economic Value of Data and Cross-border Data Flows: A Business Perspective.” OECD Digital Economy Papers, No.297.
[16] OECD. 2013a. “Exploring the Economics of Personal Data: A Surveyof Methodologies for Measuring Monetary Value.” OECD Digital Economy Papers, No.220.
[17] OECD. 2013b. “Introduction to Data and Analytics(Module1): Taxonomy, Data Governance Issues and Implications for Further Work.” DSTI/ICCP(2013)13
[18] OECD. 2021. Issues Paper: Recording Observable Phenomena and Data in the National Accounts. Paris: OECD Publishing.
[19] Reinsel, D., J. Gantz, and J. Rydning. 2017. Data Age 2025. IDC
[20] Statistics Canada. 2019. “The Value of Data in Canada: Experimental Estimates.” Latest Developments in the Canada Economic Accounts (Working Paper Series),No.9
[21] Swedish National Board of Trade. 2015. NoTransfer, No Production: The Importance of Cross–border Data Transfers for Companies Based in Sweden. Stockholm: Swedish National Board of Trade.
[22] The State Internet Information Office. 2022. Digital China Development Report (2021).
[23] United Nations Conference on Trade and Development (UNCTAD). 2021. Digital Economy Report 2021 Cross–border Data Flows and Development: For Whom the Data Flow. Geneva: United Nations Publications.
[24] Varian, H. 2018. “Artificial Intelligence, Economics, and Industrial Organization.” NBER Working Paper, No.24839.
[25] Veldkamp, L., and C. Chung. 2019. “Data and the Aggregate Economy.” Journal of Economic Literature, forthcoming.
China Economist (中文刊名:《中國經(jīng)濟學人》)是由中國社會科學院主管、中國社會科學院工業(yè)經(jīng)濟研究所主辦的面向全球發(fā)行的中英文學術期刊。China Economist創(chuàng)刊于2006年3月,始終致力于向全球傳遞中國經(jīng)濟學與管理學最前沿研究進展,搭建中外學者相互交流的學術平臺和研究陣地,向全世界宣傳能夠代表中國人民根本利益訴求的研究成果,促進國外讀者更好地了解中國,不斷增強我國的國際影響力和國際話語權?!吨袊?jīng)濟學人》先后被EconLit、EBSCO、ProQuest、SCOPUS等全球主流、權威數(shù)據(jù)庫及索引系統(tǒng)收錄,入選中國社會科學院中國人文社會科學期刊(AMI),是“代表我國人文社會科學英文刊最高水平”的期刊。
在線投稿系統(tǒng):http://ceji.cbpt.cnki.net
官方網(wǎng)站:http://www.chinaeconomist.com/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.