劉太石
把平臺當作數字田野
作者 |劉太石
作者單位 |布里斯托大學社會數字未來研究中心
華中科技大學數字社會研究中心
原文 |
拙作《數字時代的中國青年文化變遷:趣味模式、社會區隔與平臺化》有幸發表于《社會學研究》2025年第3期?;仡櫛疚膹某醢娴蕉ǜ逵馊甑臍v程,我要衷心感謝匿名評審專家和《社會學研究》編輯部老師對本文提供的所有幫助。作為青年作者,我在本文的往復修改中,獲益良多。特別感謝在本科和碩士求學期間,鄭丹丹與劉河慶兩位導師對我的悉心指導。在華科的七年時光里,兩位老師引領著我的學術與生活。其中深情,難于言表。
一、問題緣起:平臺為什么變了?
本研究源起于一個樸素的提問:平臺為什么變了?作為B平臺的老用戶,我從2013年就加入了社群。在2016年左右,我逐漸感受到B平臺社群氛圍發生了很大變化。起初,我認為身邊都是“網絡同好”,大家有著類似的青年文化趣味與生活境況。但隨著時間推移,我發現自己的文化體驗在社群中開始缺乏共鳴,曾經喜愛的內容在不斷減少,很大程度上,我覺得自己成了社區的“邊緣人”。我起初懷疑是自己跟不上潮流,直到我斷斷續續看到一批老用戶的評論,他們發出類似的感慨:“XX已經不是原來的XX了”。所以到底發生了什么?平臺變了這一感受,不僅體現在個人的文化實踐中,也應放回到結構構性的背景與動態中。為此,我試圖將“B平臺”所發生的“變遷”故事作為我的研究母題。
那么如何研究平臺變遷呢?當時,我閱讀了大量青年文化與網絡社區的訪談與民族志研究,但總覺得“不解渴”。后來,給我很大啟發的是黃榮貴老師在2017年發表于《社會》的文章《網絡場域、文化認同與勞工關注社群:基于話題模型與社群偵測的大數據分析》。這篇文章在國內學界較早引入了主題模型方法,并基于社交媒體數據進行了比較扎實的話語與社群分析。我由是想把這篇文章的思路進一步拓展到對“B平臺”上社群變遷的研究。在研究策略的啟示外,黃榮貴老師對模型解釋性的關注也給了我很深的印象。事實上,方法上的計算驅動不代表理論與解釋上的懶惰,相反,算法異質性與底層事實(Ground Truth)間的張力,恰恰要求社會學想象力的高度介入。
基于上述思考,我最終將澄清“B平臺”中發生的青年文化社群變遷作為自己的學術論文主題。當時,計算方法在國內方興未艾,尚無特別系統的網上教程或線下課程。我一方面自學了兩個月機器學習課程,一方面著手復現已有研究,結合零零碎碎的網絡博客以及軟件文檔自己學習(一位計算機專業的好友幫了不少忙)。最為艱難的還是數據獲取,以一己之力獲取足夠進行社群層面推斷的數據并非易事。從抽樣設計、代碼編寫、程序Debug再到數據清洗,生成變量以及可視化,在邊學邊做幾乎燃竭的半年里,我真是體會什么叫做“關關難過,關關過”。所幸,這項研究的最初稿在2020年順利完成,雖然在當時,這僅是個非常粗糙的對平臺中社群擴張進行案例研究的學士論文。在那篇論文中,我尚無平臺研究的意識,也無方法運用的嫻熟,在理論閱讀上也并不完整。后來伴隨著碩士升學,鄭丹丹教授作為我的導師繼續引導了本文的修改,我也作為劉河慶老師的研究助理,在計算方法上鉆研逾深。在近半年的進一步強化與調整后,2021年3月,本文的初稿完成,并在導師建議下投遞到《社會學研究》。文章非常幸運地進入了外審環節,兩位外審專家以極大的包容與耐心對本文的問題意識、研究方向及量化細節給出了深刻而富有建設性的意見,本文也至此開始了漫長的修改歷程。
二、計算扎根:把平臺作為數字時代的田野
我花了不少的時間來消化外審意見,并和我的兩位導師就進一步修改的癥結之處“碰”了很多次。在近一兩個月的思考后,我最終將初稿中的深層問題確定為了以下幾個。
一、雖然始終提醒自己關注計算研究的解釋取向,但我仍陷入了“方法陷阱”。一部分源于方法掌握的稚嫩,一部分源于對模型的過度信賴,在數據分析中,我僅是把方法應用到了材料,任由模型“自由發揮”,沒什么“問題意識”,也缺乏對數據背后“真實”情況探索的方法論自覺。對此,當時審稿人批評我在文章結尾“陷入無話可說的境地”,我思忖良久。二、是樣本的選擇問題,另一位審稿人指出原始的案例數據在推斷平臺整體狀況上的不可靠。我考慮再三,最終還是決定重新搜集數據。為此,我重新制定了抽樣策略,并花費了近兩個月重新搜集數據。由此,本文的實證相當于完全重新開始。三、另一個振聾發聵的意見來自于審稿人對平臺數據之來源的關鍵提醒。在本研究的早期階段,我天真地將平臺中的數字青年文化實踐,視為“給定之物”,進而是“自然”演化的結果。然而,審稿人對平臺背后復雜發展邏輯及動力的提醒,讓我對數字痕跡與數字平臺的本質產生了更深層的思考,進而將其視作復雜社會-技術過程的產物。
在真正消化了上述觀點后,2022-2023年間陳云松、羅家德、陳茁等學者對“計算扎根”策略的倡導也給了我很大的啟發與影響。我模糊中有一種新的方法論意識:“把平臺作為田野”。
這一立場與我后來接觸的批判性數據研究具有精神上的共鳴,即,研究者總應對平臺、算法與數據背后的本體論狀況保持反思性:后者是高度動態復雜的社會、技術以及政治經濟過程的產物。面對這一復雜性,計算社會學家的目標是創造性地使用他的方法工具箱(質性、量化或計算的),以觸及表象背后的深層“真實”。
由此,對作為復雜社會過程之側顯的數據,適用針對性的方法組合,以追溯到數據背后的真實發生的結構、事件與過程,就是我理解中的“計算扎根”。在我的個人體驗中,“計算扎根”所面對的困難,并不比現實田野中的停頓、困境與張力要少。尤其考慮到“計算扎根”的“重理論”策略,我逐漸把平臺看作數字時代的田野,唯一的差異是,研究者所面對的現象特性與問題領域,所需要的理論自覺及方法儲備有所不同。
循著上述思考,我至少三次對重新搜集的數據進行建模嘗試。在大量“作廢”的計算實驗中,模型呈現的結果距離讓數據“說出自己的故事”仍有很大距離。斷斷續續的嘗試直到我應用了HDP模型后才收尾。在該模型的幫助下,我第一次真正對“B平臺”中文化實踐的異質性進行了分析。在查閱主題建模結果時,我看到青年文化空間被分解為了超過200個高度可解釋化的趣味(taste)維度。我知道,我終于接近了數據背后的“真實”。
不過,對非結構數據進行相對漂亮的“向量化”并非研究的終結,而是開始。如要呈現B平臺的完整變遷,其核心在于揭示在平臺化進程中青年文化的結構變遷,這依賴于對各類概覽或可視化技術的使用。就這一階段的研究,2018年的《網絡左翼的三重面相:基于個案觀察和大數據的探索性研究》與2023年的《計算扎根:定量研究的理論生產方法》這兩篇文章為我提供了不少方法論參照,前者在計算與理論的雙重支持下進行了扎實而系統的類型學研究;后者則展示了預測模型的社會解釋性應用。最后,與另一位國內量化研究前輩的溝通中,我進一步意識到了“過程-事件”思維在分析平臺變遷中的潛力。這種思考引導我將“平臺動力學”作為重要的考察維度,并必須結合平臺歷史中的重要事件進行解釋。上述考慮,最終匯聚為了本文實證部分的具體安排。
總體而言,比起最初對青年文化社群的興趣,在文章修改的后期,我認為呈現“平臺化”進程中的結構與動態成了更為重要的研究目標,希望我初步做到了。
最終,在又一次“關關難過,關關過”的歷程后,本文在去年10月接近了目前版本的內容呈現,至此,我可以大致松口氣,算是給手中的材料有了個交代。在最后的修改階段,本文在編輯部幾位老師的建議下,對實證材料進一步凝練,并在對材料的理論化上進行了幾輪迭代。從最初以“青年文化研究”為線索,到目前以Savage及其團隊的“新興文化資本”理論為中心,最終版本或更為清晰可讀。
此時,回看整個修改過程,竟已逾三年,考慮到這個曲折過程中的學習、思考與交流,我感慨,終于給這個2019年的問題以一個2025年的交代。
三、余論:數字何為?
最后,我還想簡要談談對平臺化的一些思考,作為余論。這是個流變的數字時代。從上世紀90年代,克林頓政府塑造了數字技術的基礎設施與國際事務框架后(例如,信息高速公路計劃、數字千年版權法案等),數字化進程席卷世界,重塑了這個行星上絕大多數人的生活。毫無疑問,數字化是一個全球性的政治經濟議程。
放眼世界,在數字技術的萌芽年代,人們期盼千禧年的去中心世界,互聯網初創企業高呼用技術改變世界;但短短20年時間,以谷歌模式的誕生與增殖為標志,數字技術與資本主義機器的嚙合形成了新的社會裝置,我們稱之為算法,稱之為平臺。與早期數字化的解域夢想相比,深度數字化指向全球化及后金融危機時代,新資本主義(或后資本主義)模態的成形:一個全球數字平面被政治經濟因素創造、重塑并調動,形成了歐陸理論家如今憂心忡忡的“數字封建主義”。大型技術公司日益成為國家之外的超地緣力量。
在我的研究樣例中,平臺化同樣折射著深度數字化的進程,但幸運的是,數字中國正尋找其自身的全新路徑,并試圖為平臺社會尋求一種新的棲居方式。如果技術能為社會生活的福祉賦能,而不是成為控制、再現或透明化不平等的幕布,那么我們將創造歷史,并邁向中國的“技術宇宙”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.