導 語
隨著社交媒體研究在體育傳播與營銷領域的蓬勃發展,我們也見證了其認識論復雜性的同步提升。盡管這一領域取得了顯著進展,但對方法論問題及其影響的關注卻相對較少。鑒于機器學習的發展,當前研究的總體目標是響應對創新方法論的需求,以推動社交媒體研究領域的知識進步。具體而言,我們:(a)從方法論的角度評估體育社交媒體研究的現狀,特別關注機器學習的應用;(b)通過實證示例展示體育學者如何從自然語言處理及其衍生的主題建模技術中受益;(c)討論機器學習如何提升社交媒體研究的嚴謹性并改善理論發展;(d)為未來利用機器學習的體育社交媒體研究提供潛在的機會和方向。
作者:James Du, Yoseph Z. Mamo, Carter Floyd, Niveditha Karthikeyan, and Jeffrey D. James
編譯:姜本橋
International Journal of Sport Communication, 2024, 17, 97-106
https://doi.org/10.1123/ijsc.2023-0151
研究簡介
隨著社交媒體在體育傳播和營銷領域的日益普及,相關研究的深度和廣度都在不斷提升。社交媒體的研究融合了多學科的理論、方法和視角,包括體育傳播、體育社會學和體育管理。從認識論的角度來看,社交媒體為學者提供了獨特的視角,用以揭示體育的一個顯著特點:粉絲與體育對象之間形成的強烈情感紐帶。為實現這一目標,研究者能夠分析來自用戶生成內容的多樣化數據來源。隨著社交媒體在體育行業中的使用逐漸增多,研究的重點大多集中于技術媒介的社交網絡對個體化體育消費的影響。
數字信息和技術的快速發展,使得體育組織與消費者之間的實時連接和互動變得更加緊密。這一趨勢為研究領域帶來了新的拐點,研究者能夠輕松獲取海量數據,從而重新審視和驗證傳統假設與既有框架。盡管近期研究已經利用機器學習(ML)處理了一些復雜任務,例如休閑參與、客戶流失、消費者情感分析、品牌參與度、運動員抗議、電競直播觀看量及社交媒體互動,但將大數據、機器學習與體育管理研究深度結合,仍有巨大潛力尚未開發。
本研究旨在探索以下四個方面:(1) 從方法論角度評估當前體育社交媒體研究的現狀,特別關注機器學習的應用;(2) 提供一個實證案例,展示體育研究者如何利用自然語言處理(NLP)和主題建模的最新技術;(3) 探討機器學習如何提高體育社交媒體研究的嚴謹性并促進理論發展;(4) 提出未來體育社交媒體研究中使用機器學習的潛在方向和機會。
當前體育社交媒體研究現狀
由于體育迷在社交媒體上生成了大量內容,相關研究主要集中在“大數據”的定量分析。“大數據”有四個核心特征:數據量(Volume)、數據多樣性(Variety)、數據生成速度(Velocity)和數據真實性(Veracity)。數據量反映了社交媒體和數字工具所生成的信息規模;數據多樣性則體現了結構化和非結構化數據的豐富性,包括數字、文本、音頻、視頻等形式;數據生成速度強調實時性,而數據真實性則聚焦于數據的隱私性、準確性和可靠性。
通過構建實證模型,大數據研究能夠捕捉、可視化并分析潛在模式,從而提升理論發展的實際意義。社交媒體研究已成為體育管理領域的核心之一,研究者通過分析社交媒體上的內容,研究消費者的態度、情感和行為。例如,一些學者通過分析與特定體育事件相關的社交媒體帖子,推測消費者的情感動態。另一部分研究則使用情感分析和自然語言處理(NLP)技術,揭示文本數據中的情緒和觀點,這在體育營銷、消費者心理等領域展現了廣闊的應用前景。
盡管體育社交媒體研究蓬勃發展,但由于數據通常是非結構化且以文本為主,這為分析帶來了方法論上的挑戰。為此,學者們呼吁采用新興技術來處理這些復雜數據,以進一步推動研究的深度和廣度。
實證示例:機器學習在社交媒體研究中的應用
為了展示機器學習在社交媒體文本數據分析中的應用,本研究收集了2010年至2020年間《國際體育傳播期刊》(IJSC)發表的261篇與社交媒體相關的文章。我們采用了BERTopic建模來自動識別文獻數據集中隱含的主題、模式和關系。
分析結果揭示了三個潛在主題,這些主題是通過傳統文本分析難以察覺的定義性術語體現的。第一個主題“體育利益相關者”集中討論了社交媒體在體育迷、運動員和體育組織等群體中的作用;第二個主題“奧運會”反映了關于社交媒體在奧運會背景下使用的研究;第三個主題“新冠疫情”則圍繞一期特別刊物“體育與新冠疫情危機”所展開。此外,研究發現,在這三個主題中,定性方法(如訪談和內容分析)經常出現,與以往主要依賴定量方法的研究形成對比。
本研究的實證示例表明,社交媒體研究可以通過機器學習技術獲得顯著收益。作為對傳統定性研究工具的有力補充,機器學習及相關分析和可視化工具可以幫助體育管理研究者以透明且創新的方式,深入理解大規模文本數據如何在不受既定假設、概念和價值觀影響的情況下被清理、編碼、分析和解釋。這種方法為社交媒體研究開辟了新的視角,也為未來研究提供了重要的啟發。
通過機器學習提升體育社交媒體研究的嚴謹性
機器學習為研究者提供了一種強大的工具,能夠將復雜的分析任務交由算法完成,從非結構化的社交媒體數據中挖掘有意義的模式。這種能力不僅推動了基于數據的新理論發展,也為回答傳統研究中難以觸及的問題提供了靈活的模型支持。例如,機器學習可以幫助研究者識別反直覺的趨勢和未曾察覺的關聯,從而豐富理論框架。
在理論層面,社交媒體數據具有實時動態的特性,這為研究社交網絡中的關系、粉絲情緒及其社會參與行為提供了前所未有的細致視角。通過機器學習的高效分析,研究者可以提煉出隱藏在這些數據中的模式,并將其轉化為對體育社交媒體研究的重要洞見。例如,消費者情緒的分析不僅可以揭示不同消費者群體的特征,還可以進一步解釋他們與體育對象之間的聯系發展過程,這對于理論深化和實踐應用都具有重要意義。
自然語言處理(NLP)是機器學習中的關鍵技術。它不僅能夠解析文本和圖像中的象征意義,還可以幫助研究者理解消費者在非文本媒介中表達的情感。例如,通過深度學習算法,研究者能將社交媒體圖片中的低層次視覺特征映射為高層次的行為模式,這對體育營銷和消費者態度研究至關重要。盡管機器學習技術強大,研究者在使用時必須注重模型的透明性和可解釋性。一個復雜但無法解釋的模型可能限制其理論貢獻。可解釋性不僅能增強研究的理論價值,也能確保模型在學術和實踐中的可用性。
體育社交媒體研究中機器學習的未來方向
未來研究應采用更復雜的自然語言處理和詞匯編碼技術,以改進文本分析的上下文理解。目前大多數研究依賴通用詞庫,難以反映體育情境的獨特性。開發適用于體育領域的專用詞庫,例如包含賽事術語和粉絲語言的詞匯,將有助于提升研究的準確性。
在模型構建方面,未來研究需要在模型的復雜性、預測精度和可解釋性之間實現平衡。盡管開發可解釋模型更具挑戰性,但其透明性能夠提高研究的責任性。研究表明,為了可解釋性而犧牲一定的復雜性并不會顯著降低模型的預測能力,而是讓研究者對模型的細節有更深刻的理解,從而使其對理論的發展更具價值。
研究者還應擴大機器學習的應用范圍,不僅限于市場優化目標,還應利用可解釋的機器學習技術,在動態語境中探索和挑戰現有框架。例如,開發體育特定的自然語言處理詞庫,或者使用機器學習推動體育產業的多樣性、包容性和公平性,這些都可以成為有效的研究方向。
作者:姜本橋印第安納大學 博士
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.