99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

人工智能重塑社會科學:大語言模型的應用、挑戰與前瞻

0
分享至


人工智能,尤其是大語言模型(LLM)正在對社會科學研究產生重大影響。這些基于Transformer架構、通過海量文本數據預訓練的機器學習模型,正日益展現出模擬人類反應與行為的能力,從而為大規模、快速檢驗人類行為的理論和假設創造了條件。加拿大滑鐵盧大學Igor Grossmann等研究人員在《科學》(Science)期刊發表《人工智能和社會科學研究轉型》(AI and the transformation of social science research)一文,該文探討大語言模型在社會科學研究中的應用、在輔助研究方面所面臨的挑戰以及未來展望,旨在為社會科學家如何更好地利用人工智能提供參考。

大語言模型在社會科學
研究中的應用

社會科學的研究方法包括調查問卷、行為測試、半結構化的混合方法分析、多主體建模(ABM)、觀察性研究和實驗等,其目標是獲得個體、群體、文化及其互動的概括性表征。隨著先進的人工智能的出現,社會科學數據收集的形式將會發生變化。大模型可以利用深度學習捕捉語言中的復雜關系,這種通過上下文感知的方式,準確處理、生成人類語言,并能與人類進行自然互動的能力,代表了人工智能方法的重大轉變。以往的人工智能方法往往難以處理語言中的細微差別,如諷刺、隱喻和情感等。而通過適當的調節,大語言模型可以在社會科學研究中更準確地模擬人類行為反應。

大語言模型可以在數據收集中代替人類被試。例如,大語言模型已經展示了它們在消費者行為調查中,生成逼真回答的能力。盡管人們對這一應用的可行性眾說紛紜,但至少,使用模擬被試的研究可以用于生成新的假設,該假設可以進一步通過人類被試得到證實。這種方法的成功取決于訓練數據的算法保真度、訓練模型的透明度、及時的工程設計和基準選擇。

為什么這個設想是合理的?先進的人工智能模型通過在大規模數據集上的預訓練,可以代表大量的人類經驗和觀點。與傳統方法相比,它們有更大的自由度來產生不同的答案,有助于減少相關研究中的普遍性問題。由于人類存在注意力有限、反應偏差或者習慣化等問題,大語言模型可以在更廣泛的參數范圍內生成反應,從而提供較少偏差的潛在維度。這使得大語言模型在傳統數據收集方式不可行的高風險項目中占據優勢,可以在正式實施前先在模擬人群中測試干預措施。

大語言模型還可以用于其他方面,通過重現不同的理論視角或者思想流派的觀點來促進政策分析。例如,可以訓練大語言模型捕捉復雜辯論中的細微差別。通過對大語言模型進行培訓,以捕捉不同的視角,包括評估險些發生的“假設”(what-if)情景,并對這些情景的可信度進行評估。一旦大語言模型通過意識形態圖靈測試,就意味著它們能以與真人無差別的方式準確表達對立觀點,研究人員可以用它們來模擬生成未來的情景。因此,未來大語言模型經過適當的訓練后,可能在分析任務上超過人類,如綜合相互沖突的觀點,以進行更好的預測并提出政策建議。

在涉及個人或群體社會互動研究中,人工智能還可以模擬扮演同盟角色(例如假被試)。大語言模型—多主體建模(LLM-ABM)可以推導出基于經驗的社會決策或者行為規則,從而模擬具有特定特征和信仰的個體的社會互動。這種方法可以探索某些特定的特征如何影響人類的互動,為更廣泛的社會科學問題提供信息,例如研究虛假信息是如何通過社交網絡進行傳播的。

此類研究引發了關于大語言模型作為人類認知和決策模型的局限性問題。我們能否通過要求大語言模型在與人類分享和復制研究之前先來評估新聞的質量來“助推”大語言模型?如果可以,是否能夠利用LLM-ABM來確定干預措施,從而減少錯誤信息在社交網絡的傳播?一般來說,如果LLM-ABM能夠在人類行為者如何選擇分享信息、如何在社會困境中合作和競爭以及如何遵守社會規范方面提供新見解,那么它們就能形成具有更高保真度的決策模型,為人類行為和社會動態的基本機制提供有價值的見解。

大語言模型輔助社會科學研究
所面臨的挑戰

由于運行原理不同,將大語言模型納入多主體建模會帶來新的挑戰。大語言模型根據大量語言數據的統計模式來生成和解釋語言,而傳統的多主體建模則根據預定義的形式規則運行,這些規則可以通過使用現實世界的語言數據和其他定性數據生成。新的多主體建模設計需要利用大語言模型的能力來模擬問卷調查的結果、不確定情況下的行為或開放式回答。通過為多主體建模創建真實初始人群,大語言模型可以模擬被試潛在的認知或情感狀態,這超越了傳統研究人員的能力,為未來理論的生成打開了大門。

大語言模型的未來潛在優勢包括創建多類型的樣本,并且能夠對人類行為和社會動態提供更準確的描述。基于人口規模的校準數據,大模型可以幫助解決社會科學研究中可能導致模型偏差的常見問題,包括普遍性和自我選擇問題。人工智能輔助研究的有效性取決于人工智能是否能精確地反映不同群體的觀點。眾所周知,來自語言文化產品的預訓練模型可以捕捉社會文化偏見。當偏見被識別時,一個關鍵問題就是偏見的來源:它們是準確地反映了人們的思想觀念,還是模型構建出來的產物?模型構建偏差是由于在整個設計和開發過程中做出了不正確或無效的選擇,還是由于現有的社會差異造成的。

科學家—人道主義者困境(scientist-humanist dilemma)已成為一個關鍵問題:盡管科學家的目標是研究嵌入社會文化偏見的“純粹的”大語言模型,以模仿人類行為并追蹤其文化演變,但倫理約束要求工程師保護大語言模型不受各種偏見的影響。目前,大語言模型工程師已經對預訓練模型進行微調,努力在人工智能訓練中減少偏見,這可能會逐漸削弱人工智能輔助社會科學研究的有效性。大語言模型訓練本身的“黑箱”性質對研究者評估潛在機制和重復研究的能力提出了挑戰。為解決這一問題,提倡開源大語言模型,預訓練而非微調的科學研究模型以及透明的方法(例如,BLOOM,Cerebras-GPT)對確保可靠可信的人工智能驅動的研究至關重要。

人工智能時代社會科學家的
角色調適與未來展望

總的來說,研究人員需要制定在研究中使用大語言模型的倫理準則,解決與數據隱私、算法公平性、環境成本以及生成的研究結果可能被濫用有關的問題。數據質量、公平性和平等使用人工智能系統至關重要。在決定是否使用大語言模型來模擬人類行為時,研究人員必須首先驗證以語言為中介的潛在建構。他們可以將大語言模型生成的反應視為非人類被試的“樣本”并系統地改變提示,就像在傳統實驗中呈現隨機刺激一樣。使用大語言模型進行再搜索的一個重要考慮因素是外部有效性和內部有效性之間的權衡。

未來的大語言模型經過不同文化內容的訓練之后,將通過模擬人類的反應并推廣到真實世界的場景中,從而提供更高的外部有效性。然而,其不透明性將限制內部有效性。相反,由實驗室在較小受控數據集上建立的自然語言處理模型將提供更強的內部有效性,但其代價是可靠性和泛化能力的降低。在不同的環境下,這些方法都能發揮重要作用,研究人員可以根據自己的優先級,謹慎選擇這些方法。

研究人員還必須考慮研究的內容,涉及暴力的高風險情境或需要大量人類參與但明顯不可行的情境可能更適合大語言模型。例如,大語言模型可用于探索太空旅行中的人類互動。隨著人工智能重塑了社會科學的格局,研究人員的職業也將多樣化,他們將扮演新的角色,如模型偏差獵手、人工智能數據驗證者或者人機互動者。在這種情況下,保持概念的清晰性、理解測量的基礎以及堅持以理論為基礎的實踐,選擇適合自己研究問題的人工智能輔助設計至關重要。

正如柏拉圖洞穴寓言中的囚犯觀察墻上的影子并相信它們代表現實一樣,大語言模型也依賴于人類在文化產品中所描述的經驗的“影子”。這些“影子”為其所代表的現象的本質提供了一個有限的視角,因為在文化產品中捕獲的大眾心理學并不總能反映出支配人類行為的機制——這是社會科學家必須承認的局限性。盡管存在這些障礙,但大語言模型允許社會科學家打破傳統的搜索方法,以創新的方式開展工作。

大語言模型很可能會導致線上眾包平臺的衰落,此類平臺是許多社會科學領域的人類被試數據的主要來源。原因很簡單,一是大語言模型在執行簡單任務時的表現已與人類的表現不相上下,二是大語言模型引導的機器人的開放式回答與人類被試的回答難以區分,這就需要新的方法來驗證人類數據的真實性。社會科學家必須做好準備,適應不斷發展的技術帶來的不確定性,同時要意識到當前研究實踐的局限性。只有通過保持透明度和可重復性,才能確保人工智能輔助的社會科學研究真正有助于我們對人類經驗的理解。

免責聲明:本文轉自啟元洞見。文章內容系原作者個人觀點,本公眾號編譯/轉載僅為分享、傳達不同觀點,如有任何異議,歡迎聯系我們!

轉自丨啟元洞見

研究所簡介

國際技術經濟研究所(IITE)成立于1985年11月,是隸屬于國務院發展研究中心的非營利性研究機構,主要職能是研究我國經濟、科技社會發展中的重大政策性、戰略性、前瞻性問題,跟蹤和分析世界科技、經濟發展態勢,為中央和有關部委提供決策咨詢服務。“全球技術地圖”為國際技術經濟研究所官方微信賬號,致力于向公眾傳遞前沿技術資訊和科技創新洞見。

地址:北京市海淀區小南莊20號樓A座

電話:010-82635522

微信:iite_er

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

全球技術地圖 incentive-icons
全球技術地圖
洞見前沿,引領未來
3852文章數 13394關注度
往期回顧 全部

專題推薦

洞天福地 花海畢節 山水饋贈里的“詩與遠方

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 潼南县| 双辽市| 梅河口市| 沂源县| 南安市| 临洮县| 揭东县| 普格县| 色达县| 贡嘎县| 韩城市| 赫章县| 钟祥市| 威海市| 应城市| 专栏| 甘泉县| 鄂州市| 五指山市| 武宣县| 禹州市| 伊春市| 湟中县| 泌阳县| 凤城市| 申扎县| 黑山县| 深州市| 阿城市| 武清区| 海兴县| 仲巴县| 大悟县| 逊克县| 建宁县| 仙居县| 兰溪市| 阜宁县| 抚松县| 宁陕县| 兖州市|