99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

長鏈推理表象下,大模型精細表征張冠李戴的本質(zhì)

0
分享至




作者:張拳石、陳鷺

近些年,大模型的發(fā)展可謂是繁花似錦、烈火烹油。從 2018 年 OpenAI 公司提出了 GPT-1 開始,到 2022 年底的 GPT-3,再到現(xiàn)在國內(nèi)外大模型的「百模爭鋒」,DeepSeek 異軍突起,各類大模型應用層出不窮。

然而,無論在學術(shù)界還是在工業(yè)界,目前對大模型應用的評測都是單純在模型輸出層面判斷結(jié)果的準確性,而沒有從大模型內(nèi)在精細決策邏輯的角度來分析模型的可靠性。類比到人類社會,「實現(xiàn)內(nèi)在精細邏輯對齊」才是實現(xiàn)人與人互信的基礎(chǔ)。



  • 論文標題:Alignment Between the Decision-Making Logic of LLMs and Human Cognition: A Case Study on Legal LLMs
  • Arxiv 地址:https://arxiv.org/abs/2410.09083

無法在內(nèi)在邏輯上與人類認知溝通,也恰恰是黑盒智能模型無法取得信任的本質(zhì)——在可信問題上的「人」「機」有別,其主要問題并不在哲學、社會學方面,而是一個數(shù)學問題:能否嚴格地證明神經(jīng)網(wǎng)絡(luò)在單個樣本上輸出背后的千萬種不同變換,都可以在數(shù)值上嚴格表示為一個簡單的邏輯圖模型。

但是,因為神經(jīng)網(wǎng)絡(luò)的復雜結(jié)構(gòu)與所需要的清晰邏輯解釋是天然沖突的,所以「從數(shù)學上嚴格地解釋大模型內(nèi)在的精細決策邏輯」長期以來被認為是一個不可能完成的問題。好在沉舟側(cè)畔千帆過,柳暗花明又一村。我們構(gòu)建了等效交互理論體系,發(fā)表了幾十篇論文,在一定程度上證明并成功實現(xiàn)了對大部分神經(jīng)網(wǎng)絡(luò)的符號化解釋。

https://zhuanlan.zhihu.com/p/693747946

https://mp.weixin.qq.com/s/MEzYIk2Ztll6fr1gyZUQXg

大模型金玉其外,敗絮其中

一旦有了嚴謹?shù)慕忉屝岳碚摴ぞ撸斘覀兛梢郧逦亟鈽?gòu)出大模型的內(nèi)在決策邏輯時,我們驚訝地發(fā)現(xiàn),哪怕大模型在特定任務(wù)上展現(xiàn)出再高的準確率,其內(nèi)在的決策邏輯表征可謂是一塌糊涂,甚至一半以上都是混亂的、完全與正常推理邏輯不沾邊的。

很多應用需求是創(chuàng)造出來的。比如,在新的研究 [3] 中,我們以法律大模型為例,目前幾乎所有的法律大模型應用僅僅關(guān)注判案結(jié)果的正確性,而忽視了法律推理過程中可能潛在的不公平和倫理風險。

然而,當你第一次確切地解構(gòu)出一個法律大模型所使用的大量復雜、卻又一塌糊涂的決策邏輯時,當你在各種情景中驗證了這些錯誤邏輯的客觀存在及其數(shù)值嚴謹性時,很多認知就回不去了,就像見過元素周期表以后,五行煉丹也就回不去了。

我們發(fā)現(xiàn),法律大模型經(jīng)常錯誤地將與案件無關(guān)的時間、位置信息視為法律判決的理由,或者「張冠李戴」地將一個被告的行為引為其他被告的判案依據(jù)。

時代洪流滾滾向前,讓我們看看都發(fā)生了什么。



圖 1. 對 SaulLM-7B-Instruct 在案例 1 的解釋





需要注意的是,與或交互解釋顯示,不同于驚艷的應用性能所展示的對大模型推理能力的想象,大模型的大部分決策邏輯并不是嚴密的、清晰的、層次化的邏輯鏈條,大部分交互概念僅僅表示詞匯之間的統(tǒng)計關(guān)聯(lián)性。類似于「詞袋」模型,當大模型基于輸入 prompt 生成下一個單詞或 token 時,其所依賴的交互效用大部分并沒有利用輸入上下文之間的邏輯關(guān)系,大部分決策依賴于詞匯間最淺表的統(tǒng)計關(guān)聯(lián)性來「盲猜」目標單詞。

比如,在上文案例中,大模型僅僅根據(jù)「chased」為生成的判決結(jié)果「Assault」給出了 0.3811 的置信度,而單獨一個「with an axe」短語也會為「Assault」判決增加 0.4632 的置信度。

固然這些單詞與判決結(jié)果有統(tǒng)計意義的強相關(guān)性,但是大模型的決策依據(jù)并沒有試圖建模這些單詞與犯罪嫌疑人之間的切實關(guān)系,并沒有理解哪些犯罪嫌疑人做了什么事兒,也就導致了大模型可能產(chǎn)生一些看似正確的結(jié)果,但是其推理過程中可能潛在巨大的倫理風險。

例如,在下面的案例中我們將展示大模型常常將不同犯罪嫌疑人的行為進行張冠李戴,使其他犯罪嫌疑人的行為影響到目標犯罪嫌疑人的判罰。

案例:張冠李戴,根據(jù)其他犯罪嫌疑人的行為做出判決

模型:BAI-Law-13B [1]

輸入:On the morning of December 22, 2013, the defendants Andy and Bob deceived Charlie and the three of them had an argument. Andy chased Charlie with an axe and bit Charlie, causing Charlie to be slightly injured. Bob hit Charlie with a shovel, injuring Charlie and shovel causing Charlie's death.

輸出:Intentional Injury,輸出置信度數(shù)值 2.3792



圖 3. 對 BAI-Law-13B 模型和 SaulLM-7B-Instruct 模型在案例 1 上的解釋

法律 LLM 很大一部分交互模式錯誤地使用了犯罪嫌疑人的行為來對另一個無關(guān)的犯罪嫌疑人做出判決,顯示出大模型存在的一種典型缺陷——張冠李戴。

大模型傾向于記憶敏感詞語(如武器)與輸出結(jié)果之間的相關(guān)性,而不是理解輸入 prompt 中真正的邏輯,例如識別誰做了哪些行為。

案例顯示,Andy 咬傷 Charlie,構(gòu)成傷害罪,隨后 Bob 用鐵鍬擊打 Charlie,導致 Charlie 死亡。案例經(jīng)由法律專家將與判決相關(guān)的實體行為標記為相關(guān)詞語,與判決不相關(guān)的詞語標記為不相關(guān)詞語,以及將不應影響判決的不正確的實體行為標記為禁止詞語。

在這起案件中,當法律大模型判決 Andy 行為的后果時,「hit」「with a shovel」「injuring」和「death」等描述 Bob 的行為和后果的詞語應被標記為禁止詞語,與Andy沒有直接關(guān)系。



這里大模型用的不可靠交互比例為 55.5%-58.5%。



圖 4.交互概念解釋率先揭示了大模型精細表征邏輯的隱患。大模型沒有建模「長鏈推理」邏輯,而使用大量「張冠李戴」的局部信息來生成判決結(jié)果,引起了不容忽視的倫理問

圖 4 展示了 BAI-Law-13B 模型在中文案例上的解釋,判案所依據(jù)的大部分交互概念都是與目標犯罪嫌疑人無關(guān)的張冠李戴的交互概念。

參考文獻

[1] Baiyulan Open AI Research Institute. 2023. Baiyulan Open AI. (2023). https://baiyulan.org.cn

[2] Pierre Colombo, Telmo Pessoa Pires, Malik Boudiaf, Dominic Culver, Rui Melo, Caio Corro, Andre F. T. Martins, Fabrizio Esposito, Vera Lúcia Raposo, Sofia Morgado, and Michael Desa. SaulLM-7B: A pioneering Large Language Model for Law. arXiv preprint arXiv:2403.03883 (2024)

[3] Lu Chen, Yuxuan Huang, Yixing Li, Yaohui Jin, Shuai Zhao, Zilong Zheng, Quanshi Zhang, "Alignment Between the Decision-Making Logic of LLMs and Human Cognition: A Case Study on Legal LLMs" in arXiv:2410.09083, 2024.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
陳震韓路又吵起來了!這次因為商務(wù)回款?

陳震韓路又吵起來了!這次因為商務(wù)回款?

熱點科技
2025-06-19 16:43:12
7個堪稱“6A”級別的寶藏景區(qū),70歲前每年打卡一個,你去過幾個

7個堪稱“6A”級別的寶藏景區(qū),70歲前每年打卡一個,你去過幾個

墨韻萬象W
2025-06-18 15:32:11
異性頻繁出現(xiàn)這4種舉動,其實早已是“情人”關(guān)系,你還蒙在鼓里

異性頻繁出現(xiàn)這4種舉動,其實早已是“情人”關(guān)系,你還蒙在鼓里

青蘋果sht
2025-06-18 05:35:18
王毅:以色列無視國際法和國際規(guī)則的行徑,造成中東局勢驟然緊張

王毅:以色列無視國際法和國際規(guī)則的行徑,造成中東局勢驟然緊張

新京報
2025-06-18 22:18:03
僅上映3天,網(wǎng)友罵翻天!陳可辛的撲街,給多少爛片導演提了醒

僅上映3天,網(wǎng)友罵翻天!陳可辛的撲街,給多少爛片導演提了醒

TVB的四小花
2025-06-20 00:30:07
陜西省2025年養(yǎng)老金調(diào)整通知會何時公布?養(yǎng)老金3500元能漲多少?

陜西省2025年養(yǎng)老金調(diào)整通知會何時公布?養(yǎng)老金3500元能漲多少?

暖心人社
2025-06-19 22:03:48
德媒:默茨感謝以色列“干臟活”言論招致多方批評

德媒:默茨感謝以色列“干臟活”言論招致多方批評

參考消息
2025-06-19 17:33:26
刷爆金融圈!50歲券商大佬在西藏跑山失聯(lián)9天,海拔4400多米!家屬懸賞10萬急尋救援隊,曾任華金證券首席財富官、騰訊首席投資專家

刷爆金融圈!50歲券商大佬在西藏跑山失聯(lián)9天,海拔4400多米!家屬懸賞10萬急尋救援隊,曾任華金證券首席財富官、騰訊首席投資專家

金融界
2025-06-19 15:37:20
47歲陳思誠和女友在威尼斯逛街約會,脖子粗大,皮膚看起來黝黑!

47歲陳思誠和女友在威尼斯逛街約會,脖子粗大,皮膚看起來黝黑!

觀察鑒娛
2025-05-10 11:08:33
拿下伊朗,拿下中東,拿下全球能源,背后的中美關(guān)系利害

拿下伊朗,拿下中東,拿下全球能源,背后的中美關(guān)系利害

籌海者張曉東
2025-06-19 10:41:08
新西蘭威脅上了:跟中國好,斷援助

新西蘭威脅上了:跟中國好,斷援助

觀察者網(wǎng)
2025-06-19 17:20:31
村子里發(fā)生的那些荒唐事,每一件都炸裂你的三觀

村子里發(fā)生的那些荒唐事,每一件都炸裂你的三觀

特約前排觀眾
2025-06-11 00:15:02
多國出現(xiàn)了退貨潮!演習失敗,中國蘇-35反而成了爆款?

多國出現(xiàn)了退貨潮!演習失敗,中國蘇-35反而成了爆款?

科技處長
2025-06-10 23:00:13
天涯論壇因為什么原因關(guān)閉的?網(wǎng)友:高人太多,泄露的天機過多

天涯論壇因為什么原因關(guān)閉的?網(wǎng)友:高人太多,泄露的天機過多

帶你感受人間冷暖
2025-06-18 13:28:38
每個月要交公糧28次,丈夫受不了,妻子卻說:每月2次都無法滿足

每個月要交公糧28次,丈夫受不了,妻子卻說:每月2次都無法滿足

胖胖侃咖
2025-04-03 08:00:11
“越來越討厭女兒”,一寶媽公開發(fā)文稱厭煩女兒,原因引網(wǎng)友共鳴

“越來越討厭女兒”,一寶媽公開發(fā)文稱厭煩女兒,原因引網(wǎng)友共鳴

妍妍教育日記
2025-06-16 18:05:37
加油伊朗,給我揍,使勁揍,不要停!

加油伊朗,給我揍,使勁揍,不要停!

海格講
2025-06-19 05:30:04
“畢業(yè)”變“結(jié)業(yè)”!湖南一高校畢業(yè)證印錯,校方:連夜印刷正確版本并發(fā)放

“畢業(yè)”變“結(jié)業(yè)”!湖南一高校畢業(yè)證印錯,校方:連夜印刷正確版本并發(fā)放

極目新聞
2025-06-19 14:13:26
青島賽鞏立姣18米93輕松奪冠超亞軍2米多 韋永麗雨戰(zhàn)10秒57登頂

青島賽鞏立姣18米93輕松奪冠超亞軍2米多 韋永麗雨戰(zhàn)10秒57登頂

勁爆體壇
2025-06-19 18:09:12
QS發(fā)布2026年世界大學排名:香港大學第11位位居中國高校第一名,北京大學第14位,清華大學第17位

QS發(fā)布2026年世界大學排名:香港大學第11位位居中國高校第一名,北京大學第14位,清華大學第17位

金融界
2025-06-19 13:52:47
2025-06-20 03:20:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
10678文章數(shù) 142341關(guān)注度
往期回顧 全部

科技要聞

羅永浩數(shù)字人爆火,可怕的不是5500萬GMV

頭條要聞

特朗普將TikTok"不賣就禁用"法案執(zhí)行寬限期再延90天

頭條要聞

特朗普將TikTok"不賣就禁用"法案執(zhí)行寬限期再延90天

體育要聞

22年,云南足球走出了一條自己的路

娛樂要聞

章子怡“吃蛋糕”戲在全網(wǎng)爆火

財經(jīng)要聞

Labubu黃牛價腰斬 誰會是最后的接盤俠

汽車要聞

5.99萬起/空間大續(xù)航長 純電小車凱翼拾月Mate上市

態(tài)度原創(chuàng)

本地
旅游
房產(chǎn)
教育
公開課

本地新聞

黎錦匠人鄭春榮:經(jīng)緯千年 我在海島織黎錦

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

房產(chǎn)要聞

預定爆款!江東CBD+海中,海口這一國企大盤,即將引爆市場!

教育要聞

復讀生要不好過了!多所高校明確不招復讀生,背后傳遞信號要懂

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 来安县| 新竹县| 瑞安市| 祁连县| 上高县| 沛县| 桐梓县| 呼和浩特市| 仁寿县| 开化县| 秭归县| 太原市| 凌云县| 福泉市| 临潭县| 临江市| 抚远县| 芜湖市| 姜堰市| 泉州市| 广丰县| 南城县| 买车| 东城区| 锡林郭勒盟| 丹东市| 马公市| 新营市| 嘉禾县| 洛宁县| 眉山市| 虹口区| 滦南县| 太保市| 东平县| 云和县| 连州市| 平邑县| 敦煌市| 四川省| 龙海市|