99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

合成數據的突破: 從降低迎合性偏差到認知自主性的重構

0
分享至

馬來西亞思特雅大學博士生王立博,近兩年來主要研究大語言模型。起初,王立博做這類研究也是被大語言模型給逼的,因為日常總得提防其“獻媚(Sycophancy)”,這是由基于人類反饋的強化學習調優策略導致的固有缺陷。

因此,他致力于設計能夠自主學習、思考和推理的人工智能,而不是人工寵物。

引入強化學習的訓練獎勵模型進行微調,盡管可以優化用戶體驗,但是引入偏見是不可避免的,因為“獎勵”的依據是優先考慮用戶反饋的滿意度而未必是考慮客觀事實。這種偏見通常來源于互聯網數據,而大語言模型的訓練數據集主要依賴于互聯網信息。

基于此,王立博嘗試通過合成數據干預來優化僅解碼器(decoder-only)transformer 架構,彌補其對輸入序列缺乏深度分析的不足。

在生成過程中他嘗試設計加入額外阻礙,促使模型自主判斷并拒絕不合理的輸入。這一構想原理上能有效避免過度依賴用戶的反饋,因為合成數據干預會更側重于模型內在推理能力的培養,而非尋求 RAG 外部知識庫。


(來源:OpenAI)

此外,實現自主思考的重要標志之一就是判斷力,為此王立博構想加入反面示例和對抗性輸入來提升模型的抗獻媚性。

實驗結果顯示,經過合成數據干預后的 GPT4o 在量化獻媚指標上顯著下降。如果這一成果有機會走出實驗室,它可能為 decoder-only 架構的模型會帶來更客觀的決策支持,并減少偏見。

同時,該成果在機器人、自動駕駛和醫療等領域的應用,有助于提升自動化科學研究的效率。

更令王立博興奮的是,此次實驗是通過提示詞工程(prompt engineering)實現。這意味著未來合成數據干預可以不再依賴傳統的代碼編寫,僅通過編寫自然語言,推動“AI 工程師”從專業技術人員走向普羅大眾,為更多探索者擴大平等契機。

未來,開發、優化、數據處理、特征挖掘以及對前沿技術知識的了解,可能無需再依賴少數掌握編程和數學知識的專家,而只需設計邏輯清晰的提示詞。

日前,相關論文《減輕僅解碼器變換器架構中的獻媚:合成數據干預》(Mitigating Sycophancy in Decoder-Only Transformer Architectures: Synthetic Data Intervention)為題發在 arXiv[1]。


圖 | 相關論文(來源:arXiv)

隨著大語言模型推理思考和生成代碼等能力的增強, 提示詞工程使人們有機會更平等地與各領域科學家共享信息資源。因此,未來王立博會致力于推動未來工程的提示詞化,簡單直接平等。

比如,最近王立博通過設計 prompt 進行黑盒測試 (Black-Box Testing) 實驗,嘗試模擬攻擊大語言模型的護欄。他發現即便如 GPT4o 和 Grok-2 Beta,其護欄在識別多步驟越獄傾向的提示詞時仍存在較大困難。

其還通過模擬場景設計了 7 到 10 步的提示詞成功順利使得所有模型模擬生成言語攻擊的內容。這意味著當前的大語言模型的護欄仍需完善。

在稀疏注意力方面,王立博曾設計通過稀疏注意力機制降低大語言模型中思維鏈推理的成本。

同樣的,王立博通過提示詞基于 GPTs 訓練的實驗模型與 o1 preview 進行對比。實驗結果顯示,在犧牲可接受范圍內的準確率的條件下,稀疏注意力機制與具備思維鏈的編碼器-解碼器(encoder-decoder)transformer 架構結合,在推理時間和推理步驟方面都顯著降低。

王立博也曾設計過將自動語音識別和大語言模型引入智能眼鏡的架構,這些構想如今正在被工業界所實踐。即便合成數據干預或稀疏注意力機制被廣泛應用,由于其本身的限制性使交互仍主要集中在視覺和聽覺。而隨著當前深度強化學習技術不斷優化更新,人形機器人將迎來質的高速發展。在促進自主學習能力的同時,王立博設計了人形機器人多場景推理 (Multi-Scenario Reasoning) 以及模塊化機器人實現自主變形的認知模塊化控制 (Cognitive Modular Control) 等架構。受到人腦認知架構的啟發,他致力于為自適應機器人引入認知的自主化技術,促進機器人的多形態或多用途的方向轉型。因此,探索機器人在工業領域具備感知、思考、推理、規劃、記憶和決策等能力的認知自主性成為王立博的下一個研究目標。

參考資料:

1.https://doi.org/10.48550/arXiv.2411.10156

2.https://doi.org/10.48550/arXiv.2411.09111

3.https://doi.org/10.48550/arXiv.2411.16730

4.https://doi.org/10.48550/arXiv.2412.20429

5.https://openreview.net/pdf?id=lJr0M8vpZO

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
陳震韓路又吵起來了!這次因為商務回款?

陳震韓路又吵起來了!這次因為商務回款?

熱點科技
2025-06-19 16:43:12
7個堪稱“6A”級別的寶藏景區,70歲前每年打卡一個,你去過幾個

7個堪稱“6A”級別的寶藏景區,70歲前每年打卡一個,你去過幾個

墨韻萬象W
2025-06-18 15:32:11
異性頻繁出現這4種舉動,其實早已是“情人”關系,你還蒙在鼓里

異性頻繁出現這4種舉動,其實早已是“情人”關系,你還蒙在鼓里

青蘋果sht
2025-06-18 05:35:18
王毅:以色列無視國際法和國際規則的行徑,造成中東局勢驟然緊張

王毅:以色列無視國際法和國際規則的行徑,造成中東局勢驟然緊張

新京報
2025-06-18 22:18:03
僅上映3天,網友罵翻天!陳可辛的撲街,給多少爛片導演提了醒

僅上映3天,網友罵翻天!陳可辛的撲街,給多少爛片導演提了醒

TVB的四小花
2025-06-20 00:30:07
陜西省2025年養老金調整通知會何時公布?養老金3500元能漲多少?

陜西省2025年養老金調整通知會何時公布?養老金3500元能漲多少?

暖心人社
2025-06-19 22:03:48
德媒:默茨感謝以色列“干臟活”言論招致多方批評

德媒:默茨感謝以色列“干臟活”言論招致多方批評

參考消息
2025-06-19 17:33:26
刷爆金融圈!50歲券商大佬在西藏跑山失聯9天,海拔4400多米!家屬懸賞10萬急尋救援隊,曾任華金證券首席財富官、騰訊首席投資專家

刷爆金融圈!50歲券商大佬在西藏跑山失聯9天,海拔4400多米!家屬懸賞10萬急尋救援隊,曾任華金證券首席財富官、騰訊首席投資專家

金融界
2025-06-19 15:37:20
47歲陳思誠和女友在威尼斯逛街約會,脖子粗大,皮膚看起來黝黑!

47歲陳思誠和女友在威尼斯逛街約會,脖子粗大,皮膚看起來黝黑!

觀察鑒娛
2025-05-10 11:08:33
拿下伊朗,拿下中東,拿下全球能源,背后的中美關系利害

拿下伊朗,拿下中東,拿下全球能源,背后的中美關系利害

籌海者張曉東
2025-06-19 10:41:08
新西蘭威脅上了:跟中國好,斷援助

新西蘭威脅上了:跟中國好,斷援助

觀察者網
2025-06-19 17:20:31
村子里發生的那些荒唐事,每一件都炸裂你的三觀

村子里發生的那些荒唐事,每一件都炸裂你的三觀

特約前排觀眾
2025-06-11 00:15:02
多國出現了退貨潮!演習失敗,中國蘇-35反而成了爆款?

多國出現了退貨潮!演習失敗,中國蘇-35反而成了爆款?

科技處長
2025-06-10 23:00:13
天涯論壇因為什么原因關閉的?網友:高人太多,泄露的天機過多

天涯論壇因為什么原因關閉的?網友:高人太多,泄露的天機過多

帶你感受人間冷暖
2025-06-18 13:28:38
每個月要交公糧28次,丈夫受不了,妻子卻說:每月2次都無法滿足

每個月要交公糧28次,丈夫受不了,妻子卻說:每月2次都無法滿足

胖胖侃咖
2025-04-03 08:00:11
“越來越討厭女兒”,一寶媽公開發文稱厭煩女兒,原因引網友共鳴

“越來越討厭女兒”,一寶媽公開發文稱厭煩女兒,原因引網友共鳴

妍妍教育日記
2025-06-16 18:05:37
加油伊朗,給我揍,使勁揍,不要停!

加油伊朗,給我揍,使勁揍,不要停!

海格講
2025-06-19 05:30:04
“畢業”變“結業”!湖南一高校畢業證印錯,校方:連夜印刷正確版本并發放

“畢業”變“結業”!湖南一高校畢業證印錯,校方:連夜印刷正確版本并發放

極目新聞
2025-06-19 14:13:26
青島賽鞏立姣18米93輕松奪冠超亞軍2米多 韋永麗雨戰10秒57登頂

青島賽鞏立姣18米93輕松奪冠超亞軍2米多 韋永麗雨戰10秒57登頂

勁爆體壇
2025-06-19 18:09:12
QS發布2026年世界大學排名:香港大學第11位位居中國高校第一名,北京大學第14位,清華大學第17位

QS發布2026年世界大學排名:香港大學第11位位居中國高校第一名,北京大學第14位,清華大學第17位

金融界
2025-06-19 13:52:47
2025-06-20 03:20:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15315文章數 513792關注度
往期回顧 全部

科技要聞

羅永浩數字人爆火,可怕的不是5500萬GMV

頭條要聞

特朗普將TikTok"不賣就禁用"法案執行寬限期再延90天

頭條要聞

特朗普將TikTok"不賣就禁用"法案執行寬限期再延90天

體育要聞

22年,云南足球走出了一條自己的路

娛樂要聞

章子怡“吃蛋糕”戲在全網爆火

財經要聞

Labubu黃牛價腰斬 誰會是最后的接盤俠

汽車要聞

5.99萬起/空間大續航長 純電小車凱翼拾月Mate上市

態度原創

游戲
房產
教育
時尚
數碼

竟然直接雙開?《心之眼2》主打多人疑似明年發售

房產要聞

預定爆款!江東CBD+海中,海口這一國企大盤,即將引爆市場!

教育要聞

復讀生要不好過了!多所高校明確不招復讀生,背后傳遞信號要懂

中年女人夏季別再穿"t恤"了,安排這3款夏裝,時髦還顯瘦

數碼要聞

小米史上手感最好的平板!REDMI K Pad圖賞

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 宁晋县| 新绛县| 怀集县| 德清县| 留坝县| 漠河县| 隆回县| 巴塘县| 富蕴县| 四川省| 若尔盖县| 镇平县| 崇阳县| 栾川县| 古田县| 福建省| 龙江县| 军事| 轮台县| 惠水县| 佛冈县| 连州市| 河曲县| 常熟市| 大宁县| 刚察县| 雷山县| 龙里县| 孙吴县| 武定县| 桐庐县| 措勤县| 黑山县| 湖南省| 武威市| 奉贤区| 柳州市| 阜新| 太白县| 凤城市| 阿瓦提县|