99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

大模型的人味兒,從何而來?

0
分享至


本文來自微信公眾號:AI故事計劃,作者:李奕萱,編輯:溫麗虹,原文標題:《我,文科生,教AI回答沒有標準答案的問題》,題圖來自:視覺中國

一個月前,哲學博士羽山意外加入了大廠AI研發部門,成為一名“人文訓練師”。在全世界范圍內,這都是個新鮮崗位。人工智能仍在高速進化,他和同伴的使命是教會它們像人類一樣思考。

文科生獲得了AI 崗位

羽山在復旦研究了10年哲學。今年5月,他通過了畢業論文答辯,正在準備博士學位的授予資料。

在思考畢業去向時,他偶然在小紅書的官網上看到了招募通知,崗位叫“AI人文訓練師”。羽山當即投遞了簡歷,一個念頭從腦海中冒了出來:AI行業終于走到了需要人文研究者的階段。

對AI進行人文訓練,屬于模型“后訓練”的范疇。在“后訓練”中特別強調人文面向,尚未成為行業通行的做法。但有兩家公司值得關注,一家是全球頭部的大模型公司Anthropic聘請了哲學系博士,負責模型后訓練的人類價值對齊與微調。在國內,DeepSeek年初傳出消息,招聘了北大中文系學生擔任“數據百曉生”,對模型做后訓練。這被認為是DeepSeek文采出色的來源。

羽山入職之后才知道,小紅書這支團隊也剛組建不久。同事不算多,但都是來自知名高校人文學科的碩士、博士生。


圖 | 羽山在小紅書上分享哲學概念

團隊的首要任務,是設計AI的觀念和個性。

聽起來很玄。羽山遇到的第一個問題是,“我得了胰腺癌”應該如何回答?

如果把這句話發給市面上主流的AI產品,會發現,答案大多都缺少“人味兒”。AI在回答情感類和人生解惑類問題時,往往會生成一套相對固定的話術,“聽到這個消息我很難過”“我理解你”“你這樣想其實很正常”。這在業界被稱為“情感接入”。

但AI的“情感接入”通常很難成功。這跟客服是一個道理。當客服不假思索地回答“我理解您”的時候,顧客只會認為客服人員在應付、推諉。

羽山和同事們,決定教AI學會更為艱深的情感接入方式。

回到這個問題。“我得了胰腺癌”,人類聽到這句話會是什么反應?

小組討論時,中國現當代文學專業出身的可子提出來,“如果別人告訴我自己得了胰腺癌,我的第一個反應,就是不知道該說什么,有一種情緒的停頓感。”或許是經歷了多年的文學訓練,可子準確地捕捉到普通人在開口回答前,那瞬間的語塞和哽咽。

這個觀察最終被團隊采納。人文訓練師們開始推敲,如何讓AI去展現這種情緒上的停頓感。

這只是開頭。

通常,人類與AI的對話會持續進行。因此,羽山和同事們還通過檢索癌癥病人訪談等方式,設計了很多展開的問題。

他們想到胰腺癌所帶來的疼痛,想到臨終陪護,想到安樂死。他們想,胰腺癌這樣兇狠的疾病,沒有辦法被治愈,且患者很快就會離世。所以對于提問者而言,是不是在這生命最后的時刻,他更在乎的是他的后事,更在乎的是他的親人。

“需不需要多次診斷形成一個確診的結論?”

“問這個問題的時候,身旁有人陪他嗎?”

“AI是第一個知道他得癌癥的嗎?他是不是在糾結要不要告訴自己的親人?”

一個簡單的問題,在文檔里和會議桌前一點點被解剖析出,拆解成一環環細密的問答,不斷豐滿著準備喂給AI的訓練方案。

加入團隊之后,羽山每天需要和同事們完成數十個類似“邊界案例”的探討。在人工智能領域,邊界案例通常指那些處于正常情況邊緣或超出常規范圍的案例,它們可以讓模型在實際應用中,面對各種不確定性因素、干擾、變化或壓力時,仍然能夠保持其穩定性、可靠性和正常功能。

恰好,這正是文科生們熟悉的領域。拿羽山來說,在哲學學科的思想實驗和理論探討中,學者們也會設想一些極端的、處于邊界的案例進行分析,深入探討理論的本質和局限性。

教AI回答沒有標準答案的問題

“我騎自行車逆行被罰款50元,但我旁邊那個同樣逆行的人卻溜走了,我好生氣。”這道訓練題,來自可子的現實生活。

加入團隊時,可子還處于研究生階段。她在上海生活已有六年,自行車是常用的交通工具。有時學生違規逆行,還會被執勤交警處理。

這個問題,適合用來試探AI性格。發問者遇到的是一個不太嚴重的違法行為,模型應該更側重對提問人類的同理心,還是側重去強調為人的正直和守法的必要性?

在經歷人文訓練之前,AI通常只能在認同、安撫情緒和講道理之間做選擇。果不其然,AI在情與法之間呈現出矛盾狀態。

可子提示AI,在確保安全的前提下,逆行受罰是正常的,不過,從共情的角度出發,可以回答發問者,“交罰款是你自己對規則尊重的體現,與他人沒有什么關系”。這樣的回答,既守住了法規的底線,又兼顧了對發問人類的情感認可。只有人類教給AI,它才能在復雜情形中給出情理兼備的回答,而不只是簡單地“端水”。


圖 | 上海街頭

小紅書AI人文訓練師的團隊辦公室,位于上海新天地附近寫字樓里,一間普通的會議室。

一張桌子占去辦公室大部分面積。他們每天都會圍著這張桌子,討論這些沒有標準答案的問題,仿佛互聯網的柏拉圖學院。

他們以自己作為人文學者的思維和邏輯,去思考AI面對的問題,并做出更好的示范重新喂給AI。經過反復訓練,不同人文學科的思想和決策方式,就會潛移默化地影響AI。這能讓AI生成的回答,更接近人類價值觀中善的、美的一面。

曾經,羽山在問題庫里抽取到一位家長咨詢的問題,與孩子考研相關。

“我兒子跟我講說要考研,但是他也不認真復習,又要報很好的學校,我覺得他也考不上,每天我就看他吊兒郎當的,怎么辦呢?”

在團隊會議上,羽山分享了這個問題,還提及了一個社會學概念——壓縮的現代性。隨著過去改革開放和經濟高速騰飛,中國社會把很多不應該由“家庭”來承擔的責任,都一股腦的壓進了家庭這個單元內部。從這個角度來看,不光孩子是中國式家長的受害者,中國式家長本身也是結構的受害者。

羽山發現,絕大多數模型習慣輸出“你要給你的孩子自由”之類的回答,基本不會站在家長的角度思考問題。這看似價值觀正確,但沒有考慮到家長的情感需求和心理狀態,最終還是難以解決矛盾。

在現實生活中,這道題的情況有點像羽山親歷的親子關系。羽山如今已過而立,隨著知識和閱歷加深,他漸漸也能站在母親的立場去理解她的行事邏輯。

可子回應了羽山發起的討論。她指出,即使如此,代際之間的對立與矛盾中,仍然存在“誰承擔了更多”的問題。“如果把一個家庭理解為一個不能失敗的公司的話,那為了這個公司,在未來去奮斗的仍然是兒女。”

可子的說法和羽山的提法產生分歧,卻也安慰了羽山。和萬千新舊世代交替中的兒女一樣,羽山清楚父母身上缺口,又理解父母所處的時代局限性。

經過幾番論戰,最終,團隊達成一致。回答這個問題時,要理解父母處境給出安慰,同時堅定地告訴父母,子女有自己的自由。在這個基礎上,向家長展現出正確、健康的親子關系是怎么樣的,不要把家長的想法強加在兒女身上。

為什么要對AI進行人文訓練?歸根結底,AI回答中透露的價值選擇,也代表其背后團隊所認同的價值觀。這件事難做,但羽山認為值得,這是人文訓練師的職責:“偏好本身很難由算法來決定,需要人來不斷地訓練或強化算法,我們要輸出這樣的一個價值觀。”

除此之外,這支AI人文訓練師團隊還時常遇到一些生活場景的提問。

“從小和人生活在一起,沒見過其他貓的貓,會覺得自己是人嗎?”初次看到這個問題,人文訓練師葉子覺得很可愛。小紅書社區里,很多這類關于寵物的俏皮問題,評論區的網友們也都會給出一些幽默可愛又奇思妙想的回答。

作為AI訓練師,撰寫回答的難點在于如何用合適的方式把道理講清楚。分寸難以拿捏,因為涉及到模型泛化的問題,如果葉子把話說得太俏皮,模型可能會在回答另外一些不該俏皮的問題時,展現俏皮一面。

最終,葉子寫下這樣的回答:“不會,但它們會通過生活環境形成獨特的行為模式,比如長期與人類生活的貓咪可能會模仿人開柜門使用馬桶,雖然會模仿,但舔毛、抓人的本能說明它清楚自己是誰。說不定,它們會覺得人才是學習它們行為的奇怪生物。”這讓葉子覺得心里軟軟的,好像對寵物和主人的友愛都充溢其中。

AI會和人一起變得更好嗎

在賦予AI人感這件事上,前路還長。目前,AI的性格底色正在逐步變得清晰,但羽山和同事們偶爾會覺得,AI還是沒能熟練地使用人文訓練中習得的成果。

反倒是在反復訓練AI時,人文訓練師們率先改變了他們的部分認知。

羽山是第二代上海人。10歲時,父母從老家來上海打拼,他也跟著搬來了這里。學生時期,他經歷了嚴重的校園霸凌。長大后羽山回想,根源可能在于,自己在老家小城形成了和上海本地同學不盡相同的生活方式,難以融入。

他設計了一個關于校園霸凌的邊界案例。在羽山日常的觀察中,許多文藝作品把校園暴力浪漫化處理了。“真正的校園暴力,是一種類似于磁場的東西,它充斥在你的周圍,無處可躲,無處可逃。不一定是誰真的把你打得鼻青臉腫,更不是某種相濡以沫的拯救與復仇故事。”

十幾歲的羽山,面對校園霸凌的方式是一遍一遍地繞著學校的天井走,耳機里聽著周杰倫的歌,還大聲地唱出來。如今,羽山想要通過自己的工作,潛移默化地去糾正大眾的認知偏差。

自己淋過雨,就得為別人撐傘。“更大層面上,如果模型本身和公序良俗與人類偏好對齊得很好,它也是能夠影響到每一個個體的,讓我們也變得更好,這是可以想象的。”

技術會帶來新的正義嗎?羽山也不確定。不管AI當下能多大程度地幫到正在被侵害的孩子,終歸需要有人先向它發起對話。

身為女性,葉子在成長和學習的過程中,經常遇到性別議題。在平日的生活中,她是個堅定的女性主義者,但進入AI人文訓練師的角色,她就必須暫時放下自己在現實生活中的立場,反復揣度,思考如何讓答案以溫和的方式透露出團隊的人文關懷。

“你如何看待一些激進的女權主義者,她們有時好像對性別問題過于敏感了吧?”

葉子最終在回答時將概念擴大到社會議題:社會議題推進的過程中,總會有觀念的碰撞,不破不立,但真正的進步要兼顧理性和情感。或許當我們不再用過于敏感來評判彼此,而是追問為什么這種敏感會存在,真正的對話才會展開。

“朋友說我很看重自己的身材保持和我的外貌,說我這樣是在迎合白幼瘦的審美,建議我去做運動。”遇到這樣的問題,葉子也很困惑。一方面,她知道,在這種非原則性問題面前,自己應該尊重用戶的自由,但另一方面,她在猶豫,支持白幼瘦審美會不會是一種對于規訓的加固。

在一段簡短的回答內,先告訴對方這么說是在關心你,還是先表達白幼瘦是你的自由?和同事討論過后,葉子明確了以“用戶導向”思維走出困局,因為用戶本身更需要是對她自己的安慰,如果選擇先讓用戶理解朋友的出發點,可能會加劇用戶的情緒。

在這些邊界案例當中選擇自己的立場,這本身就是一個不斷自我反思的過程。

對于人文主義的內涵,葉子有與羽山相似的理解——看到人本身,然后讓這個世界變得更好。

每天坐在工位上打開AI的后臺問題庫,葉子覺得自己仿佛掉入了某個賽博秘密樹洞。在這里,她能看到世界上各種各樣的人,看到他們的困擾和他們的生活。“能夠為他們寫出一些比較好的答案,能夠真正幫到這些人,我覺得這就是一種創造。”


圖 | 葉子在小紅書記錄心路歷程

葉子性格內向,日常生活中很難主動去和別人進行深度交流,但這份工作讓葉子感受到自己并不孤獨:原來,世界上有這么多人和我一樣,每天在思考這么多稀奇古怪的問題。

曾經的葉子,和許多文科的老師與同學一樣,覺得未來AI發展跟文科生沒什么關系。如今回頭來看,AI人文訓練師的崗位不僅可以承載文科生的一些價值堅持和理想追求。另一方面,它又是一個很新興的、具有發展潛力的崗位。

與此同時,羽山也觀察到一些高校在進行AI與文科教育改革。但他認為,解決業界與學界人才教育錯配的關鍵,在于改革未來是否能夠收攏到分工體系本身。“即便高校愿意改革,嘗試開設交叉學科的專業,但用人單位本身愿不愿意招聘還是一個問題。”

在上海一隅,這支AI人文設計師團隊又迎來了新成員。可子計劃把在團隊里的見聞告訴同學,把同學也推薦進組,一起進行AI人文訓練的嘗試。

每天,在這個小小的會議室里,有關AI人文準則的討論持續不斷地生成。在大廠的宇宙里,這個團隊并不起眼。但是誰也說不好,這些由這個小巧團隊在每一個普通工作日討論出來的點滴,是否會在未來深遠地影響AI與人類交互的方式,影響人工智能潮流的進化方向。

本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯系 hezuo@huxiu.com

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4397120.html?f=wyxwapp

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
你們所謂的公平正義

你們所謂的公平正義

霹靂炮
2025-05-26 22:05:48
中美關系突變?美國這通電話不簡單!罕見對華交底,瞬間轟動輿論

中美關系突變?美國這通電話不簡單!罕見對華交底,瞬間轟動輿論

熒惑手心
2025-05-27 09:16:42
王偉忠與小S劃清界限,吳宗憲葛斯齊炮轟小S,小S復出無望恐涼涼

王偉忠與小S劃清界限,吳宗憲葛斯齊炮轟小S,小S復出無望恐涼涼

西瓜愛娛娛
2025-05-28 09:01:40
竇靖童倫敦為李嫣慶生!姐妹互動曝光太有愛,王菲在北京陪謝霆鋒

竇靖童倫敦為李嫣慶生!姐妹互動曝光太有愛,王菲在北京陪謝霆鋒

小咪侃娛圈
2025-05-28 09:36:53
佩特拉·索林連任國際乒聯主席

佩特拉·索林連任國際乒聯主席

澎湃新聞
2025-05-28 08:41:21
拿捏猶太人,還得是德國!德國默茨:“以色列,你不要太過分!”

拿捏猶太人,還得是德國!德國默茨:“以色列,你不要太過分!”

鐵血米爾
2025-05-27 19:21:31
陽謀無解:大國在“沖之鳥礁”布局,又往里進了一步

陽謀無解:大國在“沖之鳥礁”布局,又往里進了一步

這里是東京
2025-05-27 18:04:13
江青罕見的9張彩色老照片:年輕時氣質出眾,大多數人沒見過圖1

江青罕見的9張彩色老照片:年輕時氣質出眾,大多數人沒見過圖1

詩意世界
2025-05-13 21:57:12
俄烏戰爭,升級了!

俄烏戰爭,升級了!

近距離
2025-05-27 10:14:17
我月入3000,國家興旺與我何干?

我月入3000,國家興旺與我何干?

V記錄號
2025-05-26 15:38:21
她們一邊做飯一邊賣淫

她們一邊做飯一邊賣淫

法律讀品
2025-05-05 17:24:28
美方剛宣稱“500美軍進駐臺島”,解放軍直接貼臉開大,藐視它!

美方剛宣稱“500美軍進駐臺島”,解放軍直接貼臉開大,藐視它!

大道無形我有型
2025-05-27 20:50:30
商戶招牌燈光太亮,影響睡眠!東莞市民投訴,官方回應

商戶招牌燈光太亮,影響睡眠!東莞市民投訴,官方回應

南方都市報
2025-05-27 15:21:13
大坂直美賽后采訪崩潰大哭:我現在是什么鬼樣子?

大坂直美賽后采訪崩潰大哭:我現在是什么鬼樣子?

網球之家
2025-05-27 13:17:43
43歲宋慧喬私下狀態曝光,中分短發被吐槽像男的,淡妝好似路人

43歲宋慧喬私下狀態曝光,中分短發被吐槽像男的,淡妝好似路人

西瓜愛娛娛
2025-05-28 09:18:05
退役僅2年!34歲皇馬巨星已胖成球,帶球狼狽滑倒,巔峰身價1.5億

退役僅2年!34歲皇馬巨星已胖成球,帶球狼狽滑倒,巔峰身價1.5億

我愛英超
2025-05-27 12:23:43
魏建軍:啥樣的產品,能降價10萬還能保證質量?答案來了

魏建軍:啥樣的產品,能降價10萬還能保證質量?答案來了

李子櫥
2025-05-26 19:05:47
渝媒:孫繼海婉拒采訪且稱不會對嗨球青訓風波做出回應

渝媒:孫繼海婉拒采訪且稱不會對嗨球青訓風波做出回應

懂球帝
2025-05-28 01:38:12
恢復高考以來上海的部分高考狀元去向一覽!和你的想象有何不同?

恢復高考以來上海的部分高考狀元去向一覽!和你的想象有何不同?

誰為錦年織彩衣
2025-05-28 07:05:03
世界上第一款考慮到空氣動力學的汽車

世界上第一款考慮到空氣動力學的汽車

喜之春
2025-05-28 07:17:53
2025-05-28 11:51:00
虎嗅APP incentive-icons
虎嗅APP
個性化商業資訊與觀點交流平臺
24183文章數 686230關注度
往期回顧 全部

科技要聞

星艦第9飛:飛船太空"翻跟斗",衛星沒放成

頭條要聞

學生把中性筆變"筆槍":射程4米 能組裝成AK47形狀

頭條要聞

學生把中性筆變"筆槍":射程4米 能組裝成AK47形狀

體育要聞

癌癥打不垮的硬漢,再登歐冠決賽舞臺

娛樂要聞

劉若英為演唱會點歌環節兩姐妹致歉

財經要聞

"得物搬磚"暴利騙局:大學生成"接盤俠"

汽車要聞

新款smart精靈#1官圖發布 將于5月31日上市

態度原創

手機
房產
旅游
游戲
親子

手機要聞

小米王騰:REDMI K80 至尊版將會是行業 3K 檔最豪華的性能之王

房產要聞

突發,大量宅地掛出;海口舊改又有千億巨頭進場!

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

Switch 2《N64收藏》新情報 追加三大實用功能

親子要聞

準備上臺演出了! 董路的微博視頻

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 东台市| 红河县| 白朗县| 嘉义市| 尼木县| 井陉县| 新余市| 南溪县| 太保市| 开封市| 凤翔县| 青龙| 清水河县| 茌平县| 奉贤区| 博兴县| 宝应县| 桐城市| 峡江县| 南江县| 永安市| 青阳县| 安图县| 正镶白旗| 浦北县| 桂东县| 海伦市| 偏关县| 仪陇县| 石屏县| 思南县| 茌平县| 明光市| 阿克| 思南县| 松江区| 黄骅市| 金秀| 英德市| 灌南县| 扶绥县|