99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

17000字Claude 系統提示啟示:Karpathy 揭秘LLM 學習缺失“第三范式”

0
分享至


來自Andrej Karpathy的最新洞察,以及一份意外曝光的Claude系統提示詞引發的思考


Andrej Karpathy提出一個觀點:我們當前的LLM學習范式中,至少缺失了一個重要環節。他將其暫稱為“系統提示詞學習”(System Prompt Learning)

他認為:

預訓練(Pretraining)是為了讓LLM掌握海量知識

微調(SL/RL)則是為了塑造其習慣性行為

這兩者都涉及模型參數的改變。但Karpathy指出,很多人類學習更像是“系統提示詞”的調整:遇到問題、想出辦法,然后用明確的語言“記住”下次如何應對。比如,“當遇到這類問題時,我應該嘗試那種方法。” 這更像給自己寫備忘錄,是全局性的問題解決策略,而非針對特定用戶的零散記憶。Karpathy打了個比方:LLM目前就像《記憶碎片》里的主角,我們還沒給它配備“便簽本”或“草稿紙”

這種新范式如果能實現,將非常強大且數據高效。因為一個由知識引導的“復盤”階段,其反饋維度遠高于簡單的獎勵標量

Claude的“天書”級系統提示詞

Karpathy的這番思考,部分源于對Claude系統提示詞的觀察。最近,Claude的系統提示詞被一位用戶“套”了出來,內容之詳盡令人咋舌:

長度驚人:約17000詞,110kb大小。相比之下,OpenAI o4-mini的系統提示詞僅約2200詞(15.1kb),只有Claude的13%左右

Claude的系統提示詞地址:

https://github.com/asgeirtj/system_prompts_leaks/blob/main/claude.txt


這份龐大的提示詞里都有些什么呢?

1.工具定義 (Tool Definitions):這是最大頭,信息主要來自MCP服務器。MCP服務器不僅提供API,還詳細說明了LLM何時及如何使用這些工具。提示詞中列出了14種不同工具。例如,一個簡單的網頁搜索工具定義可能只有幾行,但像Google Drive搜索工具的描述就超過1700詞

2.工具使用指南:除了MCP提供的工具定義,還有大量關于如何及何時使用這些工具的指令,散布在“引用說明”、“工件說明”、“搜索說明”和“Google集成注意事項”等部分。比如,反復提醒Claude不要對其已知信息使用搜索工具(可見這是個頑固問題)

值得注意的是,Karpathy認為這種內外分離是合理的“關注點分離”:MCP包含通用工具信息,適用于任何程序;而非MCP部分則針對聊天機器人應用的特定需求。這是標準程序設計思路在提示詞工程上的應用

總計,近80%的提示詞內容都與工具的使用和定義相關

3.“熱修復”與行為規范 (Claude Behavior & Hotfixes):這部分更像是我們傳統理解中的系統提示,規定了Claude的行為方式、回應風格和禁忌。其中不乏針對LLM常見“陷阱”的“補丁”:

  • ?計數問題:“如果Claude被要求計算單詞、字母和字符數,它會先分步思考,明確地給每個計數對象編號,完成計數后再回答。”——這顯然是為了解決類似“strawberry里有幾個r”這類LLM常見難題

  • ?經典謎題:“如果Claude遇到經典謎題,它會先逐字引用所有約束條件,確認不是變體。”——防止LLM被稍作修改的經典邏輯題繞進去

  • ?知識更新:“特朗普是現任美國總統,于2025年1月20日就職。”——鑒于Claude知識截止日期是2024年10月,這條信息顯然是硬編碼的

  • ?詩歌創作:Karpathy最喜歡的一條:“如果被要求寫詩,Claude會避免使用陳詞濫調的意象、隱喻或可預測的押韻。”

從人工“補丁”到系統自主學習

Claude這份巨細的系統提示詞,恰恰印證了Karpathy的觀點:目前大量的問題解決策略,是工程師們手動寫入系統提示的。而Karpathy認為,這些本不應完全依賴人工,也不應立即或完全通過強化學習(RL)融入模型權重

理想情況下,這些策略應通過“系統提示詞學習”產生。這種學習過程類似于RL的設置,但學習算法不同(編輯提示詞 vs. 梯度下降)。LLM的系統提示詞中,有相當一部分可以通過這種方式“自我撰寫”,就像LLM為自己寫一本解決問題的指南。

當然,這其中還有很多細節待明確:編輯如何工作?編輯系統本身能否學習?如何像人類一樣,將顯性文本知識逐漸內化為習慣性權重?

Claude的系統提示詞,無疑是提示工程復雜性的一個縮影。Anthropic通過大量使用XML風格標簽來增強可讀性(這對人還是LLM更友好值得商榷),以及其MCP服務器的發明和采用,都是其管理這種復雜性的努力。但這也引出新問題:如何進行版本控制?這些“熱修復”是逐個添加還是批量評估后上線?什么時候才需要“推倒重來”?

這份提示詞也再次提醒我們:聊天機器人遠不止模型本身,其背后是不斷積累、迭代優化的指令、工具集和精心設計

參考:

https://x.com/karpathy/status/1921368644069765486

?星標AI寒武紀,好內容不錯過?

用你的在看告訴我~

求贊

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
魔獸:喬丹沒有1.22米的垂直彈跳 如果那么厲害他應該坐籃筐上

魔獸:喬丹沒有1.22米的垂直彈跳 如果那么厲害他應該坐籃筐上

直播吧
2025-06-23 19:32:22
宮魯鳴緊急呼喚劉禹彤,女籃內線與日本14號交鋒,如何制約田中?

宮魯鳴緊急呼喚劉禹彤,女籃內線與日本14號交鋒,如何制約田中?

小明侃文體
2025-06-24 11:47:36
哈爾濱美女邱巖在印尼溺亡!長的很漂亮,男友發聲,死因曝光

哈爾濱美女邱巖在印尼溺亡!長的很漂亮,男友發聲,死因曝光

鋭娛之樂
2025-06-23 10:03:59
“中國給的,比軍火貴重一萬倍!”伊朗外長通報全球

“中國給的,比軍火貴重一萬倍!”伊朗外長通報全球

智觀科技
2025-06-23 15:43:05
英國毒舌博主游中國后感嘆:中國就是發達國家,西方媒體故意抹黑

英國毒舌博主游中國后感嘆:中國就是發達國家,西方媒體故意抹黑

九號線人
2025-06-05 01:03:39
俄伊聯手成定局,中方跟不跟?外交部正面回應,中方的協助更致命

俄伊聯手成定局,中方跟不跟?外交部正面回應,中方的協助更致命

阿紿聊社會
2025-06-24 11:02:51
親華派流淚了,菲懇求中方談判,72歲崔天凱再出山,坐灘艦將沉海

親華派流淚了,菲懇求中方談判,72歲崔天凱再出山,坐灘艦將沉海

阿芒娛樂說
2025-06-18 20:31:05
一覺醒來,特朗普突然宣布伊以停火,伊方的回應,說明事情不簡單

一覺醒來,特朗普突然宣布伊以停火,伊方的回應,說明事情不簡單

薦史
2025-06-24 12:06:53
Scotto:聯盟內部普遍認為杰倫威和切特將從雷霆獲得巨額續約合同

Scotto:聯盟內部普遍認為杰倫威和切特將從雷霆獲得巨額續約合同

直播吧
2025-06-24 09:35:54
無緣自動駕駛,華為公布ADS 4九月推送,老車不支持高速L3

無緣自動駕駛,華為公布ADS 4九月推送,老車不支持高速L3

熱點科技
2025-06-23 15:25:48
原廣東臺主持人陳維聰已結束獄中生活,61歲的他或當網紅東山再起

原廣東臺主持人陳維聰已結束獄中生活,61歲的他或當網紅東山再起

比利
2025-06-22 15:01:03
縱覽熱點|貴州榕江遭超30年一遇洪水:當地回應已進行人員轉移工作,部分小區有人被困正組織救援

縱覽熱點|貴州榕江遭超30年一遇洪水:當地回應已進行人員轉移工作,部分小區有人被困正組織救援

縱覽新聞
2025-06-24 12:57:10
梅根又翻車!手寫感謝信竟藏“鼠標箭頭” 網友笑噴:PPT截圖?

梅根又翻車!手寫感謝信竟藏“鼠標箭頭” 網友笑噴:PPT截圖?

全球奇趣娛樂八卦
2025-06-23 14:44:51
哈利伯頓跟腱撕裂真實原因曝光,一針封閉毀掉所有,庫里后怕不已

哈利伯頓跟腱撕裂真實原因曝光,一針封閉毀掉所有,庫里后怕不已

君子一劍似水流年
2025-06-24 12:27:00
暴雪宣布:《魔獸世界》重磅亮相2025科隆游戲展!

暴雪宣布:《魔獸世界》重磅亮相2025科隆游戲展!

3DM游戲
2025-06-24 11:03:46
特訊!殲 - 35 一夜成中東 “護身符”,西方武器慌了?

特訊!殲 - 35 一夜成中東 “護身符”,西方武器慌了?

智觀科技
2025-06-20 17:02:05
特朗普已至白宮戰情室

特朗普已至白宮戰情室

財聯社
2025-06-24 01:04:12
哭了!廣東這12所本科大學“降為專科”,還值得報嗎?

哭了!廣東這12所本科大學“降為專科”,還值得報嗎?

譚老師地理工作室
2025-06-23 18:55:36
我考上了東南大學成賢學院,卻發現它“不是”東南大學?!

我考上了東南大學成賢學院,卻發現它“不是”東南大學?!

戶外阿毽
2025-06-24 10:20:44
山東省人民政府關于任命熊云澤職務的通知

山東省人民政府關于任命熊云澤職務的通知

齊魯壹點
2025-06-24 10:49:26
2025-06-24 14:19:00
AI寒武紀 incentive-icons
AI寒武紀
專注于人工智能,科技領域
731文章數 320關注度
往期回顧 全部

科技要聞

特斯拉股價飆漲8%,但Robotaxi小違章不斷

頭條要聞

媒體:以伊"12天戰爭"迅速走向停火 不符合以總理利益

頭條要聞

媒體:以伊"12天戰爭"迅速走向停火 不符合以總理利益

體育要聞

如果你喜歡籃球,你沒理由不喜歡步行者

娛樂要聞

名校不是護身符,李雪琴更多黑料被扒

財經要聞

以色列和伊朗同意全面停火!

汽車要聞

7.98萬起 firefly螢火蟲推出電池租用購車方案

態度原創

手機
親子
家居
數碼
軍事航空

手機要聞

三星下放 AI 技能,Galaxy A36 / A56 手機支持創建慢動作視頻

親子要聞

亞亞懷三胎肚子越來越大了,今天做染色體檢查,順便買點大碼女裝

家居要聞

龍湖滟瀾 現代歐式混搭

數碼要聞

優派推出三款 VG41V 會議顯示器,頂部 5MP Windows Hello 攝像頭

軍事要聞

特朗普:以伊完全同意全面停火

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 五家渠市| 繁峙县| 宽城| 景德镇市| 吴川市| 伊吾县| 西平县| 德阳市| 岑巩县| 江华| 永昌县| 奇台县| 托里县| 绥滨县| 灌云县| 四平市| 安新县| 阿坝| 论坛| 和政县| 阿克| 额敏县| 泌阳县| 塘沽区| 鄯善县| 玉山县| 扎赉特旗| 临洮县| 隆昌县| 彭山县| 福州市| 教育| 北流市| 绩溪县| 若尔盖县| 达拉特旗| 乐至县| 逊克县| 临泽县| 长汀县| 伊宁市|