99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

提示工程死亡?不,它剛剛重生為計(jì)算科學(xué):一篇講透Prompt設(shè)計(jì)的科學(xué)基礎(chǔ)

0
分享至


來源:深度學(xué)習(xí)自然語言處理

大型語言模型(LLM)雖然在知識(shí)任務(wù)中表現(xiàn)出色,但在數(shù)學(xué)證明、棋類推演等多步推理任務(wù)中屢屢受挫。根本原因在于Transformer架構(gòu)的計(jì)算深度限制:其注意力機(jī)制只能執(zhí)行固定步數(shù)的序列計(jì)算(TC?復(fù)雜度類),無法處理需要?jiǎng)討B(tài)深度的任務(wù),例如計(jì)算棋局狀態(tài)需要隨著步數(shù)增加而迭代更新。

Chain-of-Thought(CoT)提示通過生成中間推理步驟,將計(jì)算擴(kuò)展到文本空間,理論上可使Transformer實(shí)現(xiàn)圖靈完備性。但現(xiàn)有方法依賴"逐步思考"等通用提示,迫使模型在龐大的提示空間中盲目搜索。



  • 論文:Why Prompt Design Matters and Works: A Complexity Analysis of Prompt Search Space in LLMs

  • 鏈接:https://arxiv.org/pdf/2503.10084v2

本文首次建立提示設(shè)計(jì)的理論框架,揭示提示作為"信息選擇器"的核心作用,并通過復(fù)雜度分析證明:優(yōu)化提示可使推理性能提升超50%,為提示工程從經(jīng)驗(yàn)技巧走向系統(tǒng)科學(xué)奠定基石。

理論基礎(chǔ):CoT如何突破Transformer限制 Transformer的先天缺陷

  • 計(jì)算深度固化:Transformer的隱狀態(tài)h僅在層間傳遞(垂直方向),而非時(shí)間步傳遞(水平方向)。如圖2d所示,其最大序列計(jì)算步數(shù)等于層數(shù)(O(1)),無法隨輸入長度增長。

  • 答案模式的局限:僅輸出最終答案時(shí)(如"Q: 棋局狀態(tài)? A: 將軍"),模型需將多步計(jì)算壓縮到固定深度,丟失中間狀態(tài)信息。

傳統(tǒng)Transformer(d)、無引導(dǎo)CoT(a)、有監(jiān)督CoT(b)的對(duì)比 CoT的循環(huán)計(jì)算本質(zhì)

CoT通過文本外化隱狀態(tài)構(gòu)建虛擬循環(huán):

  1. 離散化:從隱狀態(tài)h?提取關(guān)鍵信息 → 文本符號(hào)(o?..o?)

  2. 向量化:文本經(jīng)嵌入層重建為下一時(shí)刻隱狀態(tài)h???

公式意義:

  • o是自然語言描述的中間步驟(如"白王在e4")

  • 嵌入層將文本重新編碼為向量,實(shí)現(xiàn)隱狀態(tài)迭代更新
    此過程模擬了RNN的h? → h???循環(huán)(圖3c),使Transformer獲得動(dòng)態(tài)計(jì)算深度

CoT(c)如何通過文本橋接模擬RNN(a)的循環(huán)計(jì)算 核心發(fā)現(xiàn):提示是信息選擇器 提示定義信息軌跡

隱狀態(tài)h包含豐富信息(棋盤布局、計(jì)數(shù)器等),但單步CoT只能提取s比特(受文本長度限制)。提示模板決定提取哪些信息:

  • 最優(yōu)提示:如"輸出當(dāng)前棋盤配置",提取任務(wù)關(guān)鍵信息

  • 次優(yōu)提示:如"輸出棋盤棋子數(shù)",遺漏位置關(guān)系導(dǎo)致推理失敗

提示空間復(fù)雜度公式

符號(hào)含義:

  • n:隱狀態(tài)h的信息總量(正比于模型維度d)

  • s:?jiǎn)尾紺oT可提取的信息量(正比于生成文本長度)
    核心思想 :
    該組合數(shù)量化了從n比特中選擇s比特的所有可能方式。例如:

  • h包含10種棋局信息(n=10),每步提取3項(xiàng)(s=3)→ 提示空間達(dá)120種

  • 實(shí)際搜索需啟發(fā)式策略,但次優(yōu)提示仍導(dǎo)致性能崩塌(實(shí)驗(yàn)見Table 1)

答案空間復(fù)雜度優(yōu)化

提示模板p直接決定答案空間結(jié)構(gòu):

意義解讀:

  • :全部可能解的集合(如所有棋局路徑)

  • ?:正確解的子集

  • 最優(yōu)p:縮小搜索空間(如提示"按棋盤狀態(tài)推理" → 合法路徑占比↑)

  • 劣質(zhì)p:?/ 趨近于0(如提示"統(tǒng)計(jì)棋子數(shù)" → 路徑隨機(jī)選擇)

提示空間(左)與答案空間(右)的耦合關(guān)系 實(shí)驗(yàn)驗(yàn)證:監(jiān)督提示的壓倒性優(yōu)勢(shì) 任務(wù)設(shè)計(jì)精髓
  • 三級(jí)計(jì)算復(fù)雜度

    • 正則語言(R):奇偶校驗(yàn)、循環(huán)導(dǎo)航

    • 上下文無關(guān)(CF):棧操作、列表反轉(zhuǎn)

    • 上下文敏感(CS):排序、字符串復(fù)制

  • 控制變量

    • 列表化輸入消除tokenization干擾

    • 對(duì)比監(jiān)督提示/無監(jiān)督提示/次優(yōu)提示

列表化輸入使排序任務(wù)準(zhǔn)確率提升40%

震撼性結(jié)果

  • 監(jiān)督提示統(tǒng)治性能

    • 棧操作任務(wù):監(jiān)督提示96% vs 無監(jiān)督提示0%

    • 奇偶校驗(yàn):監(jiān)督提示100% vs 次優(yōu)提示42%

  • X-of-Thought的局限

    • GoT/ToT僅優(yōu)化答案空間搜索,無法修復(fù)錯(cuò)誤提示模板

    • 當(dāng)提示本身錯(cuò)誤時(shí),多路徑探索反而降低效率(如棧操作任務(wù)中ToT準(zhǔn)確率僅36%)

核心結(jié)論:監(jiān)督提示在9類任務(wù)全面領(lǐng)先

典型失敗模式

  1. 冗余生成:次優(yōu)提示要求輸出無關(guān)信息(如"每步輸出是否吃子"),導(dǎo)致上下文溢出

  2. 遞歸陷阱:中間步驟本身需CoT才能解決(如計(jì)數(shù)子任務(wù)),形成死循環(huán)

Case:EP任務(wù)中次優(yōu)提示要求逐步輸出"ab/ba判斷",模型錯(cuò)誤計(jì)數(shù)
創(chuàng)新方法論:提示工程科學(xué)化 最優(yōu)提示設(shè)計(jì)原則
  • 核心思想:提示是信息瓶頸,需選擇top-s關(guān)鍵信息

  • 操作指南

    • 顯式定義每步輸出內(nèi)容(如"輸出當(dāng)前計(jì)數(shù)器值")

    • 拒絕模糊指令(如"詳細(xì)思考"→改為"每步更新棋盤坐標(biāo)")

實(shí)用決策框架

場(chǎng)景

策略

任務(wù)結(jié)構(gòu)清晰

提供監(jiān)督提示(如排序步驟)

任務(wù)復(fù)雜不確定

信任模型啟發(fā)式搜索

輸出錯(cuò)誤中間信息

立即停止人工干預(yù)


對(duì)X-of-Thought的重新定位

  • 本質(zhì):在固定提示模板下優(yōu)化答案空間搜索

  • 局限:無法解決提示空間選擇錯(cuò)誤

示例:若提示要求"廣度優(yōu)先搜索",ToT會(huì)并行低效路徑,而非切換為深度優(yōu)先
ToT在固定提示下探索答案空間的多路徑 結(jié)論:從經(jīng)驗(yàn)技巧到計(jì)算理論

本文顛覆了"提示工程是玄學(xué)"的認(rèn)知,通過嚴(yán)謹(jǐn)?shù)睦碚撆c實(shí)驗(yàn)揭示:

  1. 提示即算法:定義信息提取軌跡,控制答案空間結(jié)構(gòu)

  2. 復(fù)雜度可量化:提示空間大小由組合數(shù)公式刻畫,答案空間效率由len(CR)/len(S)|p度量

  3. 監(jiān)督提示必要性:在結(jié)構(gòu)化任務(wù)中帶來50%+性能提升

這項(xiàng)工作將提示設(shè)計(jì)從試錯(cuò)藝術(shù)轉(zhuǎn)變?yōu)?strong>可計(jì)算科學(xué),為LLM在復(fù)雜推理、自主決策等場(chǎng)景的應(yīng)用提供理論引擎。未來需探索復(fù)雜任務(wù)的提示泛化規(guī)律,并開發(fā)人機(jī)協(xié)作的提示優(yōu)化框架。

閱讀最新前沿科技趨勢(shì)報(bào)告,請(qǐng)?jiān)L問歐米伽研究所的“未來知識(shí)庫”

https://wx.zsxq.com/group/454854145828


未來知識(shí)庫是“ 歐米伽 未來研究所”建立的在線知識(shí)庫平臺(tái),收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級(jí)智能,數(shù)智大腦、能源、軍事、經(jīng)濟(jì)、人類風(fēng)險(xiǎn)等等領(lǐng)域的前沿進(jìn)展與未來趨勢(shì)。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進(jìn)入。

截止到3月31日 ”未來知識(shí)庫”精選的百部前沿科技趨勢(shì)報(bào)告

(加入未來知識(shí)庫,全部資料免費(fèi)閱讀和下載)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
為擴(kuò)大國際影響力,巴西足協(xié)將國家隊(duì)官方賬號(hào)更改為“巴西”

為擴(kuò)大國際影響力,巴西足協(xié)將國家隊(duì)官方賬號(hào)更改為“巴西”

懂球帝
2025-07-26 00:55:08
人到中年后,不要過度共情你的父母,尤其是不要和他們住在一起

人到中年后,不要過度共情你的父母,尤其是不要和他們住在一起

明月讀書吧
2025-06-18 15:10:03
71歲成龍斷崖式衰老,年輕時(shí)太拼命,透支身體太多

71歲成龍斷崖式衰老,年輕時(shí)太拼命,透支身體太多

健康觸點(diǎn)
2025-07-25 06:07:27
三個(gè)姑姑分掉女孩父親遺產(chǎn)后續(xù):二姑身份被扒,瓜分百萬遭起訴

三個(gè)姑姑分掉女孩父親遺產(chǎn)后續(xù):二姑身份被扒,瓜分百萬遭起訴

阿纂看事
2025-07-25 17:28:52
美團(tuán)王興:3年狂投30家,中國具身智能最大金主

美團(tuán)王興:3年狂投30家,中國具身智能最大金主

鈦媒體APP
2025-07-25 14:13:31
貴州高分考生被廈門大學(xué)馬來西亞分校誤錄取?學(xué)校回應(yīng):已有不少學(xué)生申請(qǐng)退檔

貴州高分考生被廈門大學(xué)馬來西亞分校誤錄取?學(xué)校回應(yīng):已有不少學(xué)生申請(qǐng)退檔

瀟湘晨報(bào)
2025-07-25 11:24:42
蘇林大清洗后,越南對(duì)華釋放最強(qiáng)信號(hào),前所未有

蘇林大清洗后,越南對(duì)華釋放最強(qiáng)信號(hào),前所未有

科技處長
2025-07-24 23:29:21
實(shí)錘?網(wǎng)傳杜建英有丈夫,還有一個(gè)36歲大兒子,宗慶后竟然是三哥

實(shí)錘?網(wǎng)傳杜建英有丈夫,還有一個(gè)36歲大兒子,宗慶后竟然是三哥

壹月情感
2025-07-20 22:06:40
表哥出國前把摩托7600賣我,這天換電瓶掀開座椅,看到里面我愣了

表哥出國前把摩托7600賣我,這天換電瓶掀開座椅,看到里面我愣了

蘭姐說故事
2025-07-23 05:05:03
7月25日,浙江2025養(yǎng)老金調(diào)整細(xì)則公布,取消了一個(gè)特別做法

7月25日,浙江2025養(yǎng)老金調(diào)整細(xì)則公布,取消了一個(gè)特別做法

甜檸聊史
2025-07-25 12:45:15
96小時(shí)遭襲震動(dòng)了全球,澤連斯基深夜求和

96小時(shí)遭襲震動(dòng)了全球,澤連斯基深夜求和

智慧天氣通
2025-07-25 08:26:54
宗澤后被打臉:杭州公證處繼承公證書曝光,宗慶后施幼珍并未離婚

宗澤后被打臉:杭州公證處繼承公證書曝光,宗慶后施幼珍并未離婚

做一個(gè)合格的吃瓜群眾
2025-07-25 14:19:01
西工大、鐵一中、高新一中、西交附中、濱河中學(xué)2025中考屏蔽學(xué)生

西工大、鐵一中、高新一中、西交附中、濱河中學(xué)2025中考屏蔽學(xué)生

金哥說新能源車
2025-07-25 17:47:54
湖南考生625分被四川大學(xué)退檔,提檔分619,因不服從調(diào)劑沒書讀

湖南考生625分被四川大學(xué)退檔,提檔分619,因不服從調(diào)劑沒書讀

小義了不休
2025-07-24 17:53:10
甘肅張掖馬蹄寺,怕游客偷窺景區(qū)風(fēng)景:對(duì)路人收300元過路費(fèi)

甘肅張掖馬蹄寺,怕游客偷窺景區(qū)風(fēng)景:對(duì)路人收300元過路費(fèi)

阿昌走遍中國
2025-07-23 11:25:34
駐港國家安全公署:堅(jiān)決支持香港警方依法對(duì)袁弓夷等19名外逃亂港分子采取執(zhí)法行動(dòng)

駐港國家安全公署:堅(jiān)決支持香港警方依法對(duì)袁弓夷等19名外逃亂港分子采取執(zhí)法行動(dòng)

澎湃新聞
2025-07-25 15:09:02
癌癥父親當(dāng)眾下跪,只為讓女兒在遺囑上簽字!女兒:我憑什么?

癌癥父親當(dāng)眾下跪,只為讓女兒在遺囑上簽字!女兒:我憑什么?

諾言卿史錄
2025-07-23 10:21:32
“落魄”的馬未都,已經(jīng)玩不轉(zhuǎn)了?

“落魄”的馬未都,已經(jīng)玩不轉(zhuǎn)了?

收藏大視界
2025-07-22 20:13:48
夜場(chǎng)女孩會(huì)和大哥廝混嗎?網(wǎng)友:看污了我的眼睛,不純潔了

夜場(chǎng)女孩會(huì)和大哥廝混嗎?網(wǎng)友:看污了我的眼睛,不純潔了

解讀熱點(diǎn)事件
2025-06-14 00:05:03
還是沒有熬過楊振寧!陪伴21年后,冷凍9顆卵子的翁帆痛苦嗎?

還是沒有熬過楊振寧!陪伴21年后,冷凍9顆卵子的翁帆痛苦嗎?

明月聊史
2025-07-17 15:29:09
2025-07-26 02:51:00
人工智能學(xué)家 incentive-icons
人工智能學(xué)家
人工智能領(lǐng)域權(quán)威媒體
4046文章數(shù) 37239關(guān)注度
往期回顧 全部

科技要聞

36款熱門車高危智駕場(chǎng)景測(cè)試,“團(tuán)滅”!

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

體育要聞

3年過去了,她還是歐洲杯上最酷的姐

娛樂要聞

汪蘇瀧不忍了 !張碧晨痛失《年輪》演唱權(quán)

財(cái)經(jīng)要聞

劉煜輝:當(dāng)下重要不是找確定性而是轉(zhuǎn)折點(diǎn)

汽車要聞

李斌一口氣講了近3個(gè)小時(shí)樂道L90 原因是為啥?

態(tài)度原創(chuàng)

家居
藝術(shù)
本地
手機(jī)
公開課

家居要聞

環(huán)繞設(shè)計(jì) 空間動(dòng)線合理

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

換個(gè)城市過夏天|風(fēng)拂鹽湖,躲進(jìn)格爾木的盛夏清涼

手機(jī)要聞

真把天璣 9400+ 裝在「充電寶」上了?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 随州市| 嘉禾县| 虹口区| 遂溪县| 临沧市| 恩施市| 盐城市| 开化县| 昭平县| 金阳县| 宁海县| 宜春市| 博罗县| 孟连| 苍山县| 灌阳县| 蓬安县| 丰县| 龙岩市| 永昌县| 舒兰市| 安仁县| 海丰县| 资兴市| 固安县| 娱乐| 宝鸡市| 嘉黎县| 清远市| 榆社县| 宁武县| 酉阳| 南华县| 嘉禾县| 兰坪| 乐昌市| 南靖县| 临海市| 百色市| 沿河| 灵璧县|