在完成前兩期的分享后,我們與馬驍騰老師進行了一次線下會面。正值Manus熱度高漲之際,我們借此機會就AI產品的未來方向展開了交流,并探討了未來活動的形式。我們計劃邀請更多來自AI領域的不同方面的人士參與分享,包括在讀博士(人工智能領域)、AI產品創始人以及計算機行業大咖(如:微軟MVP)等。我們誠摯歡迎各位粉絲朋友們加入我們的分享活動,表達自己的觀點。讓我們共同交流關于當下AI的熱點話題,或是探討工作與生活中的其他觀點和現象。
主講人馬驍騰,利物浦大學碩士,大廠資深產品運營專家(快手,Opera,天工AI),近兩年轉向人工智能,是國內前5的C端AI產品初始團隊成員。
主講人寄語
作為互聯網產品與知識傳播從業者,我所做的分享會盡可能以行業趨勢為基礎。我會學習論壇專家的發言,借鑒學界對 AI 行業發展的深度思考來為觀點提供佐證。
這些分享定位為科普性質,我會對專家觀點展開多維度解析、延伸與重構,將其轉化為公眾易于理解的科普素材,確保每一個復雜概念都能清晰呈現。當前,AI 領域信息過載,各類媒體發布的資訊質量良莠不齊。我期望通過這一系列分享,助力大家穿透表象、洞察本質,樹立正確的 AI 認知,培養基本的判斷能力。
如此一來,當公眾接觸到相關新聞時,能夠準確判斷該領域的發展階段,辨別是實現了技術突破,還是仍處于實驗室研發階段,進而更好地理解和應用 AI 技術。
在3月20日,我去參加了一個小型論壇,在清華大學精密光機電系統設計與控制實驗室執行主任呂爽教授的分享環節,他提到了“還要不要學提示語”,以及“調教AI的秘籍:讓你的提示詞效果倍增的關鍵策略”。這個關于提示語的思考給了我啟發,也促成了此次分享,這次分享核心的來講就是四個字“學會表達”。
(如下為直播分享的內容摘要)
與模型對話時,參與其中的角色不止2個
在人工智能交互領域,可將AI視為具備智能處理能力的對話主體。當前AI技術已具備較高水平,用戶與模型的交互效能本質上取決于提示詞工程(Prompt Engineering)的掌握程度。這類似于與人類助手的溝通邏輯:信息傳遞的準確性直接影響任務執行效果。
對話系統主要包含三個核心角色:
用戶(User):需求發起方,通過自然語言指令明確任務目標(如生成詩歌、設計剪紙方案等)
助手(Assistant):模型執行端,根據用戶輸入進行響應輸出
系統(System):隱式控制層,通過API參數預設模型行為特征與響應規則
技術實現層面,系統角色(System Role)作為底層控制機制,通過代碼層預設決定模型的身份屬性與響應范式。典型應用場景包括:
角色定義:將模型限定為「嚴謹的歷史學家」或「幽默的聊天助手」
輸出規范:設置響應長度、格式限制等(如電影推薦不超過3部)
以電影推薦智能體為例:
在此交互過程中,系統提示詞始終隱式控制輸出規則,而用戶無需在顯性對話層重復設定。這種機制有效分離了功能設定與具體任務執行,是構建專業領域智能體的關鍵技術路徑。
需特別注意:系統角色的設定直接影響模型輸出質量,但其控制邏輯對終端用戶不可見。開發者在API調用時必須明確定義系統參數(system_content),而普通用戶通過界面交互時,相關限制需內嵌于對話上下文實現。
Prompt是什么
在探討“prompt”相關概念前,先明確其在劍橋詞典中的解釋,“prompt”作為動詞,意為“make something happen”,即引起、導致。在與模型交互的情境中,“prompt”指問題的發起以及對結果產生影響的因素?!皃rompt engineering”(提示工程)旨在讓模型按照指定要求運行,以給出最佳結果,確保模型回復的穩定性和持續性。例如句子“We apply a prompt engineering technique to determine the ideal prompt”,體現了通過提示工程技術確定理想提示,使模型按設定回復。
從理性概念來看,“prompt”可理解為一種指令,但它與問題本身有所區別。在與模型對話時,用戶的輸入通常包含指令和問題兩部分,需要將二者區分看待。比如僅輸入“寫一個故事”,由于缺乏具體指令信息,生成的故事類型具有多種可能性,可能是喜劇、恐怖故事或小說等。由此可見,輸入指令(即“prompt”)的效果嚴重依賴于用戶的表達,很多時候并非模型無法解決問題,而是用戶表達不夠精準。
從感性概念來講,“prompt”的本質是表達本意,即腦海中真實想表達的內容。這類似于高中寫作文,老師給定題目后,學生需將腦海中的想法清晰表達出來。很多時候,我們覺得模型回答不符合預期,認為模型“笨”,其根源往往在于我們自身未能用文字準確清晰地表達出腦海中的想法。因此,在編寫“prompt”或向模型提問時,我們應反思自身表達是否足夠清晰。
Prompt 為什么重要
在評估模型效果時,存在這樣一個公式:模型效果 = 大模型能力×(任務 + 提示詞)。這與之前提到的“提示 + 問題”相呼應。其中,任務是每個使用者自身獨有的,其他人難以知曉。關鍵在于,使用者能否清晰地拆解自身任務,并將其與提示詞有效組合。
大模型能力是一個重要因素,它如同乘法中的一個因數。若大模型能力強,比如其能力基數為 10,相較于能力基數為 0.1 的模型,最終產生的效果會有巨大差異,前者能使效果提升 100 倍。雖然我們可以選擇能力更強的大模型,但在這個公式中,“任務 + 提示詞”這兩個因數同樣至關重要。
大模型能力決定了其理解指令的程度,模型越聰明,在解析環節的表現就越好。因此,我們自然期望所選用的模型具備更高的智能水平,同時也要確保任務描述清晰、提示詞精準,如此才能提升模型的最終效果。
對于 AI 對話產品的開發者而言,在處理用戶輸入時,會為類似“你好”這樣的語句添加注釋(comet)并進行解析后再返回結果。在大模型的運用中,需要進行大量的意圖識別工作,以判斷用戶輸入問題的類型,同時開展諸多提示工程相關工作來回應問題。
其目標是確保模型的回應與用戶問題緊密相關。這要求用戶表達清晰,因為用戶表達越清晰,模型進行意圖識別就越容易。若用戶表達意圖模糊,即便運用了提示工程,模型也會感到困惑,難以理解用戶的意思。
在用戶與模型的交互中,表達是雙向的。用戶通過提示詞表達需求,其中類似于“做”這樣的動詞尤為關鍵,“prompt”可理解為動作的發起表達,必須清晰明確。模型則需理解用戶的真實意圖,不僅要解析用戶表達的字面意思,還要識別表面文案之外的隱含需求,這既依賴于模型自身能力,也與提示工程的運用密切相關。只有這樣,模型才能精準回應用戶需求。
可以將用戶視為表達者,模型視為傾聽者,應盡量避免二者之間出現信息差,因為信息差會導致信息誤導。提示工程的作用就在于幫助模型更好地理解用戶需求。有時,即便用戶表達不夠清晰,模型仍能給出較準確的回復,這正是提示工程對用戶意圖進行判斷和分析后,找到相對準確解決方案的結果。
如何寫好一個prompt
寫好一個 prompt 可被視作一個寫作過程,它與經驗密切相關。就像寫作文時,語文老師常強調要有真實體會和感情,避免無病呻吟。寫 prompt 也需要具備相關領域的知識和背景。例如,從事財務工作的人,要了解諸如環比、周同比以及企業經營分析報告等財務知識。只有在某領域有經驗,才能寫好該領域的 prompt;若缺乏相關經驗,則需要學習該領域的知識。
此外,用詞和描述能力也很關鍵。很多人存在想法豐富,但描述和表達能力欠佳的問題,就像國外老師常指出中國學生英語寫作能力強,但口語表達能力差一樣。詞匯量會直接影響表達效果。以描述“紅色”為例,能聯想到的詞匯數量反映了個人在這方面的詞匯儲備。若能迅速聯想到“胭脂紅”“中國紅”等詞匯,說明詞匯儲備相對豐富;反之,則可能詞匯量不足。
從傳統意義上來說,寫作是文科生所擅長的,所以本期關于寫 prompt 的內容可能更適合文科生。
為大家提供一些參考模板框架,例如 CRISP 框架。使用該框架時,首先要描述決策主體,明確信息要求。若想讓模型處理的問題較為復雜,就需將問題信息闡述得更加清晰,這樣模型才能有效解決問題。要先嘗試把需求表述清楚,接著可添加一些備注說明,最后明確輸出模式。
這些是常見的框架類型,選擇其中任意一個框架來操作均可,但必須按照相應步驟進行,而操作過程中的指導思想就是之前所提及的內容。
寫不出prompt怎么辦
很多人會遇到寫作難題,就像高中寫作文,題目里的字都認識,但連在一起就不知如何下筆。高中語文老師常說,輸出能力不足往往是因為輸入不夠,即閱讀量少。在寫作中,大量閱讀、廣泛輸入十分必要,這類似于積累經驗,豐富自身的背景知識。當你對相關內容進行深入思考、充分消化,真正想清楚后,自然就能清晰地描述出來。
還有一種比較笨且實用的辦法,去套模版。模板如同填表格,要求填寫者詳細作答,所以按照表格要求的填寫即可。示例模板經過了多次調整,質量較高且適合改造。若無法進行原創,在模板基礎上進行二次創作也是可行的辦法。
誰適合成為提示(詞)工程師
可以將寫提示詞理解為一個寫作過程,首先運用自然語言(如中文)進行寫作,之后再涉及計算機語言。無論是自然語言寫作還是計算機語言編程,都需要遵循一定的邏輯,按照框架有頭有尾地進行表達。語言能力強、邏輯思維佳且表達簡潔準確的人,在這方面更具優勢,而這也是我一直努力提升的方向。過去我說話可能比較啰嗦,現在則更注重把事情表達清楚。
在提示詞工程領域存在兩個交叉點。一方面,程序員或工程師可被視為綜合性人才;另一方面,存在一條從人文向技術靠攏的鏈路,像作家、產品經理這類人群,寫作能力和邏輯思維能力是必備的。以我個人為例,我是文科背景,沒有計算機背景,我認為文科背景的人可以成為不錯的提示詞工程師,但要成為頂尖的提示詞工程師會有較大難度。
這其實表明寫作能力與計算機語言能力密切相關。計算機語言也可看作是一種寫作形式,通常寫作能力強的人,計算機語言運用能力也較強;反之,寫作能力弱的人,計算機語言能力可能也不太理想。當然,這并非絕對,只是我個人的感悟。
從提示詞到提示工程
提示工程具有一定高度,它具有指引性且有方法論。其核心在于構建撰寫提示詞的邏輯,即思考如何寫出更優質的提示詞,而這首先需要有較高的思維高度。在工程化方面,則是思考如何讓代碼將思維和方法實際呈現出來。因此,一方面要具備思維和方法,另一方面要讓程序員將想法落地實現。
若想做好提示工程,成為優秀的提示工程師,基礎理論和技術方法都需學習。以我作為產品經理為例,可算半個提示詞工程師,每個環節都要了解其作用,必要時給出示例。我先用自然語言撰寫,再交給程序員處理,期間會遇到選用何種框架等問題。成為提示工程師有工程化的要求,并非易事,但也并非高不可攀,需要不斷學習。
提示詞和提示工程不會過時,因為它是大模型不斷迭代優化及產品化的關鍵,是將其改造成人人可用的智能體的過程。2025 年,隨著模型能力提升,提示工程愈發重要。簡單來說,在不改變模型效果的前提下,開展提示工程能讓模型更易用、更通用,使普通人能更好理解問題,這正是提示工程的價值所在。
提示工程的難點
環境對齊與效果對齊是一個普遍存在的問題。實際上,模型在評測環境下往往能有出色表現,但遷移至生產環境后,性能卻會大幅下滑。例如,某公司與大模型供應商合作時,供應商團隊在測試環境中把模型效果調優至接近 100%,然而系統上線后,性能驟降至 20%。盡管在行業發展初期,這類“學費”難以完全避免,但它提醒我們,評測環境與生產環境的一致性十分關鍵。
我以自己的經歷舉例,今天我剛做了一個名為“刑法小助手”的智能體(agent)。在調試過程中,我針對“侵犯財產罪”等問題編寫提示詞(prompt),花費了兩三個小時。由于我沒有刑法相關經驗,還專門去研究刑法背景知識、查閱相關法條。在后臺調試時,效果頗為理想。
但上線后,在線上端發現部分問題回答不準確,這表明線上環境與實際調試存在差異。由此可見,提示詞的調試無法一蹴而就,需要多次調試,調試次數越多,上線后的效果越好。像我做完這個“刑法小助手”后,會不斷向它提問,至少詢問十次,觀察它是否能按照預設的人設和回復邏輯進行回復。若沒問題,我才會將其正式上線,這便是一個簡單的上線流程。
如何評估提示詞是正確的
如我之前所舉例子,通過向模型提問十個問題,若沒有發現問題就將其上線,這算是我個人一種簡單的評估方式。當然,也可以采用打分的方式進行評估。
若要進行專業級的評估,則需要設定具體指標。其中,最核心的是評估標準的適用性,這與對業務的認知密切相關,十分重要。評估過程涉及知識壓縮和應用迭代。寫出提示詞僅僅是第一步,更重要且困難的是,評估結果良好并實現大規模應用。
在互聯網領域,一切工作都應以產品上線且可用為導向。
從PE到EPE的轉變
從提示工程(PE,Prompt Engineering)向企業級提示工程(EPE,Enterprise Prompt Engineering)轉變,國產大模型也能夠取得良好效果。達成這一目標的關鍵在于,要將思維從 PE 轉換到 EPE 這一全新理念上。
從 PE 過渡到 EPE,兩者有明顯差異。PE 層面可能看上去運行良好、流程跑通了,但若是要開展企業級應用,情況就復雜得多。若企業有相關需求,可以進一步溝通探討。這里再舉一個提示詞的例子,一個完整的提示詞應包含角色設定、任務要求以及期望的輸出結果。 而企業級提示工程中,上述都是最基本的,重要的是穩定輸出,因為用戶不在是自己,而是面向的廣大用戶。
提問與交流
問:怎么考核提示詞工程師?提示詞工程師是不是需要懂些代碼知識?
答:提示詞工程師的主要產出物是提示詞(prompt),以此來解決實際需求,且這個提示詞往往需要不斷調整。最終判斷產出是否合格,關鍵在于運行腳本能否實現業務需求。
以生成 HTML 圖片為例,工程師可以先讓模型生成一個 HTML,這個過程可能沒有現成的 HTML 樣例,需要工程師自行修改調整。在實際操作中,由于要考慮 HTML 的長寬高等參數,這就要求工程師具備一定的代碼知識,這樣才能對最終結果進行判斷。工程師會將符合要求的固定結果作為示例,后續生成的內容需與之保持一致。
綜上所述,提示詞工程師需要懂一些代碼知識,在考核時,應重點關注其生成的提示詞能否讓腳本實現業務需求,以及在過程中對代碼相關內容的處理能力。
問:好用的AI prompt插件或者平臺有哪些?
答:與 ChatGPT 同期的 AIPRM 是我最早使用的插件,在向 ChatGPT 輸入內容時,它能幫助調整提示詞。
該插件需要根據不同的大模型或 AI 平臺進行適配。以我使用 StableDiffusion(SD)為例,若不借助 AIPRM,當我想要生成一張“一只小狗站在山頂上”的圖片時,即便不考慮參數設置,生成的圖片也可能與預期大相徑庭,完全詞不達意。但使用 AIPRM 后,它能幫助撰寫各種場景描述,涵蓋所需風格等內容,生成效果良好。
如下是一個可用于調整 Midjourney 提示詞的平臺。在該平臺上,用戶先輸入提示詞,之后既能夠選擇對部分內容進行優化,也可以實現一鍵優化。這樣做的目的是提前清晰優化自身描述,明確表達本意后再向模型提問,進而省去讓模型多次修改的過程。
問:提示詞控制精度和不控制精度有什么區別?
答:在與語言模型交互時,提問方式應根據實際業務需求來選擇。問題描述越清晰、具體(specific),模型給出的回答就越精準。而若問題較為寬泛,則更適用于獲取靈感創意類的內容。
以Deepseek-V3來說,在生成小紅書文案方面,它表現更佳,原因在于它更了解本地語言習慣和表達方式。不過,提問時的詳細程度會影響生成效果。如果提問寬泛,如“為一個 30 分鐘的運動跟練視頻生成一篇 300 字的文案”,由于描述模糊,模型生成的內容準確性欠佳。但如果將問題具體化,比如“為 30 分鐘網紅小姐姐全程站立瘦腰腹的展指操跟練視頻生成一篇 300 字的小紅書文案,該操無跳躍不擾民”,并結合自身感受詳細描述幾十字甚至 100 字,模型生成的文案會令人驚艷。
總之,根據自身需求,若想要非常精準的答案,就應詳細具體地提問;若希望獲得有發散性的內容,則可采用寬泛的提問方式。
隨著 AI 能力日益強大,若要寫好一個提示詞,甚至創作出令人驚艷的提示詞,創作者需具備文學底蘊、美學意境以及相應的思想深度。
實際上,撰寫提示詞時尋找關鍵詞的過程,本質是一種人文探索,可將提問視為一種寫作,而非單純的編程邏輯構建。盡管這種寫作極為簡練,可能僅由幾個詞構成,但其寫作本質并未改變。
倘若曾接受過文學、哲學、美學或藝術方面的訓練,那么在創作提示詞時,更有可能賦予其靈魂,使其呈現出美感。
附錄1:兩大提示詞機構
PEC (Prompt Engineer Conference)
Prompt Engineering Conference(提示工程大會,簡稱PEC)作為一項公益性活動,專注于以Prompt為核心內容,為AIGC領域的從業者搭建一個AI創新與探索的交流平臺。
LangGPT
LangGPT 區是國內最大的提示詞社區?!?Language For GPT ,寓意GPT的語言】,中文名為『結構化提示詞』。LangGPT 是一個幫助你編寫高質量提示詞的工具,理論基礎是我們提出的一套模塊化、標準化的提示詞編寫方法論——結構化提示詞。
地址:https://github.com/langgptai/LangGPT
附錄2:提示詞樣例
(以下內容節選自LangGPT)
#角色:
你是新漢語老師,你年輕,批判現實,思考深刻,語言風趣"。你的行文風格和"Oscar Wilde" "魯迅" "林語堂"等大師高度一致,你擅長一針見血的表達隱喻,你對現實的批判諷刺幽默。
-作者:云中江樹,李繼剛
-模型:阿里通義
##任務:
將一個漢語詞匯進行全新角度的解釋,你會用一個特殊視角來解釋一個詞匯: 用一句話表達你的詞匯解釋,抓住用戶輸入詞匯的本質,使用辛辣的諷刺、一針見血的指出本質,使用包含隱喻的金句。 例如:“委婉”: "刺向他人時, 決定在劍刃上撒上止痛藥。"
##輸出結果:
詞匯解釋
輸出詞語卡片(Html 代碼)
-整體設計合理使用留白,整體排版要有呼吸感
-設計原則:干凈 簡潔 純色 典雅
-配色:下面的色系中隨機選擇一個[ "柔和粉彩系", "深邃寶石系", "清新自然系", "高雅灰度系", "復古懷舊系", "明亮活力系", "冷淡極簡系", "海洋湖泊系", "秋季豐收系", "莫蘭迪色系" ]
-卡片樣式:
(字體 . ("KaiTi, SimKai" "Arial, sans-serif"))
(顏色 . ((背景 "#FAFAFA") (標題 "#333") (副標題 "#555") (正文 "#333"))) (尺寸 . ((卡片寬度 "auto") (卡片高度 "auto, >寬度") (內邊距 "20px"))) (布局 . (豎版 彈性布局 居中對齊))))
-卡片元素: (標題 "漢語新解") (分隔線) (詞語 用戶輸入) (拼音) (英文翻譯) (日文翻譯) (解釋:(按現代詩排版))
##結果示例:
HTML代碼()
##注意:
1. 分隔線與上下元素垂直間距相同,具有分割美學。
2. 卡片(.card)不需要 padding ,允許子元素“漢語新解”的色塊完全填充到邊緣,具有設計感。
##初始行為:
輸出"說吧, 他們又用哪個詞來忽悠你了?"
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.