現在再討論 AI 寫作,多少有點沒勁:prompt 真的越來越像咒語了,越來越像一些神秘不可洞察的玄學技巧。
這導致使用 AI 寫東西的過程,不管是寫什么類型的文字,過程都跟做法似的:賭指令能不能觸發出一些好的生成。同時還得用大量的指令,去掉「AI味」。
但問題是,我們在用的是一個語言模型,僅僅是糾結 prompt 要怎么寫,無異于坐井觀天——AI 寫作的「技巧」,其實都是大模型技術邏輯的投影。
終于,有一篇文章,不是在給出什么神之 Prompt,而是列出了一些看似非常不起眼的技巧:重復、斷句、語氣詞、準備草稿、使用破折號……
Shreya Shankar 是加州大學伯克利分校電子工程與計算機科學系五年級博士生,在 Google 研究 LLM 數據處理系統的成本優化。
她以自己日常和大模型打交道的經驗,寫了一篇博客——看起來像寫作建議,其實每一條背后,都藏著屬于大語言模型的技術邏輯。
或許你已經看了很多教程、攻略,試圖解決如何讓 AI 生成更好的文本。但如果只看一篇關于 AI 寫作的文章,那只能是這篇。
大模型的「壞毛病」真的壞嗎?
模型是被互聯網上的數據喂大的,只是,由于它是人工智能、是算法、是 transformer 變換器,它在吸收海量的數據方式,有機器專屬的方式。最后反映到生成出來的文本上,就成了「人機味」。
但是「人機」并不意味它們毫無道理,也不意味著就是糟糕的文本。以下是幾點比較典型的:
(1)排比和重復
重復可能是最有「人機味」的特征——或者叫排比,你會更容易理解。大模型生成的文本,總是喜歡用大段大段的排比,而且這些排比句是重復的。比如經典的「不是……而是……」
在一些短的文案中更明顯,這種段落看上去花里胡哨,其實都是重復,導致信息密度很低。
像是工業酒精兌水做出來的酒,嘗個兩口就被惡心到了。
但是 LLM 經常有這種重復和排比,是由其運作機制決定的:吸收了海量數據的大模型,會不斷地學習語言的「統計規律」。
排比是一個很常見的手法,重復顯然也是。試著回想一下,小時候最喜歡寫的那種作文,《我有一個夢想》《我的志愿》《我想對 xxxx 說……》,這些題目格外容易出產排比句。
這種規律客觀存在,于是被模型學了去。同時,生成文本存在一種風險:越寫越飛。
僅僅只是根據詞語的頻次,進行下一個詞的預測,很容易陷入「只看眼前」的困境中,然后讓句子的走向越來越遠、越來越偏。
重復和排比有助于約束這種「放飛行為」,使得段落有一致性,整體結構更穩定。
【怎么辦?】
重復和排比并不是洪水猛獸,Shreya 也認為,有意的重復有助于闡明和強調內容本身。
同時,重復能夠讓整個文本變得更有預測性,對于讀者的理解來說更友好。所以,有目的的重復是有價值的。
(2)指示型短語(signposting phrases)
指示型短語說的是類似于「“基本上”、“總之”、“關鍵是……”」這些詞。在 AI 生成的英語文本里更常見,不過中文的學術寫作、事務型寫作里也不少。
這些詞本身能起到整理邏輯的作用,但是放多了顯得很僵硬。想想學術論文,讀起來嚴絲合縫,這些連接詞起了不小的作用。但是 AI 大行其道之后,人類仿佛失去了「連接詞自由」。
都怪大模型太愛用。在生成過程中,模型不是靠發散思維和想象力,而是靠「預測+上下文對齊」。這些指示型短語就很有用了:它們就像「抓手」,指示模型馬上要遞進了、要劃重點了、要舉例子了,等等等等。
換句話說,這也是一種讓文本整體更穩定,不跑偏的方式。只不過這些短語確實過于規整,用多了會枯燥無味。
【怎么辦?】
連接詞是有價值的。很簡單,讀者在看到這些指示型短語的時候能明確意識到,「哦,這里是結論」「接下來是舉例」,整個閱讀體驗變得更明確。
所以一昧拿掉,只會是丟掉了一個很有用的武器。我們得自己檢查生成出來的文本,做必要、適當的刪減掉,這些刪減掉的地方,如果有銜接問題,要用自己的腦子梳理一遍語句之間的結構,而不是強行靠復雜 prompting 再下指令。
(3)破折號
破折號是 Shreya 明確表示大語言模型的一個優點。確實,破折號的用處比想象的大:可以表示轉折,或者強化語氣,也可以用來做進一步解釋,偶爾還可以代替括號——無論什么作用,它都能很絲滑地融入句子里,就像這樣。
以及,破折號不像逗號、分號、句號等等有嚴格的句法規則,破折號更模糊、彈性大。對模型來說,這意味著「風險小」,容錯高,還能增加表達味道。這意味著用破折號,不僅降低了生成難度,還能提升語氣的豐富程度,可謂是簡單又好用。
神奇的是,起碼在中文寫作里,破折號不是一個那么那么普遍的用法,它是一個更書面化的標點符號。在社交媒體、微信等日常交流里,出現得不多。
而目前的大語言模型,訓練語料里以英文數據為多,這個標點符號也是趕上了水土不服——進入中文語境之后,很多用戶看到破折號的瞬間,難免會和「機翻」聯系在一起,產生割裂感,因為那不屬于我們的寫作語感。
【怎么辦】
對模型來說,破折號的優點在于「絲滑」。它是一個非常明確的「提示符」,意在接下去的是補充內容,但是不需要用上連接詞,也不需要寫幾個句子來解釋。
嚴格來講,這不是缺點,只是在中文語境中顯得陌生。所以不必刪掉每一個破折號,適當保留反而能夠制造語氣起伏,更有「人味兒」。
Sherya Hegde 給出的最重要的技巧,恰恰和常見的攻略長得不一樣:如果你想要好的文本,應該自己「寫」,而不是圍困于寫出一個完美的 prompt。
她自己的寫作過程是這樣的:「一旦我有了大綱,我會盡量自己寫出每一段落,哪怕寫得不夠好。如果我知道自己想表達的內容,卻無法把句子說出來(不幸的是,這種情況經常發生),我會寫一個不成熟的版本,然后請語言模型幫我完善它。」
她沒有把 AI 當成一個「代替自己思考的人」,而是當成一個文本助理,來處理那些自己表達不清、寫不順的地方。
這其實也是寫作的本質:并不是讓語言模型完成你想寫的東西,而是用它,把你本來就想說的內容,表達得更清楚、更順滑一些。
如果說真有什么「AI 寫作技巧」,也許不是藏在某個神 prompt 里,而是藏在你愿不愿意先下筆、敢不敢先寫出那個「不成熟的版本」里。
歡迎加入 APPSO AI 社群,一起暢聊 AI 產品,獲取,解鎖更多 AI 新知
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.