大多數(shù)人實(shí)際上并不了解人工智能和我們每天接觸的人工智能之間的區(qū)別。
我們使用的工具,例如 ChatGPT、圖像生成器和寫作助手,不僅僅是“人工智能”。它們是生成式人工智能 (GenAI),一種非常特殊的機(jī)器學(xué)習(xí)類別,旨在通過預(yù)測下一步的內(nèi)容來生成內(nèi)容。
作為一個在研究和創(chuàng)意工作之間游走的人,我并不認(rèn)為GenAI是什么神奇的工具。我更把它看作一個 導(dǎo)航系統(tǒng)。每次我們啟動它,它都會給出方向,但并非在開放的地圖上。我們研究的路線,都是前人已經(jīng)走過、繪制過、優(yōu)化過的。
人們越是遵循這些路線,它們就越是固定不變。所以,雖然感覺像是在探索新事物,但大多數(shù)時候,你只是被引導(dǎo)著走上最熱門的路線。除非你了解模型是如何訓(xùn)練的、如何預(yù)測的,以及它的局限性,否則你只會在熟悉的道路上兜圈子。
這就是為什么我認(rèn)為我們應(yīng)該停止將通用人工智能(Gen AI)視為巡航控制系統(tǒng),而應(yīng)該開始學(xué)習(xí)它的實(shí)際工作原理。如果你感覺提示讓你陷入循環(huán),那不是你的想象,而是你只是在沿著一條已經(jīng)鋪好的路走。讓我們看看它從何而來,GenAI 是如何運(yùn)作的,以及當(dāng)我們的大多數(shù)道路都通向同一個目的地時,它意味著什么。
歷史:從邏輯機(jī)器到語言模型
“人工智能”一詞誕生于1956年的達(dá)特茅斯夏季研究項(xiàng)目中。早期的人工智能系統(tǒng)專注于符號推理和邏輯問題解決,但受限于有限的計(jì)算能力。想想莫騰·泰杜姆2014年執(zhí)導(dǎo)的電影《模仿游戲》中的密碼機(jī)。這些限制導(dǎo)致了20世紀(jì)70年代第一個人工智能寒冬,當(dāng)時人們對人工智能的興趣和資金急劇下降。
到21世紀(jì)初,計(jì)算能力、算法開發(fā)和數(shù)據(jù)可用性的進(jìn)步開啟了大數(shù)據(jù)時代。人工智能從理論模型轉(zhuǎn)變?yōu)閷?shí)際應(yīng)用,自動化執(zhí)行結(jié)構(gòu)化數(shù)據(jù)任務(wù),例如亞馬遜和Netflix的電商推薦引擎、早期的社交媒體排名算法以及谷歌自動完成等預(yù)測文本工具。
2017年,谷歌研究人員在開創(chuàng)性論文《Attention Is All You Need》中提出了Transformer架構(gòu),標(biāo)志著一個變革性的里程碑的到來。 這項(xiàng)創(chuàng)新促成了大型語言模型(LLM)的發(fā)展,并奠定了當(dāng)今生成式人工智能系統(tǒng)的基礎(chǔ)結(jié)構(gòu)。
功能:Gen AI 如何以平均值來思考
一切都始于訓(xùn)練數(shù)據(jù):海量文本,經(jīng)過清洗、過濾,然后分解成稱為“token”的小部分。一個“token”可能是整個單詞、單詞的一部分,甚至是標(biāo)點(diǎn)符號。每個“token”都被分配一個數(shù)字ID,這意味著模型實(shí)際上并不讀取語言,而是處理代表語言的數(shù)字流。
一旦被標(biāo)記化,模型就會通過反復(fù)預(yù)測序列中的下一個標(biāo)記來學(xué)習(xí),這個過程要跨越數(shù)十億個示例。但并非所有數(shù)據(jù)都會被平等對待。高質(zhì)量的來源,例如精選書籍或同行評議文章,比隨意的網(wǎng)絡(luò)文本擁有更高的權(quán)重。這會影響某些標(biāo)記模式被強(qiáng)化的頻率。
因此,如果某個短語在高質(zhì)量的語境中反復(fù)出現(xiàn),模型就更有可能將該短語內(nèi)化為可靠的模式。本質(zhì)上,它學(xué)習(xí)的是“平均”響應(yīng)的樣子,不是數(shù)學(xué)平均值,而是通過收斂到統(tǒng)計(jì)上最穩(wěn)定的延續(xù)。這種平均過程并不局限于訓(xùn)練。當(dāng)你使用模型時,它會再次出現(xiàn)。
你輸入的每個提示都會被轉(zhuǎn)換成詞條,并經(jīng)過模型的層層傳遞,每個詞條都會使用所謂的自注意力機(jī)制(一種實(shí)時上下文加權(quán)平均的方法)與其他詞條進(jìn)行比較。這些權(quán)重不會透露給輸入提示的用戶。然后,模型會根據(jù)它所看到的所有模式,輸出它認(rèn)為最有可能的詞條。
這使得系統(tǒng)嚴(yán)重傾向于中位數(shù),即分布的安全中間值。這就是為什么答案通常感覺精雕細(xì)琢卻又謹(jǐn)慎小心,它們經(jīng)過優(yōu)化,力求找到最有可能正確的答案,從而避免出錯。
您可以使用名為“溫度”的設(shè)置來更改“平均值”,該設(shè)置控制模型對中值結(jié)果的關(guān)注程度。在低溫下,模型會接近統(tǒng)計(jì)中心:安全、可預(yù)測,但略顯平淡。
隨著溫度升高,模型開始將概率從中值向外分散,從而允許一些不太常見、更令人驚訝的標(biāo)記混入其中。但這種變化也帶來了波動性。當(dāng)模型輸出偏離分布中心時,得到的是隨機(jī)性,而非創(chuàng)造力。
因此,無論是在訓(xùn)練中還是在實(shí)時生成中,Gen AI 的構(gòu)建都是為了復(fù)制中間結(jié)果。它的智能(如果我們可以稱之為智能的話)在于它能夠?qū)?shù)十億種可能性提煉成一個標(biāo)準(zhǔn)化的輸出。雖然這非常強(qiáng)大,但它也揭示了系統(tǒng)的根本局限性:它不會創(chuàng)造意義,只會對意義進(jìn)行平均。
人工智能提示:無需看路即可操控系統(tǒng)
提示不僅僅是提出問題,而是要縮小模型在訓(xùn)練過程中所映射的精確統(tǒng)計(jì)范圍。當(dāng)我們編寫提示時,我們會在標(biāo)記空間中導(dǎo)航,觸發(fā)模型之前見過的模式,并從系統(tǒng)中嵌入的平均值中提取。
提示越具體,圍繞特定詞條及其學(xué)習(xí)概率的聚類就越緊密。但我們常常忘記,用戶界面正在平滑層層復(fù)雜性。我們看不到詞語選擇的加權(quán)影響,也看不到那些影響響應(yīng)隨機(jī)性的隱形溫度設(shè)置。
這些模型是為服務(wù)普通受眾(另一種平均水平)而構(gòu)建的,這使得精準(zhǔn)引導(dǎo)他們變得更加困難。因此,雖然提示看起來似乎是無限的,但實(shí)際上它實(shí)際上是在與隱形分布和系統(tǒng)默認(rèn)進(jìn)行協(xié)商,而這些默認(rèn)設(shè)置比我們想象的要具有更大的決定性。
像 PICO(角色、指令、上下文、輸出)或 RTF(角色、任務(wù)、格式)這樣的快速框架可以幫助塑造結(jié)構(gòu),但值得記住的是,它們也是建立在對大多數(shù)人最有效方法的假設(shè)之上的。這仍然是一個平均值。有時你會很幸運(yùn),模型的輸出會超出你的認(rèn)知范圍,聽起來可能很精彩、很有見地,甚至可能很新穎。但當(dāng)你把它交給一個對這個主題很了解的人時,就會很明顯:它聽起來很像人工智能。
訣竅就在于理解你觸發(fā)的平均水平,并判斷它是否符合你的目的。誰會讀這篇文章?他們期待什么?他們需要什么程度的深度或原創(chuàng)性?這些才是你寫作主題的核心。無論你使用結(jié)構(gòu)化框架,還是自由寫作,重要的是明確目標(biāo),并了解你所處的領(lǐng)域。
有時,最好的策略是:關(guān)閉聊天窗口,打開一個新窗口。之前的標(biāo)記、緩存路徑和上下文歷史記錄的權(quán)重可能會影響結(jié)果。這不是你的錯。只是平均值有點(diǎn)雜亂。重新開始,重新校準(zhǔn),爭取獲得更好的中位數(shù)。
結(jié)論:當(dāng)平均值成為界面
讓我擔(dān)憂的一件事是,GenAI 背后的公司是如何學(xué)習(xí)針對平均水平進(jìn)行優(yōu)化的。越多人使用這些帶有快捷工程模板和框架的工具,系統(tǒng)就越會開始圍繞這些模式進(jìn)行自我塑造。這些模型經(jīng)過訓(xùn)練以適應(yīng),而它們適應(yīng)的正是我們,我們的習(xí)慣、我們的捷徑、我們的結(jié)構(gòu)化格式。
那么,當(dāng)界面本身開始強(qiáng)化這些相同的平均值時,會發(fā)生什么呢?任何超出可能、預(yù)期和熟悉范圍之外的東西都變得越來越難。那些奇怪的、原創(chuàng)的、統(tǒng)計(jì)上不可能的,這些都開始逐漸淡出人們的視線。
當(dāng)我們考察代理型人工智能時,情況就變得更加復(fù)雜了。這種人工智能似乎能夠自行做出決策或提供強(qiáng)大的輸出。它或許非常令人信服。但問題在于:它仍然建立在平均值之上。我們不僅要承擔(dān)寫作或研究的任務(wù),還要承擔(dān)思考本身的風(fēng)險。當(dāng)機(jī)器被調(diào)整以反映最常見的情況時,我們不僅僅是在外包智力,我們還在外包我們對細(xì)微差別的感知,以及持有非中立觀點(diǎn)的能力。
所以,下次當(dāng)人工智能給你一些感覺異常精彩或顯而易見的東西時,停下來想想到底是怎么回事。它并非創(chuàng)造性的。它只是在導(dǎo)航,從它之前見過的最常見、最被接受、最重復(fù)的路徑中抽取靈感。你的提示觸發(fā)了這條路線,而這條路線反映了成千上萬個像你一樣的人的提示。
一旦你理解了這一點(diǎn),你就可以開始更有意識地駕駛。你可以識別出你的方向何時被改道,穿過熱門車道,何時該離開高速公路。有時,當(dāng)輸出結(jié)果平庸得讓人感覺不正常時,最明智的做法很簡單:關(guān)上窗戶,重新設(shè)置路線,然后重新開始。因?yàn)橛袝r,找到新事物的唯一方法就是停止隨波逐流。
免責(zé)聲明:
本文所發(fā)布的內(nèi)容和圖片旨在傳播行業(yè)信息,版權(quán)歸原作者所有,非商業(yè)用途。 如有侵權(quán),請與我們聯(lián)系。 所有信息僅供參考和分享,不構(gòu)成任何投資建議。投資者應(yīng)基于自身判斷和謹(jǐn)慎評估做出決策。 投資有風(fēng)險,入市需謹(jǐn)慎。
關(guān)注我們,一起探索AWM!
近期熱
2025-05-08
2025-05-06
2025-05-06
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.