想寫關于RPA的話題很久了。
這次終于找到了一個機會,看到了一些轉(zhuǎn)折點。
是因為昨天打開影刀RPA,想搓一個自動跑圖的自動化RPA流程的時候,發(fā)現(xiàn)他們更新了一個新功能。
魔法指令。
這個功能的作用非常簡單,就是你現(xiàn)在可以通過AI,來用嘴搭建一套關于網(wǎng)頁和數(shù)據(jù)的RPA流程了。
這是我覺得,一個非常棒的轉(zhuǎn)折點。
很多朋友可能不知道這意味著什么,也有可能完全不知道RPA是什么。
所以我覺得在給大家看這個魔法指令功能之前, 還是先跟不太了解RPA的朋友,說一下他跟Agent的區(qū)別和意義。
坦率的講,最近我聽Agent已經(jīng)聽得耳朵旁有點起繭了,特別是MCP火了之后,突然感覺萬物皆可Agent了。
聽的我快有一點叛逆了。。。
當然,不是因為Agent不牛逼,我很喜歡Agent,Agent很牛逼,我也認為,必然是未來。
只不過當下的時間點,我覺得很多人都已經(jīng)陷入了某種AI幻覺里,覺得在當下的時間里,在當前的模型能力下,一切都可以Agent,一切都該Agent,一切都是Agent牛逼。
但真的去做落地項目,做業(yè)務流程,做一些自動化任務的朋友都知道,你讓Agent做著做著,就會從“臥槽牛逼哎,他自己看到錯了自己去別的地方找哎”,變成“尼瑪怎么又崩了?”、“怎么這一步又理解錯了?”、“神經(jīng)病吧。”
尤其是,越是復雜的流程,越是講究高精度、不能出錯、重復運行的業(yè)務,一旦Agent的推理鏈條超過十步,它有的時候就越來越像是在抽卡。
這個痛點,我在好幾個訪談里都說過。
比如你現(xiàn)在做一個復雜、重復的操作流程,要Agent完成20個步驟,哪怕每一步成功率99%,那整體成功率是多少?
0.99的20次方,大概是82%。
聽起來不低是吧?但是這個就代表著,每5次任務,就會有一次失敗。
而且我給的是每一步99%的成功率,其實大家都知道,這個成功率很多時候是不可能的。
如果給到每一步90%的成功率呢。
10次只能成功一次。
你告訴我,這玩意在真正需要重復、自動化、穩(wěn)定運行的生產(chǎn)環(huán)境里,咋用嘛。
這個邏輯,在今天很多人聊Agent的時候,是不被認真討論的。
大家都沉迷在AI幫我做了一件很酷的事的表演性場景里,但是卻并不在乎,這個事能不能每天執(zhí)行100次、1000次、10000次,連續(xù)跑3個月不出錯。
我之所以這么說,是因為,我真的有一堆浪費時間的重復性任務,是要交給程序自動跑的,是不是AI其實我根本不在乎,我只希望,能穩(wěn)定、能十年如一日、不出錯的運行。
所以,在這種場景上,根本就不應該用什么Agent,而是上,RPA。
RPA,Robotic Process Automation。
我不知道大家有沒有玩過一些手游,我自己十年前玩碧藍航線和陰陽師的時候,每天都在里面肝肝肝,我還記得玩陰陽師的時候我還在上大學,為了刷升一個六星茨木童子,每天一邊看劇一邊刷狗糧。
狗糧就是要升級式神的素材,得到的途徑很簡單,就是刷副本。然后副本里面是可以開自動的,一把我記得可能幾分鐘,但是結算和重新開始,還是得手動點幾下。
我刷了好幾天,實在是煩炸了。
于是就裝了一個類似于按鍵精靈的APP,具體名字我忘了,他的作用,就是記錄我點了屏幕哪里,隔了多少時間后又點了什么,是按什么順序點的。
從而實現(xiàn),可以把我解放出來,完全自動化的刷狗糧。穩(wěn)定、重復、日復一日的運行。
于是,在刷了將近一個月之后,我的式神質(zhì)量突飛猛進,吊打身邊一眾朋友,甚至還能在我們那個區(qū)競技場打到排行前十。。。
這個東西,我們一般稱為腳本。
同時,也是RPA最最最最初級的用法。
真正的RPA,比這玩意高級多了,涉及到各種數(shù)據(jù)的處理和流轉(zhuǎn)、規(guī)則的判斷、自動化點擊操作等等。
過去大家一提RPA就覺得老、慢、土、企業(yè)服務感太強,覺得AI才是未來。
但現(xiàn)在你回頭看,Agent像是帶情緒的實習生,做事隨機、有創(chuàng)意、有想法,但經(jīng)常會搞砸一些細節(jié)。
而RPA,像是老成穩(wěn)重的機器人工人,沒啥腦子,但給個流程它就一遍遍照著跑,重復、穩(wěn)定、精準、不多想。
國內(nèi)我一直覺得最有代表性的RPA產(chǎn)品,就是影刀。
網(wǎng)址在此: https://www.yingdao.com/
他們自己也總結了一個圖,這個圖我深表贊同。
Agent非常酷,像Manus、DeepResearch等等,幾乎都是我最常用的產(chǎn)品,特別是OpenAI那個 DeepResearch,每個月150次現(xiàn)在甚至都不夠我用,我吹了無數(shù)次,200刀Pro會員最大的價值所在,我非常的尊敬他們,我也覺得它們很強。
但是場景不一樣,在重復性場景上,他們還是太有個性,太聰明了。
在很多時候,自動化真正需要的,是更穩(wěn)、更可控、更可復用。
而不是更聰明。
畢竟,做這種極度重復性的工作,我要的就是你穩(wěn)定的十年如一日的運行,你要聰明干嘛,你聰明但不靠譜,還不如不聰明。
但是RPA,我認為一直有一個非常大的問題。
就是上手太難了。
你即使不懂AI,不懂編程,你依然還是可以用Cursor、Trae搓出一個小產(chǎn)品,還是可以用DeepResearch給你生成一篇很牛逼的幾萬字的報告。
但是RPA這玩意,你不會,那就是真不會。
比如我們想做一個網(wǎng)頁的自動化,你打開界面,你如果沒用過,你是真的有可能懵逼的。
你想從抖音扒個評論,這是RPA做好的詳細流程,別說搭了,大概率,你看都看不懂。
你要搭流程,要畫模塊,要定義變量,要像程序員一樣思考流程邏輯。
后來影刀這么多年一直都在努力降低門檻,加入了更多可視化、模塊化、拖拽式邏輯配置。
但,還是太復雜了。
你本質(zhì)上還是在做開發(fā)。
只是形式換了。
這兩年,AI Coding飛速發(fā)展,我其實一直想看到,像影刀這種產(chǎn)品,能出一個用AI來搭建RPA流程的功能。
AI本質(zhì)上就是降維,就是技術平權,RPA很有用,但是太難,大家用不會搭不來,那為什么不能有,用嘴來跟AI提需求,然后轉(zhuǎn)變成RPA的流程呢?
直到現(xiàn)在,在等了半年多以后,我終于看到了。
雖然他現(xiàn)在還是只能用AI生成網(wǎng)頁和數(shù)據(jù)處理的RPA流程,還不能生成桌面端跨軟件比如微信的RPA流程,但是至少,我看到了一個非常棒的轉(zhuǎn)折點。
RPA+AI,才是自動化任務的YYDS。
你們把影刀下載下來安裝,就能在主界面上看到新建,點擊新建 - 新建PC自動化應用,進入到流程搭建頁面。
你就能在標準指令里面,看到這個彩色的魔法指令。
這個就是用嘴搭流程的功能。
不過在用之前,一定記得現(xiàn)在主界面 - 頭像 - 工具 - 自動化插件那。
先把各種瀏覽器的插件給裝上,要不然后續(xù)運行不成功。
現(xiàn)在,我們舉個小例子,比如,想做一個自動化流程用于我自己的學習。
流程是每天在小紅書上搜索關鍵詞“AI”,然后把前50個筆記都爬下來,存到一個excel里,再按照一定的數(shù)據(jù)公式,找出優(yōu)質(zhì)內(nèi)容,把那部分優(yōu)質(zhì)的筆記提取出來存儲,最后扔到飛書的多位表格里。
我們直接就可以點開魔法指令,然后直接點擊進入浮窗。
你就會發(fā)現(xiàn),她變小了,然后縮到屏幕的一邊了。
默認就是網(wǎng)頁自動化,所以我們不需要修改,然后打開瀏覽器(推薦還是Chrome),打開小紅書的網(wǎng)頁。
現(xiàn)在,你的界面應該長這個樣子,左邊是小紅書的網(wǎng)頁,右邊是影刀的魔法指令浮窗。
然后,我們就直接用嘴,來寫我們的指令。
不過影刀跟所有的AI產(chǎn)品都有一個不一樣的點,就是他有一個必須的步驟,叫做捕獲元素區(qū)。
比如我們說,在搜索欄里輸入AI,然后點擊搜索按鈕。
這個Prompt其實不夠精準,可能后續(xù)運行時會出現(xiàn)一些問題,所以,你需要先捕獲元素區(qū),非常明確的告訴它,這是搜索欄,這是搜索按鈕。
我們直接點擊左下角這個icon。
你就會發(fā)現(xiàn),你的屏幕變綠了,你可以,在頁面上框選各種區(qū)域了。
我們把鼠標放在搜索框的選區(qū)上,然后按下Ctrl+Shift再加鼠標左鍵單擊,它就會給你個確認,你點對勾就行。
然后你就會發(fā)現(xiàn),這個選區(qū),出現(xiàn)在你的對話框里面了。
這個就是一個元素塊,我們現(xiàn)在,可以用嘴,來告訴AI,應該對這個元素塊進行什么操作了。
比如我就會說。在輸入框中輸入“AI”。
輸入完以后,下一步就是點擊搜索按鈕進行搜索了。我們繼續(xù)如法炮制。選中選區(qū)。
然后在prompt里面寫,點擊塊元素(就是搜索按鈕)進行搜索。
后面就都是一樣的流程了,圈中整個筆記區(qū),讓他按照筆記鏈接、作者、標題、正文、點贊數(shù)、收藏數(shù)、評論數(shù)等等來進行爬取,給我存到一個本地的excel里。
這樣,一個用AI生成RPA的Prompt就寫完了,會跟你直接對話,有一點不一樣。寫完以后,我們可以再點擊一下,他們自己的優(yōu)化提問,提高成功率。
優(yōu)化完以后,就會變成這個格式,正規(guī)很多。
一切完畢,我們把他,發(fā)送出去就行。
過了一會,就會生成魔法指令的窗口,有提示需要安裝依賴庫的,你就點擊安裝就行。
這個基本就代表了,RPA流程已經(jīng)生成完了,哪些選項可以不用管,保存到本地的文件夾路徑,是可以手動修改的。
我手動改成到了D盤。
然后,我們點擊左下角的那個,運行指令,測試一下。
一次,直接完美的成功了。我直接放我的原始未加速錄屏,大家可以感受一下。
真的,看RPA干活,是一種享受。
再來看看本地excel結果。
完美無瑕。
而且,這個東西,是保存了以后,可以十年穩(wěn)定如一日的運行的(前提是小紅書不改界面),做一次,以后可以一直用。
而且不只是10個,我們完全可以讓他存50個筆記,100個筆記,200個筆記。每天抓取一次,這個對于自己學習作用有多大,不言而喻。
生成完的流程,大家一定要記得,點擊確定,因為他只是流程,還不算應用。
點擊確定后,就會回到我們的主界面。
記得先拖一個網(wǎng)頁自動化里的打開網(wǎng)頁,到主流程中,以后一運行,就會自動打開小紅書了。
剛才保存下來的內(nèi)容,我們?nèi)绻胱詣釉僮孯PA幫我們做一輪數(shù)據(jù)篩選。就可以繼續(xù)點擊魔法指令,但是這一會,用數(shù)據(jù)處理,幫我們搞excel。
在得到結果之后,把輸出文件可以自定義一個。
我們再運行測試一下。結果出現(xiàn)了BUG,但是不用慌,直接點擊智能修復就行。
然后繼續(xù),成功了,篩選出來了22條,Nice。
最后,你甚至可以,把這些處理完的數(shù)據(jù),直接自動化的,上傳到飛書多維表格里。
以后,每天,你只要需要打開影刀,運行一下,你就有了,全新的AI領域的小紅書爆款內(nèi)容。
你甚至還可以進一步當個懶癌,跟觸發(fā)器打通,每天定時自動運行。。。
除了這個小紅書自動爬取之外。
我們還手搓了幾個其他的流程,比如每次新生圖模型出來,我用我的excel測試集去測,都巨麻煩,因為新模型幾乎不可能開放API。
那現(xiàn)在,直接可以用嘴搓個自動生圖流程,比如我就搓了個即夢的。
直接批量生圖。
然后塞到飛書里,甚至我打算,把生視頻的也做了。
這樣以后,真的解放雙手好吧。。。
寫到這里,我真的是發(fā)自內(nèi)心想說一句:
我們這兩年,很多時候,都在追問AI能不能干人干不了的事。
但其實,那些重復的、瑣碎的、機械的、你知道流程卻不想動手的任務。
我更希望,AI能把他,干得更好。
這就是我眼里,AI+RPA的價值。
它不是AI更強,也不是RPA更流弊。
而是合而為一,綻放出更平權的價值。
也許自動化的終點,不是酷炫,而是悄無聲息地,替你干完你根本不想碰的那一堆破事。
你都忘了它在工作。
但它一直都在干活。
這可能,就是魔法。
也愿我們每個人。
都能擁有魔法。
>/ 作者:卡茲克、dongyi
>/ 投稿或爆料,請聯(lián)系郵箱:wzglyay@virxact.com
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.