大模型火了以后,好像一夜之間Chatbot變成了人機交互的最佳方式,GUI(Graphic User Interface)最終會被淘汰,一系列所謂原生AI應用,都以CUI(Conversational User Interface)作為標準交互范式。
對此,我持有反對意見,具體觀點在AI時代,CUI會替代GUI么?中有講到。
其實,從GUI到CUI之間,有一個過渡性(或者叫中間形態)模式,就是Copilot(注意這不是指微軟的語音助手),智能副駕駛。
所謂智能副駕駛,是當你在使用GUI模式的應用系統時,可以有一個智能助手,需要的時候,助手可以無縫介入軟件的操作,幫助你輔助決策,甚至直接操作功能,完成工作。
Copilot不是一般意義上軟件智能助手,或者問答機器人。后者只能提供對話交互,并不能操縱軟件。Copilot具備呃直接操縱軟件的能力,從某種程度來講更像一個Agent。
企業軟件應用領域,AI目前并不能真正替代人,但Copilot的模式,可以很好的將碳基人和硅基人進行融合,一方面利用了AI的智能輔助能力,另一方面保持了人的決策判斷能力,相輔相成。Copilot是目前我認為比較合理的AI在人機交互領域的最佳實踐。
我們之前拆解過了編程輔助工具Cursor和Agent,Cursor的Agent模式,Windsurf的Write模式,就是典型的Copilot,你可以通過自然語言描述來完成人機交互和程序編寫。但編程領域比較特殊,Copilot作為一個Agent處理的是文件,而非控制GUI。那么,有沒有Copilot能幫助用戶操縱控制軟件呢(非RPA侵入方式)?答案是肯定的。
Cursor右側的Write模式的Chatbot就是一種Copilot
接下來要介紹的就是今天的主角,Zapier,這是一家12年成立于美國的公司,最早是做SaaS模式下的流程集成和自動化,這兩年開始融入AI能力,23年營收已達到3億美元。
我第一次聽到Zapier這款軟件,是來自明道云任總的文章,看到介紹后,就很有興趣。最近花了一些時間進行研究,實現了一些功能。
Zapier的核心功能,是內置了非常豐富的集成接口,覆蓋了歐美絕大多數主流SaaS軟件,可以做跨系統流程集成和工作流編排。
例如,你可以實現類似:當官網有一個客戶提交了線索,通過Zapier將線索分配給某個銷售,再給這個銷售發一封通知郵件和一條Slack消息,并且在Salesforce中創建一個線索記錄以及待跟進任務,同時給銷售主管的Notion中發一個待跟蹤任務和一條Slack通知。
然而,Zapier讓我感到好玩的不是標準功能,而是其嘗試探索了Copilot的人機交互模式,并且是目前我用過的相關軟件中,能力最強,體驗最好的一款。
讓我們一起來看看軟件功能。
首先,Zapier的幾個核心功能,Zap是工作流,Table是數據表(類似于Airtable的基礎數據表定義),Interface是界面編輯器(可以生成表單),Chatbot用來定義聊天模式的Agent(可以內置集成Zap),以及Canvas(這個后便會進一步介紹)。
Zapier的主界面,首先這個主界面就清晰、整潔,體驗非常好!
Zapier推薦通過CUI的方式嘗試創建流程
根據文本描述,Copilot自動分解任務,這也是Zapier最強的地方,他并不會直接創建流程,而是會給你選擇,你可以初步調整、編排你的任務,確認后再提交,由Copilot自動創建流程節點。
進入工作流編排界面后,Copilot會繼續存在,依然可以完成任務的分解、調整。
每執行完一個步驟,Copilot會對任務打鉤,當然不是所有任務節點都會完整創建,很多細節配置依然需要再GUI完成
對配置完成的流程,可以進行測試。既可以在GUI完成,也可以在Copilot完成。
如果測試中出現了錯誤,節點編輯組件會進行錯誤原因定位和分析,我個人覺得這個錯誤信息可以放在Copilot中,并嘗試自動修復,這樣體驗連續性可能更強。當然現在的設計也很好用!
目前Zapier還不能直接修復錯誤,但給出的修復建議基本準確,不是泛泛的方法,而是具體到字段級別的診斷。
Zapier的Copilot,雖然還有待完善,比如不能識別我用語言描述的循環邏輯,但是作為業界對Copilot的探索,已經足夠驚艷!
首先,在一個BS架構的軟件中,聊天對話框可以創建任務控制GUI中的控件,這就很神奇,而且更神奇的是,當你通過鍵盤鼠標操作GUI的時候,Copilot還能識別一些變化。
要知道,這并不是類似于RPA采用了界面截屏識別的技術能力,而是對前端控件進行了組件化處理,Zapier一定是對控件進行了函數封裝,并且集成了豐富的上下文和回調接口,從而讓用戶的人機交互可以被Copilot感知。這可是不小的工作量!
除了流程編輯器,Zapier還提供了Table和Interface。如果從軟件的三層架構MVC(Modeling,View,Controller)來講,Zap實現的是業務邏輯層C,Table定義了數據層M,Interface(這里是界面的意思,不是接口的意思)定義了View。
Zapier的Table說實話比Airtable等低代碼軟件還是弱很多,當然這是因為Zapier的定位并不是低代碼產品。
Zapier的界面編輯器,中規中矩。
Zapier的大模型節點編輯組件我覺得是目前最好用的。首先輸出數據是一個非技術人員能理解的呈現,而不是簡單粗暴的json。
其次,根據大模型返回的內容,編輯器可以自動生成一組結果變量集合,對應大模型的輸出,這就很方便了。
Zapier還有一個特別強的功能,叫做Canvas。你可以把Zap理解成一個一個API的定義,而Canvas可以把API、表單、數據表這些東西全部串起來。
例如,可以用Canvas實現以下功能:通過Interface創建一個Form,用戶提交表單后再Table生成存儲一條數據,然后調用Zap封裝的API來用Slack通知銷售并把數據傳遞到Salesforce。
Canvas同樣也可以以CUI的職能方式描述需求來創建整體畫布。
用文字描述一個業務過程,Canva會自動拆解任務,創建表單、數據表、工作流。
業務流程在Canvas中被繪制出來。
對于工作流自動化應用產品,我還體驗了幾個同類競品,比較知名的有n8n。n8n是2019年成立的團隊做的項目,可以私有化部署,源代碼公開,n8n沒有copilot,沒有人機交互,功能更強,更難用,適合有一定研發能力的企業應用,Zapier面向個人或中小企業,靈活性強,使用簡單,非技術人員友好。以下是一些界面截圖。
n8n的功能強悍,但上手困難!除了流程節點,還有多個預置的AI節點,數據處理節點。
n8n的節點配置器,看著我都頭暈。。。。
第三方給出的對比
來源 | PM楊堃(ID:pmYangKun)
作者 | 楊堃 ; 編輯 | 蝦餃
內容僅代表作者獨立觀點,不代表早讀課立場
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.