前幾天受邀參加了天工超級智能體(Skywork Super Agents)的提前測試。
試了一下我發(fā)現(xiàn),相較于各種大包大攬的所謂通用智能體,天工非常的務(wù)實,專注于幫助打工人優(yōu)化我們每天接觸最多也是最繁瑣的三個交付物,也就是所謂的 Office 三件套,文檔、表格、PPT。
天工超級智能體不是簡單的生成一個交付物就結(jié)束了,而是考慮到了整個內(nèi)容的生命周期,從意圖判斷到內(nèi)容檢索到高品質(zhì)生成到編輯和修改都做了非常多的優(yōu)化,最大限度的保證內(nèi)容的可用性。
先介紹一下天工超級智能體的主要能力:
- 五模態(tài)一鍵生成:一條指令即可創(chuàng)建文檔、PPT、表格圖表、網(wǎng)頁和播客,還有獨家Excel生成功能。
- 深度研究超級引擎:超強deep research服務(wù),搜索能力超競品10倍,GAIA評測榜首。
- 溯源透明贏得信任:每份內(nèi)容都帶精確溯源標(biāo)記,讓你在專業(yè)場合自信展示。
- 靈活編輯無縫導(dǎo)出:所有內(nèi)容支持在線實時編輯,一鍵導(dǎo)出本地文件或直接上傳至Google云端辦公。
- 私人知識庫定制:構(gòu)建專屬知識庫基礎(chǔ)上生成準確內(nèi)容,徹底消除AI幻覺。
網(wǎng)頁生成
我發(fā)現(xiàn)他們有網(wǎng)頁生成模式,那是時候掏出藏師傅的老測試項目了。
今晚不是有小米發(fā)布會嗎,我想了一個很好的測試方式,直接讓他給小米做一個發(fā)布會預(yù)熱網(wǎng)頁。
這個除了考驗對藏師傅網(wǎng)頁生成提示詞的還原以外,也非常考驗對于最新信息的檢索能力,因為很多都是預(yù)測信息,而且都是最近幾天發(fā)布的,我們很容易就能看到檢索的質(zhì)量。
我也根據(jù)小米的設(shè)計風(fēng)格改了一下網(wǎng)頁生成提示詞,大家有類似場景可以直接用。
這里可以看案例回放:https://www.skywork.ai/share/project/1925427538100752384?dataType=project&outputType=sheets&projectId=1925427538100752384&sharingId=1925448729532305408
幫我檢索 20250522 日小米發(fā)布會的所有信息做成網(wǎng)頁網(wǎng)頁,不要遺漏信息 根據(jù)上面內(nèi)容生成一個 HTML 動態(tài)網(wǎng)頁
- 使用Bento Grid風(fēng)格的視覺設(shè)計,純黑色底配合#2657FD顏色作為高亮,標(biāo)題和文字為白色和灰色
- 強調(diào)超大字體或數(shù)字突出核心要點,畫面中有超大視覺元素強調(diào)重點,與小元素的比例形成反差
- 中英文混用,中文大字體粗體,英文小字作為點綴
- 簡潔的勾線圖形化作為數(shù)據(jù)可視化或者配圖元素
- 運用高亮色自身透明度漸變制造科技感,但是不同高亮色不要互相漸變
- 模仿 apple 官網(wǎng)的動效,向下滾動鼠標(biāo)配合動效
- 數(shù)據(jù)可以引用在線的圖表組件,樣式需要跟主題一致
- 使用 Framer Motion (通過CDN引入)
- 使用HTML5、TailwindCSS 3.0+(通過CDN引入)和必要的JavaScript
- 使用專業(yè)圖標(biāo)庫如Font Awesome或Material Icons(通過CDN引入)
- 避免使用emoji作為主要圖標(biāo)
- 不要省略內(nèi)容要點
來看一下生成結(jié)果,是不是有那個味了兄弟們,他居然還畫了個矢量的芯片目標(biāo),就看前面這幾下,已經(jīng)比很多專門做的的預(yù)熱網(wǎng)頁要好了。
信息也都沒啥問題,基本上主要發(fā)布的內(nèi)容都已經(jīng)展示了,三個重點內(nèi)容還各自站了一頁,后面的零碎內(nèi)容都放了上去信息非常豐富,詳略得當(dāng)。
通用模式和播客模式
我們先來看一下最不重要的兩個部分,通用模式和播客模式,但其實他們也做的很好。
播客模式非常好理解,支持根據(jù)主題生成對應(yīng)的對談播客,不過只支持英文內(nèi)容,這里我讓他生成關(guān)于中美關(guān)稅沖突的介紹播客。
針對中美關(guān)稅風(fēng)波生成一篇詳細的邏輯清晰的對談播客
可以看到播客生成的時長到了 13 分鐘,兩者的聲音也很真實自然,基本從內(nèi)容信息量和音頻質(zhì)量都不輸 NotebookLM了,整個內(nèi)容的編排很全面,而且不止是介紹信息還有很多的分析內(nèi)容。
甚至還展示了對應(yīng)的字幕這個比NotebookLM的體驗好多了,錯過的話還能看字幕了解。
至于通用模式,我發(fā)現(xiàn)他可以生成視頻,哈哈。
這里我讓他生成了最近在小紅書很火的擬人化小貓咪參加各種戰(zhàn)斗的視頻,沒想到他可以理解我的提示詞,完美的還原了那個畫風(fēng),還整上了配樂,太可愛了。
這種質(zhì)量的視頻只要發(fā)了就能爆,我本來對這個視頻生成不抱太大期望的,結(jié)果效果還挺好,真厲害。
幫我創(chuàng)作一個非常可愛的貓咪擬人冒險 Vlog 視頻,整個畫面用極其平庸的手機拍攝,略帶模糊,講述了貓咪從剛?cè)胛槿缓蟛粩鄬W(xué)習(xí)訓(xùn)練進步到參與各個兵種作戰(zhàn)(步兵、海軍、開戰(zhàn)斗機),最后結(jié)束戰(zhàn)爭的故事,需要有故事性,場景變化要連貫
文檔生成
然后我們來到重頭戲,打工人三件套的文檔生成,在文檔生成上,他們也考慮的很細,做了很多的預(yù)設(shè)。
你可以選擇各種你需要的文體,我們不能完全指望 AI,畢竟你用 AI 寫過文章就知道,你需要將一些要求告訴他他才能寫好,不然可能會出一個偷懶的東西出來。
我最近在研究 AI 編程嘛,于是就讓他幫我生成一個 AI 編程產(chǎn)品的研究報告。
幫我生成一份現(xiàn)在所有主流AI編程產(chǎn)品的深度研究報告,搜索信息的時候用英文,PPT生成的時候用中文,今天是 2025 年 5 月 19 號
他在剛開始生成的時候如果你的要求給的不夠細的話,他會生成一個可交互的卡片詢問你的詳細意圖,你只需要選擇就行,不需要打字,既提升了生成結(jié)果的可用性又降低了用戶的操作成本,非常合理。
而且他只會在任務(wù)開始的時候詢問,避免了你后面高高興興來看答案發(fā)現(xiàn),還有個選項需要選,他沒有進行任務(wù)這種尷尬情況。
然后他會執(zhí)行自己設(shè)定的 Todo 列表,這里可以看到他記得我的要求,再用英文搜索相關(guān)內(nèi)容,這樣可以確保在一些領(lǐng)域避免國內(nèi)的信息污染,各位用的時候也可以這樣要求。
他們的結(jié)果居然是寫的網(wǎng)頁約束了樣式,而且還能導(dǎo)出 Doc 格式,這個操作太秀了。
文檔結(jié)果里面直接標(biāo)注了數(shù)據(jù)和信息的來源網(wǎng)頁,你和閱讀內(nèi)容的人都可以直接核實,不需要擔(dān)心來源或者幻覺問題。
另外在每個數(shù)據(jù)多的東西他都會選擇合適的圖表展示數(shù)據(jù),在每個部分結(jié)束的時候還有高亮的總結(jié),都是小技巧啊朋友們,從這些地方就能看到是會寫文檔的。
PPT 模式
接下來我們來到老大難的 PPT 生成,這里他依然預(yù)設(shè)了很多常見的 PPT 制作需求,這樣可以確保整體的規(guī)劃和樣式都符合對應(yīng)的行業(yè)。
之后信息檢索和意圖選擇都跟文檔一樣,看到結(jié)果的時候我驚了,他們居然使用前端實現(xiàn)的,這樣保證了頁面內(nèi)容的豐富度,也保證了模板的豐富度,藏師傅之前的提示詞啟蒙還是有用的,各家的網(wǎng)頁生成都玩的越來越溜了。
而且整個搜索出來的內(nèi)容質(zhì)量和數(shù)據(jù)質(zhì)量非常高,整個編排也很有條理性,我自己搞反正想不了這么細,信息密度這么高的 PPT 居然生成了 26 頁。
最強的是,他們搞定了 Html 轉(zhuǎn) PPT,雖然生成用的網(wǎng)頁,但是導(dǎo)出的 PPT 格式文檔一點問題都沒有,跟網(wǎng)頁完全一樣,而且你也可以導(dǎo)出 PDF。
另外他們也考慮到了修改的情況,如果某一個數(shù)據(jù)或者表述不符合你的要求,你可以點擊右上角的編輯對 PPT 進行實時編輯,文檔能編輯可以理解,PPT 也可以編輯,那是真的很棒了。
表格模式
這個就是獨一份的能力了,他可以生成真的 Xlsx 格式的表格,基本上其他類似 Agents 都沒看到這個能力。
比如這里我讓他調(diào)研美國估值前 50 的 AI 創(chuàng)業(yè)公司。
幫我列出截止目前(2025 年 5 月 19 日)美國現(xiàn)在估值前五十的AI公司的詳細信息
從結(jié)果里面可以看到我都沒說應(yīng)該包含哪些數(shù)據(jù),他自己發(fā)揮的相當(dāng)好,名稱、估值金額、創(chuàng)始人、主營業(yè)務(wù)、最新的融資輪次和金額都有了。
另外他還主動對數(shù)據(jù)進行了分析,比如公司類型占比以及融資輪次占比等,還有圖表,你可以拿來直接用。
這次測試基本就到這里了,我們最近被各種所謂的 Agents 瘋狂轟炸,很多人肯定跟我一樣都有點 Agent 疲勞了。
我們厭倦了過度宣傳和各種第一,天工超級智能體罕見的強調(diào)了自己專注的領(lǐng)域,雖然他們也能生成播客、視頻,而且生成的很好。
但是他們知道這個不重要,專注于對用戶提升最大的部分,在 Office 上下了巨大的功夫,從意圖選擇到網(wǎng)頁轉(zhuǎn)文檔 PPT 到內(nèi)容編輯,這些都是對需求有深刻洞察的產(chǎn)品才能做出來的功能。
在現(xiàn)在這個時間點,我們需要的不是各種通用和第一,模型也做不到,我們需要的是靠譜、穩(wěn)定,可復(fù)現(xiàn)。
如果你覺的內(nèi)容對你有幫助的話可以幫我點個贊或者喜歡,也可以推薦給你需要的朋友們!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.