昆侖萬維全新升級了原有的 Chatbot,發(fā)布了他們通用 Agent 新品「天工超級智能體」。
官方產(chǎn)品特性如下:
為了提升 Agent 的落地效果,「天工超級智能體」(下文簡稱天工)扎實(shí)地做了不少垂直能力封裝與人-AI 交互打磨,值得嘗試。
我也第一時(shí)間進(jìn)行了實(shí)測,特別在輸出辦公場景的產(chǎn)出物時(shí),效果頗為亮眼。總結(jié)產(chǎn)品亮點(diǎn)如下:
- More Structure, Better Agent
- 可編輯、可溯源的 Office 三件套
- 更自然順手的意圖澄清機(jī)制
本文將通過 全套完整產(chǎn)品分解,外加額外 3 項(xiàng)測試,帶你速通對打工人來說,更務(wù)實(shí)、能用、易用的「天工超級智能體」新品。
More Structure,Better Agent ?
雖然“世一Agent” Manus 曾說,Less structure,more intelligence.
但「天工」用產(chǎn)品回應(yīng):在一個(gè)可落地、實(shí)用向的 Agent 中,這兩者并不沖突。
甚至現(xiàn)階段 Agent 反而應(yīng)該考慮用 More Structure,換來 Better Performance。
為了方便理解為什么說「More Structure,Better Agent」,先讓我們以一個(gè)任務(wù)為例,理順「天工」的整體設(shè)計(jì)理念和產(chǎn)品亮點(diǎn)。
產(chǎn)品與 AI 設(shè)計(jì)全解析
打開「天工」首頁,不難看出除了「通用 Agent」模式外,文檔、PPT、表格三種產(chǎn)出場景,被一一封裝為了單獨(dú)的模式。
輸入任務(wù)如下:
選擇 PPT 模式,Prompt:請向我匯報(bào) openAI 這家公司的完整發(fā)展路線
第一步:更自然的意圖澄清
輸入這個(gè)任務(wù)后,Agent 首先向我尋求信息補(bǔ)充:
左「天工」,右「Manus」
和現(xiàn)有多數(shù) Agent 補(bǔ)充信息的方式不同,「天工」把 AI 需要用戶澄清的問題,封裝為了更加可視化的選項(xiàng)表單。
- 根據(jù)問題類型,分類使用“必填”符、文本框、單選等 UI 交互樣式,簡化了人類用戶面對「補(bǔ)充問題」環(huán)節(jié)的閱讀與回復(fù)步驟。
- 這當(dāng)然不算什么技術(shù)突破,但通過更多的交互樣式的封裝,「天工」給出了當(dāng)下最自然、順手的意圖澄清方式。
*猜測實(shí)現(xiàn)方式:
1. 先通過 Agent 內(nèi)封裝的 Prompt,要求 AI 按特定格式,輸出需要用戶澄清的表單文本;
2. 再由前端將其渲染為可視化的表單。
第二步:基于 Deep Research + MCP 的 Agent 方案
「天工」的 Agent 設(shè)計(jì),整體采用的是 Deep Research + MCP 方案:
- 通俗來說,Deep Research 是一種能讓 AI 自主規(guī)劃任務(wù)步驟的順序,并根據(jù)中間執(zhí)行過程的反饋,動(dòng)態(tài)調(diào)整后續(xù)任務(wù)計(jì)劃的 Agent 能力。
- 而 MCP 則是通過統(tǒng)一 AI 協(xié)議,為 AI 提供若干的工具,使其擁有訪問世界信息、文件讀寫等能力。(對于天工來說,會(huì)涉及到:聯(lián)網(wǎng)搜索、網(wǎng)頁瀏覽、PPT 生成、文件寫入等不同工具)
在接收到用戶的補(bǔ)充信息后(如果超時(shí)不回復(fù),AI 會(huì)自動(dòng)執(zhí)行),「天工」會(huì)規(guī)劃一份「待辦清單」,交由用戶確認(rèn)。
用戶也可以在此反饋,修改任務(wù)步驟。
同時(shí),這也是 Agent 在通過任務(wù)分治,提升子任務(wù)完成質(zhì)量,在長程執(zhí)行中記住任務(wù)目標(biāo)的手段。
隨后,「天工」就開始按照規(guī)劃,使用工具,逐步執(zhí)行任務(wù)。
第三步:專精 Office 三件套的輸出成果
在任務(wù)的準(zhǔn)備步驟完成后,則會(huì)根據(jù)要求,生成用戶所期望格式的成果。
除了通用生成外,「天工」單獨(dú)提供了「文檔、PPT、表格」Office 三件套生成模式。(客觀來說,生成效果確實(shí)很不錯(cuò))
我們選的是「PPT 模式」,所以 AI 會(huì)調(diào)用專門的ppt_agent工具。
- 可以看到昆侖單獨(dú)開發(fā)了ppt_agent,調(diào)用「生成 PPT」MCP 工具,規(guī)劃 PPT 的內(nèi)容大綱。
- 但不確定是通用 Agent 直接調(diào)用了 MCP,還是通用 Agent 里又套了單獨(dú)的ppt_agent子 Agent。
然后再基于「大模型可視化輸出」的方式(AI Coding + Artifact 渲染),逐頁生成每頁 PPT 的頁面內(nèi)容。
整個(gè)任務(wù),從開始到結(jié)束,耗時(shí)約 10 分鐘,最終樣式是這樣的:
作為報(bào)告匯報(bào)類 PPT,這個(gè)效果確實(shí)很棒,可用性很強(qiáng)。(至少給我 2 天時(shí)間,要完成調(diào)研并古法手作出這個(gè)信息密度、設(shè)計(jì)質(zhì)量的 PPT,還是夠嗆)
使用 Html 生成樣式,這個(gè)方案其實(shí)在去年 9 月的時(shí)候,我就用在了「」上,也算帶火了國內(nèi)大模型可視化輸出的用法。
但要穩(wěn)定輸出幾十頁的 PPT,還保證樣式契合內(nèi)容,是需要產(chǎn)品團(tuán)隊(duì)花不少精力做工程化的。
PS:昆侖后續(xù)也會(huì)把這套 Deep Research Agent 框架,以及生成 Office 三件套的 MCP 工具都開源出來。
拓展功能:可導(dǎo)出、可編輯、可溯源,提升可用性
此外,「天工」還提供了三個(gè)不太 AI,但很剛需的“普通”功能:
第一:支持了不少導(dǎo)出格式
PPT 可導(dǎo)出為 PPTX、PDF;Word 可導(dǎo)出為 DOC、DOCX、PDF;Sheet 也可直接下載。
第二:可在線編輯
在 Agent 對話界面,都可以直接編輯 Word、PPT 文案,保存后再下載的就是新版本。這點(diǎn)足以讓 Agent 替你打工的結(jié)果更加可用了。
第三:文檔內(nèi)可精準(zhǔn)溯源信息來源
AI 在生成結(jié)果時(shí),往往引用了大量外部信息,但難免引用到錯(cuò)誤信源,或有生成的幻覺。導(dǎo)出 Word 后也不注明原始來源,用戶都需要校對一遍才敢用。
天工比較“討巧”地先以 Html 預(yù)覽的格式,在 Word、PPT 報(bào)告中增加了“溯源模式”。
可導(dǎo)出、可編輯、可精準(zhǔn)溯源,確實(shí)更符合當(dāng)下 AI Agent 仍需與人協(xié)作、修正完成任務(wù)的現(xiàn)狀。
在這種雙向奔赴的 人-AI 協(xié)作模式下,可以大幅提升現(xiàn)階段 Agent 的可用性。
3 項(xiàng)額外測試,帶你速通「天工」表現(xiàn)
另外,我也測試了其他幾個(gè)常見任務(wù)的表現(xiàn),方便大家評估自己工作中如何使用好這個(gè) Agent。
整體來說,表現(xiàn)可圈可點(diǎn),在大部分沒有嚴(yán)格要求 or 獨(dú)特背景信息的工作場景中,用戶都應(yīng)該能找到不少 人-AI 協(xié)作的形式。
1)文檔 Agent:深度調(diào)研,輸出圖表報(bào)告
任務(wù) Prompt:我在規(guī)劃制作一個(gè) AI 相關(guān)的付費(fèi)專欄,調(diào)研 lenny's newsletter 的發(fā)展歷程與內(nèi)容、商業(yè)化體系的設(shè)計(jì)
在基于 Deep Research 的結(jié)果輸出的文檔報(bào)告中,「天工」能夠自動(dòng)根據(jù)每段信息的類型,插入相當(dāng)匹配的圖表,提升重點(diǎn)信息的可讀性與專業(yè)感:
從這圖文并茂的結(jié)果呈現(xiàn)來看,是 Gemini Deep Research 從來沒給我過的驚喜。昆侖的產(chǎn)品團(tuán)隊(duì)確實(shí)更像(啊不,更懂)打工人。
2)表格 Agent:整理信息,表格統(tǒng)一輸出
當(dāng) AI 能夠?qū)⑺阉鳌⑸山Y(jié)果,以表格形式輸出時(shí),就會(huì)有很多不同的用法,就像有個(gè)“下屬”幫你聯(lián)網(wǎng)、查閱資料,整理制表。
比如讓「天工」收集最近 Google i/o 大會(huì)的全部新品信息,整理表格:
任務(wù) Prompt:請分析 2025 年 Google i/o 大會(huì)發(fā)布的全部新品,請生成發(fā)布分析表
整體信息歸納、分析的還是相當(dāng)全面。提供的配套分析,也有其實(shí)用價(jià)值:
另外,以往出去旅游時(shí),我也常用表格方式,進(jìn)行日程管理。這次也嘗試讓「天工」幫忙規(guī)劃旅游日程表:
任務(wù) Prompt:我想去南昌旅游,2 天 1 夜,從杭州自駕出發(fā),想要盡可能吃當(dāng)?shù)氐拿朗澈陀瓮鏄?biāo)志性景點(diǎn)。請你給我生成旅游日程表
接到任務(wù)后,AI 就使用網(wǎng)頁搜索,收集了大量“杭州到南昌”的自駕游路線信息,規(guī)劃行程路線。
最終輸出為預(yù)期的表格樣式,還包含了景點(diǎn)、餐廳、住宿等信息:
能夠更加一目了然的為 J 人出行提供信息便利。(一個(gè)更實(shí)用的用法:如果事前已經(jīng)有自己的出行、住宿等目的地的大致安排,也可以直接把文件傳給 AI,讓 AI 基于你的規(guī)劃,替你整理對應(yīng)的出行表)
3)通用 Agent:設(shè)計(jì)→網(wǎng)頁→視頻
最近 Lovart 等設(shè)計(jì)垂類 Agent 也火了起來,不妨也看看「天工」在這類任務(wù)下的表現(xiàn)。
任務(wù) Prompt:設(shè)計(jì)修仙世界中的 1 個(gè)火柴人升級的形象,分別展示其從筑基期到渡劫期渡劫的動(dòng)態(tài)形象,人物主體不變,但根據(jù)等級階段,展示不同契合等級的服裝、道具、技能、姿態(tài)
AI 先依次生成了各個(gè)等級的火柴人形象(別說,還挺有模有樣的)
然后整理出了一個(gè)完整的「火柴人修仙進(jìn)階之旅」的形象網(wǎng)頁,并配有文字解說與動(dòng)態(tài)視頻形象預(yù)覽:
生成結(jié)果頁面見:https://www.skywork.ai/share/v2/website/1925040507609272320
另外,也讓 AI 把 5 個(gè)階段的視頻都做了出來,支持生成 BGM 音頻。
手動(dòng)拼合加字幕如下。在沒有更多要求的情況下,輸出這樣的產(chǎn)物,在現(xiàn)在的通用 Agent 中已經(jīng)屬實(shí)不錯(cuò):
Btw:測試時(shí)遇到了一個(gè)小問題,目前視頻處理 MCP 工具,必須要有 BGM,才支持拼合視頻;任務(wù)交互輪次過長時(shí),上下文記憶也會(huì)有所損耗。官方已經(jīng)在加緊修復(fù)。
為什么要 More Structure ?
昆侖萬維用「天工超級智能體」給出了一個(gè)他們的產(chǎn)品主張:
在通往 AGI Agent 的漫漫長路上,現(xiàn)階段不妨用更多的“結(jié)構(gòu)化”,換取高頻場景下實(shí)實(shí)在在的“可用性”。
這確實(shí)很聰明。
通讀全文,不難發(fā)現(xiàn)「天工」在追求 Agent 的“能用、好用”上下了不少功夫:
- 交互的“結(jié)構(gòu)化”:意圖澄清的選項(xiàng)表單化,本質(zhì)上都是在降低用戶的理解與反饋成本,降低 AI 的跑偏風(fēng)險(xiǎn)。這比讓用戶和 AI 玩“我想你猜”的游戲要高效得多。
- 垂直場景能力的“結(jié)構(gòu)化”:Office 三件套的 Agent 模式,是在辦公場景的特定的輸出方式,不再指望一個(gè)“通用”Agent 完美地輸出全部成果。對高頻場景的垂直深耕,更能快速提升用戶體感。
- 交付的“結(jié)構(gòu)化”:可導(dǎo)出、可編輯、可溯源,這些看似“不那么 AI”的工程化努力,恰恰是好用的關(guān)鍵。它讓 AI 的產(chǎn)出不再是“一次性用品”,而是可以被信任、被迭代、被整合的“協(xié)作過程”。
這種「More Structure」的思路,本質(zhì)上是以犧牲一定的“通用性”、“隨機(jī)性”可能帶來的上限,來換取特定場景下“確定性”和“易用性”的提升。
在當(dāng)前 AI 生成結(jié)果并不穩(wěn)定的階段,這無疑是一條更穩(wěn)妥、也更容易快速獲得真實(shí)用戶認(rèn)可的商業(yè)路徑。
它繞開了純粹追求模型智能的“軍備競賽”,轉(zhuǎn)而聚焦于如何通過產(chǎn)品化和工程化的手段,更好地服務(wù)用戶的痛點(diǎn)。
小結(jié)
人類社會(huì)的工作職責(zé)、產(chǎn)出物的要求,本就滯后于 AI 發(fā)展。
如果說「Less Structure」追求 AI 無限的智能進(jìn)步空間,那么「More Structure」則是基于人類現(xiàn)實(shí)需求的穩(wěn)定落地方案。
兩者并不沖突,而是現(xiàn)階段 Agent 落地必然要使用的互補(bǔ)手段。
「天工」的嘗試再一次印證了明確的信號:
Agent 的競爭,已經(jīng)從單純的模型、記憶管理的比拼,進(jìn)一步走向了更深的場景理解、產(chǎn)品打磨和工程實(shí)現(xiàn)。
我也期待看到「天工」在未來如何逐步解開這些“結(jié)構(gòu)”的束縛,向著更理想的 AGI 助手形態(tài)邁進(jìn)。
但在此之前,能讓我在需要出文檔、PPT、表格時(shí),有一個(gè)“不用多教的下屬”,這本身就是一種進(jìn)步。
——More Structure,Better performance.
如何試用?
「天工」共有兩個(gè)版本,請使用電腦體驗(yàn),入口如下:
- 海外:https://skywork.ai
- 國內(nèi):https://tiangong.cn
注冊的新用戶一次性贈(zèng)送 2500 積分,每天贈(zèng)送 1200 積分。(按照我的測試 case 消耗來看,如果是 office 三件套 的生成場景,基本一個(gè)簡單任務(wù)在 300~800 積分。)
對了,無需邀請碼~幾個(gè)月了,終于有款產(chǎn)品不用吭哧吭哧四處找“碼”才能使用了
如果覺得這篇文章對你有啟發(fā)或幫助,歡迎點(diǎn)贊、在看、轉(zhuǎn)發(fā)分享,讓更多熱愛 AI 的朋友能夠受益
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.