國產智能體,這次真封神了。
過去這段時間,「智能體」簡直殺瘋了。
無論是初創公司還是互聯網大廠,主流 AI 玩家們都開始圍著它轉,說它是大模型的下一站也毫不夸張。
作為人工智能的一種高級實現,智能體比大模型更具實體化、自主性、交互性,已經進化成「會思考、動手強、能串聯一切工具的全能戰士」。
就在 5 月 22 日,這條 AI 賽道迎來了一個足以傲視群雄的「巨無霸」產品,其背后站著的正是一家國產大模型廠商 —— 昆侖萬維。
這家位居國內大模型第一梯隊的選手,面向全球正式發布了天工超級智能體(Skywork Super Agents)(下文簡稱 Skywork),直接卷出了新高度!
與 Manus、OpenAI deep research、Genspark 等其他智能體相比,Skywork 有三大必殺技:「場景全、能力強與框架開源。」
首先是「全」,Skywork 遠不是一兩個小工具拼湊出來的智能體,而是系統打包了5 個專家級 AI Agent,可以一鍵生成專業文檔、數據表格、PPT、播客、網頁五件套,稱得上是內容創作者眼中的黃金搭子。
更炸裂的是,Skywork 還提供了1 個通用 AI Agent,可以一站式地輸出音樂、MV、宣傳片、繪本、有聲書等多模態內容。
其次是「智商」爆表,跑分成績給了我們很大驚喜。
Skywork 在多個 AI Agent 基準測試榜單中登頂,比如在 GAIA(最困難、最全面的智能體基準測試)中,面對從初級到高級、從易到難的不同任務(Level 1 到 Level 3),它全面超越了 Manus、OpenAI deep research。
這還沒完,Skywork 在 SimpleQA(評測智能體回答事實性問題準確性的基準測試)中的得分(94.5)同樣超越了 OpenAI 以及當前 SOTA,解決大模型「胡言亂語」更給力了。
最后是讓開發者沸騰的 ——全球首個開源的 deep research agent 框架,這意味著每個人都可以參與到智能體的定義中來了。
同時,直接開放三大 MCP 接口,供開發者調用文檔生成、數據分析、PPT 演示文檔三大能力,形成以智能體為核心的「AI 操作系統」,成為開發者們的新基建。
- 框架開源地址:https://github.com/SkyworkAI/DeepResearchAgent
- MCP 地址:https://mcp.so/server/skywork-super-agents/Skywork-ai
還有一點特別值得稱道,Skywork 不搞現在 AI 圈討厭的饑餓營銷那套,不排隊、不搶碼、不內測申請,上線即可用。性價比還賊高,單個通用任務成本僅需 0.96 元。
今日,昆侖萬維重磅宣布天工超級智能體(Skywork Super Agents)APP 正式上線,這也是全球首款基于 AI Agent 架構的 Office 智能體手機 App。
看起來,想要體驗智能體的小伙伴終于有了一個實力更強、價格又便宜的選擇。
第一手實測:智能體界的「全能型選手」
從 OpenAI 的 deep research 到 Manus、Genspark 等專精型 Agent,市面上的產品在功能上可以說大同小異,而「誰真正能落地、誰真正好用」成為普通用戶最關心的問題。
接下來,我們就搞個一手實測,看看 Skywork 這個「新秀」的實力究竟如何。
- 全球官網:https://skywork.ai
- 中國官網:https://tiangong.cn
多場景寫作
最近 AI 率檢測的問題頻頻登上各大平臺的熱搜榜。有大學生發帖稱,熬禿了頭寫的畢業論文 AI 率被判了 80%,測試一番后發現朱自清的《荷塘月色》AI 率竟超 60%。為了去 AI 味兒,學生們絞盡腦汁,要么瘋狂改標點,要么短句改長句……
對此,我們讓 Skywork 生成一份適用于 B 站 3 分鐘科技短視頻的腳本, 吐槽一下當前 AI 技術的發展帶來的魔幻現實。
不得不說,Skywork 設計的「UP 主臺詞」很有 B 站特色,如「屏幕前的各位『肝帝們』」、「億點點變化」、「以前是怕抄襲,現在是怕被 AI」 等語句非常貼合年輕受眾,既有梗又有深度。而且它還在合適的位置穿插著柱狀圖、專家觀點的引用,更增強了腳本的傳達力與可信度。
可視化數據分析
Skywork 的表格模式類似于 Microsoft Excel 和 Google Sheets,輸入主題、需求或者上傳原始數據后,它就能智能分析并生成表格、圖標等。
我們輸入指令:「生成一份圖靈獎 2015-2024 年的獲獎統計」。
Skywork 并不急于執行,而是通過與用戶交互確認任務細節,包括統計維度(如獲獎人數、國籍、研究領域、所屬機構)和展示方式(如表格、趨勢圖、占比圖等)。這種前置的任務拆解能力,使得整個分析過程具有極高的準確性和可控性。
緊接著,它會自動生成待辦清單,調用各種 MCP 工具依次執行任務,整個過程無需用戶參與。
Skywork 準確完成了數據整理和分析任務,最終生成四個結構完整、信息翔實的 sheet。在可視化呈現方面,它生成的餅圖、柱狀圖和折線圖不僅美觀,還極具數據表達力。
精美 PPT
打工人最怕三件事:加班沒有加班費、老板突然 @你、順便做個 PPT。別的順便是順手,這個「順便」是要命:字體怎么調都不對,圖表怎么看都很土,辛辛苦苦熬夜干到凌晨三點,結果老板瞅了一眼:「感覺不太對,你再打磨下」。
現在,Skywork 給每個被 PPT 逼瘋的打工人開了張救命的「藥方」。只要一句簡單的 Prompt:制作《日本鐮倉的旅游攻略》PPT,它立馬就能生成一份結構清晰、顏值在線的 PPT。
從最終生成效果來看,該 PPT 不僅有實用信息點,還配了高質量的場景圖、路線圖和日程表,我們完全可以直接拿來用。
創意網頁
今年 2 月份,Andrej Karpathy 提出了 Vibe Coding(氛圍編程)的概念,碼農們不用逐行寫代碼,只要用自然語言描述目標功能,專用大模型即可生成對應代碼。
Skywork 目前也能實現這一功能,輸入需求就能快速生成可溯源、可編輯、可應用的高質量多模態 html 成果。舉個例子,我們讓它「生成一個開心消消樂的網頁小游戲」,幾分鐘后它啪地甩來一個水果卡通風的成品。
這個網頁小游戲不僅界面設計的好看,更重要的是,它真實可玩。在規定的一分鐘內,玩家讓三個或以上相同的水果圖標連成一條直線即可消除,并且它還能根據得分情況增加等級。
智能音頻播客
去年谷歌 NotebookLM 曾掀起一股 AI 播客熱潮,僅需一個鏈接或文檔,幾分鐘就能轉成接地氣的男女對談。當時,不少 AI 圈的大咖為它「站臺」,甚至連「死對頭」OpenAI CEO Altman 都認為它很酷。
Skywork 這次上線的播客模式與之有異曲同工之妙。我們輸入 Prompt:《面紗》讀書對談播客,它隨即就去找資料寫稿「錄制」,然后一鍵生成音頻播客。
AI 男女主播吐字清晰,語音語調自然真實,語氣詞、說話的氣口都把握得相當到位。從內容來看,他倆也不是照本宣科,而是在真正讀懂了小說后,針對播客這一媒介形式進行的自我創作。
與谷歌 NotebookLM 不同的是,如果我們對成品有任何調整需求,可以直接在聊天框里提,Skywork 隨時修改。比如,我們讓播客增加一部分,介紹小說中的男主沃爾特?費恩是個怎樣的人,Skywork 立馬在原有播客基礎上更新了相應的內容。
音樂與視頻生成
此前,昆侖萬維發布了全球首個音樂推理大模型Mureka O1,不輸 Suno 的驚艷效果讓所有人看到了其在音樂生成領域的深厚造詣。
Skywork 的音樂實力同樣不俗,比如「生成一段適合清晨獨自散步時聽的輕音樂」,它以鋼琴為主旋律,整體節奏舒緩勻稱,給人一種在晨光中漫步的愜意感覺。
視頻生成也不在話下,比如「城市天臺夜晚,一群會發光的小鳥從霓虹燈上起飛,匯聚成一個漂浮的時間鐘表」,這種復雜 Prompt 的目標場景都能 hold 住,你就說贊不贊吧?!
Skywork 還能生成帶背景音樂的視頻,如下「generate a video with music: a man raps to the camera」。下一步的升級方向可能就是直接生成指定對白、語氣的音畫同步視頻了,就像谷歌 Veo 3 所能做到的那樣。
這一波實測下來,我們切身的感受是:強,太強了!
無論是生成內容的豐富性、專業性、準確性,還是界面設計的美觀程度和布局的合理性,Skywork 都展現出了一個「全能型」智能體該有的樣子,甩開了現有競品。
人無我有,打造差異化競爭優勢
在體驗過程中,我們發現,Skywork在任務協同、多模態生成、結果可信度和個人知識庫上,具備了真正的「差異化實力」,克服了 Manus、OpenAI deep research 等競品的痛點,實現了「人無我有」的后發優勢。
超能 Office 三件套 —— 高效內容創作與生產力輸出
當代打工人,誰沒被文檔、表格和 PPT 這工作「三件套」逼瘋過?
如今,Skywork 把文檔、表格、PPT 這三大辦公工具整合在了一起,生成的內容不僅更詳細、更條理,還能做出各種清晰好看的圖表,甚至還能插入 Youtube 視頻。
當然,如果你想對生成的內容進一步細化調整,Skywork 提供了在線編輯功能,通過「編輯」按鈕直接在界面上修改文字、調整結構,像使用在線協作工具一樣自然流暢。
導出格式也非常靈活,包括 PPTX、PDF、HTML、Google Slides 等多種格式,滿足我們在決策討論、版本迭代、二次創作中的不同需求。
生成酷炫內容 —— 多模態內容融合
在日常創作中,我們往往需要在文字、圖片、音頻、視頻等多個工具之間來回切換,才能把一個想法完整呈現。
Skywork 在通用對話任務上打破傳統 Agent 任務執行的邊界,接入網頁搜索、思考分析、圖片生成、圖片理解、語音生成、音樂生成、視頻生成等十余個 MCP,讓創作者無需奔波于不同平臺,就能一鍵生成宣傳片、MV、有聲書、繪本等多種形式的內容。
比如我們僅用一個 Prompt,就讓它混搭出一個小貓的旅行 vlog,不僅準確生成出各大地標,還讓小貓在每一個場景中自然入鏡,整個過程無需人工干預。
提示詞:幫我生成一個小貓的旅行 vlog,內容分別是小貓到法國埃菲爾鐵塔、美國自由女神像、中國長城、澳大利亞悉尼歌劇院、埃及金字塔、印度泰姬陵、日本富士山等地旅游并與這些著名景點自拍合照,配樂輕松歡快。
這種「Agent+MCP 多工具融合」的架構,有望引領下一代內容生產的范式革命。
信源可追溯 —— 向可驗證內容創作演進
在如今這個內容泛濫的時代,信息可靠性反倒成了稀缺資源。大模型雖然擅長高效生成,但它們一本正經地胡說八道早就不是什么新聞。
Skywork 試圖解決的正是這個痛點。它生成的每一段文字、每一張圖片都不是憑空捏造,而是能清晰追溯到具體出處。輸出文本可以關聯原文段落,圖片也能標注出溯源網頁或知識庫來源,甚至還附上完整的信源列表。
這種將信息溯源融入創作流程,讓用戶在生成內容的同時隨時驗證,大大降低了大模型「滿嘴跑火車」的風險,真正讓每一次產出都有據可查。
個人知識庫 —— 打造私有化智能內容循環
如今,市面上的智能體普遍存在的一大痛點在于:素材零散、成果不可持續,缺乏系統性積累機制。
為了解決這些挑戰,Skywork 上線了個人知識庫。我們可以上傳 pdf、doc、ppt、xls 等多種格式的文件,也可以上傳錄音、url 和 youtube 視頻播放地址。每個知識庫支持上傳最多 50 個文檔,并可根據不同主題創建多個知識庫,實現清晰有序的知識管理。
更重要的是,Skywork 不只是一個信息存儲工具,更是一個智能創作引擎。基于知識庫內容,我們可以一鍵生成 多模態內容,它們又能反向存入知識庫,形成「素材 - 創作 - 再積累」的正向循環,打造真正可生長的個人知識系統。
以上這些差異化功能,構成了 Skywork 的核心競爭力,使之成為真正「有用、敢用、好用」且更具性價比的 AI 智能打工人。
從信息發現到結構化內容輸出 全鏈路流程被打通
為了實現通用化、性能更強的智能體,Skywork 在底層技術上祭出了多項自研,打造全鏈路智能內容引擎,從深度搜索到高效生成,一站式解決復雜任務。
首先自研一個deep research 模型,通過依托「深度思考 + 推理」的信息檢索,不僅查得更廣與更準,還能更快找到高質量源信息;強化學習能力的加持又進一步增強模型面向各種搜索任務的泛化性,性能上全面對標 OpenAI 競品。
接下來是一套自研的agent workflow 框架,在高效完成傳遞信息、拆解任務之外,還能靈活調用基座大模型,使智能體能力得以延伸。效果也非常顯著,在開源的 deep research 排行榜上拿下了 SOTA 成績。
此外還自研一個生成物模型,實現高質量數據的生成、收集和訓練,使生成內容更豐富、更真實且可讀性更強;配合自研的在線編輯系統,無縫兼容常見辦公軟件,實現一站式內容生成與修改,并能一鍵導出成稿,效率與友好性絕對是拉滿了。
最后,面對特別復雜的任務也有訣竅 ——「化整為零、各個擊破」,即將復雜任務拆分為多個小任務,每個小任務單獨進行深度研究、互不干擾,有效突破了模型上下文長度的限制,支持超復雜任務協同解決。
正是技術上的一系列突破,Skywork 才有了如今敢于叫板一切對手的實力。
Office 的下一次革命來了?
自大模型技術爆發以來,人們一直在尋找應用的突破方向,最先開啟自動化革命的恰恰是寫代碼本身。
現在,很多人都知道自然語言驅動的編程工具 Cursor,它正在吸引越來越多的程序員。人們寫代碼的方式已經發生了變化:先讓 AI 寫一個 readme 列出項目設計思路、功能邏輯,然后再讓 AI 一步一步地實現就可以了。
Cursor 也讓編程門檻降到了一個前所未有的低點,號稱讓非程序員也能參與開發。只要你能描述清楚需求,Cursor 就能幫你生成專業級的代碼。
同樣地,超級智能體帶來的能力,就像是 Office 版本的 Cursor。無論是制作文檔、表格、PPT,還是生成網頁或播客,它都可以根據你提出的需求快速進行生成,節省你大量的工作時間。
隨著智能體成為 AI 產業界的核心關鍵詞,它已過了秀概念的階段,并開始了從技術展示向場景落地、從工具層向系統層的過渡。此次,Skywork 的推出不僅印證了中國 AI 企業在智能體領域具備了與國際對手抗衡乃至超越的實力,而且預示了接下來在該 AI 方向上「技術 + 場景 + 生態」全面交鋒的趨勢。
對于昆侖萬維來說,這是一次具有戰略意義的突破。在未來更大的應用前景鋪開之前,它用一款全棧自研的超級智能體為自己在市場上贏得了先機。從上手體驗來看,這款產品已經越過了實用化的門檻。
或許過不了多久,大量的工作就會由智能體接手,這何嘗不是辦公全家桶的一次進化?你只需要提出需求,投喂文件資料,確認好細節后,坐等 AI 交作業!
文中視頻&音頻鏈接:https://mp.weixin.qq.com/s/Z90cTpV6t7cwSm7ILdcj_w
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.