99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

可驗證的Agentic Workflow?MermaidFlow開啟安全、穩健的新范式

0
分享至



隨著大語言模型技術的持續突破與火熱發展,AI 智能體正從單點能力邁向復雜系統協作,多智能體系統(Multi-Agent Systems, MAS)成為學術和產業界聚焦的新前沿。在這一背景下,「Agentic Workflow」作為面向智能體自主決策與協作流程自動生成的技術理念,正成為多智能體系統研究和應用的探索熱點。

為提升智能體系統的自主化與智能化,谷歌、上海 AI Lab 等國內外領先團隊陸續推出了Meta-GPT、ADAS、AFlow等創新性 Agentic Workflow 工作,大力推動利用大模型實現任務規劃、分工協作與流程優化的自動化進程。

盡管這些系統能夠靈活的表達工作流,但在自動化搜索工作流的過程中,存在合理性難以保證、可驗證性不足、 難以直觀表達等突出挑戰,嚴重制約了多智能體系統的可靠落地與規模化部署。

近日,來自新加坡 A*STAR 的 Centre for Frontier AI Research (CFAR) 研究所與南洋理工大學的研究團隊聯合發布了創新性工作流框架「MermaidFlow」,推動智能體系統邁向結構化進化與安全可驗證的新范式。



  • 論文鏈接:https://arxiv.org/pdf/2505.22967
  • GitHub 開源代碼:https://github.com/chengqiArchy/MermaidFlow

Mermaid 破局:

讓結構式工作流表達取代腳本混戰

傳統瓶頸:命令式腳本使工作流頻頻 「翻車」

在現有多智能體系統中,大模型生成的工作流往往以 Python 腳本或 JSON 樹等命令式(imperative)代碼直接輸出,ADAS, AFlow 等主流系統也普遍采用了這種表達范式。這種低層次、混雜的生成方式,將流程規劃與具體實現深度耦合,結構信息隱含在復雜代碼中,直接導致了以下三大核心瓶頸:

  • 結構不透明:工作流整體架構深藏在雜亂代碼里,流程關系難以一目了然,協作全局難以把控。
  • 合理性難驗證:流程邏輯與實現細節高度耦合,缺乏靜態檢查和自動驗證機制,容易隱藏致命漏洞。
  • 調試與優化困難:錯誤往往只有在實際運行時才暴露,流程復現、問題定位和后續優化極為低效。

MermaidFlow: 引領結構化與可驗證工作流表達

MermaidFlow 以結構化圖語言 Mermaid 為基礎,提出了一種全新的工作流表達機制。不同于直接輸出可執行腳本的方式,MermaidFlow 強調將智能體行為規劃過程顯式建模為結構化流程圖譜,并引入形式化語義,確保流程清晰、可查、可驗證。

相比傳統的 Python/JSON 腳本,基于 Mermaid 的工作流表達具有以下核心特點:

  • 圖式結構清晰可見:每一個智能體定義、依賴關系、數據流都被結構化地表達成圖中的節點與連邊,使整個工作流一目了然、可交互、可審查.
  • 流程驗證內嵌其中:MermaidFlow 引入了多類語義約束(如依賴閉環、角色一致性、輸入輸出類型匹配等),支持靜態結構驗證與生成時一致性檢查,避免生成不符合規則的圖。
  • 天然支持演化與調試:結構化工作流圖更易于進行片段級替換、增量修復與版本比較,支持可控的演化式優化(見后節)。



圖1 MermaidFlow:從結構化圖到可驗證執行的一站式工作流表達閉環 。左側部分展示了基于 Mermaid 的聲明式工作流表達,結構清晰、依賴顯式,具備良好的人類可讀性。人們可以清晰得知道, 在該工作流中存在什么節點, 他們之間的連接情況是怎么樣的。

借助 MermaidFlow 所提出的結構化圖式表達,多智能體協作的工作流規劃過程不再是脆弱難控的黑盒編排,而是具備清晰結構、可視節點與可驗證語義的 「白盒流程」。這種方式極大地提升了Agentic Workflow 的可解釋性、可驗證性與后續演化的可操作性,為大規模部署打下堅實基礎。

作者研究發現大語言模型對Mermaid 語言具備天然的生成優勢。這也讓MermaidFlow 與 LLM 的結合變得格外絲滑又強大?

MermaidFlow 中的安全演化策略:

工作流的自我升級之道

MermaidFlow 基于Mermaid 語言對智能體工作流進行顯式建模,使每個任務節點、數據依賴與執行順序都成為可視、可解析、可操作的語義單元。相比傳統的命令式腳本,結構化表達更具模塊化特性,支持按節點插入、刪除與替換,天然適配圖級別的優化操作。每一次結構調整都具備清晰的語義邊界,顯著降低了修改的不確定性與調試復雜度

得益于 MermaidFlow 引入的靜態驗證機制(如節點類型匹配、輸入輸出閉環、角色一致性等約束),每一代演化生成的工作流候選都能在生成階段就進行結構合規性檢查,過濾掉語義不完整或存在潛在風險的 「劣質圖」。這種 「先驗校驗 + 后驗優化」 的策略,顯著提高了搜索空間的質量和魯棒性,避免了大量無效或不合法的探索路徑



圖 2 MermaidFlow 的安全演化式優化流程概覽。 本系統以結構化的 Mermaid 圖表達作為工作流起點,通過安全約束的進化算法(Safety-Aware Evolutionary Programming)在類型保持(typed)、結構可感知(structure-aware)、靜態可驗證(static verifiable)等維度上持續優化工作流結構。

實驗性能

MermaidFlow 不再依賴具備強編程能力的大語言模型,也能生成高質量的工作流。在 GSM8K、MATH、HumanEval、MBPP 等多個主流任務數據集上,MermaidFlow 均展現出優秀的性能,體現出較強的實用價值。更關鍵的是,得益于結構化表達與靜態可驗證機制,MermaidFlow 在進化流程中生成可執行且結構合理工作流的成功率超過 90%,相比于傳統基于腳本拼接的方法,極大提升了智能體系統的可控性和魯棒性,為智能體系統的穩健部署提供了堅實的支撐。



圖 3 MermaidFlow 在主流任務上的評測結果。

下圖展示了 MermaidFlow 在結構化表示下的進化過程示例。得益于每個節點及其連接關系均具備明確的語義邊界,系統能夠便捷且安全地進行局部片段的替換、重組與演化操作(如 crossover、節點替換、連邊調整等)。圖中演示了系統如何通過對 Workflow 5 和 Workflow 4 進行 crossover 操作,生成結構更健壯的 Workflow 8,引入了更優的 ensemble 與 test 模塊。這一結構可控的演化機制,有效提升了工作流生成過程的安全性、可控性與可維護性。



圖 4 MermaidFlow 靈活的工作流進化合成過程。

結語

隨著多智能體系統和大模型 AI 持續演進,如何實現結構化、可驗證與高效進化的工作流,已成為智能體研究的重要命題。MermaidFlow 提出的結構化可驗證工作流表達方式,為智能體系統實現高效、可控的協作流程提供了基礎支撐。未來的 AI 協作,也許正需要這樣一套「看得見、查得清、能進化」的流程底座。隨著應用領域的不斷拓展與工程落地,這一框架有望為智能體生態的持續進步提供有益參考。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
合作雷佳音沒火,搭檔劉亦菲沒紅,演完陳佩斯《戲臺》,終于紅了

合作雷佳音沒火,搭檔劉亦菲沒紅,演完陳佩斯《戲臺》,終于紅了

小丸子的娛樂圈
2025-07-25 20:25:38
名記透露:開拓者球隊售價預計超過40億美元,楊瀚森是新賣點!

名記透露:開拓者球隊售價預計超過40億美元,楊瀚森是新賣點!

愛體育
2025-07-25 23:15:50
兩性關系:男人年齡過了60歲,大部分男性都會出現哪種狀況?

兩性關系:男人年齡過了60歲,大部分男性都會出現哪種狀況?

伊人河畔
2025-06-30 22:29:45
又反轉!宗馥莉亮出2張底牌,這下宗澤后和3個私生子高興不起來了

又反轉!宗馥莉亮出2張底牌,這下宗澤后和3個私生子高興不起來了

小椰的奶奶
2025-07-25 19:07:39
我和3個男閨蜜來往,老公并不介意,孩子出生后我才明白他的決絕

我和3個男閨蜜來往,老公并不介意,孩子出生后我才明白他的決絕

曉悅流年
2025-07-04 16:05:34
取代楊瀚森?廣東“新王炸”或迎來國家隊首秀,中國男籃第二中鋒

取代楊瀚森?廣東“新王炸”或迎來國家隊首秀,中國男籃第二中鋒

緋雨兒
2025-07-25 13:16:25
陳羽凡做夢也想不到!為他生一個兒子的白百何,會給張思麟生二胎

陳羽凡做夢也想不到!為他生一個兒子的白百何,會給張思麟生二胎

界史
2025-06-20 13:41:29
王晶爆料!劉德華吃素原因大揭秘,竟還每天大量嗑維他命?

王晶爆料!劉德華吃素原因大揭秘,竟還每天大量嗑維他命?

智凌縱橫
2025-07-24 10:01:41
晚年毛主席原諒了很多人,為何唯獨不原諒潘漢年?主席對他寒了心

晚年毛主席原諒了很多人,為何唯獨不原諒潘漢年?主席對他寒了心

溫讀
2025-03-13 18:28:10
剛剛,物理學開始不講道理了!美國石墨烯凍住電子進入量子新大陸

剛剛,物理學開始不講道理了!美國石墨烯凍住電子進入量子新大陸

徐德文科學頻道
2025-07-25 22:09:36
貝索斯享約會夜,55歲新妻穿薄紗裙內搭空氣,標志大嘴似有新填充

貝索斯享約會夜,55歲新妻穿薄紗裙內搭空氣,標志大嘴似有新填充

譯言
2025-07-24 15:33:43
合唱希伯來語歌曲?50多名猶太少年被趕下飛機

合唱希伯來語歌曲?50多名猶太少年被趕下飛機

看看新聞Knews
2025-07-25 20:42:19
這下不吹了!俄烏兩軍連續大戰,打破一個又一個“無敵”武器神話

這下不吹了!俄烏兩軍連續大戰,打破一個又一個“無敵”武器神話

混沌錄
2025-03-27 19:15:22
青島大招:還沒開工的渤海灣大橋,以后就是東北人南下的新路線!

青島大招:還沒開工的渤海灣大橋,以后就是東北人南下的新路線!

天氣觀察站
2025-07-26 01:54:01
上海首批“大齡剩女”已住進養老院,如今的生活全被費翔說中了

上海首批“大齡剩女”已住進養老院,如今的生活全被費翔說中了

健身狂人
2025-07-22 15:21:36
7月25日,河南2025養老金調整方案細則公布,定額27元,3千漲多少

7月25日,河南2025養老金調整方案細則公布,定額27元,3千漲多少

探源歷史
2025-07-25 10:03:56
外交部:中國-歐盟領導人會晤達成重要共識

外交部:中國-歐盟領導人會晤達成重要共識

界面新聞
2025-07-25 15:36:37
現場追星樊振東,平野美宇害羞打招呼!日本世界冠軍秒變迷妹

現場追星樊振東,平野美宇害羞打招呼!日本世界冠軍秒變迷妹

陳意小可愛
2025-07-26 00:44:44
晴天娃娃唐藝昕

晴天娃娃唐藝昕

小椰的奶奶
2025-07-24 09:03:09
東風導彈泄密案:間諜郭萬鈞一家三口,全部被處以死刑

東風導彈泄密案:間諜郭萬鈞一家三口,全部被處以死刑

冰點歷史
2025-07-15 09:33:13
2025-07-26 04:07:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10945文章數 142394關注度
往期回顧 全部

科技要聞

36款熱門車高危智駕場景測試,“團滅”!

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

體育要聞

3年過去了,她還是歐洲杯上最酷的姐

娛樂要聞

汪蘇瀧不忍了 !張碧晨痛失《年輪》演唱權

財經要聞

劉煜輝:當下重要不是找確定性而是轉折點

汽車要聞

李斌一口氣講了近3個小時樂道L90 原因是為啥?

態度原創

教育
旅游
本地
健康
公開課

教育要聞

再獲國際物理奧賽金牌,南師附中學子勇登世界之巔!

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

換個城市過夏天|風拂鹽湖,躲進格爾木的盛夏清涼

呼吸科專家破解呼吸道九大謠言!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 南安市| 商丘市| 岱山县| 菏泽市| 阿图什市| 安康市| 临海市| 逊克县| 洛川县| 万全县| 丹巴县| 日土县| 于田县| 武汉市| 乌拉特前旗| 惠东县| 宁安市| 乐山市| 西昌市| 香格里拉县| 琼中| 祥云县| 同德县| 偃师市| 北辰区| 台北县| 湖南省| 安岳县| 临泽县| 阿合奇县| 安陆市| 休宁县| 德兴市| 运城市| 梨树县| 乐陵市| 泰来县| 赤水市| 宜春市| 嫩江县| 屯昌县|