網易首頁 > 網易號 > 正文申請入駐

可驗證的Agentic Workflow？MermaidFlow開啟安全、穩健的新范式

2025-07-24 16:05:58　來源: 機器之心Pro

河北舉報

分享至

隨著大語言模型技術的持續突破與火熱發展，AI 智能體正從單點能力邁向復雜系統協作，多智能體系統（Multi-Agent Systems, MAS）成為學術和產業界聚焦的新前沿。在這一背景下，「Agentic Workflow」作為面向智能體自主決策與協作流程自動生成的技術理念，正成為多智能體系統研究和應用的探索熱點。

為提升智能體系統的自主化與智能化，谷歌、上海 AI Lab 等國內外領先團隊陸續推出了Meta-GPT、ADAS、AFlow等創新性 Agentic Workflow 工作，大力推動利用大模型實現任務規劃、分工協作與流程優化的自動化進程。

盡管這些系統能夠靈活的表達工作流，但在自動化搜索工作流的過程中，存在合理性難以保證、可驗證性不足、難以直觀表達等突出挑戰，嚴重制約了多智能體系統的可靠落地與規模化部署。

近日，來自新加坡 A*STAR 的 Centre for Frontier AI Research (CFAR) 研究所與南洋理工大學的研究團隊聯合發布了創新性工作流框架「MermaidFlow」，推動智能體系統邁向結構化進化與安全可驗證的新范式。

論文鏈接：https://arxiv.org/pdf/2505.22967
GitHub 開源代碼：https://github.com/chengqiArchy/MermaidFlow

Mermaid 破局：

讓結構式工作流表達取代腳本混戰

傳統瓶頸：命令式腳本使工作流頻頻「翻車」

在現有多智能體系統中，大模型生成的工作流往往以 Python 腳本或 JSON 樹等命令式（imperative）代碼直接輸出，ADAS, AFlow 等主流系統也普遍采用了這種表達范式。這種低層次、混雜的生成方式，將流程規劃與具體實現深度耦合，結構信息隱含在復雜代碼中，直接導致了以下三大核心瓶頸：

結構不透明：工作流整體架構深藏在雜亂代碼里，流程關系難以一目了然，協作全局難以把控。
合理性難驗證：流程邏輯與實現細節高度耦合，缺乏靜態檢查和自動驗證機制，容易隱藏致命漏洞。
調試與優化困難：錯誤往往只有在實際運行時才暴露，流程復現、問題定位和后續優化極為低效。

MermaidFlow: 引領結構化與可驗證工作流表達

MermaidFlow 以結構化圖語言 Mermaid 為基礎，提出了一種全新的工作流表達機制。不同于直接輸出可執行腳本的方式，MermaidFlow 強調將智能體行為規劃過程顯式建模為結構化流程圖譜，并引入形式化語義，確保流程清晰、可查、可驗證。

相比傳統的 Python/JSON 腳本，基于 Mermaid 的工作流表達具有以下核心特點：

圖式結構清晰可見：每一個智能體定義、依賴關系、數據流都被結構化地表達成圖中的節點與連邊，使整個工作流一目了然、可交互、可審查.
流程驗證內嵌其中：MermaidFlow 引入了多類語義約束（如依賴閉環、角色一致性、輸入輸出類型匹配等），支持靜態結構驗證與生成時一致性檢查，避免生成不符合規則的圖。
天然支持演化與調試：結構化工作流圖更易于進行片段級替換、增量修復與版本比較，支持可控的演化式優化（見后節）。

圖1 MermaidFlow：從結構化圖到可驗證執行的一站式工作流表達閉環。左側部分展示了基于 Mermaid 的聲明式工作流表達，結構清晰、依賴顯式，具備良好的人類可讀性。人們可以清晰得知道, 在該工作流中存在什么節點, 他們之間的連接情況是怎么樣的。

借助 MermaidFlow 所提出的結構化圖式表達，多智能體協作的工作流規劃過程不再是脆弱難控的黑盒編排，而是具備清晰結構、可視節點與可驗證語義的「白盒流程」。這種方式極大地提升了Agentic Workflow 的可解釋性、可驗證性與后續演化的可操作性，為大規模部署打下堅實基礎。

作者研究發現大語言模型對Mermaid 語言具備天然的生成優勢。這也讓MermaidFlow 與 LLM 的結合變得格外絲滑又強大?

MermaidFlow 中的安全演化策略：

工作流的自我升級之道

MermaidFlow 基于Mermaid 語言對智能體工作流進行顯式建模，使每個任務節點、數據依賴與執行順序都成為可視、可解析、可操作的語義單元。相比傳統的命令式腳本，結構化表達更具模塊化特性，支持按節點插入、刪除與替換，天然適配圖級別的優化操作。每一次結構調整都具備清晰的語義邊界，顯著降低了修改的不確定性與調試復雜度

得益于 MermaidFlow 引入的靜態驗證機制（如節點類型匹配、輸入輸出閉環、角色一致性等約束），每一代演化生成的工作流候選都能在生成階段就進行結構合規性檢查，過濾掉語義不完整或存在潛在風險的「劣質圖」。這種「先驗校驗 + 后驗優化」的策略，顯著提高了搜索空間的質量和魯棒性，避免了大量無效或不合法的探索路徑

圖 2 MermaidFlow 的安全演化式優化流程概覽。本系統以結構化的 Mermaid 圖表達作為工作流起點，通過安全約束的進化算法（Safety-Aware Evolutionary Programming）在類型保持（typed）、結構可感知（structure-aware）、靜態可驗證（static verifiable）等維度上持續優化工作流結構。

實驗性能

MermaidFlow 不再依賴具備強編程能力的大語言模型，也能生成高質量的工作流。在 GSM8K、MATH、HumanEval、MBPP 等多個主流任務數據集上，MermaidFlow 均展現出優秀的性能，體現出較強的實用價值。更關鍵的是，得益于結構化表達與靜態可驗證機制，MermaidFlow 在進化流程中生成可執行且結構合理工作流的成功率超過 90%，相比于傳統基于腳本拼接的方法，極大提升了智能體系統的可控性和魯棒性，為智能體系統的穩健部署提供了堅實的支撐。

圖 3 MermaidFlow 在主流任務上的評測結果。

下圖展示了 MermaidFlow 在結構化表示下的進化過程示例。得益于每個節點及其連接關系均具備明確的語義邊界，系統能夠便捷且安全地進行局部片段的替換、重組與演化操作（如 crossover、節點替換、連邊調整等）。圖中演示了系統如何通過對 Workflow 5 和 Workflow 4 進行 crossover 操作，生成結構更健壯的 Workflow 8，引入了更優的 ensemble 與 test 模塊。這一結構可控的演化機制，有效提升了工作流生成過程的安全性、可控性與可維護性。

圖 4 MermaidFlow 靈活的工作流進化合成過程。

結語

隨著多智能體系統和大模型 AI 持續演進，如何實現結構化、可驗證與高效進化的工作流，已成為智能體研究的重要命題。MermaidFlow 提出的結構化可驗證工作流表達方式，為智能體系統實現高效、可控的協作流程提供了基礎支撐。未來的 AI 協作，也許正需要這樣一套「看得見、查得清、能進化」的流程底座。隨著應用領域的不斷拓展與工程落地，這一框架有望為智能體生態的持續進步提供有益參考。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.