在 AI 長文寫作領域,一項革命性突破正在改寫行業規則 —— 由「人工智能之父」Jürgen Schmidhuber 領銜的團隊,正式開源其長文寫作框架WriteHERE。該框架憑借異質遞歸規劃(Heterogeneous Recursive Planning)技術,實現單次生成超4 萬字、100 頁專業報告的能力,在小說創作、報告生成場景中全面超越 Perplexity 付費版「深度研究」、DeepMind 的 Agent's Room 及斯坦福 STORM 等頂尖方案。
- 論文標題:Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models
- 論文地址:https://arxiv.org/pdf/2503.08275
- 項目主頁 & 在線 Demo://writehere.site/
- GitHub 倉庫:https://github.com/principia-ai/WriteHERE
動態規劃顛覆傳統
從「大綱先行」到「實時編織」
現有 AI 長文生成系統(如 Agent's Room、STORM)多將寫作簡化為「規劃 - 填充」的線性流程,而 WriteHERE 首次通過數學形式化揭示:長文寫作本質上是檢索(Retrieval)、推理(Reasoning)、寫作(Composition)三類異構任務的動態編織。
1. 寫作代理系統的五元組定義
研究團隊將寫作系統抽象為數學元組:
其中:
這一形式化框架突破了傳統 AI 寫作工具「重生成、輕管理」的設計范式。寫作不再是簡單的文本擴展,而是記憶空間、工作空間與外部環境的持續交互過程。
2. 任務類型的數學建模
研究團隊將寫作過程解構為三類原子操作:
規劃問題的形式化革命
從 HTN 到異質遞歸
研究團隊受層次任務網絡(HTN)規劃啟發,提出寫作規劃問題的數學定義:
解決方案為滿足以下條件的原始操作序列:
- 可執行性:每個操作的前置條件均被滿足。
- 目標達成:最終工作空間狀態符合寫作目標。
核心技術
異質性遞歸與狀態化 DAG 任務管理
WriteHERE 的核心突破體現在兩大技術創新:
1. 異質任務遞歸分解:每個寫作任務被動態標注類型(檢索 / 推理 / 寫作),并基于類型分解為子任務,直至可執行的原子任務。例如,當執行「撰寫貿易報告第六章:行業深度剖析:識別贏家與輸家」,系統進一步分解為以下子任務:
- 檢索任務:收集最新 (截至 2025 年 4 月) 的行業數據,包括科技 (半導體、軟件、硬件)、汽車、農業、制藥 / 醫療保健、能源和消費品行業的貿易統計、市場份額、公司財務表現、行業報告及專家評論。
- 推理任務(8 個子任務):構建統一分析框架,確立「贏家」和「輸家」識別標準;分別分析科技、汽車、農業、制藥 / 醫療保健、能源和消費品行業的關稅、非關稅措施、宏觀經濟狀況及全球價值鏈重構影響;規劃行業績效對比可視化內容。
- 寫作任務(8 個子任務):撰寫章節引言;分別撰寫科技、汽車、農業、制藥 / 醫療保健、能源和消費品六大行業的詳細分析;撰寫章節結論,綜合關鍵發現并過渡至下章區域視角。
2. 狀態化層次調度算法:任務依賴關系以有向無環圖(DAG)管理,結合任務狀態(激活 / 掛起 / 靜默)實現自適應執行。該機制確保系統能根據實時反饋動態調整規劃深度,例如在貿易報告中,系統能追蹤每個子任務的狀態,確保在撰寫特定章節(如區域分析)前完成其所有依賴任務(如宏觀經濟影響分析)。
實驗表現
全面碾壓現有方案
團隊在小說創作(Tell me a story 數據集)和技術報告生成(WildSeek 數據集)兩大任務中驗證了 WriteHERE 的優越性:
- 小說寫作:基于 GPT-4o 和 Claude-3.5-Sonnet,WriteHERE 在情節結構、創意性、角色塑造等維度全面領先。當生成長度從 2000 詞擴展至 8000 詞時,其優勢進一步擴大,整體勝率較 Agent's Room 超過 90%(見圖 1)。
- 技術報告:在信息相關性、覆蓋廣度、深度等關鍵指標上,WriteHERE 以接近滿分的表現(平均 4.9/5)超越 STORM 和 Co-STORM。對比移除異質遞歸規劃模塊的消融實驗,性能顯著下降,印證了該設計的核心價值(見圖 2)。
圖 1 小說寫作任務評測
圖 2 報告寫作任務評測
壓力測試
百頁報告生成
研究團隊公開的超100 頁《2025 年 Q2 全球貿易戰深度報告》展現了框架的極致能力:
系統自動構建了一個包含 16 個主要章節、超過 80 個子任務的異質遞歸計劃,涵蓋引言、全球關稅結構、非關稅壁壘、宏觀經濟沖擊、全球價值鏈重構、行業贏家與輸家、地區分析、未來預測等內容。整個生成過程體現了異質遞歸規劃的優勢 —— 系統能夠自動根據需要深入研究特定主題(如美國 232 條款鋼鋁關稅擴張),同時保持對整體結構的把控,確保各章節之間的連貫性和一致性。最終報告包含超過 44,000 字的正文,覆蓋從關稅機制到行業贏家的全面分析。
開源生態與社區反響
作為完全開源(MIT 協議)的框架,WriteHERE 支持開發者自由調用異構 Agent(如專用檢索模型、推理引擎),或將徹底改變長文寫作工具的商業模式。
英偉達高級研究科學家 Enze Xie 試用后評價模型表現驚艷:
社區用戶 @AIExplorer 反饋:
「WriteHERE 太棒了。我把它和 GPT-4o-mini 一起使用,它能有效替代我的大部分 OpenAI 深度搜索。」
知名 AI 領域推特大 V Ben Tossell 更直言:
「這個寫作模型太棒了。」
此刻,長文寫作的「自動化天花板」已被打破。訪問 writehere.site,即可加入這場 AI 寫作的革命。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.