始智AI wisemodel.cn社區是源自中國的中立開放的AI開源社區。正在,歡迎加入共同成長。wisemodel社區上線,價格實惠,靈活方便,支持在線微調訓練模型,及和,并。
2025年,AI已超越單純的內容生成工具范疇,正逐步成為各行各業不可或缺的“第二大腦”。隨著GPT-4.5、DeepSeek等新一代大模型的迅猛崛起,已然邁入Agentic AI(智能體AI)時代。這類AI不僅具備流暢對話的能力,更擁有思考、執行與協作的功能,正在深刻重塑整個生產力范式。
在AI Coding領域,開發者的角色從單純的代碼編寫者轉變為架構師和指揮官;Deep Research方面,安全研究員借助“超級助手”,使漏洞分析效率得到極大提升;而在Security Copilot領域,SecGPT也不再局限于提示詞工具,成為實戰中得力的“作戰參謀”。
云起無垠從模型訓練、數據構建、能力評測,到安全Copilot應用,打造出了更聰明、更安全、更懂安全的SecGPT 2.0。它最核心的亮點在于重新定義了安全AI—不再是聊天機器人,而是能調度工具、閉環任務、深度理解攻防邏輯的「安全智能體核心引擎」,以開源形態推動安全生產力范式革命。現已上線始智AI-wisemodel開源社區,并在AI市場-鏡像廣場支持云起無限/SecGPT-14B一鍵創建在線體驗或者API服務,歡迎體驗。
模型地址
https://www.wisemodel.cn/models/clouditera2025/SecGPT-14B-GGUF
01.
什么是SecGPT
SecGPT能做什么?
SecGPT融合了自然語言理解、代碼生成、安全知識推理等核心能力,已能勝任多種關鍵安全任務:在漏洞分析上,可識別漏洞成因、評估影響范圍并提出修復建議;在日志/流量溯源方面,能輔助分析攻擊鏈、復原攻擊路徑;異常檢測時,可解析網絡行為并判斷是否存在潛在威脅;攻防推理中,支持紅隊演練與藍隊研判,完成多輪策略分析;命令解析能識別腳本意圖、揭示潛在風險操作;知識問答則成為團隊“即問即答”的安全知識庫。
更重要的是,這些能力不再局限于“能回答”,而是可以被“調用”、“組合”、“協同”執行,從而支撐起復雜的安全智能任務流。
SecGPT定位:安全智能體的核心引擎
在“云起AI安全大腦”體系中,SecGPT是整個系統的統一語言理解與推理核心。
在“云起AI安全大腦”體系中,SecGPT是整個系統的統一語言理解與推理核心。它能理解自然語言,大幅降低使用門檻,助力非安全專家也能輕松上手;同時融合安全知識,具備上下文關聯與多步推理能力,還擁有智能體持續優化、自我增強的持續學習反饋能力。
無論是作為單點智能助手,還是嵌入式任務引擎,SecGPT都已具備強大的適配性、擴展性與安全可控性。
02.
為什么持續更新SecGPT?
自2023年SecGPT開源以來,大語言模型技術持續突飛猛進。從語言理解到邏輯推理,再到工具調用與多任務協同,行業標準幾經更替,邁入智能體(Agentic AI)時代。與此同時,云起無垠也在持續推進商業版安全大模型 SecGPT Pro 的多輪迭代,核心能力已實現代際躍升。
但開源版本仍停留在早期階段,在語言表達、安全理解與接口兼容性方面逐漸顯現出技術邊界,難以應對當前復雜多變的安全任務需求。因此決定對SecGPT開源模型進行全面升級,持續回饋全球安全社區,并助推安全智能體在更多場景中的落地與演化。
1、模型基礎設施演進,舊模型能力邊界暴露
大語言模型領域的基礎設施已發生底層變動,與早期模型相比,新一代模型具備更長的上下文處理能力、更高效的注意力機制、結構更清晰的工具調用接口,以及支持Agent工作流的任務控制能力,例如支持MCP協議、ReAct思維鏈、Routing插件架構、Function Calling、工具上下文記憶、部署端的量化控制與微調架構等,這些都已成為安全智能體設計中的“新基礎”。
而一旦開源模型長期不更新,就會面臨一系列技術脫節問題:無法適配新一代推理引擎(如vLLM、TGI),無法兼容結構化插件調用(Function/API調度),缺失任務鏈調度能力(Task-Aware Routing),微調體系也無法與最新安全數據對齊(SFT+RLHF+RAG混合)。隨著智能體形態的普及,這種能力缺口會迅速放大,直接影響用戶體驗和模型落地價值。
2、安全任務結構升級,模型能力多維要求
早期模型使用者多集中于問答類任務,例如安全知識普及、命令解析、腳本理解等。這類任務主要依賴語言理解能力,結構相對簡單。然而,當安全模型真正進入研發、攻防、運營等實際場景后,任務呈現出明顯的結構化、多輪化、工具化趨勢:比如漏洞鏈條重建需要多日志輸入與多階段因果推理,多語言項目審計涉及代碼上下文建模與跨文件引用分析,安全知識圖譜構建要進行實體/關系抽取與圖結構生成,安全運營協同則離不開工具調度、狀態反饋及報告輸出。
這類任務要求模型不僅具備語義理解能力,還要擁有推理路徑構建能力(Chain-of-Thought/Tree-of-Thought)、知識檢索與融合能力(用于語境增強與準確性提升)、任務規劃與階段控制能力(支持多輪次有狀態任務執行)以及多工具協同使用能力(如模糊測試+漏洞掃描+資產識別)。
原有SecGPT模型架構難以完成上述能力組合,僅靠 Prompt 注入或零樣本提示遠遠不夠。
3、現實挑戰:通用模型無法替代專業安全模型
盡管DeepSeek、Qwen、LLaMA等開源大模型在通用語言理解、代碼生成等任務中取得顯著進展,但在安全場景下,它們面臨以下結構性瓶頸,尤其在企業級私有部署環境中更為突出:
1)知識盲區廣泛,缺乏關鍵安全語料支撐
通用模型訓練語料以開放領域為主,嚴重缺乏如下高價值安全語料:滲透測試日志、攻擊鏈行為樣本、系統調用軌跡、漏洞利用(PoC/Exp)、紅隊審計報告等。這直接限制了其對實戰攻防細節的掌握能力。
2)語義建模能力薄弱,缺乏安全背景意識
在漏洞成因理解、系統語境建模、協議行為解析等任務中,通用模型的理解能力多停留在淺層表述,無法進行因果鏈條建模與深層語義推理,缺乏“攻防語境”下的專業認知。
3)工具接口調用不精準,缺失系統適配能力
通用模型未針對安全工具(如模糊測試框架、漏洞掃描器、靜態分析引擎等)進行微調和適配,導致在調用第三方接口時經常出現參數配置錯誤、上下文不匹配、調用邏輯混亂等問題,嚴重影響任務可執行性和穩定性。
4)任務鏈結構理解缺失,推理與執行脫節
安全任務往往涉及多步推理(理解 → 分析 → 調用工具 → 收集反饋 → 修復建議),通用模型缺乏對這類“任務鏈”結構的建模能力,常常出現中途跳躍、邏輯斷裂、輸出不可收斂等現象,無法勝任復雜工作流調度任務。
當前通用大模型在安全場景中往往表現為“語言流暢但邏輯混亂,表達順暢但結果失真”。在真實系統環境下,其輸出容易出現答非所問、指令不收斂、工具調用失敗、上下文錯亂等問題,難以支撐企業對安全智能體高可信、高精度、高可控的實際需求。
03.
SecGPT能力提升維度
本輪升級,云起無垠同步發布了1.5B / 7B / 14B三個模型規格,全面適配從低配CPU、本地4090 GPU到企業級多卡集群等多種運行環境,實現大模型能力的普適化落地。更大規模的32B、72B、671B旗艦版也將在后續分批開放,進一步支撐企業級復雜安全任務的多輪推理與智能決策。
1、更強的基座能力:通用+安全深度融合
云起無垠基于Qwen2.5-Instruct系列與DeepSeek-R1系列基座模型,結合自建安全任務集與安全知識庫,在8臺A100 GPU集群上持續訓練一周以上,完成大規模預訓練 + 指令微調 + 強化學習,顯著提升模型在安全場景中的理解、推理與響應能力。
下圖展示了一次訓練過程中各關鍵指標的演化軌跡:
訓練與驗證損失(train/loss 與 eval/loss):二者均呈現出平穩下降趨勢,說明模型在訓練集與驗證集上均持續收斂,未出現過擬合跡象。
學習率曲線(train/learning_rate):采用典型的 Warmup + 衰減策略,有效提升了早期訓練的穩定性與收斂速度。
梯度范數(train/grad_norm):整體波動平穩,僅在少數步數存在輕微尖峰,未出現梯度爆炸或消失,表明訓練過程健康穩定。
評估表現:eval/runtime與 eval/samples_per_second波動范圍小,說明在評估過程中系統資源使用高效,推理吞吐量穩定。
其他指標:如訓練輪數(train/epoch)、輸入token 數量(train/num_input_tokens_seen)等也表明訓練過程如期進行,達成預期計劃。
模型訓練與評估過程示例圖
2、更大的高質量安全語料庫:私有+公共數據雙輪驅動
云起無垠已構建了一個超大規模、結構完備的網絡安全語料庫,總量超過5TB、共計106,721個原始文件,其中超過40%內容為人工精選與結構化處理。私有數據部分系統整合了具備70+字段 / 14類結構標簽體系的安全數據資源,經過統一清洗、語義標注與重構,構建出數百億 Tokens 級的高質量語料,為大模型深度推理能力提供堅實支撐。
下圖展示了該語料庫的構成維度,整體采集邏輯遵循“理論支撐 — 實戰對抗 — 應用落地”三層結構體系:
理論支撐:涵蓋法律法規、學術論文、行業報告等權威資料,為模型提供穩固的知識基座;
實戰對抗:包括漏洞詳情、CTF題庫、日志流量、惡意樣本與逆向分析等數據,提升模型對真實攻擊行為的識別與追蹤能力;
應用落地:涵蓋安全社區博客、教育培訓資料、安全知識圖譜與自動化策略,增強模型在安全運營、輔助決策等場景中的適配能力。
該技術的亮點在于采用雙輪驅動機制(私有+公共數據),保障了語料在廣度與深度上的協同提升;同時構建了多維標簽體系,使語料具備更強的結構化能力與上下文理解能力;此外,通過三層語料構建邏輯,覆蓋了從知識構建、威脅應對到實戰部署的完整安全任務鏈路。
3、能力躍升:SecGPT正在蛻變為“安全助手”
通過多輪數據優化與任務精調,SecGPT已在多個能力維度實現跨越式進展:它更懂攻擊鏈、攻防語言與行業術語,更擅長處理復雜日志與漏洞描述,也更適配私有化部署、邊緣推理等現實場景。
04.
核心能力提升詳解
1、模型能力評測:全面指標躍升,實戰智能初現
為全面評估 SecGPT 的安全實戰能力,云起無垠構建了一套覆蓋安全證書問答、安全通識、編程能力、知識理解與推理能力的綜合評估體系,主要采用以下標準化數據集:CISSP、CS-EVAL、CEVAL、GSM8K、BBH。
在與原始模型 SecGPT-mini 的對比中,訓練后的模型在所有指標上均實現大幅躍升,具體如下:
1)模型橫向評測對比表
對SecGPT的能力躍升可作如下解讀:從mini到1.5B,其具備了“能答對”的基礎問答能力,可適配中低復雜度任務;從1.5B到7B,推理深度和泛化能力顯著增強,能夠理解任務意圖并構建較為完整的解決路徑;而從7B到14B,能力則躍遷至“類專家”級,能夠處理高復雜度推理、安全策略制定等高階任務。
2)模型橫向評測對比
相較于基礎模型 Qwen2.5-Instruct,SecGPT 在所有評測指標上均實現實質性超越,反映出在數據構建、微調范式、安全任務精調機制上的整體優化成效:
此次的洞察亮點在于,在CISSP和CS-EVAL等安全類數據集上,SecGPT在所有參數規模下的表現均優于Qwen2.5同規格版本,這表明所構建的安全任務指令集與精調策略已顯著提升了模型的實戰應用能力與專業問答深度。
2、
安全能力提升:更全、更準、更專業
本輪升級中,SecGPT在安全知識問答方面完成了從信息整合到邏輯輸出的能力躍遷,具體體現在:
知識覆蓋更全面:引入了涵蓋法律法規、攻擊戰術、逆向分析等14類安全知識領域的結構化語料;
答案生成更精準:通過多輪對話控制與語義優化技術,提升了問答對齊率與上下文記憶穩定性;
推理能力更突出:具備多段知識聯結與復合邏輯推演能力,能完成如攻擊鏈分析、威脅研判等復雜任務。
1)滲透測試場景能力
SecGPT 能夠模擬滲透攻擊流程,從信息收集、漏洞利用到提權橫向,具備關鍵工具命令分析、Payload 構造、利用鏈生成等能力。
2)日志分析和流量分析能力
在安全日志與網絡流量場景下,SecGPT 能自動識別異常事件、構建攻擊鏈圖譜、抽取關鍵 IOC(Indicator of Compromise),輔助完成事件溯源與告警分類。
3)逆向分析能力
基于對反匯編、API 調用序列、加殼行為等低層數據的理解,SecGPT 能輔助完成惡意樣本的靜態分析、特征提取與家族歸類,具備一定的逆向輔助解讀能力。
4)代碼審計能力
import java.util.*;
import java.util.stream.Collectors;
public class AverageCalculator {
public static double calculateAverage(Object input, boolean strict) {
if (strict) {
System.out.println("Running in STRICT mode");
@SuppressWarnings("unchecked")
List
numbers = (List
) input; double total = 0; for (Number num : numbers) { total += num.doubleValue(); } return total / numbers.size(); } else { System.out.println("Running in SAFE mode"); List
parsed = parseInputSafe(input); double total = parsed.stream().mapToDouble(Double::doubleValue).sum(); return total / parsed.size(); } } public static List
parseInputSafe(Object input) { List
result = new ArrayList<>(); if (input instanceof String) { String s = (String) input; if (!s.matches("\\d+")) { throw new IllegalArgumentException("String must contain only digits."); } for (char c : s.toCharArray()) { result.add(Double.parseDouble(String.valueOf(c))); } } else if (input instanceof List ) { for (Object obj : (List ) input) { try { result.add(Double.parseDouble(obj.toString())); } catch (NumberFormatException e) { throw new IllegalArgumentException("Invalid element in list: " + obj); } } } else { throw new IllegalArgumentException("Unsupported input type: " + input.getClass()); } return result; } public static void main(String[] args) { List
testCases = Arrays.asList( new TestCase("12345", false), new TestCase("12345", true), new TestCase(Arrays.asList(1, 2, "3", "4"), false), new TestCase(Arrays.asList(1, 2, 3, "four"), false), new TestCase(Arrays.asList(1, 2, 3, "four"), true) ); for (int i = 0; i < testCases.size(); i++) { TestCase tc = testCases.get(i); System.out.println("\n--- Test Case " + (i + 1) + " | strict=" + tc.strict + " ---"); try { double avg = calculateAverage(tc.input, tc.strict); System.out.println("? Average: " + avg); } catch (Exception e) { System.out.println("? Error: " + e.getMessage()); } } } static class TestCase { Object input; boolean strict; TestCase(Object input, boolean strict) { this.input = input; this.strict = strict; } } }
5)工具使用
05.
從評測到實踐,推動安全智能體發展
1. 發布首份網絡安全大模型基準評測報告
首份網絡安全大模型能力評測與選型報告將發布,圍繞威脅情報問答、代碼審計、日志分析等典型場景,構建一套系統化、透明且可復現的評測體系,全面對比當前主流模型的能力邊界。這份報告不僅為安全技術社區提供清晰的對比依據,也將成為合作伙伴制定Fine-tune策略 和智能體架構選型的關鍵參考材料。
2. 全面復盤:如何訓練一個真正“懂安全”的大模型
盡管通用大模型在語言理解領域已取得顯著進展,但能夠真正理解攻擊鏈邏輯、漏洞細節、勝任安全推理與實戰輔助的大模型仍然稀缺。云起無垠將以全棧視角,全面復盤“如何訓練一個好用的安全大模型”,包括高質量安全訓練數據構建、模型架構調優、多任務對齊訓練、能力評測體系設計等關鍵環節,打通數據→算法→評測的閉環路徑,推動安全智能體的實用化落地。
3. 自動化 CTF 解題能力建設:邁向安全智能體的第一步
云起無垠正在持續推進SecGPT在CTF解題任務中的自動化能力,目標是實現“理解題意 → 推理思路 → 構造Payload → 完成解題”的閉環流程。
目前模型已在大量真實題目中完成微調,具備初步能力:理解題意與還原考點,自動構造注入、命令執行、ROP等攻擊鏈,解釋與變換攻擊命令含義,同類題型的遷移泛化表現良好。
下一步將聚焦標準化數據構建、解題評分指標、自動解題Agent原型開發,以及聯合社區開展實戰挑戰驗證。CTF場景將成為安全大模型邁向Agent化的典型突破口。
4. 安全訓練數據集逐步開放,共建數據基座
云起無垠正在建設并逐步開放一批具備混合結構、場景標簽的高質量安全數據集,覆蓋知識問答、代碼審計、漏洞挖掘、威脅情報解析、流量分析等關鍵任務場景。 未來將支持多語言、多模態、多任務協同訓練,進一步增強安全大模型的泛化能力和實戰適應性。
編輯:成蘊年
----- END -----
wisemodel相關:
系統升級:
系列模型:
關于wisemodel更多
1
歡迎持續關注和支持
開源社區建設需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻和維護,歡迎大家加入wisemodel開源社區的志愿者計劃和開源共創計劃。期待更多開發者將開源成果,包括模型、數據集和代碼等發布到 wisemodel.cn 社區,共建中立、開放的AI開源社區生態。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續關注wisemodel.cn開源社區動態。
2
歡迎加盟wisemodel開源社區
始智AI wisemodel社區自2023年9月上線以來,逐漸成為影響力日益擴大的中立開放的AI開源社區,為了加快公司發展,我們長期需要技術、運營等人才加盟,技術側重在AI infra、后端開發,熟悉K8S、模型訓練和推理等技術, 以及熟悉開發者生態運營的成員,歡迎感興趣的朋友加盟,可以通過添加wisemodel微信,或者將簡歷投遞到郵箱:liudaoquan@wisemodel.cn
3
歡迎投稿優質內容
歡迎投稿分享人工智能領域相關的優秀研究成果,鼓勵高校實驗室、大企業研究團隊、個人等,在wisemodel平臺上分享各類優質內容,可以是AI領域最新論文解讀、最新開源成果介紹,也可以是關于AI技術實踐、應用和總結等。投稿可以發郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。
4
關于wisemodel開源社區
始智AI wisemodel.cn開源社區由清華校友總會AI大數據專委會副秘書長劉道全創立,旨在打造和建設中立開放的AI開源創新社區,將打造成“HuggingFace”之外最活躍的AI開源社區,匯聚主要AI開源模型、數據集和代碼等,歡迎高校科研院所、大型互聯網公司、創新創業企業、廣大個人開發者,以及政府部門、學會協會、聯盟、基金會等,還有投資機構、科技媒體等,共同參與建設AI開源創新生態。
向上滑動查看
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.