網易首頁 > 網易科技 > 網易科技 > 正文

訊飛星火X1升級突破：推理性能比肩全球一流水平

2025-04-21 17:06:28　來源: 網易科技報道

北京舉報

分享至

4月20日，科大訊飛深度推理大模型——訊飛星火X1迎來全新升級；訊飛方面表示，升級后的星火X1在數學、代碼、邏輯推理、文本生成、語言理解、知識問答等通用任務上效果顯著提升，在模型參數比業界同類模型小一個數量級的情況下，整體效果對標OpenAI o1和DeepSeek R1。

訊飛方面表示，星火X1除了在常見通用任務取得顯著進步之外，由于融入了更多場景復雜類型數據，模型的泛化性也取得了進步，在教育、醫療、司法等領域表現明顯。

面向企業和廣大開發者，訊飛星火X1首發“快思考、慢思考統一模型”，全新升級模型定制優化工具鏈，進一步降低大模型私有化部署和定制門檻；同時，訊飛星火X1 API已上線訊飛開放平臺開放服務，作為首個支持全國產算力微調的推理大模型，訊飛星辰MaaS平臺同步上線了星火X1微調服務。

據訊飛方面表示，升級后的星火X1在多個任務上效果繼續突破，展現出優異的性能，根據最新測試集評測結果，星火X1在通用任務效果評測中全面對標OpenAI o1和DeepSeek R1，在數學、知識問答等方面表現突出。

數學答題和復雜的數理邏輯推理方面，星火X1能夠準確識別出復雜的數學公式，不僅給出完整的解題思路，輸出結果也嚴謹清晰；在邏輯推理時全方位思考，思考可能出現的每一種假設，表現出更強的嚴謹性和準確性。代碼能力上，星火X1不僅提高了代碼生成的準確率，對生成代碼邏輯理解也進一步提升，能夠應對更復雜的編程需求，思考問題的多種可能性，幫助開發者快速實現功能。在語言理解方面，模型輸出內容、格式更加符合用戶指令要求，能夠給到更加準確且深度思考的結果，生成內容更加連貫、準確。

此外，星火X1的長思維鏈能力支持圖像輸入，可以對輸入的圖像進行關聯思考，對于圖像中的多種復雜元素，探究可能的含義和目的，進行更深層次的信息整合和推理。

本次星火X1升級不僅提升了通用能力，也同步增強了面向行業的解決方案能力；以司法行業為例，對于行業專業需求，例如根據材料總結案件事實以及判決理由，升級后的星火X1能夠精準把握用戶指令，詳細分析爭議點，快速定位關鍵信息，并輸出準確內容，為行業用戶提供專業、可靠的智能支持。

在技術創新和模型部署方面，星火X1首發“快思考、慢思考統一模型”，由一個模型同時支持兩種思考模式，提升了模型處理不同復雜度任務的能力，滿血版星火X1僅需4張卡（華為910B）即可部署，簡化了私有化部署流程。

同時，星火X1還全新升級了模型定制優化工具鏈，支持SFT（監督微調）、強化學習兩種模型定制優化方案，只需16張卡（華為910B）即可完成行業定制優化，有效降低了企業AI的定制門檻。

訊飛星火X1的全新升級背后，是一系列獨特的技術創新與理念突破。

首先，提出基于問題難度的大規模多階段強化學習方法，在復雜推理、數學、代碼、語言理解等場景全面提升模型效果及泛化性；同時提出強化學習動態更新算法，基于樣本采樣長度動態調整強化學習更新速度，進一步提升深度思考強化學習效率及效果。

其次，統一模型下的快慢思考混合訓練方法，充分發揮快慢思考數據相互促進作用，實現基于系統指令控制模型是否深度思考，支撐下游更高效便捷地部署使用；

第三，實現多項工程技術創新，顯存動態卸載技術大幅提升長文本推理并發、訓推共卡協同實現高效訓推資源轉換、推理引擎冬眠機制實現快速拉起和恢復，實現國產算力平臺上高效和穩定的強化學習訓練全流程。

訊飛表示，在中美科技競爭日趨激烈的背景下，星火X1選擇的全國產化技術路徑更具深遠意義。最近，科大訊飛與華為昇騰聯合團隊在前期工作基礎上再獲突破，升級MoE模型的PD分離+大規模專家并行系統方案，實現了集群推理性能翻番，包括PD分離部署提升20%+性能、MTP多token預測技術提升30%+整體性能、專家負載均衡算法優化使集群吞吐提升30%+，以及異步雙發射技術降低服務請求調度耗時提升10%系統性能。（平章）