4月20日,科大訊飛深度推理大模型——訊飛星火X1迎來全新升級;訊飛方面表示,升級后的星火X1在數學、代碼、邏輯推理、文本生成、語言理解、知識問答等通用任務上效果顯著提升,在模型參數比業界同類模型小一個數量級的情況下,整體效果對標OpenAI o1和DeepSeek R1。
訊飛方面表示,星火X1除了在常見通用任務取得顯著進步之外,由于融入了更多場景復雜類型數據,模型的泛化性也取得了進步,在教育、醫療、司法等領域表現明顯。
面向企業和廣大開發者,訊飛星火X1首發“快思考、慢思考統一模型”,全新升級模型定制優化工具鏈,進一步降低大模型私有化部署和定制門檻;同時,訊飛星火X1 API已上線訊飛開放平臺開放服務,作為首個支持全國產算力微調的推理大模型,訊飛星辰MaaS平臺同步上線了星火X1微調服務。
據訊飛方面表示,升級后的星火X1在多個任務上效果繼續突破,展現出優異的性能,根據最新測試集評測結果,星火X1在通用任務效果評測中全面對標OpenAI o1和DeepSeek R1,在數學、知識問答等方面表現突出。
數學答題和復雜的數理邏輯推理方面,星火X1能夠準確識別出復雜的數學公式,不僅給出完整的解題思路,輸出結果也嚴謹清晰;在邏輯推理時全方位思考,思考可能出現的每一種假設,表現出更強的嚴謹性和準確性。代碼能力上,星火X1不僅提高了代碼生成的準確率,對生成代碼邏輯理解也進一步提升,能夠應對更復雜的編程需求,思考問題的多種可能性,幫助開發者快速實現功能。在語言理解方面,模型輸出內容、格式更加符合用戶指令要求,能夠給到更加準確且深度思考的結果,生成內容更加連貫、準確。
此外,星火X1的長思維鏈能力支持圖像輸入,可以對輸入的圖像進行關聯思考,對于圖像中的多種復雜元素,探究可能的含義和目的,進行更深層次的信息整合和推理。
本次星火X1升級不僅提升了通用能力,也同步增強了面向行業的解決方案能力;以司法行業為例,對于行業專業需求,例如根據材料總結案件事實以及判決理由,升級后的星火X1能夠精準把握用戶指令,詳細分析爭議點,快速定位關鍵信息,并輸出準確內容,為行業用戶提供專業、可靠的智能支持。
在技術創新和模型部署方面,星火X1首發“快思考、慢思考統一模型”,由一個模型同時支持兩種思考模式,提升了模型處理不同復雜度任務的能力,滿血版星火X1僅需4張卡(華為910B)即可部署,簡化了私有化部署流程。
同時,星火X1還全新升級了模型定制優化工具鏈,支持SFT(監督微調)、強化學習兩種模型定制優化方案,只需16張卡(華為910B)即可完成行業定制優化,有效降低了企業AI的定制門檻。
訊飛星火X1的全新升級背后,是一系列獨特的技術創新與理念突破。
首先,提出基于問題難度的大規模多階段強化學習方法,在復雜推理、數學、代碼、語言理解等場景全面提升模型效果及泛化性;同時提出強化學習動態更新算法,基于樣本采樣長度動態調整強化學習更新速度,進一步提升深度思考強化學習效率及效果。
其次,統一模型下的快慢思考混合訓練方法,充分發揮快慢思考數據相互促進作用,實現基于系統指令控制模型是否深度思考,支撐下游更高效便捷地部署使用;
第三,實現多項工程技術創新,顯存動態卸載技術大幅提升長文本推理并發、訓推共卡協同實現高效訓推資源轉換、推理引擎冬眠機制實現快速拉起和恢復,實現國產算力平臺上高效和穩定的強化學習訓練全流程。
訊飛表示,在中美科技競爭日趨激烈的背景下,星火X1選擇的全國產化技術路徑更具深遠意義。最近,科大訊飛與華為昇騰聯合團隊在前期工作基礎上再獲突破,升級MoE模型的PD分離+大規模專家并行系統方案,實現了集群推理性能翻番,包括PD分離部署提升20%+性能、MTP多token預測技術提升30%+整體性能、專家負載均衡算法優化使集群吞吐提升30%+,以及異步雙發射技術降低服務請求調度耗時提升10%系統性能。(平章)