訊飛星火X1,作為業界唯一基于全國產算力訓練的深度推理大模型,在4月20日迎來了全新升級,此次升級不僅在數學、代碼、邏輯推理、文本生成、語言理解、知識問答等常用的通用任務上取得了顯著的進步,還同步增強了面向行業的解決方案能力,助力產業智能化轉型,由于融入了更多場景復雜類型數據,模型的泛化性也得到了提升,多個行業任務上展現出了業界領先的能力,如在教育、醫療、司法等重點行業進一步擴大了領先優勢。
針對企業和開發者的創新
針對企業和開發者,訊飛星火X1首發“快思考、慢思考統一模型”,全新升級模型定制化工具鏈,降低了大模型私有化部署和定制門檻;此外,訊飛開放平臺已上線星火X1 API,作為首個支持全國產算力微調的推理大模型,訊飛星辰MaaS平臺同步上線了星火X1微調服務。
通用能力比肩國際頂尖模型水平
全新升級后的訊飛星火X1,在多個任務效果上繼續突破,性能表現優異。根據最新測試集評測結果,星火X1在通用任務效果評測中全面對標OpenAI o1和DeepSeek R1,在數學和知識問答等方面表現尤為突出。
測試集合來源:自建測試集+公開測試集
備注:自建測試集(訊飛星火APP、星火大模型API、業界主流任務數據)、公開測試集(數學、答題、推理、代碼等外部典型測試集)
在數學答題和復雜的數理邏輯推理能力方面,星火X1能夠準確識別出復雜的數學公式,不僅提供完整的解題思路,而且輸出結果也更加嚴謹清晰;在邏輯推理時,星火X1能夠全方位思考,考慮各種可能的假設,表現出更強的嚴謹性和準確性。
在代碼能力方面,星火X1在提高了代碼生成的準確率,并提升了對生成代碼的邏輯理解,能夠應對更為復雜的編程需求,幫助開發者快速實現功能。在語言理解方面,模型輸出內容、格式更加符合用戶指令要求,生成內容更加連貫、準確。
此外,星火X1具備長思維鏈能力,支持圖像輸入,可以對輸入的圖像進行關聯思考,探究圖像中的多種復雜元素,進行深層次的信息整合和推理。
盡管星火X1的模型參數比業界同類模型小一個數量級,但其整體效果已經能夠對標OpenAI o1和DeepSeek R1,再次證明了基于國產算力訓練的大模型具備登頂業界最高水平的實力和持續創新的潛力。
行業應用領先,簡化部署流程
星火X1在多個行業任務上展現了業界領先的能力。以司法行業為例,升級后的星火X1能夠精準把握用戶指令,詳細分析爭議點,快速定位關鍵信息,并輸出準確內容,為用戶提供專業、可靠的智能支持。
測試集合來源:真實場景測試集
在技術創新和模型部署方面,星火X1首發“快思考與慢思考統一模型”,一個模型同時支持兩種思考方式,提升了處理不同復雜度任務的能力。滿血版星火X1僅需4張華為910B卡即可部署,簡化了私有化部署流程。同時,星火X1還全新升級了模型定制優化工具鏈,支持監督微調(SFT)和強化學習兩種模型定制優化方案,只需16張華為910B卡即可完成行業定制優化,有效降低了企業AI的定制門檻,使各行業能更便捷地落地AI應用價值。
核心技術突破,邁向自主可控新階段
科大訊飛和華為昇騰聯合團隊在前期工作的基礎上再獲突破:通過升級MoE模型的PD分離和大規模專家并行系統方案,實現了集群推理性能翻番。具體包括PD分離部署提升20%+性能、MTP多token預測技術提升30%+整體性能、專家負載均衡算法優化使集群吞吐提升30%+,以及異步雙發射技術降低服務請求調度耗時提升10%系統性能。
在中美科技競爭日趨激烈的背景下,星火X1選擇的全國產化技術路徑具有深遠意義。正如科大訊飛董事長劉慶峰所說:“訊飛星火大模型代表了完全自主可控大模型中國能達到的高度。”
科大訊飛董事長劉慶峰
正因為一直堅持自主可控算法創新和系統工程創新,基于國產算力的星火大模型能夠快速迭代進步,在實際應用場景中取得顯著效能優勢。此次訊飛星火X1的全面升級,不僅展示了中國人工智能技術在國產算力平臺上的創新突破,也為各行各業的數字化轉型提供了新的可能性。作為基于國產算力訓練的大模型代表作,星火X1的表現證明,在技術自主可控的道路上,中國AI已具備與國際頂尖模型同臺競技的實力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.