業界從星火X1升級方向來看,科大訊飛目標明確,它要進一步打開垂類行業市場。
文|周路平 趙艷秋
編|牛慧
深度推理模型已經是廠商競爭和企業關注的焦點。
去年以來,深度推理模型掀起了熱潮。由于能模擬人類的系統性思維過程,它在解決復雜問題上的能力顯著提升;在算力層面,DeepSeek通過軟硬技術優化,實現了算力節省和成本降低;科大訊飛成功在全國產算力上跑通相關技術,這些突破都在不斷降低企業的使用門檻。在應用層面,深度推理模型已呈現出廣泛行業應用爆發的趨勢。
為此,包括DeepSeek、科大訊飛、阿里和騰訊,都在今年一季度陸續推出了深度推理大模型。
今年1月,科大訊飛推出推理模型星火X1,并在最近兩個多月,多次對模型能力進行升級迭代。4月20日,訊飛星火X1再次宣布全面升級,在模型參數小一個數量級的情況下,整體效果對標OpenAI o1和DeepSeek R1
業界觀察,從這次升級的情況來看,科大訊飛的定位明確:它要進一步打開垂類行業市場——無論從模型大小的選擇、算力成本降低,還是相關行業數據的采用,亦或是強化學習和微調工具鏈和解決方案,以及“快思考、慢思考統一模型”,都瞄準了行業的落地痛點。星火X1升級后,將在教育、醫療、司法、能源、汽車等多個行業中,加快落地進程
01
全棧國產化大模型,穩站第一梯隊
4月20日,訊飛星火X1再次宣布全面升級。除了之前升級的數學能力,星火X1在代碼、邏輯推理、文本生成、語言理解、知識問答等通用能力上,實現了以小一個數量級的參數規模,即70B大小的模型,整體效果比肩OpenAI o1和DeepSeek R1。
而且,除了常見的通用任務,訊飛星火X1由于融入了更多行業場景的復雜類型數據,其泛化性得到很大提升的同時,在多個行業任務上也展現出業界領先的能力。在重點行業如教育、醫療、司法等進一步擴大了領先優勢。
比如,在專業性很強的司法行業,升級后的星火X1可以根據用戶指令需求,詳細分析案件爭議點,快速定位材料中的關鍵信息,準確總結案件事實以及判決理由。
訊飛星火X1這次全新升級背后,涉及到三大核心技術突破——提出基于問題難度的大規模多階段強化學習方法、統一模型下的快慢思考混合訓練方法,以及多項工程技術的創新。
相比于其他大模型廠商,科大訊飛采用了全國產算力平臺是“獨一份”的,來做大模型訓練和推理,背后是針對國產算力卡適配的大規模投入、技術突破和生態完善。
兩年前,科大訊飛就與華為合作,建設了首個萬卡國產算力平臺“飛星一號”,能支持萬億參數大模型訓練。科大訊飛董事長劉慶峰在今年年初透露,“飛星二號”將在2025年交付使用首批算力
而最近,雙方團隊也基于全國產算力,在模型訓練和推理上取得更大突破。針對MoE(混合專家系統)已成為大模型技術發展的核心趨勢之一,今年3月,訊飛攜手華為突破了在國產算力集群上,MoE模型的大規模跨節點專家并行集群推理,這是繼DeepSeek公布其MoE模型訓練推理方案后,業界首個基于國產算力的全新解決方案。4月,雙方再次通過多種優化手段,將MoE模型集群推理的性能實現翻番。
DeepSeek掀起的熱潮,讓其成為業界新寵,一度對其他大模型廠商帶來了巨大壓力和挑戰。但通過在算法和數據訓練策略上下功夫、算法與國產算力上的技術攻關、工程優化等,訊飛深度推理大模型不僅在行業第一梯隊,還在教育、醫療等行業領域更具優勢。
02
降低行業賽道落地門檻是核心
業界從這次星火X1的升級重點來看,科大訊飛針對行業市場落地面臨的痛點需求,逐一給出了解決方案。
DeepSeek-R1推出后,數智前線獲悉,在行業中,一些客戶場景必須選擇滿血版模型,才能滿足性能上的要求。但滿血版部署至少需要8張卡,算力成本不低。
為此,一些企業選擇先將模型蒸餾到32B,來降低算力花費。“但32B肯定是沒法與滿血版相比的,它適合專屬助手,類似安全規范、律所卷宗搜索、報告生成這種應用。”一位在工業領域的人工智能應用人士告訴數智前線。
這次星火X1滿血版則選擇70B大小的參數量,推出“快思考、慢思考統一模型”,由一個模型同時支持兩種思考模式,讓模型部署僅需4張卡(華為910B),而整體效果對標OpenAI o1和DeepSeek-R1。這樣的考量和創新,應該是基于企業落地的綜合性價比
值得關注的是,此前,一些企業選擇深度推理模型上有些猶豫。“因為它的慢思考時延較長,在一些場景下,用戶等不及。”一位政務行業應用人士告訴數智前線。而星火X1讓企業能根據自身場景要求,選擇不同的思考模式,適配不同的時延要求。
除此之外,訊飛強調星火X1訓練中,融入了更多場景的復雜類型數據。從它的表述來看,不少數據可能來自它的重點賽道,如教育、醫療、司法等。一位教育行業應用人士分析這一做法的重要性。“專業語料的積累、質量和獨特性,可能會成為各大模型競爭的終極戰場。”訊飛也強調,這讓其在“多個行業任務上展現出業界領先的能力”。
產業鏈中非常核心的環節是,企業的私有數據如何與通用模型結合,最終做出行業模型和智能體應用。有行業人士告訴數智前線,今年以來,這方面的技術路線出現了一些變化。
在2023年到2024年間,大家采用的常規模式是,通用大模型結合RAG本地知識庫,在一些更高要求的場景中,則去做模型微調。今年很多企業則通過強化學習方式,將自有數據訓練到模型上去,形成行業小模型
“從我們的業務實踐中發現,強化學習需要的數據量更小,而且深度推理模型,經過強化學習之后,它的推理質量、任務響應力也有很好地提升。”一位金融企業人士說,由于強化學習對硬件需求大幅下降,也讓大量企業能實現更快地落地。
而此次星火X1也全新升級了模型定制優化工具鏈,支持SFT(監督微調)、強化學習兩種模型定制優化方案,可完成行業定制優化。
值得關注的是,科大訊飛大幅降低了模型定制門檻,SFT、強化學習兩種模型定制優化方案只需16張卡(華為910B)之前,對滿血版DeepSeek的SFT,則需要256張卡,僅算力就要投資數千萬元,這讓一般企業望塵莫及。
這一系列降低模型落地的門檻舉措,讓各行各業都可以擁抱AI。而每降低一些門檻,就會激發出更大的長尾市場,進一步推動AI行業應用井噴。
還有一個關鍵的點是,在大模型落地中,企業需要的是智能化的應用,而不僅僅是一個AI平臺。在去年的科大訊飛全球1024開發者節上,科大訊飛提出“建算力、理數據、訓模型,到落場景、保安全、精運營”的全鏈路方法,提出從場景出發,給客戶提供人工智能的解決方案。
以理數據為例,這是目前大模型應用落地中,非常關鍵的一環。在用戶現場,數據以各種形式存在,質量參差不齊。科大訊飛在項目中沉淀了一套工具鏈。與行業主流開源工具相比,數據清洗、SFT數據準備效率都有大幅提升,而在知識問答領域里面,“多模態零采編”方案的能力優于開源工具,目前在中石油、中國綠發、華潤集團和廈門航空都在使用。
多年的政府側、企業側積累,讓科大訊飛建立了解決方案思路,并建立了很強的交付體系。“在現場,客戶提出需求,甚至是人機界面這樣的需求,科大訊飛的團隊都會開發。”一位大型企業人士觀察。這些打法,都支撐星火X1進一步打開行業市場。
03
行業應用將加速
得益于包括深度推理在內的大模型性能的提升和門檻的降低,業內普遍認為,今年是行業應用爆發之年。
原來企業落地大模型的一大痛點是,大模型本身能力還不夠強。而伴隨各類大模型性能的提高,包括深度推理模型在系統性思維過程的提高,大大提升了大模型在行業落地中的能力。
過去兩年,科大訊飛在央國企、教育、汽車、醫療、政務、金融等領域中,實現了大量應用落地,而星火X1將激發出更多、更深入的行業場景應用。
央國企在大模型應用落地中動作較多。央國企扮演著基礎設施的角色,涉及國計民生的方方面面,所以它們對技術自主可控的需求更加嚴苛。科大訊飛的全棧國產化能力,讓其獲得了這一市場的信賴。根據IDC 2024年《中國央國企大模型解決方案市場份額》報告,2024年央國企在大模型解決方案市場規模達 31.8 億元。其中,科大訊飛市場份額居首位。
2025年開年以來,央國企在大模型應用上動作頻繁。以中國石油為例,去年它已經與中國移動、華為、科大訊飛共建的昆侖大模型,已發布涵蓋43個專業應用和通用應用創新場景。今年2月28日,昆侖大模型完成了新一輪模型能力、應用場景迭代和新增。目前,對外發布“行業大家”,面向能源化工領域,打造綜合性知識服務與信息檢索平臺,已開啟社會邀請體驗
行業人士認為,過去一年多的落地,央國企市場應用其實都還處于淺中層,業界面臨落地逐步走向深水區的挑戰,如油田勘探數據分析、金融風控交易鏈分析甚至電力調度這一非常有深度的場景。而包括星火X1在內的深度推理大模型,也正從輔助工具逐步走向決策“大腦”,探索進入更多核心場景。
在教育、科研和央國企領域,AI for Science的應用越來越重要。目前,訊飛聯合中科大劉海燕教授團隊,成功設計了48個自然界不存在的全新蛋白質,把原來需要6個月的實驗提速到只需1天完成。另外在單細胞基因表達課題的研究,托卡馬克等離子體控制的研究上,大模型的應用正在加快科研工作的進展。
此外,科大訊飛還聯合中科大研發“化學大模型”,聯合中科院大連化學物理研究所研發“化工大模型”。而訊飛發布的星火科研助手,已在中科院下屬116個院所使用。
在智算建設市場,業界提出智算中心要避免重建設、輕需求,以應用為導向,提高整個算力中心的利用率,并帶動各地產業經濟。4月17日,在湖北利川武陵山(利川)人工智能計算中心二期上線中,科大訊飛幫助打造的全國首個縣域文旅大模型,也同期投入運行,構建起覆蓋游客、商戶、政府的三端服務體系。這是智算中心建設運營的生動體現。訊飛將持續通過“算力+數據+算法+場景+生態”五維體系,助力城市打造AI產業底座,推動傳統產業智能化升級
汽車智能化也是當下的熱點。以大模型上車為例,科大訊飛與支付寶合作搭建了咖啡助手智能體,支持車內刷臉無感支付訂咖啡。
另外,通過“快思考”與“慢思考”的統一,訊飛星火大模型將實現根據用戶提出的問題類型,智能分配算力資源,選擇合適的模型進行處理。比如簡單的車輛控制指令,如調節車窗、空調溫度等,采用“快思考”模型快速響應;而旅游規劃、餐廳推薦等需要多輪交互和深度推理的復雜問題,則會啟用“慢思考”模型,提升用戶體驗。
目前,訊飛星火大模型已落地16余款車型,在中國汽車出海的前十強車企中,有八家選擇與科大訊飛合作。而本周將舉辦的上海車展,訊飛也將會有新的合作進展披露
隨著落地門檻的降低,與行業需求的交融,結合訊飛在多個行業賽道一二十年的積累和全鏈路打法,星火X1在行業賽道上將釋放更大潛能,推動行業應用邁向深水區,爭奪行業智能化市場。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.