它有實力,也有決心去搶占AI時代的“根紅利”。
文/劉宇翔
編輯/王芳潔
當 50 歲的微軟回望 24 年前的自己,它會驚訝地發現,它后來的輝煌,都源于那一年的落筆。
2001年10月25日,26 歲的微軟正式推出Windows XP,徹底擺脫DOS內核依賴,基于Windows NT架構開發,該架構也成為往后數代Windows 操作系統的底層架構。同一年,微軟發布的 Office XP進一步鞏固辦公軟件市場優勢地位,還推出了首款家用游戲主機Xbox,向硬件娛樂領域跨界擴張。
26 歲的微軟,年輕、業務嫻熟,充滿朝氣,對操作系統有深刻的理解,以此一步步開拓它的數字邊疆,時至今日,數以億計的設備奔跑著它的代碼。
而比微軟“小一歲”的蘋果,盡管回歸后的喬布斯帶領公司從1997年的破產危機中走出,但仍面臨市場份額低迷、業務增長乏力等挑戰。2002 年,蘋果推出了iPod,它以簡潔的設計、創新的硬盤存儲以及滾動式轉盤控制,打開了數字音樂市場。
26 歲的蘋果,終于將多年積累的工業設計+用戶體驗,落地為改變世界的產品。而今,蘋果的產品線依然和它的產品設計一樣簡潔,但成千上萬人會在第一時間搶購它的新品。
如果說科技企業的成長和進化有個第一推動力,那應該是始于其創始時對某一領域有了深刻而獨到的理解,它就像一顆種子,破土、發芽、生長,到了某一時間點,進入輕熟期,開始加速,最終長成參天大樹。
我們發現,對于很多科技企業來說,26 歲就是企業進入輕熟期時,它已積攢足夠的勢能,也有相對成熟的經驗,身上想改變世界的朝氣也還在,正是一家企業的當打之年。如2001 年的微軟、2002 年的蘋果、2013 年超越愛立信的華為,等等。
細細數來,今年還有一家科技企業也進入輕熟期時,它曾吮吸過863 計劃的“營養”,并在 IBM、微軟等的重圍中破土萌發,是的,它的成立比一些國際大廠要晚的多,但它的創始人覺得沒關系,“流水不必爭先”。而今這家中國科技企業確已實現全棧自主可控的技術路線,有實力,也有決心去搶占AI時代的“根紅利”。
01
打造技術護城河
1998年前后,科技界正為“千年蟲問題”而投入大量精力時,人工智能發展也迎來了關鍵轉折點,“機器學習時代”在黎明期等待破曉。
一年前,IBM的超級計算機深藍戰勝世界冠軍卡斯帕羅夫,證明AI在規則明確的領域能超越人類。僅僅一年后,最早的卷積網絡架構之一LeNet-5 ,就被用于文檔識別。長短時記憶網絡(LSTM)解決了傳統循環神經網絡(RNN)在處理長序列時的梯度問題,為日后的自然語言處理(NLP,包括語言模型、文本生成、機器翻譯、語音識別等)奠定了技術基礎。
語音技術是當時一個熱門領域,作為全世界使用同一語言人口最多的中國,就成了外國科技巨頭覬覦的超級大市場。1997 年,IBM推出了漢語連續語音識別系統ViaVoice,具有“自我”學習的功能。1998年,微軟投資8000萬美元在中國籌建微軟中國研究院(2000年更名為微軟亞洲研究院),開發的重點方向之一就是語音識別。一時之間,全國語音技術人才幾乎都被這些巨頭所“虹吸”。
當時是中國 863 計劃的第12年,承擔了該計劃的語音合成技術(Text-to-Speech, TTS)項目的中科大語音實驗室,在 1998 年交出了一份成果。這個由劉慶峰帶隊開發的KD863語音合成系統,不僅具備了優良的自然度,合成出來的語句近乎人聲,成為國家863計劃成果比賽中最為轟動的研究成果。
語音合成技術能將文本轉換成自然流暢的語音,廣泛應用于電話客服、導航系統、智能家居等多個領域。KD863語音合成系統的誕生,你可以理解為中國人在PC 世界的“嘴”終于長在了自己“臉上”。
如果科研成果只停留在實驗室里,束之高閣,那么最終還是會被后來者居上,把“嘴”搶過去。1999年,劉慶峰帶領研發團隊創立了科大訊飛,目標是打破中文語音技術被國外壟斷的局面。這份帶著斗志的目標,開啟了中文語音技術產業化的元年。
2000年,科大訊飛將KD2000語音合成系統正式推向市場,在與國際巨頭的競爭中脫穎而出,2001年,華為公司宣布正式采購訊飛公司的合成產品。
語言作為信息的載體,天然就是智能探索的鑰匙,時任微軟總裁的比爾蓋茨說:“語音技術不只是簡單地代表未來,而且代表信息本身的未來。”
即使國際巨頭投入巨大,但“本土作戰”的科大訊飛更懂中文,其語音合成技術在國內市場取得了領先地位,2001 年,智能語音平臺開發廠商突破100家,2004年銷售收入首次過億元,扭虧為盈,標志著其盈利模式探索成功,為后續的發展奠定了基礎。
隨著科大訊飛在語音合成的深入探索,它將目光投向更復雜的語音識別技術,語音識別技術能將人類語音轉換成文字,應用范圍同樣廣泛,如語音助手、會議記錄、醫療聽寫等。科大訊飛在這一領域同樣取得了重大突破,其語音識別準確率達到了行業領先水平,即使是在嘈雜環境下,識別也穩定輸出。
在語音合成、語音識別深耕多年后,科大訊飛來到了一個次元壁,那就是“語言-智能”。語音是語言的物質外殼,是語言的外部形式,也是最直接記錄人的思維活動的符號體系,人類思維的過程天然依賴語言符號系統進行抽象與推理,而人類智能的核心能力(如邏輯分析、情感表達)均通過自然語言進行輸出。
換而言之,語言的次元壁背后,就是智能。6月9日,在科大訊飛成立26周年之際,劉慶峰坦言,過去26年,雖然科大訊飛先后涉足語音合成、語音識別、機器翻譯、以及認知智能和大模型,但其實走的是“彎曲的直線”,這條直線就是人工智能主賽道。
但要讓機器理解人類語言談何容易,所用到的 NLP(自然語言處理)融語言學、計算機科學、數學于一體,而深入到人工智能,就需要對這些學科都融會貫通。有趣的是,劉慶峰除了擁有通信與電子系統、信號與信息處理學位,1995年還赴中國社科院跟隨吳宗濟教授研修過語言學。
從語音合成到語音識別,當穿過語音這層外殼,科大訊飛果然到了智能世界的邊界:大模型。這是場不斷打怪練級之路,能走到這一步的,算是拿到了 AI 的入場券。
此時基于神經網絡的深度學習已經獲得極大發展,2014年科大訊飛啟動“訊飛超腦計劃”,開始認知智能研發,讓機器“能理解會思考”。2022 年科大訊飛發布“訊飛超腦2030”,提出通用人工智能演進路徑。2023年5月6日,科大訊飛正式發布訊飛星火認知大模型,具有7大核心能力,即文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模交互,對標ChatGPT ,并不斷迭代,到 V4.0版本實現多模態深度交互,獲 2024 年的國家科技進步一等獎。
通過語音合成切入到語言腹地,最終科大訊飛敲開了人工智能的大門,人工智能成為其核心能力。
和26年前一樣,這一次劉慶峰還是決定要走完全自主可控的技術路線,哪怕相比使用英偉達等海外算力,基于國產算力開展大模型訓練和算法創新存在諸多挑戰,需要增加移植適配、性能調優、對比驗證等額外步驟和額外算力。但訊飛有實力克服這些挑戰,不再給別人卡脖子的機會。
事實證明,劉慶峰絕不是在畫餅。進入2025年,科大訊飛就像開了掛似的,1月正式發布業界首個基于全國產算力平臺訓練的深度推理大模型——訊飛星火X1,利用更少算力實現業界一流效果;訊飛星火4.0 Turbo底座升級,行業首發混域知識搜索技術;業界首個具備端到端語音到語音同傳能力的大模型星火語音同傳大模型,達到人類專家譯員的水平。2025年4月,訊飛星火X1二度升級,在模型參數量比業界同行少一個數量級的情況下,數學、代碼、邏輯推理、文本生成、語言理解、知識問答等通用任務效果顯著提升,整體效果對標OpenAI o1和DeepSeek R1。
“如果訊飛不付出,中國的算力支撐不了深度推理模型的訓練!基于國產算力的新算法研發,會慢一些,但不會矮!”這是劉慶峰的決心。
已屆輕熟之齡的科大訊飛,如同當年的微軟、蘋果,銳氣十足。
02
當打之年
除了對語言、技術有深刻的理解,科大訊飛高強度的投入,也是其能進化為 AI 公司的重要原因。對于技術投入,劉慶峰一直的觀點都是:“要有一桶水,才能倒出一碗水。
在宏觀經濟學理論里,諾貝爾經濟學獎得主保羅·羅默為知識溢出模型中引入了知識資本概念,他認為知識具有非競爭性和部分排他性,其溢出效應使研發部門規模擴張,持續提升了全要素生產率,推動了經濟發展。
如果把企業看作是一個小型經濟體,其實這個理論也成立,持續的研發投入,聚集了人才,推動了創新和增長。科大訊飛每年將營業收入的20%左右用于研發,僅在2024年,科大訊飛在研發投入就達45.8億元,占營收比例19.62%,目前擁有核心技術人員1000人,博士生100人左右,持續保持高人才密度、高壓強投入,為技術創新提供堅實支撐。
可以相比較的是,在 2001 年財年,微軟研發費用占營收比例為16.5%,微軟的研發強度在當時科技巨頭中處于領先水平,這也是為什么后來微軟能擊敗IBM脫穎而出的重要原因。
對于科技公司來說,對技術的積累和理解,是寬廣的護城河,但科技公司畢竟是商業公司,將技術實力轉化為產品力、商業力也是關鍵。
相比起業務繁雜的多元化企業,科技公司的核心能力在不同市場具有通用性,比如基礎研發能力(如算法開發、硬件設計)可跨領域復用,數據采集、處理及模型優化能力適用于所有數字化場景,只需對不同細分市場做針對性封裝、優化。一如基于Windows NT架構,微軟面向家庭、專業、企業用戶推出了不同產品。
而在AI時代,企業的進化速度取決于算法化基因改造能力——將核心能力封裝為面向用戶的可迭代智能模塊。
從財報上看,科大訊飛 2024年全年營收達233.43億元,同比增長18.79%,歸母凈利潤5.6億元,同時現金流創歷史新高,經營性現金流凈流入24.95億元,同比激增超6倍。分板塊來看,智慧教育、智慧汽車等業務板塊表現突出,分別同比增長29.94%和42.16%。智慧教育業務收入占比達30.97%,是公司收入的重要支柱。此外,智慧醫療、開放平臺及消費者業務也保持較高增速,分別同比增長28.18%和31.33%。
這些業務所用到的底層技術都是人工智能,而在原有的技術優勢基礎上,科大訊飛又提出了三大創新點:第一,國內首發基于快慢思考的統一模型訓練推理方法;第二,提出結合評語模型和細粒度反饋的強化學習技術;第三,研發國產平臺強化學習算法包,實現了全國產化算力深度推理模型訓練效率優化。
此外,相比于同行,科大訊飛在數據,特別是行業數據的提取層面更有經驗,在行業應用方面,基于自主可控的底座和對行業的深度理解,其能夠更靈活、深入地打造行業應用。
目前,科大訊飛已為全國32個省級行政區、5萬余所學校、1.3億師生提供智慧教育產品和解決方案。今年高考期間,各家AI大模型迎來了一場“被動大考”,據三方權威媒體評測顯示,訊飛星火X1在語文作文的綜合得分,位列主流大模型榜首;在英語作文盲評中,獲得第一,超越DeepSeek R1等模型;數學測評中,訊飛星火成為僅有的兩個整卷得分突破140分的大模型之一。
在5月的世界數字教育大會上,基于訊飛星火X1的中小學科學教育智能導師,成為中國教科院在世界數字教育大會期間唯一發布的教育數字化成果,由科大訊飛提供核心技術支撐的武漢經開區神龍小學湖畔校區,是唯一向世界展示的基教示范觀摩校,中國地質大學聯合科大訊飛發布的地學大模型,武漢理工大學聯合科大訊飛發布的材料大模型,作為高等教育領域學科大模型建設的標桿成果向世界展示。
在醫療領域,科大訊飛為醫生打造了 AI診療助理、為居民打造了 AI健康助手,智醫助理產品已在全國31個省市的680+個區縣實現常態化應用,累計提供超9.3億次AI輔診建議,規范病歷超3.6億次,基于訊飛星火醫療大模型X1的全球首個1型糖尿病專病大模型發布,星火X1醫療大模型今年將在專科診療中達到三甲醫院主治醫生水平。
在工業領域,為全國10個省20多個地市提供基于工業感知、工業認知、工業大模型、能源大模型等工業AI技術的產品和解決方案,在高端裝備制造業、能源行業等場景陸續打造行業示范應用,其中與中石油聯合打造的昆侖大模型5月28日再次升級,行業知識問答采納率超95%,代碼開發效率提升73%,物資招采輔助評審準確率82%,安全生產作業識別準確率85%;與國家能源集團合作的智能評標助手實現人工提效與節支率提升,該系統在國資委網站被作為典型案例推薦。
在政務場景,其智辦一體機發布后,覆蓋4500多種標準化事項及相關政策文件、60多種票證材料。今年4月,科大訊飛助力安徽省檢察院的安徽省檢察院AI輔助辦案系統已上線運行。
就連在競爭最為激烈的汽車市場,2024年,科大訊飛智能汽車業務新增前裝智能化產品出貨也超900萬套,累計出貨量超6300萬套;年度在線交互次數達到136億次,同比增長36%,月均活躍用戶超2500萬。
在知識溢出模型中,研發投入打造的核心基礎能力,會創造出中間產品種類,它們可以應用到各行各業,中間產品供給增加,能極大提高經濟增長率。體現到科大訊飛,隨著訊飛星火大模型的持續迭代升級,以它為基礎開發的新產品、新解決方案不斷涌現,在增強了市場競爭力的同時,也為客戶創造了價值,提升了銷量和復購率,形成了正循環。
并且,人工智能產品還具有“規模增加-智能提升”和成本邊際遞減效應,即使用的人越多,開發者越多,數據越多,大模型越智能,分攤的算力成本就越低。
招商證券研報就認為,科大訊飛的AI消費者產品、AI行業應用、AI開放平臺三大AI落地商業化體系,隨著應用規模的持續擴大,由數據驅動的“模型算法一產品價值一業務增長”商業飛輪效應正在不斷顯現。
進入當打之年的科大訊飛,確實“越來越能打”。
03
爭的是滔滔不絕
企業是經濟周期里的一艘船,經歷周期才能刺激企業提升產品力、商業力,能活下來的企業,不僅只有技術實力,還有商業能力,僅有技術而沒有經營能力,就只能被大浪淘沙。
微軟、蘋果、亞馬遜都經歷過經濟周期,在周期里,它們做了調整,以適應市場變化,其中就包括出海和國際化。經歷了數個經濟周期,科大訊飛對市場、產品也有了更深的理解,此時,輕熟的科大訊飛有了加速國際化的能力。
國際化其實一種“奢侈品”,只有具有創新能力國家,才能產生技術與商業兼備的科技創新型企業,將能力、模式、產品復制到海外,經過本地化優化,形成極化效應(資源集聚)和擴散效應(技術溢出),在使得企業獲得新增長曲線的同時,也帶動周邊發展。
現在全世界只有中美兩個科技增長級,有科技創新型企業,中國企業正迎來出海和全球化的新機遇。
在全球化戰略布局上,科大訊飛以“一帶一路”沿線國家為國際化的重要增量方向,如中東、東南亞等區域。從2018年首次提出“讓世界聆聽我們的聲音”到現在,科大訊飛的出海大致經歷了三個階段:品牌技術展示、探索與試水、精細化運營。
2018年科大訊飛首次參加了國際消費電子展(CES),展示了一系列人工智能產品,向國際市場亮明了其在語音識別、自然語言處理和智能硬件領域的技術實力。而在海外業務的第一站,科大訊飛選定了東南亞,制定了“1+4”戰略,包含1 個以新加坡為中心的訊飛開放平臺國際站,以及 4 項戰略投資,分別是本地化投資、技術投資、產品創新投資、合作伙伴計劃投資。
除了在新加坡設立區域總部外,科大訊飛還在泰國、馬來西亞、沙特、阿聯酋等國家建成本地化運營團隊,并于2023年發布布達佩斯人工智能聯合開放平臺,面向歐洲提供AI服務。2024 年,科大訊飛亮相阿聯酋迪拜通訊及消費電子展覽會(GITEX GLOBAL 2024),結合中東本地化發布了多場景的AI解決方案,及訊飛同傳和訊飛翻譯機等產品。
三個階段為科大訊飛出海現實了“三足鼎立”:智能硬件出海、行業解決方案輸出、技術生態全球化。
智能硬件出海方面,訊飛翻譯機、訊飛AI錄音筆、訊飛詞典筆等產品已銷往美國、韓國、日本、匈牙利、澳大利亞、新加坡、泰國、馬來西亞、印尼、土耳其、阿聯酋等國家及地區。行業解決方案輸出,訊飛同傳已成功助力COP28(聯合國氣候變化框架公約大會)、金磚國家媒體高端論壇、IAA世界廣告大會等多個重要會議,為全球50多個國家及地區服務,支撐超40萬場會議。技術生態全球化方面,訊飛開放平臺國際站的上線為全球開發者提供語音識別、語音合成、機器翻譯、圖文識別等人工智能服務,目前相比2024年,海外開發者數從38.6萬增加到50.9萬,同比增長31.9%。
科大訊飛基于人工智能領域的全棧自主可控和豐富技術產品積累,正為海外用戶提供更多智能產品、多語種大模型和整體解決方案。
科大訊飛不但自己出海,也幫助其他中國企業出海,2024 年,中國汽車出海前10強企業中就有8家和科大訊飛進行深度合作,訊飛座艙智能語音解決方案已幫助上百種車型出海60余個國家和地區,覆蓋全球23種外語。
在周年慶上,劉慶峰表示,“未來,一個國家和民族在全球影響力的標準之一,是全球有多少個主權大模型是由它輸出的。如果說中國能向更多國家提供底座大模型能力,中華民族在全球的影響力很快就能上來。從這個角度來說,科大訊飛也要堅定不移地為世界提供第二選擇。”
但出海并不是只有順風洋流,還可能遭遇風暴。在神話傳說里,遠古的人類曾經講同一種語言,團結起來的人類試圖建造通往天堂的巴列塔,以“傳揚自己的名”,但被神所嫉恨,將人類的語言變得混亂,無法相互理解,阻止了巴別塔的繼續建造。
神話傳說終究是神話傳說,人類語言的多樣性承載了不同的文化、思維,可以說是個智慧寶庫,但語言的多樣性也的確制造了溝通障礙,導致了文化交流、貿易交往不暢,產生了種種分歧乃至爭端。
科大訊飛的 AI 產品在技術、產品層面解決了跨語言的交流難題,但需要應對世界貿易日益增加的矛盾。
為此,2025年,科大訊飛錨定“技術攻堅+應用拓展+雙循環布局”三大戰略方向:在核心技術層面始終保持國際領先,搶抓大模型發展機遇,用國際領先的核心技術為實際業務應用提供堅實保障,持續樹立技術壁壘和領先優勢;以創新優勢解決社會剛需,積極推動人工智能相關技術的規模應用,實現人工智能技術與多行業、多領域的深度結合;從戰略上逐步形成國內、國際兩個市場的相互補充和風險對沖。
好消息是,盡管貿易受到地緣的影響,但“中國制造+中國孵化”正將勢能轉化為發展動能。正在舉行的大阪世博會上,依托訊飛星火大模型打造的實時交互人工智能大模型“AI孫悟空”,是中國館唯一的大模型展項,各國游客無論是想了解徽派建筑的獨特魅力,還是探尋黃梅戲的起源故事,它都能對答如流,還能根據游客興趣,定制專屬旅游路線。
開館54天,“AI 孫悟空”大模型互動4萬+次,每分鐘至少完成1次講解+交互,涵蓋天文地理、歷史人文、旅游美食等方方面面,不少游客激起了前往中國旅游的興趣。
你看,雖然巴列塔沒能建成,但人們還是渴望交流、交易的,科技產品能讓不同國家、文化的人們,建立起交往的橋梁。
全球需求,需要中國供給。26 歲的科大訊飛,在輕熟的最好年紀,帶著“悟空”,走向新的打怪練級之路,爭取源頭技術全球領先,應用大規模落地,只為“解放生產力、釋放想象力,用人工智能建設美好世界”。
對了,劉慶峰有句話是這么說的:“流水不爭先,爭的是滔滔不絕。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.