當生成式人工智能的浪潮席卷全球,仿佛一夜之間,AI成了新的“基礎(chǔ)設(shè)施”,大模型成了技術(shù)圈與資本市場的“通關(guān)密碼”。從硅谷到中關(guān)村,從ChatGPT到國產(chǎn)百模大戰(zhàn),一時間,模型參數(shù)越大、語料越全、推理越快,似乎就能代表一家企業(yè)的未來。
但在熱潮洶涌的表面之下,一個問題正在逐漸凸顯:在這場技術(shù)革命中,誰能走得更遠?誰能真正把AI做成生產(chǎn)力,而不是幻象?
潮水退去,裸泳者畢現(xiàn)。而那些在AI還沒有成為“顯學(xué)”時就已默默耕耘、在技術(shù)荒原上耐得住寂寞的企業(yè),正逐漸成為穿越周期的參照坐標。
科大訊飛,正是這樣一家典型的“長期玩家”。二十六年過去,人工智能的每一次浪潮,它都在場。以史為鑒,可以知興替。要看清楚未來的方向,也許可以從歷史的軌跡中,找到一些啟發(fā)。
人工智能發(fā)展的“長河”,
從沒停止“激蕩”
人工智能,并不是今天才突然火起來的“新事物”。如果從1956年達特茅斯會議算起,它已經(jīng)走過了近70年的發(fā)展歷程。但這70年,并非線性推進,而是一次次在技術(shù)突破與現(xiàn)實掣肘的拉鋸中艱難前行。
每一輪技術(shù)浪潮,都像是一場產(chǎn)業(yè)的重新洗牌——不僅刷新了人們對“智能”的想象邊界,也不斷改變誰能主導(dǎo)AI的未來。
回顧AI的三次主浪潮,每一輪都影響深遠:
1950-1980年代:專家系統(tǒng)與邏輯主義階段。這一時期的AI主要靠符號推理和規(guī)則建模來模擬人類智能,但受限于算法能力、算力水平和數(shù)據(jù),最終未能跨越實驗室門檻。第一次“AI寒冬”,由此而來。
2000年代:感知智能覺醒,語音和圖像識別走向?qū)嵱谩I疃葘W(xué)習(xí)的崛起帶來模型表達能力的飛躍,語音識別、圖像識別、自然語言處理等感知層技術(shù)走出低谷,成為工業(yè)界重點投資方向,AI第一次大規(guī)模進入產(chǎn)業(yè)化階段。
2017年至今:大模型開啟通用智能探索。以Transformer為基礎(chǔ)的預(yù)訓(xùn)練語言模型,徹底改變了AI研發(fā)范式。GPT家族讓AI具備了類人的語言生成能力,隨后包括科大訊飛“星火”、DeepSeek、通義千問等在內(nèi)的眾多大模型紛紛登場,AI從感知走向認知,再邁向“通用”。
中國的AI發(fā)展路徑,也幾乎與全球保持同頻。每一輪技術(shù)突破都迅速引入、學(xué)習(xí)、對標,甚至在一些細分賽道形成超越。但與此同時,也面臨著自身獨有的“結(jié)構(gòu)性難題”:
一是“技術(shù)空心化”:核心算法、訓(xùn)練框架、底層硬件高度依賴國外技術(shù)。
二是“落地難與場景分離”:AI模型能力強,但與產(chǎn)業(yè)需求之間常常“隔著一層”。
在這樣的環(huán)境中,真正能從底層技術(shù)出發(fā),構(gòu)建完整技術(shù)體系與產(chǎn)業(yè)閉環(huán)的企業(yè),屈指可數(shù)。而科大訊飛正是其中少數(shù)的代表之一。
科大訊飛既是見證者,也是推動者
從語音識別“冷門”技術(shù)出發(fā),經(jīng)歷了感知智能的產(chǎn)業(yè)落地、認知智能的逐步成型,再到大模型時代的加速爆發(fā),訊飛沒有缺席任何一場AI革命。更重要的是,它從未只停留在“接口調(diào)用”和“概念復(fù)述”,而是始終堅持做自主底座構(gòu)建者、真實場景落地者,一步步將“技術(shù)理想”磨成“產(chǎn)業(yè)現(xiàn)實”。
可以說,這一路走來,科大訊飛是人工智能發(fā)展歷程的見證者,也是重要的推動者。
☆1999年成立:源自中科大,技術(shù)冷門中孕育出的“非風(fēng)口公司”
如果說今天的AI是全民話題,那么1999年,當人工智能還停留在學(xué)術(shù)象牙塔,語音識別更是科研體系中的“邊角料”時,創(chuàng)辦一家專注語音技術(shù)的公司,聽上去并不聰明。
那是個“誰做語音識別誰傻”的年代——市場不看好、資本不感興趣、技術(shù)也未成熟。但就是在這樣的背景下,一群從中科大走出的技術(shù)理想主義者創(chuàng)辦了科大訊飛,并堅定選擇了“語音”這條看似狹窄卻通往未來的路徑。
他們不是在追風(fēng),而是在堅持。“讓機器能聽會說、能理解會思考”——這個使命在公司創(chuàng)立之初就已明確,而今已寫入了公司每一代的戰(zhàn)略演進中。正是這種技術(shù)理想與現(xiàn)實打磨并行的路徑,奠定了訊飛此后二十多年的產(chǎn)業(yè)定力。
☆2000s:第一次AI浪潮中,訊飛構(gòu)建起中文語音技術(shù)“地基”
隨著深度學(xué)習(xí)和機器學(xué)習(xí)在2000年代初期逐步進入產(chǎn)業(yè)應(yīng)用,AI迎來了第一波實用化浪潮。在這一階段,語音識別、語音合成、語音評測等感知智能成為前沿熱點。
而對于中文語音,情況更加復(fù)雜:語音調(diào)豐富、多音字密集、方言體系廣泛,遠比英語語音系統(tǒng)更難建模。但訊飛始終堅持“解決最難的中文,才能擁有最強的技術(shù)壁壘”。
這期間,科大訊飛率先在中文語音識別領(lǐng)域?qū)崿F(xiàn)技術(shù)突破,并逐步將成果應(yīng)用于教育、司法、通信、客服等真實場景中。它不是只做演示系統(tǒng),而是在一線場景中磨技術(shù)、找路徑、落產(chǎn)品。
更關(guān)鍵的是,訊飛在這一時期累計構(gòu)建起海量高質(zhì)量中文語音語料庫,這一長期戰(zhàn)略投入為其后續(xù)AI技術(shù)的發(fā)展打下了堅實基礎(chǔ)——也成為中國少數(shù)具備語料自主權(quán)和技術(shù)訓(xùn)練閉環(huán)能力的AI企業(yè)。
☆2010s:感知智能爆發(fā)期,訊飛在“語音+認知”一體化上加碼
進入2010年代,深度神經(jīng)網(wǎng)絡(luò)推動AI進入第二個“產(chǎn)業(yè)春天”。圖像識別、語音交互、自然語言處理等技術(shù)在多個垂直行業(yè)走向成熟。智能手機普及、移動互聯(lián)網(wǎng)崛起,也讓AI走向C端成為可能。
科大訊飛沒有錯過這波“從聽得見到聽得懂”的技術(shù)躍遷。
在C端市場上,訊飛語音輸入法、翻譯機、智能辦公本等產(chǎn)品相繼爆發(fā),成為許多用戶接觸AI的“第一站”;而在B/G端市場,訊飛的技術(shù)已深入政務(wù)、司法、教育、醫(yī)療等“剛需+高門檻”場景,成為實際生產(chǎn)流程中的關(guān)鍵能力。
同時,訊飛也在這一階段完成了從“感知智能”向“認知智能”的全面進化:不再滿足于識別字詞語音,更在語義理解、多輪對話、知識圖譜構(gòu)建、個性化推薦等方向展開布局。
這一時期的訊飛,已從一個“語音技術(shù)公司”,成長為真正意義上的“AI平臺型公司”。它所構(gòu)建的,不再是單一模型的能力,而是一整套能支撐產(chǎn)業(yè)落地的AI系統(tǒng)工程。
而這一切,則成為它參與大模型競賽的底氣。
大模型是技術(shù)長流中的持續(xù)推進,
而非短期爆發(fā)
大模型不是“從0到1”的神跡,而是“從1000個點”匯聚而來的合力。
當下的大模型風(fēng)潮,在許多人眼中像是一場突如其來的技術(shù)爆炸,但它其實是過去二十年AI技術(shù)演進的系統(tǒng)集成與方法論重構(gòu)。
Transformer架構(gòu)的提出,只是一個起點。真正將它推向?qū)嵱玫模呛A空Z料數(shù)據(jù)的積累、預(yù)訓(xùn)練-微調(diào)范式的建立,以及分布式計算和算力調(diào)度的不斷優(yōu)化。這是一場沒有捷徑的“技術(shù)長跑”。
OpenAI的ChatGPT,點燃了大眾對生成式AI的集體認知,DeepSeek、訊飛星火、通義千問等國產(chǎn)大模型的爆發(fā)讓行業(yè)意識到:大模型競爭不只是算力堆疊,而是背后數(shù)據(jù)、算法、場景與工程能力的綜合博弈。尤其是進入2025年后,AI Agent的興起讓人們開始期待大模型真正成為“任務(wù)型生產(chǎn)力”而非“語言玩具”。
在這個階段,只有真正具備“技術(shù)底座+數(shù)據(jù)語料+應(yīng)用場景”三位一體能力的公司,才能把大模型做深、做實、做久。
科大訊飛恰好是這種“全棧能力型”的典型代表:
它有深厚的語音識別與語義理解技術(shù)體系,支撐模型對中文復(fù)雜結(jié)構(gòu)的準確建模;
它擁有多年積累的高質(zhì)量中文語料和行業(yè)數(shù)據(jù)集,避免模型被“喂垃圾”;
它還掌握從教育到政務(wù)、從醫(yī)療到司法的真實高頻場景反饋機制,讓模型能力在實戰(zhàn)中不斷進化。
換句話說,訊飛有能力把“模型能力”轉(zhuǎn)化為“系統(tǒng)能力”——這才是能走通商業(yè)化和產(chǎn)業(yè)化的關(guān)鍵。
如果說大模型是AI新時代的“基礎(chǔ)設(shè)施”,那么訊飛星火的出現(xiàn),就像是訊飛過往20多年技術(shù)積累的一次集中釋放。
在剛剛過去的高考測試中,訊飛星火X1在多家權(quán)威機構(gòu)組織的實測中表現(xiàn)優(yōu)異:在語文作文任務(wù)中,星火在評分維度上排名所有主流模型第一;在英語作文盲評中超越DeepSeek等競品;在高考數(shù)學(xué)實測中,訊飛星火是僅有的兩個整卷得分突破140分的大模型之一。
這些不是“選題演示”,而是真實考試題目下對中文理解、邏輯推理、知識遷移能力的綜合考驗——用一次公開考試,讓技術(shù)說話。
這一成績的背后,是訊飛在大模型技術(shù)路徑上堅持的三大原創(chuàng)能力:
快慢思考統(tǒng)一模型訓(xùn)練方法,首次引入“類腦決策邏輯”作為認知建模框架,提升復(fù)雜推理表現(xiàn);
結(jié)合評語模型與細粒度反饋的強化學(xué)習(xí)技術(shù),提升模型輸出質(zhì)量與對人類偏好的適配能力;
基于國產(chǎn)算力的推理算法優(yōu)化包,突破“國產(chǎn)慢三個月”的技術(shù)困境,在算法層拉齊效率。
這不是一場PR主導(dǎo)的“模型秀場”,而是一套以真實問題驅(qū)動模型演進、以模型迭代支撐業(yè)務(wù)深化的技術(shù)-產(chǎn)品閉環(huán)。
解答時代難題,才是科大訊飛的使命
技術(shù)行業(yè)的每一次變革,都會衍生出一批短期“明星”和一批長期“支柱”。在大模型成為全行業(yè)底座的時代,真正能穿越周期的企業(yè),往往不是最熱鬧的那一個,而是最能啃硬骨頭、解復(fù)雜題、打通底層閉環(huán)的那一個。
在AI產(chǎn)業(yè)最核心的兩個難題——“卡脖子”與“落地難”上,科大訊飛給出了不走捷徑、直面挑戰(zhàn)的解法。
1. 面對“卡脖子”:自主可控不是選項,是底層戰(zhàn)略
當前AI產(chǎn)業(yè)最大的不確定性,不僅在于模型能力能否提升,還在于底層算力和系統(tǒng)生態(tài)的可控性。一旦底座受制于人,技術(shù)安全與發(fā)展空間都難以保障。
科大訊飛是國內(nèi)少數(shù)全面轉(zhuǎn)向國產(chǎn)昇騰算力的公司之一。
這不是一次簡單的“硬件替換”,而是一場系統(tǒng)級再造:從模型架構(gòu)、訓(xùn)練框架,到推理優(yōu)化、能效調(diào)度,再到全棧適配和性能調(diào)優(yōu),幾乎每一個環(huán)節(jié)都要“重寫一遍”。
劉慶峰在內(nèi)部講話中直言:“基于國產(chǎn)算力的算法開發(fā)會慢三個月,在今天這個你追我趕的時代,是不得了的差別。”但訊飛仍然選擇了這條“慢但對的路”,其背后,是一個深層判斷:
有能力做,所以必須做;
不做,就永遠受制于人。
在這個過程中,訊飛還打造了從數(shù)據(jù)采集、預(yù)處理、模型訓(xùn)練、強化學(xué)習(xí),到評測反饋的完整國產(chǎn)AI訓(xùn)練閉環(huán)。這意味著,即便外部環(huán)境變化,訊飛依舊可以在自主可控的體系內(nèi),完成大模型的持續(xù)演化和行業(yè)部署。
這是訊飛“系統(tǒng)型公司”價值的集中體現(xiàn):不僅僅是有一個模型,而是有一整套可持續(xù)演進的AI產(chǎn)業(yè)操作系統(tǒng)。
2. 面對“落地難”:To B不是故事,是硬仗
與To C模式下的用戶增長和API變現(xiàn)不同,To B和To G場景是“剛需高門檻”,拼的是解決行業(yè)真實痛點的能力,以及在復(fù)雜組織結(jié)構(gòu)中的推廣、運維、反饋、迭代能力。
這正是訊飛長期深耕的“硬核主場”。
在教育領(lǐng)域,科大訊飛不僅參與構(gòu)建了全國多地的智能教學(xué)系統(tǒng),還登上了世界數(shù)字教育大會,被中國教科院選為唯一展示成果的中小學(xué)AI教育平臺。它不僅讓AI“能答題”,更強調(diào)“因材施教”和“學(xué)生全面發(fā)展”,引入心理健康、創(chuàng)造力評估等軟性指標,形成真正可用、可信、可持續(xù)的智能教學(xué)輔助體系。
在醫(yī)療領(lǐng)域,訊飛星火醫(yī)療大模型已應(yīng)用于1型糖尿病等專病方向,聯(lián)合三甲醫(yī)院、科研機構(gòu)共同訓(xùn)練專業(yè)模型。根據(jù)公司規(guī)劃,星火X1醫(yī)療模型將在年內(nèi)達到三甲醫(yī)院主治醫(yī)生水平,推動AI向“醫(yī)療決策共識平臺”演進。
在司法領(lǐng)域,訊飛法律大模型具備案件要素抽取、訴請答辯分析、法律法規(guī)推薦等功能,據(jù)公司內(nèi)部測試結(jié)果,在準確率上超越DeepSeek R1,并已在安徽省檢察院真實上線運行,協(xié)助檢察官提效辦案,成為中國“AI輔助司法”的樣板系統(tǒng)。
在企業(yè)級市場,中石油與訊飛聯(lián)合打造的“昆侖大模型”已正式升級,在行業(yè)知識問答、代碼輔助、物資評審、安全作業(yè)等方面實現(xiàn)效率飛躍;國家能源集團部署的智能評標系統(tǒng),也獲得國資委點名推薦,驗證了星火大模型在央國企場景下的商業(yè)可行性和擴展?jié)摿Α?/p>
這些案例的共同特征是:復(fù)雜、真實、高門檻,不適合講故事,只能靠能力說話。
也正是在這樣的硬仗中,訊飛不斷用“解決一個個具體問題”的方式,讓自己的大模型逐步進化為真正有用、有生命力的產(chǎn)業(yè)引擎。
誰能在AI的“長流中”定義未來?
當大模型從“科研演示”走向“通用底座”,AI產(chǎn)業(yè)的核心邏輯也正在從技術(shù)爆發(fā)期進入到產(chǎn)業(yè)重構(gòu)期。
這意味著,真正的競爭不再只是誰的參數(shù)更大、demo更炫,而是:
誰能落地得更深:在專業(yè)剛需場景中形成真實業(yè)務(wù)閉環(huán);
誰能控制得更穩(wěn):從算法框架到數(shù)據(jù)資產(chǎn)、算力平臺實現(xiàn)自主可控;
誰能輸出得更廣:實現(xiàn)從本地化適配到全球化布局的規(guī)模躍遷。
而這三件事,恰恰是過去二十多年里科大訊飛始終在做、正在做、也擅長做的。
在教育、政務(wù)、醫(yī)療這些高門檻、高確定性、關(guān)聯(lián)國計民生的“國家關(guān)鍵場景”中,訊飛不是“新兵”,而是“老兵”,并已建立起從模型訓(xùn)練→產(chǎn)品定義→用戶反饋→持續(xù)優(yōu)化的正循環(huán)體系。技術(shù)不是空轉(zhuǎn)的,而是嵌入在真實流程里,解決真實問題。
更重要的是,訊飛也在努力將“AI中國解法”帶向全球。
在剛剛過去的大阪世博會上,訊飛推出了支持中、日、英三語實時交互的“AI孫悟空”,不僅成為中國館的明星項目,也以“每分鐘至少一次交互”的頻率,成為了中國AI技術(shù)軟實力出海的具象化樣本。
劉慶峰提出,“未來,一個國家的全球影響力,一部分將取決于它是否擁有可供他國使用的主權(quán)大模型。”
從這個視角看,訊飛不僅是在構(gòu)建自己的產(chǎn)品競爭力,更是在構(gòu)建中國AI在全球博弈中的系統(tǒng)位勢。
在這個被流量重構(gòu)認知的時代,耐心早已成為稀缺資源。
但科大訊飛用26年告訴我們:真正重要的技術(shù)成果,從來不是“講”出來的,而是“做”出來的。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.