99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

SuperCLUE推理榜驚現(xiàn)黑馬:原來中興是一家AI公司?

0
分享至



機器之心原創(chuàng)

作者:張倩

中興通訊,這家數(shù)萬人的科技大廠,憑借40年 ICT 技術(shù)積累正式進軍 AI 賽道。

一家信息通信公司,居然拿到了 AI 推理競賽的冠軍,這事兒有點意思。

前段時間,中文大模型測評基準(zhǔn) SuperCLUE 發(fā)布了 2025 年 5 月報告。這份報告評估了來自 OpenAI、谷歌、DeepSeek、字節(jié)跳動等多家國內(nèi)外 AI 公司的大模型,并發(fā)布了多個榜單。報告顯示,雖然海外模型在綜合能力上占優(yōu),但國內(nèi)模型在推理任務(wù)中表現(xiàn)亮眼,Doubao-1.5-thinking-pro-250415 與星云大模型 NebulaCoder-V6 以推理總分 67.4 并列第一



SuperCLUE 推理榜單深度聚焦模型的邏輯思維與問題解決能力,涵蓋數(shù)學(xué)推理、科學(xué)推理、代碼生成三大硬核維度。

作為專業(yè)賽道的選手,Doubao 的表現(xiàn)并不讓人意外。但是,星云大模型 NebulaCoder-V6 著實算得上一匹黑馬,因為它來自一家老牌信息通信公司 —— 中興通訊。而且,除了拿下推理榜單第一,它在綜合總榜中也表現(xiàn)不俗 —— 與 DeepSeek-R1 并列第二,拿到了銀牌。



這樣的成績讓外界對中興這家公司產(chǎn)生了好奇 —— 畢竟在大多數(shù)人的認知里,大模型競賽是互聯(lián)網(wǎng)公司和 AI 實驗室、創(chuàng)業(yè)公司的主場(上榜的模型也大多出自這類機構(gòu))。一個常年和基站、交換機打交道的 ICT 廠商,突然在需要抽象思維和邏輯鏈條的 AI 推理任務(wù)中拔得頭籌,確實帶來了意料之外的「跨界」驚喜。

那么,中興為什么要這么做?為什么可以做那么好?為了弄清楚這些問題,機器之心和中興通訊的首席戰(zhàn)略與生態(tài)專家屠嘉順、星云大模型總工程師韓炳濤、研究員吳琦聊了聊,了解到了通訊與 AI 行業(yè)的緊密聯(lián)系以及星云大模型背后的核心技術(shù),也對中興這家成立 40 年的科技公司的下一站有了新的認識。

中興通訊,為何重倉押注 AI?

在今年 3 月份的 GTC 大會上,英偉達 CEO 黃仁勛曾預(yù)言說,「AI 可以徹底改變通信」。

屠嘉順告訴我們,其實這種改變現(xiàn)在就在發(fā)生。以基站為例,現(xiàn)在的 4G、5G 基站相比前幾年增加了很多,但運維人員數(shù)量的增幅卻沒有那么大。這背后的核心原因是,現(xiàn)在的通信網(wǎng)絡(luò)大量采用自動化技術(shù),形成了所謂的「自治網(wǎng)絡(luò)」,大大減少了對運維人員的需求。

在即將到來的 6G 時代,這種變革會更加明顯。英偉達高級副總裁 Ronnie Vasishta 在一次簡報會上提到,「6G 的倒計時已經(jīng)開始。基礎(chǔ)研究已經(jīng)將注意力轉(zhuǎn)向下一代無線通信。下一代網(wǎng)絡(luò)將是 AI 原生的 ——AI 將嵌入硬件和軟件中…… 下一代無線網(wǎng)絡(luò)需要連接數(shù)千億臺智能設(shè)備,這將需要 AI 的支持」。

屠嘉順同意這種「6G 將是 AI 原生」的說法。他認為,6G 網(wǎng)絡(luò)會從設(shè)計之初就將 AI 作為其核心組成部分,AI 將貫穿于網(wǎng)絡(luò)的架構(gòu)、協(xié)議、功能等各個方面。

正是因為看到了這一顛覆性趨勢的可能性,中興很早就在 AI 方向做前瞻性布局。在內(nèi)部,他們成立了多個 AI 相關(guān)團隊以及星云大語言模型、電信行業(yè)大模型這樣的大型基礎(chǔ)研究團隊,并把智算等 AI 相關(guān)的方向作為重要的戰(zhàn)略方向,涵蓋 AI 基礎(chǔ)設(shè)施、AI 數(shù)據(jù)中心、上層行業(yè)應(yīng)用智能體等多個方面。前段時間,他們開發(fā)的 Co-Sight 智能體還登上了 GAIA 基準(zhǔn)測試的榜首。

其實,除了為未來做準(zhǔn)備,當(dāng)前的中興也已經(jīng)與 AI 深度綁定。無論是網(wǎng)絡(luò)側(cè)、算力側(cè)還是終端側(cè),中興都有相關(guān)的業(yè)務(wù)布局。這些業(yè)務(wù)都需要進行 AI 技術(shù)迭代。

而且作為一家科技公司,中興內(nèi)部也有用 AI 提高研發(fā)效率的需求,比如代碼自動化。他們研發(fā)的星云大模型在其中發(fā)揮了重要作用。目前,在內(nèi)部應(yīng)用中,星云大模型每天產(chǎn)生 15 億 token,合成的代碼量已經(jīng)達到幾千萬行,公司的 AI 代碼占比已經(jīng)達到了 30%

從這些維度來看,中興早已突破大眾對 ICT 廠商的固有認知,實質(zhì)上是以 AI 為核心引擎的科技企業(yè),其發(fā)展軌跡正朝著 AI 領(lǐng)域加速演進。

星云大模型,何以奪冠?

此次星云大模型在 SuperCLUE 推理榜單奪冠,離不開技術(shù)團隊設(shè)計的大模型高效訓(xùn)練優(yōu)化方案。從預(yù)訓(xùn)練到監(jiān)督微調(diào)再到強化學(xué)習(xí),他們試圖在每一步都激發(fā)出模型極致的推理能力。

預(yù)訓(xùn)練:高效構(gòu)建知識圖譜,幫大模型打好基礎(chǔ)

預(yù)訓(xùn)練階段的核心目標(biāo)是提升模型的平均表現(xiàn),類似于人類學(xué)生時代的通識教育。

在這一階段,數(shù)據(jù)非常重要。但是原始的預(yù)訓(xùn)練數(shù)據(jù)存在的知識缺失和知識錯誤的問題,是模型產(chǎn)生知識類幻覺的重要原因。

針對這些問題,研究人員設(shè)計出了一套高效的知識圖譜構(gòu)建方法,幫助大模型迅速形成準(zhǔn)確度極高的知識結(jié)構(gòu)

具體來說,他們提出了一個名叫領(lǐng)域共享屬性和自校驗的圖譜知識注入框架 「DASER」(Domain-Aware Self-validating Entity Representation),該框架能夠準(zhǔn)確識別預(yù)訓(xùn)練文本中的缺失知識和錯誤知識,再利用搜索引擎從互聯(lián)網(wǎng)在線檢索,補全缺失和更正錯誤知識,提升模型的知識性能力,讓模型「看得多」,又「學(xué)得準(zhǔn)」,更「懂得深」。



什么叫「領(lǐng)域共享屬性」?研究人員舉了個例子,假如在現(xiàn)成的預(yù)訓(xùn)練語料中,火星的知識非常豐富,但木星的數(shù)據(jù)殘缺不全,用傳統(tǒng)的預(yù)訓(xùn)練數(shù)據(jù)直接訓(xùn)練必然會缺失大量的木星知識,從而導(dǎo)致模型幻覺。DASER 的創(chuàng)新之處在于使用了同一領(lǐng)域內(nèi)知識的共享規(guī)律 —— 比如行星都具有公轉(zhuǎn)周期、自轉(zhuǎn)周期等共同屬性。因此在構(gòu)建木星知識圖譜時,它會根據(jù)之前所識別到的行星公共屬性去自動填充可復(fù)用的屬性,并通過網(wǎng)絡(luò)檢索進行缺失數(shù)據(jù)填充。

借助這一方法,星云大模型團隊構(gòu)建了覆蓋國家基礎(chǔ)學(xué)科分類體系的全學(xué)科知識圖譜。模型訓(xùn)練效率、推理準(zhǔn)確性均顯著提升,在中興構(gòu)建的高難度私域知識類 QA Bench 上,準(zhǔn)確率指標(biāo)由 61.93% 增長至 66.48%



監(jiān)督微調(diào):批判學(xué)習(xí) + 數(shù)據(jù)飛輪,讓模型理解復(fù)雜指令

監(jiān)督微調(diào)(SFT)階段的目的是將預(yù)訓(xùn)練模型擁有的通用潛力轉(zhuǎn)化為特定領(lǐng)域的專業(yè)能力,讓模型理解并執(zhí)行復(fù)雜指令,這個過程類似于人類的高等教育或職業(yè)培訓(xùn)。

研究人員介紹說,這一階段的數(shù)據(jù)通常有兩類:第一類是標(biāo)準(zhǔn)的 QA「問題 - 正確答案」對,用于直接訓(xùn)練模型模仿正確響應(yīng);第二類是思維鏈數(shù)據(jù),即在答案中顯式包含推理步驟,引導(dǎo)模型分步解決問題。

更進一步,還可以使用批判學(xué)習(xí)(Critique Learning, CL)基于難樣本生成特定形式的思維鏈數(shù)據(jù),讓模型對錯誤答案進行批判并驗證,從而構(gòu)建一個持續(xù)優(yōu)化模型推理與批判能力的「批判 - 推理」數(shù)據(jù)飛輪。

在訓(xùn)練模型的過程中,他們發(fā)現(xiàn)批判學(xué)習(xí)數(shù)據(jù)效果更為顯著。其原理在于:模型如同人腦,對「異常」(如錯誤答案)高度敏感。發(fā)現(xiàn)錯誤并提出批判的過程,比單純接受標(biāo)準(zhǔn)答案更能深化模型的理解。

因此,研究人員在 SFT 中引入了批判學(xué)習(xí)(CL)及成對批判學(xué)習(xí)(PCL)算法。PCL 的關(guān)鍵流程是:

  1. 針對困難樣本,模型給出初始(錯誤)回答。
  2. 模型對錯誤回答進行批判。
  3. 基于批判信息,模型生成修正后的回答。
  4. 利用規(guī)則方法驗證最終答案的正確性。

上述流程將產(chǎn)生 {任務(wù)描述,錯誤回答,批判信息,正確回答} 的四元組訓(xùn)練樣本。進一步的,他們發(fā)現(xiàn)在模型訓(xùn)練中使用從四元組中抽取 {任務(wù)描述,錯誤回答,批判信息} 三元組,而非直接使用四元組,訓(xùn)練效果會更好。

相較于使用純思維鏈類數(shù)據(jù)的 SFT,引入額外 CL/PCL 數(shù)據(jù)的批判 CFT(Critique Fine-Turing)方法在數(shù)學(xué)、代碼等多項推理中準(zhǔn)確率明顯上升。







除此之外,為了讓模型在遇到用戶復(fù)雜指令時也能準(zhǔn)確理解并執(zhí)行。需要讓模型看到更多高質(zhì)量指令數(shù)據(jù)。為了得到這些數(shù)據(jù),他們構(gòu)造了一個數(shù)據(jù)飛輪。如下圖所示,整個飛輪分為四個模塊,其中很多工作可以借助模型來自動完成,比如場景挖掘、候選答案生成。在其中一個關(guān)鍵模塊 —— 模型校驗中,他們也用到了批判學(xué)習(xí)。他們借助這種方式獲得的數(shù)據(jù)反哺訓(xùn)練集,迭代地幫模型提高意圖理解能力。



強化學(xué)習(xí):雙階段強化學(xué)習(xí),提升回答精度與嚴謹度

強化學(xué)習(xí)階段的目的是通過環(huán)境反饋(獎勵信號)進一步優(yōu)化模型的行為策略,使其能夠解決更復(fù)雜的現(xiàn)實世界問題,類似于人類的職場實戰(zhàn)。

在這一階段,星云大模型團隊主要關(guān)心兩個問題:如何提高大模型解決復(fù)雜問題的準(zhǔn)確率和邏輯嚴謹性。

為此,他們提出了雙階段強化學(xué)習(xí),即「先整體糾錯→再局部精修」。

在糾錯階段,他們引入了「批判性強化學(xué)習(xí)(CRL)」,選取 STEM 領(lǐng)域的高難度問題進行專項訓(xùn)練,迭代提升模型回答高難度問題的準(zhǔn)確度。



在精修階段,研究人員發(fā)現(xiàn)使用強化學(xué)習(xí)會導(dǎo)致回答多樣性下降。拿代碼生成舉例,模型可能有多種正確的實現(xiàn)方式, 如果某一種方式因為細微的錯誤被視為負樣本,模型可能會「誤以為」這種方法本身是錯誤的,從而在未來避免使用。這會導(dǎo)致模型生成的答案多樣性下降,甚至在海量強化數(shù)據(jù)優(yōu)化后無法提供解決方案,從能力「涌現(xiàn)」到能力「崩塌」。

為了解決這個問題,他們首先在數(shù)據(jù)層面,將模型回答錯誤的樣本,通過一個離線的拒絕采樣過程,獲取「最小修改」糾錯樣本。再改進傳統(tǒng)強化學(xué)習(xí)算法,單獨計算每個 Token 的回報值。這種「更細粒度」的強化學(xué)習(xí)算法,使模型無論是模型回答還是思維鏈條都更合理,幻覺明顯下降,人類偏好打分提升 13%。

從 ICT 到 AI 的無縫切換

當(dāng) 40 年的 ICT 巨頭闖入 AI 戰(zhàn)場,等待他們的是「跨界」陣痛,還是無縫切換?答案可能是后者。

這是因為,AI 和 ICT 看似「跨界」,實際有很多相似之處,比如它們的核心都在于數(shù)據(jù)的處理、交換和存儲;都是復(fù)雜超大系統(tǒng)的高效協(xié)同。

具體來說,ICT 涉及多個網(wǎng)元組成的龐大網(wǎng)絡(luò),AI 需要芯片、服務(wù)器、存儲、交換和數(shù)據(jù)中心組成高效綠色的基座。這些系統(tǒng)不僅需要達到局部最優(yōu),還要放在一起進行全局優(yōu)化。這要求具備全棧的技術(shù)積累、工程實踐和系統(tǒng)優(yōu)化能力,而這恰恰是中興所擅長的,也是他們在未來重要的戰(zhàn)略方向 ——「智算」中所要強化的。

除此之外,在 AI 這個方向上,中興也有自己獨特的優(yōu)勢。

我們知道,AI 的發(fā)展是一個跨多學(xué)科的復(fù)雜工程科學(xué),它的創(chuàng)新進程離不開大量工程實踐經(jīng)驗,比如參數(shù)調(diào)優(yōu)、算子融合、算法優(yōu)化…… 其涉及領(lǐng)域之廣,技術(shù)門檻之高已經(jīng)讓一些早期入局的企業(yè)感覺吃力。

而從中興身上,我們能夠看到一些走 AI 長期路線的潛質(zhì)。具體來說,和芯片廠家相比,他們有整體的系統(tǒng)工程能力;和做通算的純 IT 類廠家相比,他們的組網(wǎng)能力更強;和純做大模型的廠家相比,他們的硬件能力又更強。所以綜合來看,中興其實更容易拉起整個產(chǎn)業(yè)鏈,無論是硬件開發(fā)、軟件平臺、大模型還是行業(yè)應(yīng)用,他們在原來的領(lǐng)域都已經(jīng)有所涉及。

而且,中興也有巨大的產(chǎn)品生態(tài)支撐,這些產(chǎn)品目前正在「AI 化」。如果未來全部 AI 化,市場空間巨大,也能讓技術(shù)在豐富的場景中快速迭代,形成數(shù)據(jù)反哺。

當(dāng)傳統(tǒng) ICT 巨頭全力擁抱 AI,這場轉(zhuǎn)型會給行業(yè)帶來怎樣的化學(xué)反應(yīng)?答案或許就在中興接下來的每一步里。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
日本很想跟中國再打一仗,臺灣,東南沿海、上海都是他的攻擊目標(biāo)

日本很想跟中國再打一仗,臺灣,東南沿海、上海都是他的攻擊目標(biāo)

慢看世界
2025-06-17 11:13:22
南京市市長陳之常,赴任內(nèi)蒙古

南京市市長陳之常,赴任內(nèi)蒙古

新京報
2025-07-01 17:37:10
房價跌麻了!從371萬到266萬,合肥一樓盤剛交房就虧100多萬…

房價跌麻了!從371萬到266萬,合肥一樓盤剛交房就虧100多萬…

明月雜談
2025-07-01 21:32:29
U16國足隊長被曝4大丑聞!疑似已被國家隊開除 4天后就踢日本隊了

U16國足隊長被曝4大丑聞!疑似已被國家隊開除 4天后就踢日本隊了

二瘋說球
2025-07-01 08:34:05
“清華才女”武亦姝畢業(yè)后現(xiàn)狀曝光,全網(wǎng)都炸了:父母放任不管的代價,原來這么殘酷……

“清華才女”武亦姝畢業(yè)后現(xiàn)狀曝光,全網(wǎng)都炸了:父母放任不管的代價,原來這么殘酷……

LULU生活家
2025-07-02 04:37:19
日媒:美國的困境與中國無關(guān)

日媒:美國的困境與中國無關(guān)

環(huán)球時報國際
2025-07-01 11:09:54
瘦到脫相!鹿晗直播首度回應(yīng)暴瘦內(nèi)情,真實原因令人淚目!

瘦到脫相!鹿晗直播首度回應(yīng)暴瘦內(nèi)情,真實原因令人淚目!

訪史
2025-07-01 11:29:00
為何被迫將中國移動的號碼都改成8元套餐?實在是無可奈何!

為何被迫將中國移動的號碼都改成8元套餐?實在是無可奈何!

柏銘銳談
2025-07-01 17:46:17
手受傷檢查男性功能后續(xù):醫(yī)院稱衛(wèi)健委規(guī)定,衛(wèi)健委停職醫(yī)生調(diào)查

手受傷檢查男性功能后續(xù):醫(yī)院稱衛(wèi)健委規(guī)定,衛(wèi)健委停職醫(yī)生調(diào)查

大川哥
2025-07-01 19:02:22
終于開始收拾李嘉誠,港府把李家踢出局,已經(jīng)沒上桌資格了

終于開始收拾李嘉誠,港府把李家踢出局,已經(jīng)沒上桌資格了

閆樹軍論評
2025-07-01 18:30:07
誰在故意抹黑上海?令全上海蒙羞受冤動物園不讓喂奶真相反轉(zhuǎn)!

誰在故意抹黑上海?令全上海蒙羞受冤動物園不讓喂奶真相反轉(zhuǎn)!

魔都囡
2025-07-01 11:27:11
高考后兒子“網(wǎng)暴”父親,看得人心涼:不僅是白眼狼,更是無賴

高考后兒子“網(wǎng)暴”父親,看得人心涼:不僅是白眼狼,更是無賴

熙熙說教
2025-07-01 20:18:53
正式簽約加盟!拉塞爾!

正式簽約加盟!拉塞爾!

技巧君侃球
2025-07-02 07:09:48
看來泰王還是懂的,在佩通坦被停職的前一天,通過了新的內(nèi)閣名單

看來泰王還是懂的,在佩通坦被停職的前一天,通過了新的內(nèi)閣名單

牛鍋巴小釩
2025-07-02 01:32:42
重磅消息一單接一單!雄鹿隊完成9筆操作,利拉德NBA歷史紀錄

重磅消息一單接一單!雄鹿隊完成9筆操作,利拉德NBA歷史紀錄

蛋疼體育
2025-07-02 07:05:30
能比湖人多給600萬隊記:雄鹿成為湖人得到艾頓的最大勁敵!

能比湖人多給600萬隊記:雄鹿成為湖人得到艾頓的最大勁敵!

直播吧
2025-07-01 22:45:26
首發(fā)中鋒跑了!特納4年1.07億簽約雄鹿,步行者要進入擺爛模式!

首發(fā)中鋒跑了!特納4年1.07億簽約雄鹿,步行者要進入擺爛模式!

田先生籃球
2025-07-02 03:36:18
太慘烈了!一線城市房價,回到了2016年

太慘烈了!一線城市房價,回到了2016年

暴財經(jīng)
2025-07-01 17:44:16
女子拍到野牛跌入89℃溫泉被“煮”死:所幸未受太久痛苦

女子拍到野牛跌入89℃溫泉被“煮”死:所幸未受太久痛苦

大象新聞
2025-07-01 10:04:08
特朗普真要來中國了,特意幫中國說好話,但中方必須滿足一個條件

特朗普真要來中國了,特意幫中國說好話,但中方必須滿足一個條件

掌青說歷史
2025-07-01 16:27:32
2025-07-02 07:20:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
10757文章數(shù) 142353關(guān)注度
往期回顧 全部

科技要聞

不懼小米YU7?特斯拉逆勢漲價

頭條要聞

萬斯“一票破局” 美參議院51比50通過大而美法案

頭條要聞

萬斯“一票破局” 美參議院51比50通過大而美法案

體育要聞

鄭欽文1-2西尼亞科娃 連續(xù)三年溫網(wǎng)一輪游

娛樂要聞

瘦到脫相!鹿晗首度回應(yīng)暴瘦內(nèi)情?

財經(jīng)要聞

中央財經(jīng)委:依法治理企業(yè)低價無序競爭

汽車要聞

2026款MG Cyberster/MG5 兩款新車售5.99萬起

態(tài)度原創(chuàng)

游戲
時尚
手機
數(shù)碼
公開課

《開球!REMATCH》評測:大巧不工"/> 主站 商城 論壇 自運營 登錄 注冊 《開球!REMATCH》評測:大巧不工 神堡薛師傅 2025-07-...

仙女裙+運動鞋=今夏王炸cp!顯瘦!洋氣!巨時髦!

手機要聞

Nothing Phone (3) 手機發(fā)布:背部取消燈條改用小屏幕

數(shù)碼要聞

小米手環(huán)10體驗:十年新里程 重新定義智能手環(huán)標(biāo)準(zhǔn)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 平果县| 平乐县| 义马市| 商都县| 金湖县| 忻城县| 团风县| 抚远县| 屏山县| 望谟县| 内江市| 崇明县| 蓬溪县| 嘉荫县| 桂平市| 页游| 金门县| 嘉黎县| 广平县| 朝阳县| 衡阳县| 曲靖市| 凤山市| 宣恩县| 仙居县| 兰考县| 云阳县| 美姑县| 道真| 肃南| 浑源县| 平顺县| 谢通门县| 大化| 红原县| 康乐县| 喜德县| 厦门市| 龙游县| 白朗县| 永丰县|