網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

超越OpenAI？國(guó)產(chǎn)推理模型的2025半年“狂飆時(shí)刻”

2025-05-22 17:26:12　來源: 智能相對(duì)論

湖南舉報(bào)

分享至

文 | 智能相對(duì)論

作者 | 陳泊丞

今年年初，DeepSeek-R1以低成本、高性能以及開源特性在全球AI圈內(nèi)爆火走紅，風(fēng)頭一度壓過OpenAI，同時(shí)也開啟了國(guó)產(chǎn)推理模型持續(xù)“狂飆”時(shí)刻。

回顧過去的2025上半年，「智能相對(duì)論」統(tǒng)計(jì)發(fā)現(xiàn)，在DeepSeek之外，阿里、科大訊飛、小米、月之暗面、商湯科技等廠商都陸續(xù)宣告自家大模型對(duì)OpenAI系列模型產(chǎn)品的追趕或是超越。

智能相對(duì)論制圖

國(guó)產(chǎn)模型的加速“狂飆”有目共睹。OpenAI在今年4月一改口風(fēng)，發(fā)布了o3/o4 mini模型，或許也有來自后來者追趕的壓力。但是，對(duì)于國(guó)產(chǎn)模型而言，比起性能上的追趕和超越，自我的發(fā)展節(jié)奏也在上半年逐漸形成，初見端倪。

國(guó)產(chǎn)模型的“彎道超車”

DeepSeek的走紅并非是其性能完全超越OpenAI，而是來自于低成本優(yōu)勢(shì)和開源生態(tài)帶來的顛覆性體驗(yàn)，使其迅速“破圈”，成為全球熱門AI模型。在過去的半年內(nèi)，延續(xù)DeepSeek的破圈邏輯，國(guó)產(chǎn)模型似乎也瞄準(zhǔn)了類似的路徑。

一、低成本突圍，用更少的算力追趕OpenAI的性能。

前不久，阿里千問3登頂全球最強(qiáng)開源模型，也在一定程度上完成了國(guó)產(chǎn)模型的破圈。成就這次現(xiàn)象的關(guān)鍵除了模型快速上線通義App之外，還有就是自身的高性能與低成本特性，其性能在超越OpenAI-o1與DeepSeek-R1的同時(shí)，部署成本大幅降低，僅需4張H20即可部署千問3滿血版，顯存占用僅為性能相近模型的三分之一。

盡管在性能上，國(guó)產(chǎn)模型很難跟OpenAI拉開太大的差距，但是在部署成本上的持續(xù)優(yōu)化，從另一個(gè)角度真正意義上完成了對(duì)OpenAI的追趕。幾乎是同一時(shí)間，星火X1也完成升級(jí)，整體效果對(duì)標(biāo)OpenAI-o1與DeepSeek-R1。而在算力成本上，星火X1不僅是業(yè)界唯一基于全國(guó)產(chǎn)算力訓(xùn)練的深度推理模型，還成功實(shí)現(xiàn)了只需4張華為910B芯片即可完成部署，把國(guó)產(chǎn)模型的低成本特性再度“打爆”。

中美博弈態(tài)勢(shì)加劇，美國(guó)對(duì)華的算力管控越來越嚴(yán)格，從某種程度來說，這是一種無奈之舉，但同時(shí)也是一個(gè)強(qiáng)勢(shì)突圍的方向，依托低成本部署優(yōu)勢(shì)，國(guó)產(chǎn)模型在AI普惠與行業(yè)應(yīng)用中具備更強(qiáng)的適配性。若能繼續(xù)沿著這一方向突圍，國(guó)產(chǎn)模型的行業(yè)滲透率將在今年下半年繼續(xù)保持強(qiáng)勢(shì)增長(zhǎng)。

二、開源生態(tài)破局，重新制定行業(yè)規(guī)則，打破技術(shù)霸權(quán)秩序。

DeepSeek-R1采用MIT協(xié)議，千問3采用Apache2.0協(xié)議，均是極寬松的開源協(xié)議，在OpenAI的閉源霸權(quán)之下，國(guó)產(chǎn)模型更熱衷于用開源策略來吸引全球開發(fā)者的目光，打造一個(gè)更廣泛的模型生態(tài)，從而制衡OpenAI的先發(fā)優(yōu)勢(shì)與性能主義。這一策略正在被更多的國(guó)產(chǎn)模型所復(fù)刻，小米也開源了MiMo。

如今，中國(guó)的模型廠商在開源路徑上不斷走出自己的特色，不僅開放了不同參數(shù)規(guī)格的模型產(chǎn)品，還包括各種量化版本、完整的訓(xùn)練數(shù)據(jù)集以及微調(diào)所需的數(shù)據(jù)模板等，滿足了不同場(chǎng)景下的實(shí)際需求，甚至是給到詳細(xì)的API設(shè)計(jì)和文檔，方便開發(fā)者快速集成和使用。

在開源上，國(guó)產(chǎn)模型表現(xiàn)出積極的態(tài)度。比起性能上的追趕，國(guó)產(chǎn)模型也正在試圖在開源與性能之間中找到一個(gè)平衡點(diǎn)，基于完善的服務(wù)和生態(tài)來實(shí)現(xiàn)模型的超越。值得一提的，DeepSeek-R1、千問3在HuggingFace等開源社區(qū)上均取得了開發(fā)者們不錯(cuò)的反饋，整個(gè)千問系列的全球衍生模型更是超過10萬個(gè)，超越美國(guó)Llama位列第一，說明國(guó)產(chǎn)模型的開源策略正在被更多的全球開發(fā)者所認(rèn)可。

三、特定能力強(qiáng)化，專為行業(yè)應(yīng)用而打造，實(shí)用主義的國(guó)產(chǎn)屬性爆表。

現(xiàn)階段，國(guó)產(chǎn)模型對(duì)OpenAI的超越更多體現(xiàn)在特定的能力或任務(wù)處理上。日日新V6的多模態(tài)處理能力對(duì)標(biāo)OpenAI-o1，同時(shí)迭代成為國(guó)內(nèi)首個(gè)支持10分鐘中長(zhǎng)視頻深度解析的大模型。

為什么要這么強(qiáng)化特定能力？商湯科技認(rèn)為，比起文本性的內(nèi)容消費(fèi)，視頻、圖文結(jié)合是更大的內(nèi)容消費(fèi)市場(chǎng)。由此，日日新V6把語音、視頻、文字形成一個(gè)統(tǒng)一跟時(shí)間軸對(duì)齊的上下文表達(dá)，從而實(shí)現(xiàn)人機(jī)交互更自然、高效。這種做法更多是從實(shí)際的行業(yè)應(yīng)用出發(fā)，日日新V6的能力強(qiáng)化正是為了具身智能的突破做準(zhǔn)備。

這樣的做法類似于中國(guó)的古代智慧“田忌賽馬”，OpenAI-o1在結(jié)構(gòu)化推理方面優(yōu)勢(shì)顯著，而國(guó)產(chǎn)模型則在中文語境、多模態(tài)能力、成本效率上進(jìn)行非對(duì)稱競(jìng)爭(zhēng)，不去和OpenAI強(qiáng)勢(shì)的一面做對(duì)抗。同時(shí)，這也符合當(dāng)前本土產(chǎn)業(yè)在AI應(yīng)用過程中對(duì)模型能力的需求，順勢(shì)讓國(guó)產(chǎn)模型更快地進(jìn)入企業(yè)級(jí)市場(chǎng)，加速商業(yè)化。

模型“狂飆”：OpenAI向左，國(guó)產(chǎn)向右

在今年上半年，OpenAI已經(jīng)推出更強(qiáng)、更智能的o3和o4-mini模型。盡管在成本效率上無法達(dá)到國(guó)產(chǎn)模型的夸張水平，但OpenAI在上代相同的延遲和成本上實(shí)現(xiàn)了更強(qiáng)的性能體驗(yàn)。

OpenAI對(duì)模型性能的追求依舊是業(yè)內(nèi)標(biāo)桿，作為最新的旗艦?zāi)Ｐ停琽3和o4-mini（無工具版本）在AIME 2024數(shù)學(xué)競(jìng)賽題目中的準(zhǔn)確率分別達(dá)91.6%和93.4%，遠(yuǎn)遠(yuǎn)甩開o1的74.3%的成績(jī)。而在Codeforces編程競(jìng)賽評(píng)分中，支持終端工具的o3和o4-mini也分別取得2706和2719的ELO分?jǐn)?shù)，領(lǐng)先程度有目共睹，展現(xiàn)了其在數(shù)學(xué)和代碼能力上的巨大突破。

除此之外，OpenAI的新模型在知識(shí)問答、多模態(tài)推理等方面也都表現(xiàn)出更強(qiáng)大的能力，再次奠定了其在AI行業(yè)的領(lǐng)軍地位。相對(duì)而言，國(guó)產(chǎn)模型的路徑更多傾向于行業(yè)應(yīng)用，綜合特定能力、成本效率、應(yīng)用流程等條件下追求更適配的AI解決方案。

日前，階躍星辰發(fā)布并開源3D模型Step1X-3D，同一時(shí)間還公布了完整的數(shù)據(jù)清洗策略，數(shù)據(jù)預(yù)處理策略，以及800K高質(zhì)量的3D資產(chǎn)，3D VAE、3D geometry Diffusion以及 texture Diffusion的全鏈路訓(xùn)練代碼開源。基于這些強(qiáng)而有力的措施，國(guó)產(chǎn)模型在造福開發(fā)者的同時(shí)，也在用近乎掀桌子的方式引領(lǐng)一個(gè)全新的3D社群生態(tài)。

垂直領(lǐng)域的能力強(qiáng)化、開源策略吸引開發(fā)者以及各種成本效率優(yōu)勢(shì)......綜合以上種種優(yōu)勢(shì)，國(guó)產(chǎn)模型在上半年正在形成類似的打法來尋求市場(chǎng)突圍。當(dāng)然，盡管如此，國(guó)產(chǎn)模型也沒有放棄主流的前進(jìn)方向，比如多模態(tài)能力依舊是OpenAI和國(guó)產(chǎn)模型的主要迭代方向，基礎(chǔ)模型的能力研發(fā)與突破同樣也在國(guó)產(chǎn)廠商的考量之內(nèi)。

即將過去的2025上半年，是國(guó)產(chǎn)模型的高光時(shí)刻，也是一眾國(guó)產(chǎn)模型在面對(duì)OpenAI的強(qiáng)勢(shì)攻勢(shì)與全球市場(chǎng)激烈博弈下持續(xù)尋求突圍的關(guān)鍵階段。在這場(chǎng)AI比拼中，盡管國(guó)產(chǎn)模型依舊熱衷于對(duì)標(biāo)OpenAI，但是走的路卻是逐步形成了自己的特色。

從某種程度來說，國(guó)產(chǎn)模型不再是完全的追隨者，也在進(jìn)化為獨(dú)立的引領(lǐng)者。在諸多國(guó)產(chǎn)模型的發(fā)展上，這一趨勢(shì)或許在下半年會(huì)越來越明顯。

*本文圖片均來源于網(wǎng)絡(luò)

聲明：個(gè)人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.