文 | 智能相對(duì)論
作者 | 陳泊丞
今年年初,DeepSeek-R1以低成本、高性能以及開源特性在全球AI圈內(nèi)爆火走紅,風(fēng)頭一度壓過OpenAI,同時(shí)也開啟了國(guó)產(chǎn)推理模型持續(xù)“狂飆”時(shí)刻。
回顧過去的2025上半年,「智能相對(duì)論」統(tǒng)計(jì)發(fā)現(xiàn),在DeepSeek之外,阿里、科大訊飛、小米、月之暗面、商湯科技等廠商都陸續(xù)宣告自家大模型對(duì)OpenAI系列模型產(chǎn)品的追趕或是超越。
智能相對(duì)論制圖
國(guó)產(chǎn)模型的加速“狂飆”有目共睹。OpenAI在今年4月一改口風(fēng),發(fā)布了o3/o4 mini模型,或許也有來自后來者追趕的壓力。但是,對(duì)于國(guó)產(chǎn)模型而言,比起性能上的追趕和超越,自我的發(fā)展節(jié)奏也在上半年逐漸形成,初見端倪。
國(guó)產(chǎn)模型的“彎道超車”
DeepSeek的走紅并非是其性能完全超越OpenAI,而是來自于低成本優(yōu)勢(shì)和開源生態(tài)帶來的顛覆性體驗(yàn),使其迅速“破圈”,成為全球熱門AI模型。在過去的半年內(nèi),延續(xù)DeepSeek的破圈邏輯,國(guó)產(chǎn)模型似乎也瞄準(zhǔn)了類似的路徑。
一、低成本突圍,用更少的算力追趕OpenAI的性能。
前不久,阿里千問3登頂全球最強(qiáng)開源模型,也在一定程度上完成了國(guó)產(chǎn)模型的破圈。成就這次現(xiàn)象的關(guān)鍵除了模型快速上線通義App之外,還有就是自身的高性能與低成本特性,其性能在超越OpenAI-o1與DeepSeek-R1的同時(shí),部署成本大幅降低,僅需4張H20即可部署千問3滿血版,顯存占用僅為性能相近模型的三分之一。
盡管在性能上,國(guó)產(chǎn)模型很難跟OpenAI拉開太大的差距,但是在部署成本上的持續(xù)優(yōu)化,從另一個(gè)角度真正意義上完成了對(duì)OpenAI的追趕。幾乎是同一時(shí)間,星火X1也完成升級(jí),整體效果對(duì)標(biāo)OpenAI-o1與DeepSeek-R1。而在算力成本上,星火X1不僅是業(yè)界唯一基于全國(guó)產(chǎn)算力訓(xùn)練的深度推理模型,還成功實(shí)現(xiàn)了只需4張華為910B芯片即可完成部署,把國(guó)產(chǎn)模型的低成本特性再度“打爆”。
中美博弈態(tài)勢(shì)加劇,美國(guó)對(duì)華的算力管控越來越嚴(yán)格,從某種程度來說,這是一種無奈之舉,但同時(shí)也是一個(gè)強(qiáng)勢(shì)突圍的方向,依托低成本部署優(yōu)勢(shì),國(guó)產(chǎn)模型在AI普惠與行業(yè)應(yīng)用中具備更強(qiáng)的適配性。若能繼續(xù)沿著這一方向突圍,國(guó)產(chǎn)模型的行業(yè)滲透率將在今年下半年繼續(xù)保持強(qiáng)勢(shì)增長(zhǎng)。
二、開源生態(tài)破局,重新制定行業(yè)規(guī)則,打破技術(shù)霸權(quán)秩序。
DeepSeek-R1采用MIT協(xié)議,千問3采用Apache2.0協(xié)議,均是極寬松的開源協(xié)議,在OpenAI的閉源霸權(quán)之下,國(guó)產(chǎn)模型更熱衷于用開源策略來吸引全球開發(fā)者的目光,打造一個(gè)更廣泛的模型生態(tài),從而制衡OpenAI的先發(fā)優(yōu)勢(shì)與性能主義。這一策略正在被更多的國(guó)產(chǎn)模型所復(fù)刻,小米也開源了MiMo。
如今,中國(guó)的模型廠商在開源路徑上不斷走出自己的特色,不僅開放了不同參數(shù)規(guī)格的模型產(chǎn)品,還包括各種量化版本、完整的訓(xùn)練數(shù)據(jù)集以及微調(diào)所需的數(shù)據(jù)模板等,滿足了不同場(chǎng)景下的實(shí)際需求,甚至是給到詳細(xì)的API設(shè)計(jì)和文檔,方便開發(fā)者快速集成和使用。
在開源上,國(guó)產(chǎn)模型表現(xiàn)出積極的態(tài)度。比起性能上的追趕,國(guó)產(chǎn)模型也正在試圖在開源與性能之間中找到一個(gè)平衡點(diǎn),基于完善的服務(wù)和生態(tài)來實(shí)現(xiàn)模型的超越。值得一提的,DeepSeek-R1、千問3在HuggingFace等開源社區(qū)上均取得了開發(fā)者們不錯(cuò)的反饋,整個(gè)千問系列的全球衍生模型更是超過10萬個(gè),超越美國(guó)Llama位列第一,說明國(guó)產(chǎn)模型的開源策略正在被更多的全球開發(fā)者所認(rèn)可。
三、特定能力強(qiáng)化,專為行業(yè)應(yīng)用而打造,實(shí)用主義的國(guó)產(chǎn)屬性爆表。
現(xiàn)階段,國(guó)產(chǎn)模型對(duì)OpenAI的超越更多體現(xiàn)在特定的能力或任務(wù)處理上。日日新V6的多模態(tài)處理能力對(duì)標(biāo)OpenAI-o1,同時(shí)迭代成為國(guó)內(nèi)首個(gè)支持10分鐘中長(zhǎng)視頻深度解析的大模型。
為什么要這么強(qiáng)化特定能力?商湯科技認(rèn)為,比起文本性的內(nèi)容消費(fèi),視頻、圖文結(jié)合是更大的內(nèi)容消費(fèi)市場(chǎng)。由此,日日新V6把語音、視頻、文字形成一個(gè)統(tǒng)一跟時(shí)間軸對(duì)齊的上下文表達(dá),從而實(shí)現(xiàn)人機(jī)交互更自然、高效。這種做法更多是從實(shí)際的行業(yè)應(yīng)用出發(fā),日日新V6的能力強(qiáng)化正是為了具身智能的突破做準(zhǔn)備。
這樣的做法類似于中國(guó)的古代智慧“田忌賽馬”,OpenAI-o1在結(jié)構(gòu)化推理方面優(yōu)勢(shì)顯著,而國(guó)產(chǎn)模型則在中文語境、多模態(tài)能力、成本效率上進(jìn)行非對(duì)稱競(jìng)爭(zhēng),不去和OpenAI強(qiáng)勢(shì)的一面做對(duì)抗。同時(shí),這也符合當(dāng)前本土產(chǎn)業(yè)在AI應(yīng)用過程中對(duì)模型能力的需求,順勢(shì)讓國(guó)產(chǎn)模型更快地進(jìn)入企業(yè)級(jí)市場(chǎng),加速商業(yè)化。
模型“狂飆”:OpenAI向左,國(guó)產(chǎn)向右
在今年上半年,OpenAI已經(jīng)推出更強(qiáng)、更智能的o3和o4-mini模型。盡管在成本效率上無法達(dá)到國(guó)產(chǎn)模型的夸張水平,但OpenAI在上代相同的延遲和成本上實(shí)現(xiàn)了更強(qiáng)的性能體驗(yàn)。
OpenAI對(duì)模型性能的追求依舊是業(yè)內(nèi)標(biāo)桿,作為最新的旗艦?zāi)P停琽3和o4-mini(無工具版本)在AIME 2024數(shù)學(xué)競(jìng)賽題目中的準(zhǔn)確率分別達(dá)91.6%和93.4%,遠(yuǎn)遠(yuǎn)甩開o1的74.3%的成績(jī)。而在Codeforces編程競(jìng)賽評(píng)分中,支持終端工具的o3和o4-mini也分別取得2706和2719的ELO分?jǐn)?shù),領(lǐng)先程度有目共睹,展現(xiàn)了其在數(shù)學(xué)和代碼能力上的巨大突破。
除此之外,OpenAI的新模型在知識(shí)問答、多模態(tài)推理等方面也都表現(xiàn)出更強(qiáng)大的能力,再次奠定了其在AI行業(yè)的領(lǐng)軍地位。相對(duì)而言,國(guó)產(chǎn)模型的路徑更多傾向于行業(yè)應(yīng)用,綜合特定能力、成本效率、應(yīng)用流程等條件下追求更適配的AI解決方案。
日前,階躍星辰發(fā)布并開源3D模型Step1X-3D,同一時(shí)間還公布了完整的數(shù)據(jù)清洗策略,數(shù)據(jù)預(yù)處理策略,以及800K高質(zhì)量的3D資產(chǎn),3D VAE、3D geometry Diffusion以及 texture Diffusion的全鏈路訓(xùn)練代碼開源。基于這些強(qiáng)而有力的措施,國(guó)產(chǎn)模型在造福開發(fā)者的同時(shí),也在用近乎掀桌子的方式引領(lǐng)一個(gè)全新的3D社群生態(tài)。
垂直領(lǐng)域的能力強(qiáng)化、開源策略吸引開發(fā)者以及各種成本效率優(yōu)勢(shì)......綜合以上種種優(yōu)勢(shì),國(guó)產(chǎn)模型在上半年正在形成類似的打法來尋求市場(chǎng)突圍。當(dāng)然,盡管如此,國(guó)產(chǎn)模型也沒有放棄主流的前進(jìn)方向,比如多模態(tài)能力依舊是OpenAI和國(guó)產(chǎn)模型的主要迭代方向,基礎(chǔ)模型的能力研發(fā)與突破同樣也在國(guó)產(chǎn)廠商的考量之內(nèi)。
即將過去的2025上半年,是國(guó)產(chǎn)模型的高光時(shí)刻,也是一眾國(guó)產(chǎn)模型在面對(duì)OpenAI的強(qiáng)勢(shì)攻勢(shì)與全球市場(chǎng)激烈博弈下持續(xù)尋求突圍的關(guān)鍵階段。在這場(chǎng)AI比拼中,盡管國(guó)產(chǎn)模型依舊熱衷于對(duì)標(biāo)OpenAI,但是走的路卻是逐步形成了自己的特色。
從某種程度來說,國(guó)產(chǎn)模型不再是完全的追隨者,也在進(jìn)化為獨(dú)立的引領(lǐng)者。在諸多國(guó)產(chǎn)模型的發(fā)展上,這一趨勢(shì)或許在下半年會(huì)越來越明顯。
*本文圖片均來源于網(wǎng)絡(luò)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.