99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

國產六大推理模型激戰OpenAI?

0
分享至

撰文| 郝 鑫

編輯| 王 潘

“DeepSeek-R1如同當年蘇聯搶發的第一顆衛星,成為AI開啟新時代的斯普特尼克時刻。”

2025年春節前,DeepSeek比除夕那天的煙花先一步在世界上空綻放。

離年夜飯僅剩幾個小時,國內某家云服務器的工程師突然被拉入工作群,接到緊急任務,要求其快速調優芯片,以適配最新的DeepSeek-R1模型。該工程師告訴我們,“從接入到完成,整個過程不到一周”。

大年初二,一家從事Agent To B業務的廠商負責人電話被打爆,客戶的要求簡單粗暴:第一時間驗證模型真實性能,盡快把部署提上日程。

節前大模型,節后只有DeepSeek。DeepSeek-R1就像一道分水嶺,重新書寫了中國大模型的敘事邏輯。


以2022年11月,OpenAI發布基于GPT-3.5的ChatGPT應用為起點,國內自此走上了追趕OpenAI的道路。2023年,大模型如雨后春筍般冒出頭,無大模型不AI,各廠商你追我趕,百模大戰初見端倪。

你方唱罷我登場,2024年的主人公變成了“AI六小虎”,AI創業成為新的故事腳本。僅一年的時間,智譜累計完成40億元人民幣融資,月之暗面融資總額超13億美元。在資本拋出橄欖枝后,他們站到了聚光燈下,一躍成為明星獨角獸公司。

新的轉折點發生在DeepSeek-R1爆火后,曾有一段時間內行業陷入了“一半火焰,一半海水”的境地,即一邊積極擁抱學習R1,一邊陷入了深深的自省。

徘徊是短暫的,隨著百度、阿里、字節、騰訊、科大訊飛等廠商紛紛發布最新的推理模型,2025年的AI敘事主題呼之欲出:“六大推理模型迎戰OpenAI”。

推理模型的當打之年

回看OpenAI的模型發布時間線,在基礎模型方向,可以分為GPT系列和o系列,2024年OpenAI所發布的o1是一個里程碑式的轉向。



(光子星球制圖)

GPT系列是OpenAI最早構建的模型體系,聚焦自然語言處理、對話系統與文本生成,強調語言流暢性與上下文理解能力。o系列是OpenAI于2023年新設立的模型家族,核心聚焦“結構化推理”能力,強調模型的邏輯、分析、工具調用能力,是對GPT系列“語言偏重”路線的補充與擴展。

未來GPT系列或將逐漸退出歷史舞臺。OpenAI在更新日志中宣布,自2025年4月30日起,GPT4將在ChatGPT中退役,將完全被GPT4o取代。

如果只是OpenAI自身技術選擇,o系列和DeepSeek-R1并不會帶來如此強大的影響。以底層模型架構舉例,有公司選擇傳統的Transformer架構,也有公司選擇自研架構。

o系列崛起有一個大背景,即大模型范式的改變,從傳統預訓練階段模型參數的Scaling Law,轉移到強化學習推理計算帶來新Scaling Law。這一點在OpenAI的o3開發過程中得到了驗證,OpenAI觀察到大規模強化學習表現出與GPT系列預訓練中觀察到的趨勢相同,計算量越大,性能越好。

簡而言之,就是讓AI自己規劃、學習、反饋和完成任務,這與如今大熱的Agent所需具備的能力一致。

有技術人員告訴光子星球,o1以后所發布的“Deep Research”Agent,完全基于模型從頭訓練,且未公開思維鏈推理過程。“這意味著底座模型能力直接決定了Agent的落地效果”,想要在大模型第二程變得有競爭力,推理模型幾乎成為了必選。

站在公司和技術一號位角度,第一時間跟進o1和DeepSeek-R1是一種判斷和眼光,但同時也代表著重投入與高風險。

我們了解到國內的很多公司,名義上有自研大模型,但實則是“套殼”。o系列站在GPT的肩膀上誕生,這導致地基不牢的公司只能望而卻步。另一方面,融資和商業化變現的壓力,又淘汰了一批公司。



(光子星球制圖)

于是,我們發現去年星光暗淡的大廠們,成為了反應最快,跟進最及時的代表。

以DeepSeek-R1(2025年1月20日發布)為時間基準線,當月科大訊飛就發布了深度推理大模型——訊飛星火X1;3月,百度發布文心大模型X1,阿里發布通義千問Qwen-QwQ-32B推理模型,騰訊發布混元T1深度思考模型;4月,字節豆包1.5深度思考模型上線,同時訊飛星火X1迎來升級,發布“快思考、慢思考統一模型”。

上述廠商有一些共同之處,跟上了每一次的模型能力升級進度,在轉向推理方向前,其基礎模型能力基本都達到了GPT-4的水平。以此作為參照,這可能是邁入大模型第二階段的基本條件。

六大推理模型混戰o3

o3目前是OpenAI最強大的推理模型。網上流傳的一張大模型IQ圖顯示,人類平均IQ為100,o3智商達到了驚人的136。

測試數據顯示,o3在多項基準測試中超越了o1的性能,特別在分析圖像、圖表和圖形等視覺任務中表現尤為出色。

在外部專家的評估中,o3在困難的現實任務中比o1犯的重大錯誤減少20%,在編程、商業、咨詢和創意構思等領域都有不錯的表現。

需要承認的是,OpenAI存貨確實有兩把刷子,繼o1之后,o3又成為了新的大模型性能攀登高峰。但國內各大模型廠商的跟進速度并不慢,若以DeepSeek-R1為參考標準,百度、阿里、科大訊飛、字節、騰訊后面所發布的推理模型水平相差不大,部分在一些測試指標上甚至有超越。

截至目前,國產六大推理模型各有千秋。

DeepSeek-R1的意義不言而喻,完整的技術報告和開源部署,給予了行業推理大模型訓練思路。打開了OpenAI閉源的“黑匣子”,成功復刻出了性能相差無幾的o1。R1突出的特點是“花小錢辦大事”,高效且追求極致性價比。在非常有限的算力、數據等資源投入的情況下,訓練成本卻僅為560萬美元,遠低于美國AI公司的數千萬美元乃至數億美元投入。

一位知情人士告訴我們,DeepSeek-R1和一些國產推理大模型不構成直接競爭對手。在B端業務中,目前阿里開源的千問系列模型占比更重。“全尺寸和全模型,就像一個全家桶,可以供客戶選擇。32B的模型大小,跑起來成本也不是很高”。

百度在這波中從生態層面接入了DeepSeek,這給了用戶更多選擇權,開源和免費的策略或將能吸引更多用戶。文心大模型X1采用“思維鏈-行動鏈”協同訓練,在復雜任務中自動拆解為二十多個推理步驟,同時可以調用十幾種的工具鏈,以此來增強Agent的能力。

有參與過與百度合作的人士告訴光子星球,在金融、醫療、政務等一些垂類領域,百度會“牽線搭橋”,把一些相關業務的公司攢到一個局。“百度提供基礎模型,我們提供另一方所需的技術,最后直接跟百度核算”。通過這種方式,百度正不斷縮小To B大模型市場與科大訊飛之間的差距。

科大訊飛的星火X1,是當前業界唯一基于全國產算力訓練的深度推理大模型。

正是基于全棧國產、自主可控的優勢,科大訊飛的星火大模型倍受央國企和政府客戶的青睞,保持行業端領先。4月21日,星火X1升級提升了通用能力,也同步增強了面向行業的解決方案能力。在重點行業,如教育、醫療、司法等領域的測試中,都獲得了超過OpenAI和DeepSeek的分數,這些能力無疑會在今年大模型訂單中有所體現。

星火X1一個模型同時支持兩種思考模式,提升了模型處理不同復雜度任務的能力,滿血版星火X1僅需4張卡(華為910B)即可部署。與華為的深度合作,以及不斷迭代的底座大模型能力和強大的行業大模型落地體系,已經成為科大訊飛在一眾大廠圍剿中突出重圍的三大利器。

國內閉源大模型中,豆包模型被評價為“有一定價格競爭力”。一位做AI玩具的廠商告訴我們,他的產品接入了多家大模型,在用戶使用過程中,優先使用各家的免費Token額度,“一旦超過后,優先切換豆包,價格能控制在比較低的成本”。

去年,豆包參與主導了價格戰,豆包大模型價格降至0.0008元/千Tokens,豆包視覺理解模型定價0.003元/千Tokens,均低于當時行業平均水平。此外,豆包大模型是技術落地AI應用產品值得借鑒的案例,端到端的實時語音技術、多模態、Agent技術都能在第一時間介入豆包應用端,這也是支撐其快速迭代更新的原因之一。

騰訊混元入場較晚。有員工曾向我們表示,混元團隊成員大部分以前是搜索推薦廣告出身,跟通義、字節或許有一定差距,“趕鴨子上架,好像也沒什么明確方向,東一下西一下”,“一群外行人指導內行人”。加之人員的流逝,導致了混元曾一度處于停滯狀態。

借著DeepSeek崛起的東風,元寶已經悄然實現了逆襲。至少從數據層面看,已經取得階段性成果。一位內部人士告訴我們,2025年春節以來的這幾個月,騰訊傾注了整個集團資源對元寶進行推廣,無論線下活動資源,還是微信導流或者預算投入,對于元寶都是重點傾斜,通過這種大力出奇跡的方式,逆轉了此前完全被動的局面。

從目前各公司的市場反饋來看,云端多模調用已經逐漸被認可,各家模型并存,用戶按需調取才是未來。在現實情況中,客戶最終是否選用一款大模型,模型性能只是一項衡量標準,背后可能還涉及數據、生態等多方面的考量。

大模型全面國產

自DeepSeek-R1開始,國產推理大模型成為了各榜單的常客,AI開源社區的用戶以真實的下載量和Star數來支持中國AI的發展。

即便如此,當前大模型仍面臨著或多或少的“卡脖子”的問題。

近期,有消息稱,英偉達已通過非正式渠道通知其AIC合作伙伴(如七彩虹、影馳、同德等),暫停GeForce RTX 5090D的銷售和出貨。這一舉措被認為是英偉達在應對國際環境變化的預防性措施。

盡管英偉達尚未發布正式公告,但業內普遍認為,RTX 5090D的供應已進入“暫停狀態”,這僅僅才只是開始。

若從源頭上被限制,英偉達必將遭遇更加巨額的損失,而美國之外國家的大模型發展將遭遇不確定性,追趕OpenAI的步伐也將受到一定的阻礙。

在此背景下,全國產化技術路徑將越來越成為大家的備選項。這其中,科大訊飛做了較為充分的準備。據了解,科大訊飛與合作伙伴聯合通過四大核心技術優化,實現MoE模型集群推理性能翻倍提升。

根據最新測試集評測結果,星火X1在通用任務效果評測中全面對標OpenAI o1和DeepSeek R1,在數學、知識問答等方面表現突出,這表明在技術自主可控的道路上,中國AI已具備與國際頂尖模型同臺競技的實力。

去年風光無限的AI六小虎,如今早已各奔東西,境遇迥然。被DeepSeek擊碎“AGI理想”“學術天才創業”和“明星AI產品”的月之暗面,回歸到低調的技術研發中;將底層技術和產品解綁后的MiniMax,加大了對技術的投入,方向同樣為Agent和推理模型;六小虎中的智譜終于盼來了即將IPO的好消息,不過其整體營收、估值以及能否順利實現IPO,仍充滿變數。

去年,Kimi、海螺AI等AI應用的出圈,短暫地迎來了AI公司的高光時刻。但今年,推理模型已經成為了國內各大廠商角逐的重要方向,AI六小虎的方向與大廠高度重合,而決定他們能否生存下去的“口糧”則握在大廠們的手上。

如今,隨著六大推理大模型的全面崛起,以及國際環境的不確定性加劇,全棧國產化大模型有望將成為一種新的主流。

從半導體、工業軟件與信創再到今天的AI芯片,歷史的經驗告訴我們,想要擺脫被制約的現狀就得實現獨立自主,將命運牢牢掌握在自己手中。或許在不久的將來,越來越多的國產大模型將走上全棧國產化對抗OpenAI們的道路。

微信號|TMTweb

公眾號|光子星球

別忘了掃碼關注我們!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
沙特豪門站隊中國球迷!利雅得新月退出香港賽,疑似不滿米高事件

沙特豪門站隊中國球迷!利雅得新月退出香港賽,疑似不滿米高事件

小金體壇大視野
2025-07-18 08:33:11
“大尺度”女星的瓜!

“大尺度”女星的瓜!

文刀萬
2025-05-23 06:05:02
80萬美軍進入最高戰備,目標是中國,如果開戰,解放軍能否打贏

80萬美軍進入最高戰備,目標是中國,如果開戰,解放軍能否打贏

文雅筆墨
2025-07-18 07:40:46
男子超市買347瓶五糧液207瓶是假貨,超市:入庫酒為真品,但被員工周某換成假酒,法院判超市對假酒退款,并賠12萬余元

男子超市買347瓶五糧液207瓶是假貨,超市:入庫酒為真品,但被員工周某換成假酒,法院判超市對假酒退款,并賠12萬余元

揚子晚報
2025-07-18 23:56:55
大鵬《長安的荔枝》結尾太諷刺,“電影版”環衛工8噸垃圾找手表

大鵬《長安的荔枝》結尾太諷刺,“電影版”環衛工8噸垃圾找手表

一娛三分地
2025-07-18 22:33:18
中國的征信,已經到了不能不管的地步了

中國的征信,已經到了不能不管的地步了

墜入二次元的海洋
2025-07-14 02:53:25
向美國捐8億被罵叛徒!無錫唐氏21代掌門:我的錢只認文明歸屬

向美國捐8億被罵叛徒!無錫唐氏21代掌門:我的錢只認文明歸屬

云景侃記
2025-07-16 14:29:21
對黃楊鈿甜耳環的通報,我有理有據地提出質疑

對黃楊鈿甜耳環的通報,我有理有據地提出質疑

虬髯客好忙
2025-07-17 18:13:36
寧可下跪也不反抗,靠西方施舍立國的國家,都鄙視中國的斗爭精神

寧可下跪也不反抗,靠西方施舍立國的國家,都鄙視中國的斗爭精神

boss外傳
2025-06-26 08:10:03
新國標即將實施,“電雞”車速超25km/h會自動斷電,重要提醒

新國標即將實施,“電雞”車速超25km/h會自動斷電,重要提醒

魯中晨報
2025-07-18 07:00:03
三次上門挑釁:我要睡你老婆!被丈夫連捅38刀,不要欺負老實人!

三次上門挑釁:我要睡你老婆!被丈夫連捅38刀,不要欺負老實人!

談史論天地
2025-07-15 14:20:03
已下架!七大著名酸奶全軍覆沒,實為科技糖水,以后別再被騙了!

已下架!七大著名酸奶全軍覆沒,實為科技糖水,以后別再被騙了!

阿纂看事
2025-07-16 21:30:01
就在今天,7月19日凌晨!跳水隊傳來了全紅嬋的最新消息!

就在今天,7月19日凌晨!跳水隊傳來了全紅嬋的最新消息!

皮皮觀天下
2025-07-19 06:18:14
臺風“韋帕”已升級! 預計周日下午至夜間在這一帶登陸→

臺風“韋帕”已升級! 預計周日下午至夜間在這一帶登陸→

椰城椰城
2025-07-19 10:17:31
為討好特朗普,卡尼對華加稅25%,中方轉手將訂單交給了澳大利亞

為討好特朗普,卡尼對華加稅25%,中方轉手將訂單交給了澳大利亞

掌青說歷史
2025-07-18 16:03:15
金毛被判安樂死,臨走給主人最后一個擁抱,獸醫一句話眾人愣住

金毛被判安樂死,臨走給主人最后一個擁抱,獸醫一句話眾人愣住

城事錄主
2025-07-16 09:15:24
剛剛!知情人士:黑石集團退出競購TikTok美國業務財團

剛剛!知情人士:黑石集團退出競購TikTok美國業務財團

瑪麗姬絲
2025-07-19 12:57:31
10萬大軍逃亡,烏新總理塵埃落定,澤連斯基民調落后,轉折點出現

10萬大軍逃亡,烏新總理塵埃落定,澤連斯基民調落后,轉折點出現

歷史求知所
2025-07-18 12:20:03
66年,薄一波夫婦深夜嚴肅詢問兒子:還跟劉源玩嗎,聽完松了口氣

66年,薄一波夫婦深夜嚴肅詢問兒子:還跟劉源玩嗎,聽完松了口氣

百年人物志
2025-05-24 10:07:04
人類史上最大最瘋狂的超級工程:已持續建設48年,還有25年才完工

人類史上最大最瘋狂的超級工程:已持續建設48年,還有25年才完工

特特農村生活
2025-07-18 04:10:23
2025-07-19 14:12:49
光子星球 incentive-icons
光子星球
細微之處,看見未來!
1136文章數 2124關注度
往期回顧 全部

科技要聞

工信部等約談17家車企巨頭,競爭劃新紅線

頭條要聞

農夫山泉等被指或受良渚自來水事件影響 知情人士發聲

頭條要聞

農夫山泉等被指或受良渚自來水事件影響 知情人士發聲

體育要聞

西蒙尼最彪悍的弟子,正成為下個“匪帥”

娛樂要聞

肖戰微博改名爆!保留了三部代表作

財經要聞

娃哈哈爭產大戰:杜建英的進擊

汽車要聞

中汽中心新能源檢驗中心煥新發布"汽車行車控制安全技術驗證VCTA"

態度原創

房產
數碼
藝術
本地
公開課

房產要聞

一梯一戶純板樓!斷貨三年,海口這一核心區,硬貨出場!

數碼要聞

七彩虹隱星G16 Pro存儲性能評測:搭載長江存儲PC411 1TB SSD 隨機性能秒殺同類產品

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

換個城市過夏天 | 誰打翻了濰坊的調色盤?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 锦屏县| 新郑市| 耿马| 高邮市| 屯门区| 济宁市| 巴东县| 福安市| 阜新市| 高雄县| 高阳县| 张家界市| 赣榆县| 陇西县| 霍林郭勒市| 西充县| 扶绥县| 贡山| 奇台县| 黔西| 新乡县| 恩施市| 板桥市| 乌兰浩特市| 高淳县| 邢台县| 如东县| 孝昌县| 渑池县| 泉州市| 澄江县| 耒阳市| 阳原县| 锡林浩特市| 泸水县| 遂平县| 安丘市| 巩留县| 湄潭县| 镇原县| 宿松县|