99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

來自中國的大模型成最大黑馬,成本僅國外三十分之一,硅谷恐慌

0
分享至

1.25

知識分子

The Intellectual



圖源:pixabay

撰文 |張天祁 李珊珊

“Meta的生成式AI部門正處于恐慌中。這一切始于 Deepseek,它使得 Llama 4 在基準測試中已經落后。雪上加霜的是:那個不知名的中國公司,僅有 550 萬美元的訓練預算。工程師們正在瘋狂地剖析 Deepseek,并試圖從中復制一切可能的東西……”

一位Meta的工程師在美國科技公司員工社區Blind中這樣寫道。

5天前,中國的一家AI大模型創業公司DeepSeek(深度求索)正式發布 DeepSeek-R1大模型。在發布聲明中,DeepSeek表示, DeepSeek-R1在數學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1 正式版。這一消息震動了全球AI圈。

例如,在AIME 2024數學基準測試中,DeepSeek-R1的得分率為79.8%,而OpenAI-o1的得分率為79.2%。在MATH-500基準測試中,DeepSeek-R1的得分率為97.3%,而OpenAI-o1的得分率為96.4%。在編碼任務中,DeepSeek-R1超過了96.3%的人類選手,而o1是96.6%。



01

一樣好用,

但成本不到三十分之一

這個來自中國的大模型,雖然各項指標往往只是與國外的競品“相當”,最多也只是“略強”,但它的低成本,以及在算力資源上的節省,仍然令國外同行在《自然》雜志上驚呼:“這太瘋狂了,完全出乎意料”。

DeepSeek 現在尚未公布訓練 R1 的完整成本,但它公布了API的定價,每百萬輸入 tokens 1 元(緩存命中)/ 4 元(緩存未命中),每百萬輸出 tokens 16 元。這個收費大約是 OpenAI o1運行成本的三十分之一。



在低價優質的基礎上,DeepSeek-R1還實現了部分開源。官方聲明同步開源了模型權重,允許研究者和開發者在自己的項目中自由使用該模型,或在其基礎上進行進一步的研究和開發。DeepSeek-R1系列支持商業用途,并且允許用戶對模型進行任何形式的修改和衍生創作。同時,DeepSeek-R1對用戶開放思維鏈輸出,這意味著我們能直接看到它以文本形式輸出的“思考”過程。

去年 12 月底,DeepSeek發布的DeepSeek-V3已經引起過一次AI圈的震動。它的性能GPT-4o和Claude Sonnet 3.5等頂尖模型相近,但訓練成本極低。整個訓練在2048塊英偉達H800 GPU集群上完成,僅花費約557.6萬美元,不到其他頂尖模型訓練成本的十分之一。

GPT-4o等模型的訓練成本約為1億美元,至少在萬個GPU量級的計算集群上訓練,而且使用的是性能更為優越的H100 GPU。例如,同為頂尖大模型,去年發布的Llama 3.1在訓練過程中使用了16,384塊H100 GPU,消耗了DeepSeek-V3 11倍的計算資源,成本超過6000萬美元。

隨著大模型的競爭越來越卷,去年OpenAI、Meta、Google以及馬斯克的xAI,各大AI巨頭都開始打造自己的萬卡(GPU)集群,萬卡集群似乎成了訓練頂尖大模型的入場券。但DeepSeek卻用不到十分之一的資源打造出性能相近的大模型,這讓習慣了資源競賽的硅谷AI界人士感到意外。

DeepSeek-V3發布后,英偉達高級研究科學家Jim Fan曾在社交媒體上表示,“DeepSeek是本年度開源大語言模型領域的最大黑馬[1]”。

硅谷人工智能數據服務公司Scale AI的創始人亞歷山大·王(Alexander Wang)則在社交媒體上直言不諱地表達了對中國科技界追趕美國的擔憂。他認為DeepSeek-V3的發布,是中國科技界帶給美國的苦澀教訓。“當美國休息時,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上。”

而今年年初DeepSeek-R1發布后,硅谷科技界的評價依然很高。亞歷山大·王認為“我們發現,DeepSeek……是表現最好的,或者大致與美國最好的模型相當.這個領域的競爭越來越激烈,而不是越來越少[2]”。

Jim Fan的評價更上一層樓,甚至討論起了DeepSeek“接班”OpenAI的話題。相比依靠閉源構筑護城河的OpenAI,他在社交網站上表示“我們生活在這樣一個時間線上,一家非美國公司正在維持 OpenAI 的原始使命——真正開放、前沿的研究,賦予所有人力量。這看似不合邏輯,但最有趣的結果往往最容易發生[3]”。

在基準測試中的得分未必能完全代表大模型的真實能力,科學家們對R1的能力持更為謹慎的態度。目前,科學家們已經開始對R1進行更深入的測試。

德國埃爾蘭根馬克斯·普朗克光學研究所人工智能科學家實驗室負責人馬里奧·克倫,讓OpenAI o1和DeepSeek-R1兩個競爭模型對3,000個研究想法按照其有趣程度進行排序,并將結果與人類的排序進行了比較。在這個評估標準上,R1的表現略遜于o1。然而,她指出R1在某些量子光學計算任務中表現優于o1[4]。

02

不走尋常路

引起AI圈好奇的,除了DeepSeek-R1性能表現和低成本,還有技術論文中展示的,DeepSeek團隊對于AI訓練方法的新嘗試。

以往的模型在提升推理能力時,通常依賴于把監督微調(SFT)這個環節。在監督微調階段,研究人員會使用大量已標注的數據對預訓練的AI模型進行進一步訓練。這些數據包含了問題及其對應的正確答案,以及如何建立思考步驟的范例。靠著這些模仿人類思維的“例題”和“答案”,大模型得以提升推理能力。

DeepSeek-R1訓練過程中的DeepSeek-R1-Zero路線則直接將強化學習(RL)應用于基礎模型。他們的目標是探索大模型在沒有任何監督數據的情況下,通過純強化學習過程進行自我進化,從而獲得推理能力。

團隊建立了兩條最簡單的獎勵規則。一條是準確性獎勵,對了加分錯了減分。另一條是格式要求,模型要把思考過程寫在標簽之間,類似于考試中我們必須把答案寫在答題框里。不靠“例題”,只讓AI這個“學生”以自己的方式學會做推理。

從基準測試的成績看,DeepSeek-R1-Zero 無需任何監督微調數據即可獲得強大的推理能力。在AIME 2024基準測試里,使用多數投票機制時的DeepSeek-R1-Zero達到86.7%準確率,高過OpenAI o1。

在訓練OpenAI o1這個級別的推理模型這個任務上,DeepSeek-R1是首個直接強化學習證明這一方法有效的模型。

艾倫人工智能研究所(Allen Institute for AI)的研究科學家內森·蘭伯特(Nathan Lambert)在社交媒體上表示,R1的論文“是推理模型研究不確定性中的一個重要轉折點”,因為“到目前為止,推理模型一直是工業研究的一個重要領域,但缺乏一篇具有開創性的論文[5]。”

中山大學集成電路學院助理教授王美琪解釋稱,直接強化學習方法與 DeepSeek 團隊在多版模型迭代中的一系列工程優化技術(如簡化獎懲模型設計等)相結合,有效降低了大模型的訓練成本。直接強化學習避免了大量人工標注數據的工作,而獎懲模型的簡化設計等則減少了對計算資源的需求。

DeepSeek-R1 的成果顯示,大規模運用直接強化學習,而非依賴大模型經典訓練范式(如采用預設思維鏈模版和監督微調)是可行的。這為大模型訓練提供了更高效的思路,有望啟發更多研究人員和工程師沿著這一方向進行復現與探索。DeepSeek 還開源模型并提供了詳細技術報告,也有助于他人快速驗證和拓展該方法。

“從核心原理上來講,DeepSeek的大部分訓練技巧在AI發展過程中都有跡可循,但其所揭示的直接強化學習的巨大潛力,以及訓練過程中自反思和探索行為的涌現,對大模型高效訓練乃至人類學習模式的探索都有很大啟發意義。”王美琪說。

03

這個大模型能為中國的AI行業帶來什么?

對于DeepSeek,《自然》雜志指出:盡管美國出口管制限制中國公司獲得為人工智能處理而設計的最佳計算機芯片,但它還是成功制造了(DeepSeek的)R1。

在硅谷,人們將這個節省算力的中國大模型稱作“來自東方的神秘力量”,從《紐約時報》到《連線》、《福布斯》幾乎所有的媒體都在說:美國對先進半導體的出口管制旨在減緩中國人工智能的發展,但這可能無意中刺激了創新。”

那么,這樣一個節省算力的大模型會成為中國針對AI芯片禁運的解法嗎?

一位人工智能領域的專家告訴《知識分子》:最終,“還是需要把芯片搞上去。”

算力困境仍在,然而,這樣一個極度節省算力的大模型的出現仍然給中國的大模型們帶來了新的希望——除了算力,我們可以依靠的還有優化。正如《自然》雜志上引用的華盛頓西雅圖的人工智能研究員 Fran?ois Chollet 的評價:“這一事實表明,高效利用資源比單純的計算規模更重要。”

《福布斯》則指出,它讓世界認識到,“中國并未退出這場(人工智能的)競賽。”

這個來自中國的大模型讓人們看到了從構架、算法上進行優化的潛力,幾乎是以一己之力扭轉了全球大模型領域對算力的瘋狂追逐,為無數的小公司帶來了新的機會。

《自然》雜志說,DeepSeek的V3訓練時只花了不到600萬美元,而Meta訓練其最新人工智能模型Llama 3.1 405B時所耗資金超過6000萬,《紐約時報》說:“有600萬美元資金的公司在數量上遠遠多于有1億美元或10億美元資金的公司”。

效率之外,DeepSeek另一個常被夸贊的亮點是開源。Reddit上,人們贊嘆DeepSeek“開源、而且可以本地運行”,“我一定要下載一個到我的電腦上”。

開源,這意味著這個模型的研發者將不僅只與自己的同事合作,他們“其實在與世界各地最優秀的同行合作”,《紐約時報》說,“如果最好的開源技術來自中國,美國開發人員將在這些技術的基礎上構建他們的系統。從長遠來看,這可能會讓中國成為研發人工智能的中心。”

當然,引領整個生態,那是遙遠的未來,開源,更為直接的,肉眼可見的一個影響是:“一個開源又好用的AI,它會迅速占領學術界的”,前述人工智能相關專家告訴《知識分子》。



參考文獻:

;1]Nature Publishing Group. (2025). China’s cheap, open AI model DeepSeek thrills scientists. Nature.

[2]Jiang, B. (2025, January 13). Meet DeepSeek: the Chinese start-up that is changing how AI models are trained. South China Morning Post.

[3]Field, H. (2025, January 23). Scale AI CEO says China has quickly caught the U.S. with the DeepSeek open-source model. CNBC.

[4]Nature Publishing Group. (2025b). China’s cheap, open AI model DeepSeek thrills scientists. Nature.

[5]Chowdhury, H. (2025, January 22). A Chinese startup just showed every American tech company how quickly it’s catching up in AI. Business Insider.

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
ESPN:米奇從監獄把德章泰-穆雷撈了出來 將他培養進了NBA

ESPN:米奇從監獄把德章泰-穆雷撈了出來 將他培養進了NBA

直播吧
2025-05-03 09:17:14
賈平凹 :人老了,躺在病床上才明白,廢掉身體最快速的方式,不是抽煙、喝酒、打麻將,而是這2件事

賈平凹 :人老了,躺在病床上才明白,廢掉身體最快速的方式,不是抽煙、喝酒、打麻將,而是這2件事

感覺會火
2025-02-18 12:12:18
重慶榮昌的高書記如果提拔不了,還可以繼續留在榮昌干幾年嗎?

重慶榮昌的高書記如果提拔不了,還可以繼續留在榮昌干幾年嗎?

小鬼頭體育
2025-05-03 10:55:04
汪小菲首次談兒女時隔六年回北京:機場接他們的時候,快要哭了!

汪小菲首次談兒女時隔六年回北京:機場接他們的時候,快要哭了!

東方不敗然多多
2025-05-01 02:08:59
中國九大名山排行,第一竟然是個冷門景點!

中國九大名山排行,第一竟然是個冷門景點!

風到腰彎
2025-04-30 11:21:31
體壇丑聞毀三觀!睡有婦之夫、玩嫖娼賭球、與小三玩刺激被抓現行

體壇丑聞毀三觀!睡有婦之夫、玩嫖娼賭球、與小三玩刺激被抓現行

紅色鑒史官
2025-04-29 17:10:03
額外配130平辦公室,區供銷聯社主任被“雙開”

額外配130平辦公室,區供銷聯社主任被“雙開”

環球網資訊
2025-05-03 12:51:09
美國務卿批德國將選擇黨列為“極右翼組織” 德國外交部反駁說“這就是民主”

美國務卿批德國將選擇黨列為“極右翼組織” 德國外交部反駁說“這就是民主”

新華社
2025-05-03 17:12:25
傷心欲絕!十幾年前我接的盤子,現砸手里了!如今再也找不到下家

傷心欲絕!十幾年前我接的盤子,現砸手里了!如今再也找不到下家

笑熬漿糊111
2025-03-07 00:05:26
老牌商場“換臉”!青島存量商業地產,靠面子工程還能撐多久?

老牌商場“換臉”!青島存量商業地產,靠面子工程還能撐多久?

錦晨房產咨詢
2025-05-02 23:29:29
你最惡心的親戚是誰?網友:最煩的就是見面就問一個月掙多錢的人

你最惡心的親戚是誰?網友:最煩的就是見面就問一個月掙多錢的人

娛樂圈人物大賞
2025-05-02 00:50:05
烈火英雄!廣東干部掰車門救人,縣委書記登門慰問,央視專門報道

烈火英雄!廣東干部掰車門救人,縣委書記登門慰問,央視專門報道

特特農村生活
2025-05-03 08:49:06
衣服脫下來只能扔沙發?看了鄰居家的做法后,真被狠狠上了一課

衣服脫下來只能扔沙發?看了鄰居家的做法后,真被狠狠上了一課

裝小宅
2025-05-02 10:29:40
李克勤現身蘇杯現場為中國隊加油,與鳳凰組合合影

李克勤現身蘇杯現場為中國隊加油,與鳳凰組合合影

懂球帝
2025-05-03 14:58:43
一天的吸煙量,盡量別超過這個數,既不用戒煙,肺也能舒服些!

一天的吸煙量,盡量別超過這個數,既不用戒煙,肺也能舒服些!

39健康網
2025-05-02 20:31:34
2018年,陳小魯葬禮上,穿著素服的粟惠寧萬般不舍一臉憂傷

2018年,陳小魯葬禮上,穿著素服的粟惠寧萬般不舍一臉憂傷

紅儒
2025-05-01 22:22:02
日本男子花200萬把自己整成狗,女朋友白天帶他遛彎,晚上睡狗籠

日本男子花200萬把自己整成狗,女朋友白天帶他遛彎,晚上睡狗籠

天氣觀察站
2025-05-02 08:32:16
“最會玩”的夫妻:賣光北京房產周游世界,8年后回家發現竟賺2億

“最會玩”的夫妻:賣光北京房產周游世界,8年后回家發現竟賺2億

博覽歷史
2025-04-22 13:30:06
找華裔假扮中方官員談判,這是21世紀能想出的套路?

找華裔假扮中方官員談判,這是21世紀能想出的套路?

藍鉆故事
2025-05-03 00:00:13
詹姆斯談是否說服東契奇留在湖人:這不是我的職責,他必須自己規劃未來

詹姆斯談是否說服東契奇留在湖人:這不是我的職責,他必須自己規劃未來

雷速體育
2025-05-03 17:06:22
2025-05-03 18:00:49
知識分子 incentive-icons
知識分子
關注科學、人文、思想
388文章數 803關注度
往期回顧 全部

科技要聞

特朗普下手,英偉達對華“特供版”要改

頭條要聞

五一黃金"跳水"引爆搶購潮 有游客拖箱到水貝市場掃貨

頭條要聞

五一黃金"跳水"引爆搶購潮 有游客拖箱到水貝市場掃貨

體育要聞

北京請神馬布里?許利民真有“玄學”!

娛樂要聞

趙又廷節目中高調撒糖 大贊高圓圓超好

財經要聞

巴菲特年度盛會,六大看點前曕!

汽車要聞

易三方科技體驗日·北京站上演硬核駕控

態度原創

教育
藝術
家居
手機
時尚

教育要聞

廣州五年級孩子都在看啥書 興趣才是最好的老師

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

家居要聞

意式輕奢 低飽和質感美學

手機要聞

高通驍龍8s Gen4勁敵!聯發科天璣9400e來了:一加全球首發

解鎖夏季“白開水穿搭”新玩法,時尚達人都在藏的秘訣

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 南投县| 四会市| 长宁区| 泾源县| 新兴县| 高阳县| 谢通门县| 吉水县| 喜德县| 常熟市| 龙胜| 法库县| 双城市| 扶沟县| 邹平县| 南岸区| 仁化县| 华容县| 镶黄旗| 家居| 房产| 平山县| 澎湖县| 亚东县| 衡东县| 郑州市| 苗栗县| 云和县| 福安市| 河间市| 安顺市| 沙坪坝区| 巴东县| 汾西县| 建水县| 德州市| 淳安县| 黄龙县| 西充县| 韶关市| 锦屏县|