網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

最近有件比肩六代機首飛的事，撼動了整個西方科技界和財經(jīng)界

2024-12-28 22:28:37　來源: 許戈投資

上海舉報

分享至

　　昨晚美股市場突遭猛烈拋售

　　
有人講外界關(guān)注中國六代機成功首飛傳聞，被中國的六代機嚇到了。

　　有人講是四川艦下水，意味著中國航母和類航母的巨大優(yōu)勢，中美在最高軍事技術(shù)的斗爭中，中國取得了壓倒性勝利。

　　有人講是被中國宇樹的機器人震撼了（而波士頓機器人被日本軟銀收購后又被轉(zhuǎn)賣給了韓國現(xiàn)代）。

　　其實上面這些都不是主要原因

　　真實情況是號稱AI界的拼多多！國產(chǎn)AI大模型DeepSeek-V3版本正式發(fā)布

　　它不僅便宜，而且完全開源，僅需2000張GPU計算卡，兩個月的訓(xùn)練時間就匹敵了美國OpenAI公司花費數(shù)百倍成本的最先進大模型GPT-4o，訓(xùn)練成本僅556萬美元。

　　于是這對大多數(shù)美國人的震驚程度真的不亞于中國六代機領(lǐng)先美國首飛，特別是那些對武器裝備不感興趣的老外們，他們把這件事稱為“斯普尼特時刻”，這對美國經(jīng)濟和科技圈的影響也遠遠大于六代機首飛。

　　其實這事真的挺震撼的，我們一個國產(chǎn)大模型能在世界上大殺四方。

　　不僅訓(xùn)練成本比國外一眾大模型低的離譜，效果還出奇的好。

　　具體有多強呢？

　　DeepSeek V3 是一個6710億參數(shù)的開源大模型。

　　作為對比，我們熟知的阿里開源的 Qwen 2.5 系列最大的模型參數(shù)量是720億。

　　Meta開源的 Llama 3.1 系列最大的模型參數(shù)量是4050億。

　　重點來了，DeepSeek V3 在參數(shù)量如此巨大的情況下，只用了2048塊 H800 GPU，花費了僅僅550萬美金左右的訓(xùn)練成本，要知道，Llama 3.1 的訓(xùn)練成本是 DeepSeek V3 的11倍。

　　而且，DeepSeek V3 在多個評測成績排名上，不僅超越了 Qwen 2.5 和 Llama 3.1，甚至還能和最頂尖的閉源模型 GPT-4o 和 Claude-3.5-Sonnet 打打排位。

　　簡直強到離譜。

　　OpenAI可是燒了幾個億才燒出 GPT-4o 這樣逆天的模型，而 DeepSeek 只花了區(qū)區(qū) 550萬，零頭都不到。

　　這還沒完，DeepSeek 不僅把模型毫無保留地開源了，還發(fā)布了一份53頁的技術(shù)報告，所有的細節(jié)掰開揉碎了給你講清楚那種，生怕一眾友商們學(xué)不會。

　　因為以前從來沒有論文，能把大模型的秘密解釋得這么清楚。OpenAI弄出東西了，但是論文根本沒說細節(jié)，云山霧罩的，背離了業(yè)界的開源傳統(tǒng)。

　　現(xiàn)在很多人以為美國干出了什么黑科技，其實不是，論文說的很清楚，就是這么弄出來的。

　　DeepSeek沒有選擇「1→10」而逆向選擇了「0→1」，其提出了一種嶄新的MLA（一種新的多頭潛在注意力機制）架構(gòu)。

　　也正是這種獨特架構(gòu)，其把顯存占用降到了過去最常用的MHA架構(gòu)的5%-13%。

　　同時，它獨創(chuàng)的DeepSeekMoESparse結(jié)構(gòu)，也把計算量降到極致，所有這些最終促成了成本的下降，宣布了行業(yè)震驚的定價方案——API定價為每百萬tokens輸入1元、輸出2元，價格顯著低于當前市場上的其他同類產(chǎn)品。

　　套用QLoRA一作大佬的話說，這模型簡直“優(yōu)雅”到家了！

　　然而更抽象的是，如此厲害的大模型，竟然不是互聯(lián)網(wǎng)科技巨頭研發(fā)的，而是來自金融領(lǐng)域的頭部量化——幻方量化。

　　你看看國內(nèi)做量化的，竟然能對模型訓(xùn)練的資金控制這么嚴，硬生生逼出來一個新一代模型了，遠超一眾大舉投入數(shù)百億的互聯(lián)網(wǎng)公司

　　幾乎所有投資者圈層都在問：幻方De-e-p-s-e-ek v3只用了2048卡的H800，訓(xùn)練兩個月就完成了。你們公司買了10萬張卡，單集群萬卡，都搞出什么成果來了？有人質(zhì)疑Op-e-n-AI干什么去了。

　　然后今天這些機構(gòu)，大資金跑的比誰都快。

　　因為在 DeepSeek V3 發(fā)布之前，所有人都以為大模型要做到頂流，一定要堆參數(shù)，堆GPU，大廠的軍備競賽變成了誰擁有最多的GPU，誰就是王者的氪金游戲。

　　而 DeepSeek V3 告訴大家，在人工智能時代，我們?nèi)匀灰戎腔郏葎?chuàng)新，不是誰燒的錢多，誰就會贏得一切。

　　假如DeepSeek V3 模型的訓(xùn)練這么節(jié)省顯卡，且數(shù)據(jù)是真實準確的，那么意味著市場上的算力GPU卡已經(jīng)過剩，英偉達卡在未來幾年的出貨量將會斷崖下降。

　　如果大家有興趣的話，可以去他們官網(wǎng)試著玩一玩。

DeepSeek V3體驗網(wǎng)址：https://chat.deepseek.com/

　　看到這里，不少網(wǎng)友可能就會發(fā)出感嘆：怪不得炒股賺不到錢，原來自己做交易的對手竟然是電腦，論計算，普通人怎么比得過電腦？

　　還有網(wǎng)友直接將其比作是：核動力鐮刀。

　　不過，幻方量化此前曾多次澄清，探索AGI并不是用來炒股，是做 GTP 相關(guān)的大模型，與金融無關(guān)。

　　相反，正是由于2024年10月，監(jiān)管政策加近期市場環(huán)境的變化，幻方認為中性量化策略不賺錢，逐步降低倉位，縮減私募規(guī)模至200～300億。如下新聞記錄。

　　不搞量化了，這么多卡用來干啥呢？

　　于是，幻方的deepseek大模型橫空出世。

　　目前老美的科創(chuàng)能力還是很堅實和領(lǐng)先的。咱這邊局部趕上了一些。但還有差距。

　　正如DeepSeek創(chuàng)始人梁文峰所說：「中國也要逐步成為貢獻者，而不是一直搭便車。」

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

中國航母為什么不造成20萬噸？比大小，貨輪完勝軍艦！

楊叔洞察 2025-05-12 11:42:30
1 跟貼 1
18歲天才高中生獨登頂刊，AI解鎖150萬新天體！斯坦福連夜發(fā)offer

新智元 2025-05-12 16:40:09
812 跟貼 812

專訪北京交通大學(xué)特聘教授張向宏：未來國家數(shù)據(jù)基礎(chǔ)設(shè)施技術(shù)路線一定會收斂成一條，核心是將供數(shù)、用數(shù)和服務(wù)主體放進同一個空間

每日經(jīng)濟新聞 2025-05-12 14:46:03
1 跟貼 1

《Nature》刊文批評中科院：你們的科研評價體系存在很大問題

西游記者 2025-05-12 17:41:39
0 跟貼 0
首部中國航母紀錄片發(fā)布：遼寧艦新裝備公開升降機助力戰(zhàn)機出庫

農(nóng)村丑爸記錄生活 2025-05-13 00:31:34
0 跟貼 0

中國航母福建艦：體系化作戰(zhàn)與文明型海軍的崛起

烽火三月佳人三千 2025-05-12 03:35:48
0 跟貼 0

美國強調(diào)不對華開戰(zhàn)，英航母卻殺向中國，英媒：1艘頂2艘中國航母

戰(zhàn)武科普 2025-05-10 10:39:02
0 跟貼 0
央視亮出福建艦電磁彈射器，而這彎道超車背后，還藏著更大底牌

栗子評述 2025-05-09 09:34:18
1 跟貼 1

央視高調(diào)亮相！福建艦攜6艘船強勢出海，中國航母力量震撼世界

天行艦 2025-05-08 21:10:44
1 跟貼 1
臺媒警告大陸：一旦臺海爆發(fā)戰(zhàn)事，臺軍將首先擊沉解放軍的航母

子墨君 2025-05-12 00:26:14
3 跟貼 3
瓦良格總設(shè)計師巴比奇，為何拒美來華？為中國航母事業(yè)貢獻巨大

司徒振 2025-05-12 09:52:22
0 跟貼 0
航母飛行員，清一色是軍官！果然知識能改變命運

公干的搞笑社 2025-05-08 19:25:52
3 跟貼 3
中國航母克星東風-21D究竟有多猛？

往事我敬你一杯酒人 2025-05-09 22:17:35
0 跟貼 0
美日研發(fā)“太空航母”，對太空安全有何影響？

李莉說 2025-05-11 10:00:00
49 跟貼 49
中國反艦導(dǎo)彈已就緒，印度航母再次出海，40架“梟龍”嚴陣以待

瑩瑩觀點 2025-05-11 12:47:41
1 跟貼 1
印度聰明的話就不要動航母，巴鐵空地全贏，就差反艦斬殺印度航母

地球記 2025-05-11 06:03:22
0 跟貼 0
印度航母空襲巴基斯坦，卡拉奇港陷入火海？真相來了

瑩瑩觀點 2025-05-10 16:02:10
1 跟貼 1
北京人形機器人天團來了！

智東西 2025-02-19 16:29:42
20 跟貼 20
印度將開建新航母（上）：準備造6艘！還要搞核動力和電磁彈射

三叔胡侃 2025-05-10 20:03:02
1 跟貼 1
印度航母出港，印巴第四次戰(zhàn)爭一觸即發(fā)，巴鐵的殲10或?qū)⒅泵媸讘?zhàn)

戰(zhàn)武科普 2025-05-10 10:40:03
0 跟貼 0
央視首次揭秘！霹靂15導(dǎo)彈竟然靠機器人制造！

百萬暢談 2025-05-11 10:25:40
0 跟貼 0
這是我見過做倒霉的機器人

快樂追劇吧 2025-05-10 19:15:23
1 跟貼 1
目標印度航母！擊沉？

漢唐智庫 2025-05-10 19:26:50
0 跟貼 0
國產(chǎn)機器人深圳街頭散步爆火！超自然步態(tài)嚇呆國外網(wǎng)友

量子位 2025-01-10 16:29:56
880 跟貼 880
繼福建艦后，另一國產(chǎn)戰(zhàn)艦開始海試！美媒盛贊：若歸美軍將更佳

軍武時間線 2025-05-12 10:36:23
0 跟貼 0
機器人的腦殼竟然活了

一人追劇 2025-05-11 09:17:19
1 跟貼 1
世界航母排名：福建艦實力如何？與福特級和尼米茲級航母相比怎樣

三叔胡侃 2025-05-10 20:02:32
1 跟貼 1
宇樹機器人復(fù)雜環(huán)境穩(wěn)定起立，速度不亞于人類

量子位 2025-04-09 10:10:32
0 跟貼 0
清華&通院推出"絕對零"訓(xùn)練法,零外部數(shù)據(jù)大模型自我博弈解鎖推理

量子位 2025-05-12 17:01:16
10 跟貼 10
航母打擊群全速撤離 20架美軍五代機連夜返回國內(nèi)：脫離險境

戰(zhàn)武科普 2025-05-12 10:32:37
0 跟貼 0
景區(qū)有一個碩大的機器人，沒想到還能動，有山崩地裂的架勢！

烏龜愛搞笑 2025-05-12 13:35:37
1 跟貼 1
宇樹科技G1機器人展示武打動作：算法升級任意動作任意學(xué)

財聯(lián)社 2025-02-25 23:59:43
0 跟貼 0
世界上第一個聊天機器人復(fù)活！Eliza源代碼重見天日

量子位 2025-03-13 11:45:47
0 跟貼 0
宇樹科技VS云深處，誰是國產(chǎn)機器人之王

華商韜略 2025-03-17 13:06:16
0 跟貼 0
GPT-5研發(fā)內(nèi)幕首曝！OpenAI首席研究官：AGI指日可待

新智元 2025-05-12 19:11:09
29 跟貼 29
32B方案成本已做到萬元級！零售業(yè)加速部署大模型，智能體 AI生鮮識別率先成熟|行業(yè)動態(tài)

財聯(lián)社 2025-05-12 16:48:14
0 跟貼 0
殲10擊落陣風登上西方媒體頭條，英國專家：西方軍工出口受到挑戰(zhàn)

萬俊很zun 2025-05-12 15:35:28
1 跟貼 1
印巴沖突驟起又戛然而止：航母退縮背后的戰(zhàn)略博弈與大國影子

你是我心里的陰影 2025-05-11 03:05:44
0 跟貼 0
戰(zhàn)機垂直沖向航母，降落瞬間無需減速，一看就不是在中國

小魚搞笑家 2025-05-11 16:48:00
4 跟貼 4
我國小航母下水服役，實力不輸美國母艦，對標美國最強登陸艦

超喜歡我 2025-05-13 01:35:06
0 跟貼 0

手機 / 數(shù)碼

房產(chǎn) / 家居

最近有件比肩六代機首飛的事，撼動了整個西方科技界和財經(jīng)界

“AGI實現(xiàn)路徑清晰了，世界模型不遠了”

數(shù)百名車主要求退車 小米：可取消訂單 但不退定金

數(shù)百名車主要求退車 小米：可取消訂單 但不退定金

場均21.3分5.3失誤 雷霆如何降服約老師？

張杰爸媽現(xiàn)身演唱會，親和力滿滿

蔚來去年平均賒賬197天 資金饑渴癥待解

大眾純電版GTI采用后置后驅(qū) 動力更加激進

態(tài)度原創(chuàng)

這物購的…夠夠的了……

南陽市三中教育集團召開期中教育教學(xué)質(zhì)量提升專題會

《劍星》制作人通關(guān)《光與影》 玩家建議取取經(jīng)

熱聞|清明假期將至，熱門目的地有哪些?

澤連斯基：將在土耳其“等候”普京

數(shù)百名車主要求退車小米：可取消訂單但不退定金

數(shù)百名車主要求退車小米：可取消訂單但不退定金

場均21.3分5.3失誤雷霆如何降服約老師？

蔚來去年平均賒賬197天資金饑渴癥待解

《劍星》制作人通關(guān)《光與影》玩家建議取取經(jīng)