99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

幻方DeepSeek成功震驚硅谷:富則火力覆蓋,窮則戰(zhàn)術(shù)穿插

0
分享至

這兩天全網(wǎng)都在談幻方DeepSeek,來自中國的AI大模型震驚了硅谷,給中國人長了臉。所以幻方老板梁文峰馬上就被邀請參加了總理座談會。

其他搞AI大模型的人都是互聯(lián)網(wǎng)行業(yè)出來的,梁文峰則是搞金融發(fā)家的,2015年成立幻方量化,基金規(guī)模從零開始幾年時間就跨上百億、千億門檻。

但梁文峰賺了錢,卻把錢砸到了AI上。之前媒體報道幻方數(shù)據(jù)中心有上萬張英偉達顯卡,人們還奇怪一家金融行業(yè)投資公司要這么多顯卡干什么,在股市割韭菜不用這么夸張吧。誰能想到幻方在AI時代,把國內(nèi)互聯(lián)網(wǎng)大廠們按在地上摩擦。

DeepSeek的成功,意義在于在有限算力的條件下挖掘算法潛力。美國有條件所以大力出奇跡,大廠們瘋狂建AI數(shù)據(jù)中心,都搞出來5000億美元的星際之門計劃,中國買不到最先進的英偉達芯片只能在算法、推理上下功夫。


幻方DeepSeek的成功驚醒了整個AI行業(yè),任何時候算法、推理都是基礎(chǔ),算法模型好事半功倍。但是DeepSeek是開源模型,美國人馬上又會把DeepSeek成功的算法吸收過去,繼續(xù)砸算力。用軍迷的話來說,中美一貫都是富則火力覆蓋,窮則戰(zhàn)術(shù)穿插。

據(jù)說DeepSeek現(xiàn)在已經(jīng)實現(xiàn)盈利,而且沒有進行過對外融資。不知道會不會借勢開啟融資,畢竟幻方再賺錢,也不可能靠自身實力支持DeepSeek和美國硅谷巨頭們競爭。美國那邊頭部AI公司動不動融資幾十億、上百億美元的,沒有芯片算力、沒有頂尖人才根本沒法在這場競賽中卷下去。
甲骨文老板埃里森說未來4到5年內(nèi),任何想?yún)⑴c這場大模型競賽的企業(yè),前沿模型門檻將高達1000億美金,而且這場算力軍備競賽將永遠進行下去。

DeepSeek的成功可能把這個門檻拉下來不少,但長遠來說,大模型競賽還是一項巨額投資的領(lǐng)域。這兩天也有消息稱,字節(jié)跳動2025年資本支出將高達1500億,主要就在AI領(lǐng)域,雖然字節(jié)予以否認(rèn),但投資肯定在千億級別。

最近網(wǎng)上有杭州科技六小龍的說法,連杭州市長、浙江發(fā)改委主任都在媒體面前公開做了回應(yīng)。這六家公司是游戲科學(xué)、深度求索(DeepSeek)、宇樹科技、云深處科技、強腦科技和群核科技。它們都是“互聯(lián)網(wǎng)之都”杭州近年來崛起的處于新技術(shù)領(lǐng)域前沿、在業(yè)內(nèi)具有影響力的“科技新貴”。在阿里巴巴光芒略微黯淡后,杭州的新生力量成功補位。

深度求索的創(chuàng)始人是80后年輕人梁文峰,他擁有浙江大學(xué)信息與電子工程學(xué)系本科和碩士學(xué)位。2008年起,梁文鋒就開始帶領(lǐng)團隊使用機器學(xué)習(xí)等技術(shù)探索全自動量化交易。2015年,幻方量化正式成立,2019年,幻方資金管理規(guī)模就突破百億元。


2021年,幻方量化成為國內(nèi)首家突破千億規(guī)模的量化私募公司。不過由于近幾年國內(nèi)股市的低迷,和監(jiān)管部門對量化的限制,幻方量化逐漸降低其資金管理規(guī)模,目前資金管理規(guī)模在數(shù)百億。

由于公司創(chuàng)始人都是計算機相關(guān)專業(yè),而不是金融專業(yè)出身。他們對投資并不是那么執(zhí)著,目前公司重心已經(jīng)轉(zhuǎn)向AI。早在2016年10月21日,幻方量化就推出第一個AI模型,第一份由深度學(xué)習(xí)生成的交易倉位上線執(zhí)行,使用GPU進行計算。2017年,幻方量化宣稱實現(xiàn)投資策略全面AI化。幻方量化也在2018年就確立以AI為公司的主要發(fā)展方向。

2020年開始,幻方累計投資超億元、占地面積相當(dāng)于一個籃球場的AI超級計算機“螢火一號”正式投入運作,號稱可以匹敵4萬臺個人電腦的超級算力。

2021年,幻方投入10億建設(shè)“螢火二號”,“配備了1萬張A100GPU芯片”,在性能上接近DGX-A100但成本降低了一半,同時能耗減少了40%。當(dāng)時國內(nèi)擁有上萬枚GPU的企業(yè),除了幻方量化外,其他4家都是互聯(lián)網(wǎng)大廠。


2023年7月,幻方量化成立大模型公司DeepSeek,正式進軍通用人工智能領(lǐng)域。DeepSeek包括創(chuàng)始人梁文鋒在內(nèi),僅有139名工程師和研究人員。相比之下,OpenAI有1200名研究人員,Anthropic則有500多名研究人員。

2024年5月,DeepSeek發(fā)布了DeepSeek V2。DeepSeek-V2的API定價為每百萬tokens輸入1元、輸出2元,價格僅為GPT-4 Turbo的百分之一。

DeepSeek-V2采用了注意力機制方面的MLA和前饋網(wǎng)絡(luò)方面的DeepSeekMoE架構(gòu)等,實現(xiàn)了更高經(jīng)濟性的訓(xùn)練效果和更高效的推理。因為大幅降低了API價格,DeepSeek也被稱為“AI界的拼多多”,引發(fā)了國內(nèi)字節(jié)、阿里、百度等大廠的大模型價格戰(zhàn)。

2024年12月27日,DeepSeek V3更是橫空出世,火爆全球。V3評測成績不僅超越了阿里巴巴的Qwen2.5-72B和臉書的Llama 3.1-405B等頂級開源模型,甚至能和GPT-4o、Claude 3.5-Sonnet等頂級閉源模型一較高下。

更令人震驚的是,DeepSeek V3整個訓(xùn)練僅花費了557.6萬美元,在2048塊英偉達H800 GPU集群上運行55天完成,只是OpenAI GPT-4o模型訓(xùn)練成本的不到十分之一。

而2025年1月20日, DeepSeek又發(fā)布了DeepSeek-R1模型。該模型在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩OpenAI o1正式版。R1在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。

幻方的成功代表的是開源相對閉源的一次勝利。早期OpenAI也是開源的,但大規(guī)模融資后逐漸選擇了閉源,這也是馬斯克和openAI的鬧翻的原因。現(xiàn)在主流的開源模型是Meta的Llama,幻方DeepSeek成功后,大模型的開源力量將進一步增強。

幻方對推理成本的消減,比訓(xùn)練更加震撼。DeepSeek架構(gòu)厲害的地方在于,和標(biāo)準(zhǔn)的transformer架構(gòu)相比,并沒有引入特殊的算子,理論上對GPU的要求會降低很多。

推理成本的降低,必將帶來應(yīng)用的繁榮,豐富當(dāng)前大模型領(lǐng)域的生態(tài)。DeepSeek支持私有部署和自主微調(diào),為下游應(yīng)用提供了遠大于閉源模型的發(fā)展空間。

有人說DeepSeek的成功,會利空英偉達。因為不用那么多GPU、不用最先進的GPU也能實現(xiàn)性能一流的大模型。甚至還有人說這會刺破美股當(dāng)前由AI革命過分吹大的泡沫。這其實有點夸大了。

DeepSeek使用的也是英偉達的芯片,Scale AI創(chuàng)始人Alexandr Wang稱DeepSeek目前擁有約5萬臺英偉達H100顯卡。而且2024年國內(nèi)字節(jié)和騰訊分別都訂購了23萬顆英偉達芯片,購買量位列全球第二和第三,僅次于微軟。

網(wǎng)上也都說雖然美國政府有所限制,但國內(nèi)企業(yè)還是可以通過各種渠道購買到英偉達的芯片。所以國內(nèi)大模型年底對美國AI巨頭們的這一波追趕,有可能促使美國進一步加強對英偉達芯片出口的限制。長期來說,中國AI企業(yè)需要逐步適應(yīng)英偉達芯片的短缺,或者用華為等其他性能較低的AI芯片來進行替代。

由于在算力上中國和美國的差距,短期內(nèi)只會繼續(xù)加大。中美兩國在通用人工智能(AGI)的進化方向上也會逐漸分野,中國企業(yè)重算法、推理,美國企業(yè)重算力。

DeepSeek的成功,更重要的是打破了國內(nèi)AI行業(yè)對美國巨頭的神話,打破了美國的算力霸權(quán),讓中國企業(yè)更有信心參與AI競爭。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
印度要把中國網(wǎng)紅告到聯(lián)合國?只因歌曲“飛機被打了”已洗腦全球

印度要把中國網(wǎng)紅告到聯(lián)合國?只因歌曲“飛機被打了”已洗腦全球

喜歡歷史的阿繁
2025-05-12 14:51:12
模擬選秀:火箭與奇才首輪互換,摘下新秀中鋒!防守+機動力一流

模擬選秀:火箭與奇才首輪互換,摘下新秀中鋒!防守+機動力一流

熊哥愛籃球
2025-05-12 13:06:11
讓張靚穎戴眼鏡的人真是個天才,誰懂推眼鏡那一下

讓張靚穎戴眼鏡的人真是個天才,誰懂推眼鏡那一下

東方不敗然多多
2025-05-10 12:15:59
2025年端午放假通知已公布:3個驚喜,2個意外,1個遺憾,了解下

2025年端午放假通知已公布:3個驚喜,2個意外,1個遺憾,了解下

小談食刻美食
2025-05-10 10:53:41
中國不挽留,美國也不收了,李嘉誠終于認(rèn)了!

中國不挽留,美國也不收了,李嘉誠終于認(rèn)了!

奇思妙想生活家
2025-04-24 23:46:51
“輔導(dǎo)員也是女人!”老師私下穿小白裙被學(xué)生撞見,學(xué)生出言不遜

“輔導(dǎo)員也是女人!”老師私下穿小白裙被學(xué)生撞見,學(xué)生出言不遜

妍妍教育日記
2025-05-11 13:41:32
跟隊:泰山從玉溪回來后,克雷桑不再擔(dān)任隊長,場上隊長換王大雷

跟隊:泰山從玉溪回來后,克雷桑不再擔(dān)任隊長,場上隊長換王大雷

直播吧
2025-05-12 09:04:02
A股:股市可能要重演歷史了

A股:股市可能要重演歷史了

生活中的栗子
2025-05-12 13:14:24
印巴沖突尚未完全偃旗,世界已然開始南亞站隊賽

印巴沖突尚未完全偃旗,世界已然開始南亞站隊賽

起喜電影
2025-05-12 17:06:35
陣風(fēng)戰(zhàn)機被中國殲10CE擊落,讓臺獨分子嚇破膽昏招頻出

陣風(fēng)戰(zhàn)機被中國殲10CE擊落,讓臺獨分子嚇破膽昏招頻出

林子說事
2025-05-12 17:14:48
史無前例的漲價,要開始了?

史無前例的漲價,要開始了?

混知房產(chǎn)
2025-04-28 07:35:58
“重慶姐弟墜亡案”媽媽擺攤賣甜品:喪子之痛不會消失,但想踏出重生的第一步|母親節(jié)特別策劃

“重慶姐弟墜亡案”媽媽擺攤賣甜品:喪子之痛不會消失,但想踏出重生的第一步|母親節(jié)特別策劃

紅星新聞
2025-05-12 14:33:15
上海老教授臨終捐空房產(chǎn),養(yǎng)子整理遺物找到結(jié)婚證,翻開后癱坐在地

上海老教授臨終捐空房產(chǎn),養(yǎng)子整理遺物找到結(jié)婚證,翻開后癱坐在地

紅豆講堂
2025-05-09 09:55:16
特朗普再度揮刀藥價:最惠國模型卷土重來,哪些制藥巨頭最“肉疼”?

特朗普再度揮刀藥價:最惠國模型卷土重來,哪些制藥巨頭最“肉疼”?

華爾街見聞官方
2025-05-12 14:11:33
廣州未來兩天冷空氣繼續(xù),周三后“變臉”,雷陣雨又要來

廣州未來兩天冷空氣繼續(xù),周三后“變臉”,雷陣雨又要來

FM96.2廣州新聞電臺
2025-05-12 10:31:07
小姨和情夫私奔18年沒回家,母親退休后跑去探望,見到情夫愣在原地

小姨和情夫私奔18年沒回家,母親退休后跑去探望,見到情夫愣在原地

紅豆講堂
2025-05-01 11:55:12
A股放量成交13084億,兩市突然大漲原因是什么,明天會怎么走?

A股放量成交13084億,兩市突然大漲原因是什么,明天會怎么走?

一擔(dān)金
2025-05-12 15:06:19
S家死因再添謎團!能通話卻被家人拔管,多位醫(yī)護人員齊發(fā)聲!

S家死因再添謎團!能通話卻被家人拔管,多位醫(yī)護人員齊發(fā)聲!

古希臘掌管月桂的神
2025-05-12 14:32:57
楊靖宇遺孤如今在哪?兒子因公殉職,女兒生活平淡

楊靖宇遺孤如今在哪?兒子因公殉職,女兒生活平淡

一切都可能
2024-12-02 15:05:52
于東來新疆游玩被偶遇,開140萬車穿30塊T恤,接地氣毫無架子

于東來新疆游玩被偶遇,開140萬車穿30塊T恤,接地氣毫無架子

紅香娛
2025-05-11 10:47:42
2025-05-12 18:28:49
上林院 incentive-icons
上林院
經(jīng)濟學(xué)博士,產(chǎn)業(yè)經(jīng)濟觀察
760文章數(shù) 13028關(guān)注度
往期回顧 全部

科技要聞

“AGI實現(xiàn)路徑清晰了,世界模型不遠了”

頭條要聞

“美方取消了共計91%的加征關(guān)稅”

頭條要聞

“美方取消了共計91%的加征關(guān)稅”

體育要聞

最熱鬧的國家德比,除了防守什么都有

娛樂要聞

張杰爸媽現(xiàn)身演唱會,親和力滿滿

財經(jīng)要聞

中美雙方降低超100%關(guān)稅

汽車要聞

大眾純電版GTI采用后置后驅(qū) 動力更加激進

態(tài)度原創(chuàng)

藝術(shù)
健康
房產(chǎn)
本地
手機

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

唇皰疹和口腔潰瘍是"同伙"嗎?

房產(chǎn)要聞

海口二手房,越來越難賣了!

本地新聞

非遺里的河南|汴梁鳶舞千年韻!宋室風(fēng)箏藏多少絕活

手機要聞

vivo Y300 GT圖賞:經(jīng)典萬里舷窗全曲舒適手感

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 田阳县| 兴化市| 温泉县| 塘沽区| 朝阳区| 茂名市| 白山市| 卢氏县| 花垣县| 边坝县| 闽侯县| 仙桃市| 辰溪县| 德庆县| 天长市| 奉化市| 泗洪县| 兰坪| 额济纳旗| 牙克石市| 龙江县| 凌海市| 柳林县| 馆陶县| 鄂温| 永仁县| 昭平县| 鸡东县| 泸水县| 兴隆县| 堆龙德庆县| 中西区| 合川市| 湖州市| 孟村| 乐至县| 临沂市| 清水河县| 通道| 广州市| 宁夏|