99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI生態(tài)圈的天都塌了,DeepSeek牛在哪里?

0
分享至


?無(wú)盡的算力戰(zhàn)爭(zhēng)

1965年6月的一個(gè)深夜,決定成為一名偉大的小說(shuō)家的史努比,在一臺(tái)沉重的老式打印機(jī)上,敲下了引人入勝的名著開(kāi)頭:

在一個(gè)漆黑的、風(fēng)雨交加的夜晚…

據(jù)說(shuō),史努比構(gòu)思的一切精彩小說(shuō),都是從這個(gè)艮古不變的開(kāi)頭寫(xiě)起的。

也就在這一年,史努比戰(zhàn)勝了肯尼迪、赫魯曉夫、披頭士等強(qiáng)大對(duì)手,登上了《時(shí)代》雜志的封面。它覺(jué)得它當(dāng)之無(wú)愧。


然鵝,一個(gè)美麗童話(huà)的終結(jié),總是意味著另一個(gè)天方夜譚的開(kāi)始。

2022年12月,年僅8歲的伊薩克·亞當(dāng)斯命令一個(gè)冰冷的程序,寫(xiě)一個(gè)類(lèi)似于史努比的小說(shuō)開(kāi)頭。很快,他得到了它:

那是一個(gè)凄涼的大霧之夜,是那種讓最勇敢的人也感到戰(zhàn)栗的夜晚…

看到這個(gè)遠(yuǎn)超史努比的小說(shuō)開(kāi)頭,亞當(dāng)斯睜大了眼睛,怯生生地縮回手指,以為看到了神跡。

事實(shí)上,為人們寫(xiě)詩(shī)、寫(xiě)小說(shuō),僅僅是這個(gè)軟件最粗陋的應(yīng)用。而一切故事的開(kāi)始,都發(fā)生于2022年11月30日。

這一天,OpenAI倉(cāng)促發(fā)布了該公司落后一代的大型語(yǔ)音AI模型,用于垂直打擊市場(chǎng)上同類(lèi)聊天AI產(chǎn)品,這就是在GPT-3基礎(chǔ)上微調(diào)而成的:

ChatGPT。

市面上的同類(lèi)營(yíng)銷(xiāo)產(chǎn)品應(yīng)聲倒地,整個(gè)世界為之徹底改變。

北密歇根大學(xué)的學(xué)術(shù)委員會(huì)激烈地抨擊了ChatGPT,因?yàn)樗珜?xiě)的論文通過(guò)了盲審第一輪;硅谷高科技公司的HR叫苦不迭,因?yàn)橛兄袑W(xué)生通過(guò)ChatGPT答題,順利通過(guò)了年薪50萬(wàn)美元的工程師筆試。

ChatGPT不僅能夠以自然語(yǔ)言與人類(lèi)進(jìn)行互動(dòng)問(wèn)答、撰寫(xiě)小說(shuō)劇本,還能生成可用的編程代碼、學(xué)術(shù)論文…它似乎無(wú)所不能。

那么古爾丹,代價(jià)是什么呢?


答案就矗立在距離美國(guó)首都華盛頓僅有數(shù)十英里的微軟云數(shù)據(jù)中心。

被稱(chēng)之為北弗吉尼亞州數(shù)據(jù)中心的大樓里層層疊疊地堆滿(mǎn)了服務(wù)器,粗壯的同軸電纜把來(lái)自世界各地的指令導(dǎo)入其中,代碼總量達(dá)350G的ChatGPT通過(guò)高性能的GPU處理數(shù)據(jù),在輸出結(jié)果的同時(shí),也消耗了天量的電力,產(chǎn)生了大量的熱能。

國(guó)際能源署(IEA)發(fā)布的白皮書(shū)指出:

ChatGPT每響應(yīng)一個(gè)請(qǐng)求需要消耗2.9瓦時(shí),這相當(dāng)于一個(gè)5瓦的LED燈泡亮35分鐘。

盡管北弗吉尼亞州數(shù)據(jù)中心擁有275個(gè)數(shù)據(jù)中心和超過(guò)2600兆瓦的配套電力,盡管在這里電價(jià)已經(jīng)低至0.07美元/千瓦時(shí),但這依然是一個(gè)沉重的負(fù)擔(dān):

ChatGPT每天都需要響應(yīng)90億次問(wèn)題指令,每年消耗的電力是9太瓦時(shí)(1太瓦時(shí)=10^9千瓦時(shí),1千瓦時(shí)即為1度電),接近一個(gè)中等核電站的全年滿(mǎn)負(fù)荷發(fā)電量。


AI大模型能源消耗的瘋狂飆升,源于支持AI運(yùn)行的芯片組,后者被廣泛應(yīng)用于“更高、更快、更強(qiáng)”的算力戰(zhàn)爭(zhēng)。

一方面,高算力要求高性能的芯片集成,對(duì)應(yīng)著功耗的增加;另一方面,高功耗又會(huì)增加芯片的發(fā)熱量。

IEA報(bào)告指出,數(shù)據(jù)中心的電力需求主要來(lái)自計(jì)算和冷卻兩個(gè)方面,兩者各占總電力需求的40%。而它們又反過(guò)來(lái)推高了ChatGPT的運(yùn)營(yíng)成本。

目前,ChatGPT API的價(jià)格是0.002美元/千token。相當(dāng)于每輸出100萬(wàn)個(gè)英文單詞支付2.7美元,也相當(dāng)于輸出50萬(wàn)個(gè)中文需支付18元人民幣。

IEA報(bào)告估算,如果全球60%的AI算力需求可以經(jīng)算法優(yōu)化后由中端芯片承載,由此節(jié)約的成本將以萬(wàn)億美元計(jì)。

但事實(shí)上,算力戰(zhàn)爭(zhēng)從未停止,高性能芯片的需求一再被拉升——近年來(lái),英偉達(dá)昇騰芯片的出貨量,每年增速都接近300%,還供不應(yīng)求。

對(duì)此,硅谷的高科技公司似乎并不在乎。在投資人的慷慨解囊下,它們不用在乎“燒錢(qián)”,也不用在乎被諷刺為“大力出奇跡”,只要成為最終活下來(lái)的勝利者,這些都不是事。

只是,AI應(yīng)用必然要因?yàn)樽分鹚懔Γ豢ㄔ诟叱杀镜墓秩χ袉幔?/p>

一家來(lái)自中國(guó)的初創(chuàng)公司決定說(shuō)“不”。

2025年1月20日,一家名為DeepSeek的中國(guó)人工智能公司發(fā)布了DeepSeek-R1 模型,其性能可比肩OpenAI o1正式版,但由于采用強(qiáng)化學(xué)習(xí),其成本已經(jīng)降到了不可思議的地步。

綜合36氪等媒體報(bào)道,GPT-4o模型訓(xùn)練成本約為1億美元,而DeepSeek僅用了2048塊GPU,訓(xùn)練了不到2個(gè)月,共花費(fèi)550多萬(wàn)美元。其成本只有GPT-4o的1/20。

低廉的成本成為DeepSeek“免費(fèi)商用、完全開(kāi)源”策略的底氣所在,由此形成的沖擊,超乎了幾乎所有人的想象。

最先被震驚的是華爾街的投資人,他們驚呼DeepSeek是“來(lái)自神秘東方的魔法”。無(wú)數(shù)投資人忙著訂飛往杭州的機(jī)票,哪怕是所謂的紅眼航班也不要緊,哪怕大洋彼岸正忙著過(guò)年…也不要緊。

投資嗎,就要拿出三顧茅廬的誠(chéng)意來(lái)啊,混蛋!

然后感受到威脅的是硅谷的科技精英。畢竟550萬(wàn)美元的訓(xùn)練成本過(guò)于寒磣,它甚至于不及一名資深A(yù)I工程師的年薪。

現(xiàn)在,這么低成本的AI模型登陸應(yīng)用商店,硅谷的AI工程師能怎么辦?他們也很絕望啊,難不成要自愿降薪到1/20?

而美國(guó)網(wǎng)友則樂(lè)瘋了。1月27日,DeepSeek應(yīng)用登頂蘋(píng)果美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,在美區(qū)下載榜上超越了ChatGPT。

一時(shí)間,從太平洋西岸的洛杉磯到太平洋東岸的上海,DeepSeek的名字無(wú)人不知無(wú)人不曉,而從寂寂無(wú)聞的發(fā)布到席卷全球的追捧,它僅用了不到一周的時(shí)間。

?DeepSeek強(qiáng)在哪里?

美國(guó)著名財(cái)經(jīng)頻道CNBC在最新訪談節(jié)目中表示,DeepSeek 的出現(xiàn),對(duì)以 OpenAI 為代表的主流AI巨頭構(gòu)成了實(shí)質(zhì)性威脅。


但我們都知道,人們都已經(jīng)習(xí)慣于夸大競(jìng)爭(zhēng)對(duì)手的強(qiáng)大,以此索要更高的投入。

那么,DeepSeek究竟好在哪里?

讓我們從一篇16頁(yè)的論文談起。

2025年1月22日,DeepSeek AI在GitHub公開(kāi)了一篇學(xué)術(shù)論文,介紹了DeepSeek系列模型的技術(shù)邏輯,從中說(shuō)明了如何在Open AI的基礎(chǔ)上進(jìn)行蒸餾優(yōu)化。


在論文的引言部分中,作者指出一個(gè)反直覺(jué)的結(jié)論:

Open AI的o1模型之所以取得成功,是因?yàn)樗鼪](méi)有像傳統(tǒng)大模型一樣,把算力集中在模型的預(yù)訓(xùn)練上,而是把更多資源分配給模型的推理,賦予后者更多的算力,以實(shí)現(xiàn)性能的大幅提升。

打個(gè)比方,一個(gè)好的教師,好就好在沒(méi)有讓參加考試的小朋友把時(shí)間和精力集中在“刷題”之上,而是讓他們集中思考怎么把問(wèn)題分解,轉(zhuǎn)化為已知問(wèn)題。


(傳統(tǒng)的AI大數(shù)據(jù)模型中,預(yù)訓(xùn)練是很重要的一環(huán),它限定了AI“學(xué)什么”)

不過(guò),因?yàn)镺pen AI的o1模型沒(méi)有開(kāi)源,DeepSeek的開(kāi)發(fā)者也不知道具體的邏輯原理,相當(dāng)于試卷中只有標(biāo)準(zhǔn)答案,但沒(méi)有解題過(guò)程。

因此,開(kāi)發(fā)者就通過(guò)“大范圍強(qiáng)化學(xué)習(xí)”( large-scale reinforcement learning)的策略,讓模型在缺少“外部監(jiān)管”的環(huán)境中,自己根據(jù)標(biāo)準(zhǔn)答案,在試卷上進(jìn)行反復(fù)推理,做錯(cuò)了修改,做對(duì)了予以?xún)r(jià)值評(píng)判,給予正反饋。這就是DeepSeek R1-zero模型的基本原理。

當(dāng)然,除了強(qiáng)化學(xué)習(xí)的技術(shù),開(kāi)發(fā)者還加入了GRPO優(yōu)化和正則化獎(jiǎng)勵(lì)。

GRPO優(yōu)化(Group Relative Policy Optimization)是采用分組,對(duì)同一個(gè)問(wèn)題生成多條候選輸出,并以組內(nèi)相互比較的方式來(lái)估計(jì)相對(duì)獎(jiǎng)勵(lì)的方法。

打個(gè)比方,GRPO更接近于“小組競(jìng)爭(zhēng)學(xué)習(xí)法”,也就是把全班同學(xué)分為若干個(gè)小組,組員合作完成解答成果,然后做好PPT,派代表上臺(tái)講解解題過(guò)程,而授課教師全程評(píng)判,選取“最符合答案”的解題思路,然后把它作為下一輪的標(biāo)尺(benchmark),發(fā)放給所有的小組,讓各小組繼續(xù)學(xué)習(xí),開(kāi)始第二輪的答題…如此反復(fù),逼近最滿(mǎn)意解。

采用GRPO的AI模型,計(jì)算資源的消耗量下降了約40%,訓(xùn)練速度提升了兩倍以上。


所謂正則化獎(jiǎng)勵(lì)(Regularizer Reward),是指在得出的完整答案中,根據(jù)經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的原則,加上一個(gè)規(guī)則化項(xiàng)(regularizer)或罰項(xiàng)(penalty term),調(diào)整答案的權(quán)重。

這就相當(dāng)于小朋友完成答題后,除了要求答案正確,還要求解題過(guò)程必須完整(程式化)、字跡清晰(標(biāo)準(zhǔn)化),絕不能和數(shù)學(xué)大神一樣思維跳脫,動(dòng)不動(dòng)就寫(xiě)出“由上易得”、“顯然有”…之類(lèi)的虎狼之詞。

正則化獎(jiǎng)勵(lì)的優(yōu)勢(shì),不僅僅是便于溯源,而且還能遏制機(jī)器學(xué)習(xí)過(guò)程中拼湊答案的不良苗頭——畢竟問(wèn)題是已知的,結(jié)論也是已知的,中間蒙一下瞎寫(xiě)一個(gè)答題過(guò)程,也是人/機(jī)器之常情。

經(jīng)由正則化獎(jiǎng)勵(lì)獲得的實(shí)驗(yàn)結(jié)果,可以讓GRPO的迭代學(xué)習(xí)更有效率,更加優(yōu)化。


總之,感謝即使翻譯工具,讓我這個(gè)門(mén)外漢也能囫圇吞棗地了解DeepSeek的基本學(xué)習(xí)策略。

而這三大策略的“組合技”威力也是巨大的。

例如強(qiáng)化學(xué)習(xí)策略減少了監(jiān)督微調(diào)過(guò)程;獎(jiǎng)勵(lì)機(jī)制便于篩選出更優(yōu)質(zhì)的語(yǔ)料,指導(dǎo)模型改進(jìn)推理;GRPO則提高了訓(xùn)練效率,減少了功耗。更重要的是,在沒(méi)有預(yù)設(shè)代碼的背景下,DeepSeek在迭代強(qiáng)化學(xué)習(xí)的過(guò)程中擁有了“頓悟”的感覺(jué),非常接近“一力降十會(huì)”的Open AI模型。

此外,DeepSeek R1的蒸餾技術(shù)也非常出彩。所謂蒸餾技術(shù),就是把大模型的推理能力遷移到小模型中,從而實(shí)現(xiàn)計(jì)算效率與性能結(jié)果的動(dòng)態(tài)平衡。

打個(gè)比方,就是先用R1大模型生成數(shù)十萬(wàn)條高質(zhì)量的推理樣本,然后以這些樣本作為監(jiān)督微調(diào)的范式,去訓(xùn)練小模型,從而讓小模型在某些方面達(dá)到接近于大模型的性能。

論文中列舉了一個(gè)有趣的例子,在解答一道國(guó)際數(shù)學(xué)奧賽題的過(guò)程中,經(jīng)過(guò)蒸餾技術(shù)訓(xùn)練的千問(wèn)模型(擁有7B的參數(shù),也就是70億個(gè)參數(shù)),在性能上已經(jīng)接近了此前的32B模型(擁有320億個(gè)參數(shù))。


(論文發(fā)布后,有研究人員經(jīng)過(guò)測(cè)試,基本復(fù)現(xiàn)了圖表中的統(tǒng)計(jì)結(jié)論,由此引發(fā)業(yè)界轟動(dòng))

但這并不意味著DeepSeek甫一出世,就能取代其他AI產(chǎn)品,就能終結(jié)AI行業(yè)對(duì)算力的依賴(lài)(例如有人狂言,DeepSeek R1發(fā)布后,英偉達(dá)的芯片滯銷(xiāo),穿皮衣的黃教主趕緊來(lái)訪問(wèn)中國(guó)了…)

Open AI的前代教父卡帕西一再表示:

(DeepSeek R1的成功)并不意味著大模型不再需要GPU的大規(guī)模集成,因?yàn)槲覀儽仨毚_保模型不浪費(fèi)現(xiàn)有資源。

作為圈內(nèi)大佬,卡帕西的話(huà)比較含蓄。他其實(shí)是說(shuō):

DeepSeek R1模型很可能是把ChatGPT的模型的知識(shí)蒸餾到了新模型之中,以之前存在的海量高質(zhì)量模型提取出少量的高質(zhì)量數(shù)據(jù),以此作為新模型的訓(xùn)練數(shù)據(jù),進(jìn)而得到接近于原始數(shù)據(jù)的訓(xùn)練效果。

也就是說(shuō),Deepseek是一個(gè)善于從知識(shí)的汪洋里采摘明珠的孩子,這當(dāng)然是極好的。但不能因此認(rèn)為,為知識(shí)的海洋添加活水的其他孩子就不重要了——傳統(tǒng)的大數(shù)據(jù)模型(例如Open AI)就是“其他的孩子”,而它們使用的工具,就是GPU集群。

你不能因?yàn)閷W(xué)生模型有著出色表現(xiàn),就否認(rèn)教師模型的作用。

這里我需要強(qiáng)調(diào)一點(diǎn),DeepSeek并不是Open AI的換皮產(chǎn)品,但它在應(yīng)用部署過(guò)程中使用了蒸餾技術(shù),并將ChatGPT作為教師模型,這一點(diǎn)是大概率的事。

例如某媒體報(bào)道。一位科技圈知名評(píng)測(cè)研究員曾報(bào)告一個(gè)早期DeepSeek版本的bug:當(dāng)你問(wèn)“你是什么模型”的時(shí)候,DeepSeek說(shuō)它是:

ChatGPT。


所以O(shè)pen AI的CEO山姆·奧特曼在近期發(fā)文稱(chēng):

復(fù)制你知道有效的東西是相對(duì)容易的,而嘗試一些新的、有風(fēng)險(xiǎn)且你不知道效果如何的事情,是極其困難的,但那也是最酷的事…


(凹凸曼教主的發(fā)言,沒(méi)有一個(gè)字提及DeepSeek,但沒(méi)有一句話(huà)不在暗示DeepSeek,其中糾結(jié),用心良苦)

但我們并不能因此否認(rèn)DeepSeek R1的偉大。

在某種程度上,高質(zhì)量的蒸餾才是DeepSeek R1模型的最突出貢獻(xiàn)。這意味著“分布式AI”成為一種可能。換而言之,我們可以把算力較低的機(jī)器(例如家用計(jì)算機(jī),小型服務(wù)器,甚至手機(jī))接入大模型,經(jīng)過(guò)蒸餾訓(xùn)練后,得到與大模型接近的性能。

而如果把眼界放得更長(zhǎng)遠(yuǎn)一點(diǎn),高質(zhì)量的蒸餾技術(shù),可以緩解算力緊張的危機(jī)。對(duì)于GPU進(jìn)口大門(mén)被限制、相關(guān)資源有限的國(guó)家來(lái)說(shuō),更是具有重大的工程意義。

因此,像Deepseek這樣的AI是藏不住的。

就算它有諸多不如意之處,它的口碑也會(huì)從每一次免費(fèi)對(duì)話(huà)中流出來(lái),攔不住,也斷不掉。

哪怕很少有人能夠說(shuō)出它的原理,但也已經(jīng)不重要了。

?那些開(kāi)發(fā)了DeepSeek的年輕人

掌聲如潮水般涌起,涌向僅有140名員工的DeepSeek公司。

美國(guó)硅谷的同行稱(chēng)之為“神秘的東方力量”,誠(chéng)邀團(tuán)隊(duì)人員參加最前沿的會(huì)議;而在國(guó)內(nèi),各路同行公司揮舞支票,盼望著DeepSeek開(kāi)發(fā)團(tuán)隊(duì)人員的加盟。

最新的消息是,雷軍成功地以千萬(wàn)年薪挖角“天才AI少女”羅福莉。對(duì)此,DeepSeek稱(chēng),研究員羅福莉確實(shí)已經(jīng)離職,但不清楚是否加入了其他公司。

如彗星般崛起的羅福莉,其實(shí)是一名“95后”。她在攻讀北京大學(xué)計(jì)算語(yǔ)言學(xué)碩士期間,因在國(guó)際計(jì)算語(yǔ)言學(xué)協(xié)會(huì)(ACL)上發(fā)表多篇論文而聲名鵲起,然后畢業(yè)后加入阿里巴巴達(dá)摩院,再在2022年進(jìn)入幻方量化,參與DeepSeek大模型項(xiàng)目。


(作為一名自信的95后,羅福莉在社交媒體上回答了網(wǎng)友的提問(wèn),并公布了自己的照片)

而整個(gè)DeepSeek團(tuán)隊(duì),甚至它的母公司幻方量化,基本由年輕人構(gòu)成。

例如在2023年5月,DeepSeek發(fā)布V2模型時(shí),在主頁(yè)上重點(diǎn)介紹了作出卓著貢獻(xiàn),但又最為年輕的兩位成員。

第一位是2013年被保送到北京大學(xué)物理系的廣東人高華佐,第二位是2017年考入北京郵電大學(xué)的湖南新化人曾旺丁。

他們是那么的年輕,但在二十多歲的年紀(jì)時(shí),就已經(jīng)為改變這個(gè)世界盡了一份自己的努力。

而幾乎每一個(gè)DeepSeek團(tuán)隊(duì)的成員,都對(duì)公司創(chuàng)始人梁文鋒表達(dá)了敬意。

在接受騰訊“暗涌”的專(zhuān)訪時(shí),梁文鋒表達(dá)了他選人、用人的標(biāo)準(zhǔn)。他說(shuō),過(guò)去很多年,中國(guó)公司習(xí)慣了別人做技術(shù)創(chuàng)新,我們拿過(guò)來(lái)做應(yīng)用變現(xiàn),但這并非是一種理所當(dāng)然。這一波浪潮里,我們的出發(fā)點(diǎn),就不是趁機(jī)賺一筆,而是走到技術(shù)的前沿,去推動(dòng)整個(gè)生態(tài)發(fā)展。

隨著經(jīng)濟(jì)發(fā)展,中國(guó)也要逐步成為貢獻(xiàn)者,而不是一直搭便車(chē)。例如過(guò)去三十多年 IT 浪潮里,我們基本沒(méi)有參與到真正的技術(shù)創(chuàng)新里。我們已經(jīng)習(xí)慣摩爾定律從天而降,躺在家里 18 個(gè)月就會(huì)出來(lái)更好的硬件和軟件。

因此,梁文鋒選人的第一個(gè)原則,就是好奇心和創(chuàng)造欲。

例如他說(shuō),團(tuán)隊(duì)成員在午歇期間聊天,聊起人工智能的本質(zhì)是不是語(yǔ)言。因?yàn)槿祟?lèi)的思維最終是以語(yǔ)言表達(dá)出來(lái)的,你以為你在思考,其實(shí)是在腦子中組織語(yǔ)言,它們看上去是一回事。

梁文鋒認(rèn)為這個(gè)想法很有意思,愿意提供資源,鼓勵(lì)成員去了解語(yǔ)言學(xué)相關(guān)知識(shí),去驗(yàn)證這個(gè)猜想——這個(gè)猜想的答案也許無(wú)用,也許會(huì)成為催生人工智能的關(guān)鍵。

除此以外,梁文鋒喜歡從國(guó)內(nèi)的TOP高校招募應(yīng)屆生。

他認(rèn)為,也許行業(yè)中前50名頂尖人才可能不在中國(guó),但我們能利用本土人才打造這樣的人。因?yàn)楸就链髮W(xué)的應(yīng)屆生,往往有著敢愛(ài)敢做的創(chuàng)新精神。

梁文鋒說(shuō),應(yīng)屆生有一個(gè)好,就是認(rèn)為所有的套路都是上一代的產(chǎn)物,未來(lái)不一定成立,這對(duì)創(chuàng)新是非常重要的。

因?yàn)槿绻非蠖唐谀繕?biāo),找現(xiàn)成有經(jīng)驗(yàn)的人是對(duì)的。但如果看長(zhǎng)遠(yuǎn),經(jīng)驗(yàn)就沒(méi)那么重要了。例如做一件事,有經(jīng)驗(yàn)的人會(huì)不假思索告訴你,應(yīng)該這樣做,但沒(méi)有經(jīng)驗(yàn)的人,會(huì)反復(fù)摸索、很認(rèn)真去想應(yīng)該怎么做,然后找到一個(gè)符合當(dāng)前實(shí)際情況的解決辦法。

因此幻方量化有個(gè)招人的原則,就是核心技術(shù)崗位,基本以應(yīng)屆和畢業(yè)一兩年的人為主。

其實(shí),就連梁文鋒創(chuàng)立幻方量化時(shí),他本人都沒(méi)有任何量化經(jīng)驗(yàn)。

2002年,梁文鋒以廣東省吳川市第一中學(xué)“高考狀元”的成績(jī)考上浙江大學(xué)電子信息工程專(zhuān)業(yè),后來(lái)又攻讀該校碩士,因?yàn)樽稣n題才積累了市場(chǎng)行情數(shù)據(jù)和探索全自動(dòng)量化交易。

2010年,碩士畢業(yè)后的梁文鋒與同校好友徐進(jìn)一起創(chuàng)業(yè),并在2015年共同創(chuàng)辦了幻方量化。幻方很快就成為國(guó)內(nèi)四大量化公司之一,2021年管理的基金規(guī)模炒股了千億元大關(guān),并獲得基金界的最高榮譽(yù)金牛獎(jiǎng)。

2019年,為了解決算力瓶頸,梁文鋒創(chuàng)辦了幻方AI公司,投資2億元研發(fā)深度學(xué)習(xí)訓(xùn)練平臺(tái)“螢火一號(hào)”,為此搭載了1100塊GPU顯卡。

在GPU卡脖子事件匯總,梁文鋒成為幸運(yùn)加成的幸運(yùn)兒。對(duì)此,他謙虛地表示:

并不是我在2021年有了什么先見(jiàn)之明,也沒(méi)有一個(gè)不為人知的商業(yè)邏輯,因?yàn)槿绻麊渭冎蛔隽炕顿Y,很少的卡也能達(dá)到目的…我主要就是好奇心驅(qū)動(dòng)。

同樣是因?yàn)榕d趣,梁文鋒在2023年創(chuàng)辦DeepSeek公司,宣布要做通用人工智能(AGI)。他說(shuō):

一件激動(dòng)人心的事,或許不能單純用錢(qián)衡量。就像家里買(mǎi)鋼琴,一來(lái)買(mǎi)得起,二來(lái)是因?yàn)橛幸蝗杭庇谠谏厦鎻椬鄻?lè)曲的人。

2022年,幻方量化的一位員工以“一只平凡的小豬”的名義,向慈善機(jī)構(gòu)捐款1.38億元,其中的扶持項(xiàng)目涵蓋白血病救助、鄉(xiāng)村工匠、中學(xué)生資助、聽(tīng)障兒童支持、關(guān)愛(ài)老兵等。有人說(shuō),這位員工就是梁文鋒。

2024年10月,梁文鋒的幻方量化發(fā)布一份“告投資者公告”,稱(chēng)未來(lái)會(huì)逐步將對(duì)沖產(chǎn)品投資倉(cāng)位降低至零。

2025年1月,國(guó)務(wù)院總理主持召開(kāi)專(zhuān)家、企業(yè)家和教科文衛(wèi)體等領(lǐng)域代表座談會(huì),梁文鋒在會(huì)上發(fā)言。


在農(nóng)歷2024年的最后一天,我們看過(guò)了太多灰敗的塌房事件,但AI圈被DeepSeek這條鯰魚(yú)攪了個(gè)天翻地覆,顯然是一個(gè)難得的、振奮人心的好消息。

有人說(shuō),當(dāng)經(jīng)濟(jì)開(kāi)始進(jìn)入下行期,資本也進(jìn)入了冷周期,這可能對(duì)生活、工作、創(chuàng)新產(chǎn)生不利。

但我們欣喜地看到,在中國(guó),有這么一批年輕人認(rèn)為,中國(guó)產(chǎn)業(yè)結(jié)構(gòu)的調(diào)整,讓人們發(fā)現(xiàn)過(guò)去靠時(shí)代紅利賺快錢(qián)的機(jī)會(huì)消失了,而更愿意俯身去做真正的創(chuàng)新。

中國(guó)的希望,就在于有這樣的年輕人。

王爾德說(shuō):

We are all in the gutter,but some of us are looking at the stars.

(我們都在溝里,但仍有人仰望星空)

——(全文完)——

寫(xiě)在后面的話(huà):

如果說(shuō),像梁文鋒這樣的年輕人,讓我們看到了中國(guó)的未來(lái),那么萬(wàn)科在昨天的驚天劇變,則貢獻(xiàn)了農(nóng)歷2024年最精彩的冷笑話(huà)。

話(huà)說(shuō),昨天下午,萬(wàn)科公布預(yù)虧450億元、管理層“被退出”的新聞時(shí),我一點(diǎn)兒都不吃驚。畢竟前些天關(guān)于祝九哥“進(jìn)去又出來(lái)”的新聞,已經(jīng)讓人感慨良多了。

但我顯然低估了這個(gè)突發(fā)事件的戲劇性。

例如,萬(wàn)科原管理層被勸退后,新接盤(pán)的深圳地鐵董事長(zhǎng)辛先生擔(dān)任萬(wàn)科新一任董事長(zhǎng),而深圳國(guó)資委某負(fù)責(zé)人稱(chēng):

截至2024年底,深圳市市屬?lài)?guó)資國(guó)企資產(chǎn)超過(guò)了5萬(wàn)億元,規(guī)模大、實(shí)力強(qiáng)、有能力、有實(shí)力,也有足夠的“子彈”,支持地鐵集團(tuán)通過(guò)一切可能的市場(chǎng)化、法治化手段,推動(dòng)萬(wàn)科穩(wěn)健發(fā)展。

嗯,這就是改革開(kāi)放的橋頭堡、市場(chǎng)化最徹底的深圳的答復(fù)。

而更秀的是,在萬(wàn)科發(fā)布重磅新聞后僅兩個(gè)小時(shí),王石在朋友圈發(fā)文稱(chēng):

國(guó)家隊(duì)出手相助!

我愿稱(chēng)之為2024年中國(guó)房地產(chǎn)為人民群眾貢獻(xiàn)的最好笑的笑話(huà),沒(méi)有之一。

Anyway,祝讀者胖友們新年玉快~


覺(jué)得有趣,請(qǐng)關(guān)注公眾號(hào):將軍箭

28 Jan 2025

點(diǎn)擊“分享”“贊”,感謝你的支持

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
7月21日,黑龍江、河北、天津、湖南養(yǎng)老金上調(diào)金額可查詢(xún),查查

7月21日,黑龍江、河北、天津、湖南養(yǎng)老金上調(diào)金額可查詢(xún),查查

探源歷史
2025-07-21 17:33:47
上海飛悉尼航班疑因“起落架銷(xiāo)未拔”放油返航 東航回應(yīng):已安排補(bǔ)班

上海飛悉尼航班疑因“起落架銷(xiāo)未拔”放油返航 東航回應(yīng):已安排補(bǔ)班

新民晚報(bào)
2025-07-21 19:36:59
曾志偉合影辱華藝人風(fēng)波升級(jí)!致歉評(píng)論區(qū)控不住,多次涉爭(zhēng)議事件

曾志偉合影辱華藝人風(fēng)波升級(jí)!致歉評(píng)論區(qū)控不住,多次涉爭(zhēng)議事件

萌神木木
2025-07-21 16:42:06
“第一度電” 倒計(jì)時(shí):可控核聚變擊碎 50 年詛咒,萬(wàn)億市場(chǎng)撕開(kāi)裂縫

“第一度電” 倒計(jì)時(shí):可控核聚變擊碎 50 年詛咒,萬(wàn)億市場(chǎng)撕開(kāi)裂縫

鈦媒體APP
2025-07-20 17:52:18
余杭自來(lái)水事件驚天反轉(zhuǎn)!上市公司硬剛:誰(shuí)傳謠,告到傾家蕩產(chǎn)!

余杭自來(lái)水事件驚天反轉(zhuǎn)!上市公司硬剛:誰(shuí)傳謠,告到傾家蕩產(chǎn)!

詩(shī)與星空
2025-07-21 08:00:09
宗慶后遺產(chǎn)風(fēng)波再升級(jí):信托是謠傳,遺囑是真,捧骨灰的另有其人

宗慶后遺產(chǎn)風(fēng)波再升級(jí):信托是謠傳,遺囑是真,捧骨灰的另有其人

比利
2025-07-21 16:35:21
50歲保安提前1小時(shí)到崗猝死不算工傷?家屬:當(dāng)日最高氣溫超40℃,保安亭和宿舍沒(méi)空調(diào)

50歲保安提前1小時(shí)到崗猝死不算工傷?家屬:當(dāng)日最高氣溫超40℃,保安亭和宿舍沒(méi)空調(diào)

極目新聞
2025-07-21 18:31:09
為什么河北總能養(yǎng)出重量級(jí)抽象網(wǎng)紅?

為什么河北總能養(yǎng)出重量級(jí)抽象網(wǎng)紅?

X博士
2025-07-21 14:04:03
請(qǐng)問(wèn)調(diào)查組:檢驗(yàn)科篡改血鉛檢測(cè)結(jié)果的動(dòng)機(jī)是什么?

請(qǐng)問(wèn)調(diào)查組:檢驗(yàn)科篡改血鉛檢測(cè)結(jié)果的動(dòng)機(jī)是什么?

常識(shí)群
2025-07-20 23:51:04
凌志峰履新公安部副部長(zhǎng),近半年內(nèi)公安部多位部領(lǐng)導(dǎo)調(diào)整

凌志峰履新公安部副部長(zhǎng),近半年內(nèi)公安部多位部領(lǐng)導(dǎo)調(diào)整

南方都市報(bào)
2025-07-21 19:52:06
男大學(xué)生電腦存700多張女性裸露色情照片,又一機(jī)構(gòu)回應(yīng)

男大學(xué)生電腦存700多張女性裸露色情照片,又一機(jī)構(gòu)回應(yīng)

大象新聞
2025-07-21 15:32:03
省疾控中心公然造假,我們還能相信什么?

省疾控中心公然造假,我們還能相信什么?

郁風(fēng)手記
2025-07-21 01:35:01
AI時(shí)代的“擺渡人”:從云起到智深,源信網(wǎng)絡(luò)的七年穿越

AI時(shí)代的“擺渡人”:從云起到智深,源信網(wǎng)絡(luò)的七年穿越

至頂頭條
2025-07-05 21:12:07
效果明顯!朝陽(yáng)暴走團(tuán)消失了,民警在現(xiàn)場(chǎng)巡控,白衣哥怒罵立大功

效果明顯!朝陽(yáng)暴走團(tuán)消失了,民警在現(xiàn)場(chǎng)巡控,白衣哥怒罵立大功

鋭娛之樂(lè)
2025-07-21 17:43:03
武漢警方:已打掉一特大犯罪團(tuán)伙!

武漢警方:已打掉一特大犯罪團(tuán)伙!

極目新聞
2025-07-21 18:20:17
富國(guó)銀行毛晨月被禁離華,涉小米蔚來(lái)引關(guān)注,其業(yè)務(wù)有何風(fēng)險(xiǎn)?

富國(guó)銀行毛晨月被禁離華,涉小米蔚來(lái)引關(guān)注,其業(yè)務(wù)有何風(fēng)險(xiǎn)?

聞號(hào)說(shuō)經(jīng)濟(jì)
2025-07-21 17:03:18
史無(wú)前例!巨無(wú)霸工程開(kāi)工,投資1.2萬(wàn)億,戰(zhàn)略意義空前!

史無(wú)前例!巨無(wú)霸工程開(kāi)工,投資1.2萬(wàn)億,戰(zhàn)略意義空前!

櫻桃大房子
2025-07-20 20:48:02
中國(guó)雅魯藏布江大壩即將開(kāi)工,印媒憤怒發(fā)聲:印度將以牙還牙

中國(guó)雅魯藏布江大壩即將開(kāi)工,印媒憤怒發(fā)聲:印度將以牙還牙

阿萊美食匯
2025-07-21 18:13:53
財(cái)務(wù)造假,這家A股公司或被終止上市!明起停牌,股價(jià)已大跌近90%

財(cái)務(wù)造假,這家A股公司或被終止上市!明起停牌,股價(jià)已大跌近90%

每日經(jīng)濟(jì)新聞
2025-07-20 23:30:04
真相來(lái)了?天水血鉛調(diào)查結(jié)果公布,系醫(yī)院私自篡改,真兇竟30多人

真相來(lái)了?天水血鉛調(diào)查結(jié)果公布,系醫(yī)院私自篡改,真兇竟30多人

派大星紀(jì)錄片
2025-07-21 11:41:47
2025-07-21 21:24:49
將軍箭 incentive-icons
將軍箭
本號(hào)關(guān)注財(cái)經(jīng)與民生,雖是自?shī)首詷?lè),仍求立足干貨
118文章數(shù) 1232關(guān)注度
往期回顧 全部

科技要聞

OpenAI自嗨“國(guó)際奧數(shù)金牌”遭官方怒斥

頭條要聞

男大學(xué)生電腦存700多張女性裸露色情照片 機(jī)構(gòu)回應(yīng)

頭條要聞

男大學(xué)生電腦存700多張女性裸露色情照片 機(jī)構(gòu)回應(yīng)

體育要聞

這四位大兄弟,你們真敢要3000萬(wàn)吶

娛樂(lè)要聞

五哈全員為寶石老舅送祝福

財(cái)經(jīng)要聞

炒港美股"補(bǔ)稅潮"突襲?一文了解始末

汽車(chē)要聞

勞斯萊斯前設(shè)計(jì)師全新力作 榮威M7正式亮相

態(tài)度原創(chuàng)

房產(chǎn)
旅游
藝術(shù)
教育
軍事航空

房產(chǎn)要聞

歷時(shí)15年!廣州最難拆的一條村,也終于走到了句點(diǎn)

旅游要聞

熱聞|清明假期將至,熱門(mén)目的地有哪些?

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫(xiě)法

教育要聞

招募丨歡迎各專(zhuān)業(yè)學(xué)長(zhǎng)學(xué)姐加入我們,領(lǐng)取你的第一桶金!

軍事要聞

美客機(jī)空中險(xiǎn)與美軍B-52轟炸機(jī)相撞

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 黎平县| 榕江县| 宣恩县| 云梦县| 西丰县| 隆安县| 安溪县| 涿州市| 郑州市| 沙田区| 杂多县| 威远县| 贡山| 宝山区| 团风县| 航空| 灌云县| 桂平市| 江孜县| 泽普县| 津南区| 如皋市| 凤台县| 南召县| 兴义市| 定西市| 永昌县| 阿瓦提县| 文安县| 浙江省| 松原市| 连云港市| 保德县| 密云县| 海门市| 台北县| 盐池县| 民勤县| 仁寿县| 信丰县| 安图县|