網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

私募機(jī)構(gòu)做的“AI鐮刀”，秒殺大廠，雷軍也動手了

2025-01-06 10:27:43　來源: 無冕財(cái)經(jīng)

廣東舉報(bào)

分享至

本文由無冕財(cái)經(jīng)（wumiancaijing）原創(chuàng)發(fā)布

作者：譚嘉琳

編輯：陳澗

設(shè)計(jì)：嵐昇

2024年底，國內(nèi)AI界出了兩件大事兒。

一是小米被曝出要以千萬級別的年薪，從名為“DeepSeek”（深度求索）的大模型團(tuán)隊(duì)挖角一名“天才少女”，這被視為小米發(fā)力大模型軍備戰(zhàn)。

二是國內(nèi)一款大模型面世，性能上趕超國際巨頭Open AI的GPT-4o，還因?yàn)闃O低的訓(xùn)練成本被稱為“大模型屆的拼多多”，一時(shí)成為驚艷硅谷的“神秘東方力量”。

而這款大模型，就叫做DeepSeek-V3。

這樣一來，原本名不經(jīng)傳的DeepSeek團(tuán)隊(duì)一下被推到聚光燈下。更令網(wǎng)友震驚的是，這么頂尖的大模型，竟然不是出自天天砸錢高呼“All in AI”的互聯(lián)網(wǎng)大廠，而是來自私募機(jī)構(gòu)幻方量化。

“炒股”機(jī)構(gòu)做出來的AI，是怎么跑贏一眾大廠的？

AI“天才少女”，出自私募機(jī)構(gòu)

去年12月23日，業(yè)內(nèi)傳出95后AI“天才少女”羅福莉被雷軍以千萬級年薪挖角，或?qū)㈩I(lǐng)導(dǎo)小米的大模型團(tuán)隊(duì)。

一時(shí)間，主人公眾多標(biāo)簽被網(wǎng)友扒出：北大碩士畢業(yè)、一年發(fā)8篇頂級會議論文、畢業(yè)后橫掃BAT最頂級碩士offer……

▲羅福莉的個(gè)人簡介。圖片來自其知乎個(gè)人首頁。

不過，消息被炒熱后，據(jù)紅星新聞2024年12月31日報(bào)道，羅福莉?qū)τ谑欠褚鄣叫∶祝壳斑€在猶豫，還發(fā)聲希望不要被過度關(guān)注。

而像羅福莉一樣“悶聲干大事”的，還有她背后的公司幻方量化。

幻方量化成立于2015年，專注于量化投資，也就是通過數(shù)學(xué)、統(tǒng)計(jì)、人工智能等方式取代人工決策進(jìn)行投資。

但作為私募機(jī)構(gòu)，讓幻方在國內(nèi)外最“出圈”的，不是投資產(chǎn)品，反而是以“超絕性價(jià)比”著稱的大模型產(chǎn)品。

2024年5月，幻方旗下的開源大模型DeepSeek-V2橫空出世，將推理成本降低到每百萬token僅1塊錢，僅是當(dāng)時(shí)行業(yè)領(lǐng)先的GPT-4 Turbo的七十分之一。去年12月26日，DeepSeek再發(fā)布DeepSeek-V3，訓(xùn)練成本僅550萬美元，約為GPT-4o的二十分之一。

而在性能方面，DeepSeek-V3 技術(shù)報(bào)告稱，其在英語、代碼、數(shù)學(xué)、漢語以及多語言任務(wù)上表現(xiàn)十分出色。國外獨(dú)立AI測評機(jī)構(gòu)評道，“DeepSeek-V3超越了迄今為止所有開源模型”。

震驚硅谷的同時(shí)，DeepSeek也把國內(nèi)公司殺了個(gè)措手不及。

雖然幻方曾向暗涌Waves透露，DeepSeek大模型目前還沒有商業(yè)化的計(jì)劃，只專注于技術(shù)創(chuàng)新；但如此高性能搭配極低成本，可想而知，一旦DeepSeek發(fā)力，將引發(fā)一輪“血戰(zhàn)”。

這不，去年5月份DeepSeek-V2問世，立馬引起各大模型警覺，掀起一陣價(jià)格戰(zhàn)。

獨(dú)角獸智譜AI第一個(gè)跟進(jìn)，在5月11日宣布將其入門級模型GLM-3 Turbo的API降價(jià)為1元/百萬tokens；15日，字節(jié)跳動發(fā)布豆包大模型，定價(jià)低至0.0008元/千Tokens，比行業(yè)降低約99%。隨后，阿里云、騰訊云等也宣布將其下大模型降價(jià)，百度、科大訊飛等甚至決定將幾款輕量級大模型免費(fèi)開放。

就在去年12月31日，DeepSeek-V3發(fā)布后5天，阿里云還宣布開啟第三輪大模型降價(jià)，其下通義千問視覺理解模型全線降價(jià)超80%。

▲阿里云發(fā)布的降價(jià)公告。圖片來自阿里云公眾號。

私募機(jī)構(gòu)做AI，還“吊打”了一眾大廠。聽起來不可思議，但放在幻方倒也合理。

都知道私募是替有錢人干活的，炒股的眼光必須毒辣；而幻方從一開始，就瞄準(zhǔn)了AI輔助——不僅要炒，還要用機(jī)器學(xué)習(xí)精準(zhǔn)炒股。

早在2008年，幻方就開始使用機(jī)器學(xué)習(xí)探索全自動量化交易；2017年，幻方就開始全面應(yīng)用深度學(xué)習(xí)技術(shù)進(jìn)行交易。

到了2023年4月，ChatGPT問世一周月，大模型正是科技圈的必爭之地，幻方也抓緊組建成立子公司DeepSeek，令西方AI界驚嘆的“東方神秘力量”也就此誕生。

AI炒股，“鐮刀”會更鋒利嗎？

事實(shí)上，DeepSeek的大模型一出世，也曾引起外界質(zhì)疑——私募機(jī)構(gòu)要是搞起了AI炒股，普通股民哪里比得過？有的網(wǎng)友甚至把大模型比作“核動力鐮刀”，要割倒一片“韭菜”。

不過，DeepSeek已經(jīng)向外界澄清，自己做AI大模型跟金融無關(guān)，純純是對科技創(chuàng)新感興趣。更何況，以幻方最近的業(yè)績來看，AI量化助攻確實(shí)作用不大。

截至去年12月20日，幻方量化共有65只基金公開披露凈值，其中有29只基金年內(nèi)漲幅超過10%，其余36只基金均在年內(nèi)下跌。另外，據(jù)深藍(lán)財(cái)經(jīng)，此前幻方旗下多只收益率達(dá)100%-400%的產(chǎn)品，到2024年后大多都降至10%左右。

曾經(jīng)管理規(guī)模達(dá)到千億的幻方，如今已經(jīng)降到200億-300億元規(guī)模。而放眼百億級私募業(yè)績整體，數(shù)據(jù)顯示，截至11月底，年內(nèi)百億級私募旗下產(chǎn)品平均收益超17%。如此比較，幻方反而掉隊(duì)了。

不過，既然是“最牛大模型”，DeepSeek用不到炒股上，但還是很有“錢”途的。憑借技術(shù)創(chuàng)新得來“超絕性價(jià)比”，DeepSeek不愁市場地位。

據(jù)鳳凰網(wǎng)科技，目前最新的DeepSeek-V3的定價(jià)為輸入每百萬tokens 0.5元（緩存命中）/2元（緩存未命中）、輸出每百萬tokens 8元，性價(jià)比很高。據(jù)AI咨詢公司semianalysis測算，DeepSeek-V3的毛利率達(dá)到70%以上。

雖然DeepSeek對外公布還沒開始全面商業(yè)化，但其創(chuàng)始人梁文鋒向媒體透露，DeepSeek已經(jīng)在成本之上開始盈利。

而另一邊，大廠們還得燒錢補(bǔ)貼價(jià)格戰(zhàn)，才能與之匹敵。據(jù)科技新知，2024年5月DeepSeek-V2發(fā)布前，國內(nèi)大模型推理算力毛利率高于60%，和國際同行基本一致，但在5月接連降價(jià)后，毛利率直接跌至負(fù)數(shù)。

未來DeepSeek想做的，還是大模型產(chǎn)業(yè)的最上游。用梁文鋒的話說，“我們只負(fù)責(zé)基礎(chǔ)模型和前沿的創(chuàng)新，然后其它公司在DeepSeek的基礎(chǔ)上構(gòu)建toB、toC的業(yè)務(wù)”。

即使不做“鐮刀”，但可以料想，DeepSeek足以在大模型界刮起腥風(fēng)血雨。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.