本文由無冕財(cái)經(jīng)(wumiancaijing)原創(chuàng)發(fā)布
作者:譚嘉琳
編輯:陳澗
設(shè)計(jì):嵐昇
2024年底,國內(nèi)AI界出了兩件大事兒。
一是小米被曝出要以千萬級別的年薪,從名為“DeepSeek”(深度求索)的大模型團(tuán)隊(duì)挖角一名“天才少女”,這被視為小米發(fā)力大模型軍備戰(zhàn)。
二是國內(nèi)一款大模型面世,性能上趕超國際巨頭Open AI的GPT-4o,還因?yàn)闃O低的訓(xùn)練成本被稱為“大模型屆的拼多多”,一時(shí)成為驚艷硅谷的“神秘東方力量”。
而這款大模型,就叫做DeepSeek-V3。
這樣一來,原本名不經(jīng)傳的DeepSeek團(tuán)隊(duì)一下被推到聚光燈下。更令網(wǎng)友震驚的是,這么頂尖的大模型,竟然不是出自天天砸錢高呼“All in AI”的互聯(lián)網(wǎng)大廠,而是來自私募機(jī)構(gòu)幻方量化。
“炒股”機(jī)構(gòu)做出來的AI,是怎么跑贏一眾大廠的?
AI“天才少女”,出自私募機(jī)構(gòu)
去年12月23日,業(yè)內(nèi)傳出95后AI“天才少女”羅福莉被雷軍以千萬級年薪挖角,或?qū)㈩I(lǐng)導(dǎo)小米的大模型團(tuán)隊(duì)。
一時(shí)間,主人公眾多標(biāo)簽被網(wǎng)友扒出:北大碩士畢業(yè)、一年發(fā)8篇頂級會議論文、畢業(yè)后橫掃BAT最頂級碩士offer……
▲羅福莉的個(gè)人簡介。圖片來自其知乎個(gè)人首頁。
不過,消息被炒熱后,據(jù)紅星新聞2024年12月31日報(bào)道,羅福莉?qū)τ谑欠褚鄣叫∶祝壳斑€在猶豫,還發(fā)聲希望不要被過度關(guān)注。
而像羅福莉一樣“悶聲干大事”的,還有她背后的公司幻方量化。
幻方量化成立于2015年,專注于量化投資,也就是通過數(shù)學(xué)、統(tǒng)計(jì)、人工智能等方式取代人工決策進(jìn)行投資。
但作為私募機(jī)構(gòu),讓幻方在國內(nèi)外最“出圈”的,不是投資產(chǎn)品,反而是以“超絕性價(jià)比”著稱的大模型產(chǎn)品。
2024年5月,幻方旗下的開源大模型DeepSeek-V2橫空出世,將推理成本降低到每百萬token僅1塊錢,僅是當(dāng)時(shí)行業(yè)領(lǐng)先的GPT-4 Turbo的七十分之一。去年12月26日,DeepSeek再發(fā)布DeepSeek-V3,訓(xùn)練成本僅550萬美元,約為GPT-4o的二十分之一。
而在性能方面,DeepSeek-V3 技術(shù)報(bào)告稱,其在英語、代碼、數(shù)學(xué)、漢語以及多語言任務(wù)上表現(xiàn)十分出色。國外獨(dú)立AI測評機(jī)構(gòu)評道,“DeepSeek-V3超越了迄今為止所有開源模型”。
震驚硅谷的同時(shí),DeepSeek也把國內(nèi)公司殺了個(gè)措手不及。
雖然幻方曾向暗涌Waves透露,DeepSeek大模型目前還沒有商業(yè)化的計(jì)劃,只專注于技術(shù)創(chuàng)新;但如此高性能搭配極低成本,可想而知,一旦DeepSeek發(fā)力,將引發(fā)一輪“血戰(zhàn)”。
這不,去年5月份DeepSeek-V2問世,立馬引起各大模型警覺,掀起一陣價(jià)格戰(zhàn)。
獨(dú)角獸智譜AI第一個(gè)跟進(jìn),在5月11日宣布將其入門級模型GLM-3 Turbo的API降價(jià)為1元/百萬tokens;15日,字節(jié)跳動發(fā)布豆包大模型,定價(jià)低至0.0008元/千Tokens,比行業(yè)降低約99%。隨后,阿里云、騰訊云等也宣布將其下大模型降價(jià),百度、科大訊飛等甚至決定將幾款輕量級大模型免費(fèi)開放。
就在去年12月31日,DeepSeek-V3發(fā)布后5天,阿里云還宣布開啟第三輪大模型降價(jià),其下通義千問視覺理解模型全線降價(jià)超80%。
▲阿里云發(fā)布的降價(jià)公告。圖片來自阿里云公眾號。
私募機(jī)構(gòu)做AI,還“吊打”了一眾大廠。聽起來不可思議,但放在幻方倒也合理。
都知道私募是替有錢人干活的,炒股的眼光必須毒辣;而幻方從一開始,就瞄準(zhǔn)了AI輔助——不僅要炒,還要用機(jī)器學(xué)習(xí)精準(zhǔn)炒股。
早在2008年,幻方就開始使用機(jī)器學(xué)習(xí)探索全自動量化交易;2017年,幻方就開始全面應(yīng)用深度學(xué)習(xí)技術(shù)進(jìn)行交易。
到了2023年4月,ChatGPT問世一周月,大模型正是科技圈的必爭之地,幻方也抓緊組建成立子公司DeepSeek,令西方AI界驚嘆的“東方神秘力量”也就此誕生。
AI炒股,“鐮刀”會更鋒利嗎?
事實(shí)上,DeepSeek的大模型一出世,也曾引起外界質(zhì)疑——私募機(jī)構(gòu)要是搞起了AI炒股,普通股民哪里比得過?有的網(wǎng)友甚至把大模型比作“核動力鐮刀”,要割倒一片“韭菜”。
不過,DeepSeek已經(jīng)向外界澄清,自己做AI大模型跟金融無關(guān),純純是對科技創(chuàng)新感興趣。更何況,以幻方最近的業(yè)績來看,AI量化助攻確實(shí)作用不大。
截至去年12月20日,幻方量化共有65只基金公開披露凈值,其中有29只基金年內(nèi)漲幅超過10%,其余36只基金均在年內(nèi)下跌。另外,據(jù)深藍(lán)財(cái)經(jīng),此前幻方旗下多只收益率達(dá)100%-400%的產(chǎn)品,到2024年后大多都降至10%左右。
曾經(jīng)管理規(guī)模達(dá)到千億的幻方,如今已經(jīng)降到200億-300億元規(guī)模。而放眼百億級私募業(yè)績整體,數(shù)據(jù)顯示,截至11月底,年內(nèi)百億級私募旗下產(chǎn)品平均收益超17%。如此比較,幻方反而掉隊(duì)了。
不過,既然是“最牛大模型”,DeepSeek用不到炒股上,但還是很有“錢”途的。憑借技術(shù)創(chuàng)新得來“超絕性價(jià)比”,DeepSeek不愁市場地位。
據(jù)鳳凰網(wǎng)科技,目前最新的DeepSeek-V3的定價(jià)為輸入每百萬tokens 0.5元(緩存命中)/2元(緩存未命中)、輸出每百萬tokens 8元,性價(jià)比很高。據(jù)AI咨詢公司semianalysis測算,DeepSeek-V3的毛利率達(dá)到70%以上。
雖然DeepSeek對外公布還沒開始全面商業(yè)化,但其創(chuàng)始人梁文鋒向媒體透露,DeepSeek已經(jīng)在成本之上開始盈利。
而另一邊,大廠們還得燒錢補(bǔ)貼價(jià)格戰(zhàn),才能與之匹敵。據(jù)科技新知,2024年5月DeepSeek-V2發(fā)布前,國內(nèi)大模型推理算力毛利率高于60%,和國際同行基本一致,但在5月接連降價(jià)后,毛利率直接跌至負(fù)數(shù)。
未來DeepSeek想做的,還是大模型產(chǎn)業(yè)的最上游。用梁文鋒的話說,“我們只負(fù)責(zé)基礎(chǔ)模型和前沿的創(chuàng)新,然后其它公司在DeepSeek的基礎(chǔ)上構(gòu)建toB、toC的業(yè)務(wù)”。
即使不做“鐮刀”,但可以料想,DeepSeek足以在大模型界刮起腥風(fēng)血雨。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.