風(fēng)評(píng)轉(zhuǎn)向很快,量化從股市敵對勢力到掀起科技國運(yùn),僅用了一年時(shí)間。
DeepSeek R1的開源,幾乎拉齊了中美大模型的代差,也重塑了量化行業(yè)的公眾形象。對于過去兩年深陷某種道德困境的量化私募行業(yè)而言,AI 實(shí)驗(yàn)室成為了當(dāng)下一個(gè)不可忽視的風(fēng)口。在巨大的社會(huì)價(jià)值面前,擴(kuò)招的消息一個(gè)接著一個(gè)。
寬德Will Lab招募AI工程師,鳴石創(chuàng)世紀(jì)AI Lab招募AI科學(xué)家,蒙璽AI Lab招募機(jī)器學(xué)習(xí)實(shí)習(xí)生,黑翼、磐松、正定、啟林、世紀(jì)前沿近期也加入AI搶人之爭。
而頭部量化之間,這場AI軍備競賽其實(shí)早已暗流涌動(dòng)。
眾所不周知的是,明汯已囤了數(shù)千張GPU卡,數(shù)萬張CPU核,在金融數(shù)據(jù)的應(yīng)用場景下AI算力可以達(dá)到400P Flops;九坤更是與微軟亞洲研究院復(fù)現(xiàn)了DeepSeek R1模型,在此之前低調(diào)建立了Data Lab、AI Lab、水滴等多個(gè)AI實(shí)驗(yàn)室。
看起來DeepSeek已不僅是資本市場信心重啟的重要催化劑,更變成了一些量化私募的OKR,激勵(lì)他們以更重要的角色參與到時(shí)代進(jìn)程里。
只是在與多位量化管理人交流后,筆者感受到一種溫差:如火如荼的投產(chǎn)之下,各大建立AI實(shí)驗(yàn)室的量化在大語言模型能力上距離DeepSeek還很遠(yuǎn)。反過來,DeepSeek目前對量化投研的幫助也十分有限。
整個(gè)量化行業(yè),集體投入到建設(shè)AI實(shí)驗(yàn)室的熱情中,真實(shí)意圖并不只是技術(shù)理想主義的追求。
量化難有下一個(gè)DeepSeek
開年以來,機(jī)構(gòu)盡調(diào)量化私募時(shí)會(huì)多問一句,「你們家有多少張卡?」
雖說算力儲(chǔ)備難與投資能力扯上多少關(guān)系,但在很多盡調(diào)機(jī)構(gòu)眼里,卡的數(shù)量一定程度反映了量化私募的做成大模型的概率,對于一些銷售機(jī)構(gòu)而言,這也是衡量量化私募未來的某種標(biāo)尺。
但一個(gè)顯而易見的現(xiàn)實(shí)是,大多數(shù)量化私募目前并沒有足以支撐做大模型的算力。
大模型的算力門檻相當(dāng)之高?;梅绞侨珖鵀閿?shù)不多萬卡集群的公司,2021年,幻方對「螢火2號(hào)」AI集群投入10億,搭載了1萬張A100顯卡。2024年,DeepSeek V3官方報(bào)告訓(xùn)練大模型使用了2048塊H800 GPU集群。中存算董事長陳巍測算,幻方實(shí)際的卡數(shù)2.78萬張(A100+H20)+2048張H800,大概在3萬張左右的規(guī)模[1]。
多數(shù)量化私募并不具備如此闊綽的家底。
一名上海百億量化管理人向遠(yuǎn)川透露:「當(dāng)前購入大量先進(jìn)顯卡難度非常大,且成本高昂,建設(shè)大模型算力投入至少數(shù)十億,這就要求量化每年至少有10億利潤。即便如此,人才成本、時(shí)間成本、團(tuán)隊(duì)磨合成本都不可忽略,未來幾年基本不可能再出一個(gè)DeepSeek,彎道超車難度巨大?!?/p>
另一名百億量化老板告訴遠(yuǎn)川,目前在算力和利潤上符合做大模型條件的另外兩家量化,只有九坤和明汯,「九坤規(guī)模體量足夠大,而且比較學(xué)院派,跟清華北大聯(lián)系密切,有足夠的人才供給?!沟珦?jù)遠(yuǎn)川了解,九坤與幻方的方向并不相同,相較基礎(chǔ)模型,他們更關(guān)注垂域模型并推動(dòng)AI在應(yīng)用領(lǐng)域的落地。
「而明汯,我覺得搞大模型不像老裘的風(fēng)格,老裘還是希望在金融領(lǐng)域與國際頂級(jí)對沖基金競爭?!?/p>
簡言之,量化做大模型最大的兩個(gè)門檻是算力密度和人才密度,這兩者與鈔能力休戚相關(guān)。比如幻方?jīng)]有融資的顧慮,擁有大部分量化以及大部分AI 創(chuàng)業(yè)公司都難以企及的「造血能力」。
這種「造血能力」創(chuàng)造了松弛的研發(fā)環(huán)境,DeepSeek 160人研發(fā)團(tuán)隊(duì)基本是沒有海歸背景和大廠背景的年輕人,BOSS直聘上DeepSeek招募的深度學(xué)習(xí)研究員年收入高達(dá)176萬,超越了降薪背景下很多公募投研。在優(yōu)渥待遇的前提下,研發(fā)人員還能從容地獲得源源不斷的輸血支撐算法行業(yè)的巨量失敗。
超額衰減的當(dāng)下,多數(shù)量化自身規(guī)模尚不算殷實(shí),面臨著未來更激烈的內(nèi)卷,更沒有在芯片出口管制之前低價(jià)囤上數(shù)萬張卡,錯(cuò)過了財(cái)富積累的黃金時(shí)間。
就算具備一切現(xiàn)實(shí)要素,創(chuàng)始人沒有利潤之上的價(jià)值取向也很難維系持續(xù)的重金投入,就像朱嘯虎溢于言表的贊美,「梁文鋒的想法確實(shí)不一樣,他連幾個(gè)億的用戶都不要,任何考慮賺錢的角度都太世俗了?!?/p>
蒙璽投資告訴遠(yuǎn)川,量化做大模型的窗口期已經(jīng)過去了?!缸鲞@個(gè)的價(jià)值在哪里?DeepSeek是開源的,在他們的基礎(chǔ)上改一改代碼然后讓大家眼前一亮,怎么可能?」
DeepSeek對投資幫助有限
DeepSeek橫空出世以來,金融行業(yè)彌漫了一層焦慮,量化私募運(yùn)用DeepSeek先進(jìn)生產(chǎn)力,好比給本就強(qiáng)悍的策略增添了核動(dòng)力。量化集體建設(shè)實(shí)驗(yàn)室加碼AI,也意味著僅剩不多的超額未來或許會(huì)被加速榨干。
倍漾量化CEO馮霽判斷:「三年內(nèi)不使用AI的量化基金勢必遭淘汰。」在他看來,DeepSeek是向那些仍然不相信AI力量的人,作最后一次的呼吁[2]。
除了互聯(lián)網(wǎng)行業(yè),資管行業(yè)數(shù)十家機(jī)構(gòu)已爭先恐后地「接入」DeepSeek。中金測試其量化選股能力,發(fā)現(xiàn)2024年以來671b標(biāo)準(zhǔn)版DeepSeek-R1在行業(yè)輪動(dòng)上有穩(wěn)定超額[3]。大模型極大提高量化中后臺(tái)制作路演材料的速率,VS Code+Github Copilot比炸雞配啤酒還香。
雖然行業(yè)一片歡呼雀躍,但客觀看DeepSeek在投研上的主要應(yīng)用于兩個(gè)維度,與其他大模型沒有實(shí)質(zhì)區(qū)別:
一是輸入端拓寬另類數(shù)據(jù)獲取方式。DeepSeek能分析新聞研報(bào)文本、語音、視頻多個(gè)另類數(shù)據(jù)源,有很強(qiáng)的信息處理能力,不僅能從新聞中獲取情緒因子,對專家訪談的回答質(zhì)量也能定性判斷。
鳴熙資本基金經(jīng)理陳昊煒,曾就職于美國對沖基金Point 72。他想起一個(gè)有意思的細(xì)節(jié),當(dāng)上市公司高管回答投資者問題時(shí),Point 72創(chuàng)始人Steve Cohen 喜歡聘請F(tuán)BI的專家來對他們的微表情進(jìn)行判斷,觀察他們表達(dá)是否自信,話語是否存在貓膩。諸如此類的細(xì)節(jié),為美劇《億萬》打造主角提供了非常多的原型參考。
「具備多模態(tài)的能力的大語言模型能通過微表情變化進(jìn)行情緒判斷,把非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)變?yōu)榻Y(jié)構(gòu)化數(shù)據(jù)?!龟愱粺樥f。
二是輸出端提高編程的效率。平方和投資對遠(yuǎn)川表示,最直觀的變化是DeepSeek降低了投研人員在接觸新的編程語言時(shí)的門檻,「VS Code等編輯器也集成諸多AI插件,實(shí)現(xiàn)從代碼靜態(tài)分析到動(dòng)態(tài)優(yōu)化建議的全鏈路賦能,便于編程人員的代碼分析、優(yōu)化和管理?!?/p>
DeepSeek是能夠?qū)Υa層面的重構(gòu)、金融語料的訓(xùn)練、另類數(shù)據(jù)的處理等投研流程提效增速,但百億量化龍旗科技告訴遠(yuǎn)川,「至少目前而言,大模型處理的精細(xì)度還遠(yuǎn)遠(yuǎn)達(dá)不到我們的實(shí)際要求。」龍旗認(rèn)為通過基本面研究,結(jié)合機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí)來處理數(shù)據(jù)構(gòu)建模型,對他們來講比運(yùn)用大模型更具實(shí)踐意義。
蒙璽投資很早在本地部署DeepSeek,最大的用處是輔助編程,「通俗來說就是找BUG。」如果研究員Prompt寫的足夠好,還可給DeepSeek喂研報(bào),讓它自動(dòng)去做因子?!覆贿^在精細(xì)化層面,比如模型預(yù)測這塊我們是不太可能讓DeepSeek參與太多?!?/p>
對于絕大多數(shù)量化私募來說,DeepSeek等大模型對量化投資的實(shí)盤幫助有限。
從過程來看,大模型在處理文本及其邏輯上優(yōu)勢明顯,量化投研則是數(shù)據(jù)處理上有更大需求,輿情類因子占比不大;從結(jié)果來看,DeepSeek有幻覺和生產(chǎn)內(nèi)容隨機(jī)性的局限,模型輸出結(jié)果未必符合現(xiàn)在量化投研的嚴(yán)謹(jǐn)要求。
即使不聚焦DeepSeek,AI整體對量化也無法起到?jīng)Q定性作用。目前量化管理人的AI能力和基金的未來業(yè)績并沒有直接的正相關(guān)系,否則幻方就是業(yè)績最好的量化的基金。
AI作為一種科技工具,現(xiàn)已被廣泛應(yīng)用于高頻量價(jià)的因子挖掘。雖然AI在機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、大數(shù)據(jù)處理等方面能提供超越人類思維的算法邏輯,為策略研發(fā)提供更多可能,但在當(dāng)前市場AI更多是一種輔助工具,能發(fā)揮多少還得看管理人的水平。
特別是一些低頻量化、具有獨(dú)特?cái)?shù)據(jù)處理邏輯與算法的私募對AI的依賴性并沒有那么強(qiáng),這樣的團(tuán)隊(duì)市場上仍是主流,其中不乏業(yè)績持續(xù)穩(wěn)定的管理人。
既然時(shí)下大模型對量化投資幫助有限,量化私募距離做大模型還很遠(yuǎn)。那量化集體布局AI實(shí)驗(yàn)室的目的是什么?僅僅是看好量化未來的火拼,取決于各家AI實(shí)力?
DeepSeek對量化意味著什么?
在非量化金融人士眼里,國內(nèi)量化做出DeepSeek似乎有其必然性。
因?yàn)镈eepSeek降低訓(xùn)練成本,原本就屬于量化的方法論,包括怎么針對卡的集群做更精準(zhǔn)的調(diào)校,如何用浮點(diǎn)的精度調(diào)整文字模型。再加上量化對卡的使用較早,運(yùn)用嫻熟,對集群的理解比別人更強(qiáng),所以很多人認(rèn)為量化做出DeepSeek是一件自然的事情。
但在很多量化老板眼里,DeepSeek是一個(gè)無法復(fù)制的行業(yè)個(gè)例。
一個(gè)直觀的對比:美國擁有D.E.Shaw、Two Sigma等遠(yuǎn)比幻方體量、實(shí)力強(qiáng)得多的量化基金,同樣在AI領(lǐng)域積淀深厚,更是沒有芯片制約,但做出世界級(jí)大模型的也不是他們。
在量化從業(yè)者們看來,DeepSeek誕生在量化行業(yè)本就是一個(gè)奇跡,不僅重振了人們對中國科技與中國資產(chǎn)的信心,也間接地改善了量化的展業(yè)環(huán)境。
輿論壓力緩解的同時(shí),量化的技術(shù)力量也引起了金融行業(yè)更廣泛的重視。近日,深圳私募基金業(yè)協(xié)會(huì)召開私募量化機(jī)構(gòu)調(diào)研座談會(huì),與16家頭部量化共同探討「AI+資產(chǎn)管理」,并對設(shè)立「量化創(chuàng)新實(shí)驗(yàn)室」推動(dòng)產(chǎn)學(xué)研合作提供政策支持。
蒙璽投資辦公地在上海,AI實(shí)驗(yàn)室卻落地合肥。創(chuàng)始人李驤安徽人,畢業(yè)于中科大,當(dāng)前是中科大金融碩士研究生指導(dǎo)老師。據(jù)遠(yuǎn)川了解,蒙璽的目的不是追趕DeepSeek,而是另辟蹊徑吸引中科大的優(yōu)秀學(xué)生,也有一部分回饋母校的情懷。
「我們做AI Lab是為了給中科大學(xué)生提供一些AI 相關(guān)的就業(yè)機(jī)會(huì)、實(shí)習(xí)機(jī)會(huì)。AI Lab如果能做出一些用到實(shí)盤的東西就非常成功了,如果能在主流期刊發(fā)表論文那就極度成功了?!姑森t認(rèn)為即使實(shí)現(xiàn)這些成果,距離做大模型還是很遠(yuǎn)。
另一方面,在大學(xué)邊駐點(diǎn)是量化搶人的一種方式。比如李驤的校友,寬德創(chuàng)始人馮鑫就在北京高校邊駐點(diǎn)時(shí)發(fā)現(xiàn)人大數(shù)學(xué)系90后天才少年徐御之,后者一路晉升為寬德合伙人并成為公司最大股東。相比之前,AI實(shí)驗(yàn)室總比量化炒股對頂級(jí)大學(xué)生更有吸引力。
過去,量化老板最大的困惑是找不到在中國商業(yè)社會(huì)的站位——除了為市場提供流動(dòng)性,自身的價(jià)值意義在哪?如果作為一種普惠金融幫老百姓賺錢尚且算是一種意義,但私募百萬申購門檻顯然把這層意義擋在了門外。
直到DeepSeek的出現(xiàn),為量化行業(yè)打樣了一個(gè)實(shí)現(xiàn)社會(huì)價(jià)值的路徑,量化老板的困惑也由此解開。某種程度上,量化私募集體設(shè)立AI實(shí)驗(yàn)室不是為了造出下一個(gè)DeepSeek,而是在一個(gè) AI 正在從方方面面改變和重塑人們的工作和生活方式的時(shí)代里,將溢出的技術(shù)通過逐漸普及的應(yīng)用反哺給更多的普羅大眾。
參考資料
[1]「3萬張卡」、60億投入后,DeepSeek發(fā)了5000億紅包,騰訊科技
[2]橋水CEO:我們的人工智能基金堪比人類管理的基金,彭博商業(yè)周刊
[3]中金 | 大模型系列(1):DeepSeek-R1量化策略實(shí)測,中金點(diǎn)睛
封面來源:shotdeck
作者:沈暉
編輯:張婕妤
責(zé)任編輯:張婕妤
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.