01
從浙江大學畢業之后,您都進行了哪些嘗試,又如何開始的創業之路?
梁文鋒:畢業后,我沒有像大多數同學那樣,投身大廠成為安穩的碼農。
在一個簡陋的空間里,開始研究用計算機賺錢的各種途徑,整日與代碼和數據相伴,累了就趴在桌上小憩。
在探索過程中,接觸到量化投資。當時,量化投資在國內還是新鮮事物,但我堅信自己能在這個領域闖出一片天地。
量化投資,簡單來說,就是利用數學模型和計算機技術,對金融市場的數據進行分析和預測,從而制定投資策略,即通過計算機取代人,以數量化方式程序化發出買賣指令。
這是一個融合金融、數學和計算機科學的交叉領域,需要具備深厚的專業知識和強大的技術能力。
為掌握量化投資的核心技術,我開始瘋狂學習金融知識,購置大量金融書籍,從經典金融理論著作到最新量化投資研究報告,同時,報名參加各種金融培訓課程,學習國內外頂尖量化投資機構的經驗與方法。
量化投資的數學模型復雜難懂,金融市場波動變幻莫測,每一次嘗試與失敗都讓人感到沮喪和迷茫。
但每當想要放棄時,總會想起量化投資之父西蒙斯的一句話:“一定有辦法對價格建模。”這句話如同一束光,給予我黑暗中堅持下去的勇氣。
2010年,滬深300股指期貨正式推出,猶如春風喚醒沉睡的量化投資市場。2013年,我將人工智能AI與量化交易結合,和浙江大學校友徐進等人創立了以德國數學家卡爾·雅可比命名的投資公司——杭州雅克比投資管理有限公司。
2015年,共同創立杭州幻方科技有限公司,也就是今天的浙江九章資產管理有限公司,次年又成立了寧波幻方量化投資管理合伙企業(有限合伙)。
經過幾年發展,幻方量化在國內迅速崛起。2016年10月,幻方量化推出第一個AI模型,第一份由深度學習生成的交易倉位上線執行。
在量化投資領域積累了強大的技術實力和算力資源,幻方量化也以強大的算力支持聞名。
到2017年底,幾乎所有量化策略都采用AI模型計算。2019年,幻方量化管理規模突破百億,成為國內量化私募“四巨頭”之一。
2021年,幻方量化因業績不佳向投資者致歉,承認誤判了市場走向。
后來,行業又遭遇挫折,中國金融監管機構嚴厲打擊量化交易,認為這類交易助長羊群效應,加劇市場波動。
創業就是這樣,從來沒有坦途。
02
沒有人能隨隨便便成功,量化交易與常規投資不同,您如何能夠異軍突起,又如何看待量化投資的未來?
梁文鋒:我們的核心團隊,連我自己,一開始都沒有量化經驗,這一點很特殊。不能說是成功的秘密,但這是幻方的文化之一。
幻方某種程度上增強了我們對技術驅動型創新的信心,我們經歷了一個漫長的積累過程。外部看到的是幻方 2015 年后的部分,但其實我們做了 16 年。
那么,量化和非量化,到底是怎么區分的?在投資決策的過程中,核心你是用數量化方法進行決策的,還是用人進行決策的。
所以區別不是交易,不是研究手段,而是決策方式。
量化公司有很多交易員和研究員,但是沒有基金經理的,基金經理就是一堆服務器。人來做投資決策的時候,它是一種藝術,要憑感覺。程序來決策的時候,它是一種科學,它有最優解。
有人問,量化投資以后還需要人類嗎?當然需要,需要大量的程序員和研究員。
量化交易共四種股票策略,最重要的是第一種日間量價模型。大家經常聽說的多因子、alpha其實都是說日間量價模型,規模大概有兩千億。
第二種是日內回轉模型,俗稱股票T0,有大幾百億。第三種是基本面模型,第四種是事件驅動模型,目前都不是重點。
在傳統上,所有的模型都是多因子模型,通過選股和擇時來獲取超額收益。在2017年以前,多因子模型是萬能的,以前我們都希望模仿worldquant的模式,就是找很多的人來挖因子。同行里大家競爭的是誰的因子更加有效。
現在你要再挖出一些很有效的因子,已經很難了。
2017年之后,行業發生變化,傳統的多因子框架逐漸被人工智能取代。2019年之后,又逐漸被更新的集成框架取代。作為私募,投資人對我們的期望是很高的,如果一年跑贏指數低于25%,投資人是不滿意的。
私募之間的競爭很激烈。
每個星期都會拿到同行的業績數據,這個星期誰跑贏了多少,大家放到一起來比,如果落后了客戶就馬上就會打電話來,所以我們壓力很大的。
正是這樣的壓力,逼得我們不斷地提升投資能力,加班改策略,因為一偷懶就落后了。當然我們向客戶的收費也高,遠遠高于公募,所以這個業績和壓力也是公平的。
我們經常會被問:量化投資到底是賺了誰的錢?
其實答案很簡單,量化賺了原來人類投資者賺的錢。人類投資者分兩個流派,一種叫技術面,一種叫基本面。說得更具體一點,現在量化賺的是技術面流派原來賺的錢。
量化私募整個行業的進步,大致是符合摩爾定律的,每18個月投資能力翻一倍。但是這幾年來,量化投資的平均收益率,差不多是沒變化的,因為市場的有效性在不斷提高。
這是符合邏輯的,因為投資能力提高一倍,市場的有效性還一樣的話,賺的錢應該是原來的2倍才對。所以市場的有效性提高了。
預測中國量化投資的未來,一個辦法就是看一下美國的現狀。美國的資產管理有兩個趨勢:一個是共同基金逐漸指數化,另一個是對沖基金逐漸走向量化。
共同基金類似國內的公募基金,對沖基金相當于中國的證券私募。最初的對沖基金都不是量化的,這個表是2004年全球對沖基金資管規模排名的前10名,大部分都不是量化的。
2018年的排名,量化已經占了前面的多數,我們熟悉的橋水排名第一,AQR排名第二,文藝復興排名第四。
從美國的經驗來看,量化私募的管理規模可以做得很大。全球最大的對沖基金橋水的管理規模是一萬億人民幣左右,而國內大的量化公司在100~200億之間,我們可能還有幾十倍的增長空間。
國外那么多量化公司,他們都在做什么,都在做高頻嗎?顯然不是。高頻容納的錢很少的,并不是資產管理的主流。答案是所有策略都做,從宏觀對沖,到股票基本面,到股票量價,到大宗商品,到債券,主戰場是股票和債券。
全球最大的對沖基金橋水,是做宏觀量化的,全球第二大對沖基金AQR是做股票基本面的。越是低頻的策略,容量越大。
所有原來人類做的策略,現在量化都在做。而國內的對沖基金,現在大家主要都是做量價策略,我們整體上比美國是落后的。從美國的經驗來看,在策略類型上面,我們應該還有很大的發展空間。
我們預計未來幾年,中國的股票市場,有效性會進一步提高。這是歷史趨勢,不可阻擋。
未來量化投資的提升應該來自于多策略結合,總有一天技術面的波動會越來越小,技術的進步到達瓶頸,未來量化投資一定會去瓜分原來基本面流派的人賺的錢。
市場有效的時候,你直接買指數就可以了,指數就是真正的價值投資。
03
量化交易這么有“錢途”,為什么又開始進軍人工智能大語言模型,您具體是怎么做的,如何實現賽道轉換?
梁文鋒:核心是好奇心的驅動,對 AI 能力邊界的好奇。
對于渴望探索機器學習極限的工程師來說,將進軍AI模型是自然而然的事情。
當初,幻方的主要班底里,很多人是做人工智能的。當時我們嘗試了很多場景,最終切入了足夠復雜的金融,而通用人工智能可能是下一個最難的事之一。
對很多行外人來說,ChatGPT 這波浪潮沖擊特別大;但對行內人來說,2012年 AlexNet 帶來的沖擊已經引領一個新的時代。
AlexNet 的錯誤率遠低于當時其他模型,復蘇了沉睡幾十年的神經網絡研究。雖然具體技術方向一直在變,但模型、數據和算力這三者的組合是不變的。
特別是當 2020 年 OpenAI 發布 GPT3 后,方向很清楚,需要大量算力;但即便 2021 年,我們投入建設螢火二號時,大部分人還是無法理解。
從近處說,GPT4還有很多待解之謎。我們去復刻的同時,也會做研究揭秘。
只做復刻的話,可以在公開論文或開源代碼基礎上,只需訓練很少次數,甚至只需finetune(微調)一下,成本很低。而做研究,要做各種實驗和對比,需要更多算力,對人員要求也更高,所以成本更高。
從遠處說,我們想去驗證一些猜想。
比如我們理解人類智能本質可能就是語言,人的思維可能就是一個語言的過程。你以為你在思考,其實可能是你在腦子里編織語言。這意味著,在語言大模型上可能誕生出類人的人工智能(AGI)。
比如,其實從最早的1張GPU卡,到2015年的100張卡、2019年的1000張卡,再到一萬張,這個過程是逐步發生的。
幾百張卡之前,我們托管在IDC,規模再變大時,托管就沒法滿足要求了,就開始自建機房。很多人會以為這里邊有一個不為人知的商業邏輯,但其實,主要是好奇心驅動。
對我們來說,這是一個怎么做的問題,而不是為什么做的問題。既然我們想做這個事,又有這個能力,這個時間點上,我們就是最合適人選之一。
我們做大模型,其實跟量化和金融都沒有直接關系。我們獨建了一個名為深度求索的新公司來做這件事。
幻方作為我們的出資人之一,有充足的研發預算,另外每年有幾個億的捐款預算,之前都是給公益機構,如果需要,也可以做些調整。
我們也在找不同出資方在談。接觸下來,感覺很多VC對做研究有顧慮,他們有退出需求,希望盡快做出產品商業化,而按照我們優先做研究的思路,很難從VC那里獲得融資。但我們有算力和一個工程師團隊,相當于有了一半籌碼。
我們不會過早設計基于模型的一些應用,會專注在大模型上。我們要做的是通用人工智能,也就是AGI。
語言大模型可能是通往AGI的必經之路,并且初步具備了AGI的特征,所以我們會從這里開始,后邊也會有視覺等。
04
人們常說,創新是第一動力,人才是第一資源,在人工智能的創業路上,人才如何創新,又扮演什么角色?
梁文鋒:前期因為人手不夠,會從幻方臨時借調一部分人過去。
去年底ChatGPT3.5風靡時,我們就開始動手招聘了,不過我們依然需要更多的人加入。
當前,團隊中并沒有什么高深莫測的奇才,都是一些 Top 高校的應屆畢業生、沒畢業的博四、博五實習生,還有一些畢業才幾年的年輕人。
V2 模型沒有海外回來的人,都是本土的。前 50 名頂尖人才可能不在中國,但也許我們能自己打造這樣的人。
因為我們在做最難的事,對頂級人才吸引最大的,肯定是去解決世界上最難的問題。其實,頂尖人才在中國是被低估的。
因為整個社會層面的硬核創新太少了,使得他們沒有機會被識別出來。我們在做最難的事,對他們就是有吸引力的。
在我看來,人才最重要的素質就是,熱愛和扎實的基礎能力。其他都沒那么重要。
他們的熱情通常會表現出來,因為他真的很想做這件事,所以這些人往往同時也在找你。
招人時確保價值觀一致,然后通過企業文化來確保步調一致。當然,我們并沒有一個成文的企業文化,因為所有成文東西,又會阻礙創新。更多時候,是管理者的以身示范,遇到一件事,你如何做決策,會成為一種準則。
我們的總結是,創新需要盡可能少的干預和管理,讓每個人有自由發揮的空間和試錯機會。創新往往都是自己產生的,不是刻意安排的,更不是教出來的。
總體而言,在人才的選用育留,我們基本還是延續在幻方的人才模式。
幻方招人有條原則是,看能力,而不是看經驗。我們的核心技術崗位,基本以應屆和畢業一兩年的人為主。
如果追求短期目標,找現成有經驗的人是對的。但如果看長遠,經驗就沒那么重要,基礎能力、創造性、熱愛等更重要。從這個角度看,國內合適的候選人就不少。
做一件事,有經驗的人會不假思索告訴你,應該這樣做,但沒有經驗的人,會反復摸索、很認真去想應該怎么做,然后找到一個符合當前實際情況的解決辦法。
事實上,第一年他們什么都做不出來,第二年才開始有點成績。但我們的考核標準和一般公司不太一樣。
我們沒有 KPI,也沒有所謂的任務。交給他重要的事,并且不干預他。讓他自己想辦法,自己發揮。
一家公司的基因是很難被模仿的。比如說招沒有經驗的人,怎么判斷他的潛力,招進來之后如何才能讓他成長,這些都沒法直接模仿。
我們不會故意回避有經驗的人,但更多是看能力。
拿銷售這個崗位舉個例子。我們的兩個主力銷售,都是這個行業的素人。一個原來做德國機械品類外貿的,一個是原來在券商做后臺寫代碼。
他們進入這個行業時,沒有經驗,沒有資源,沒有積累。而現在我們可能是唯一一家能以直銷為主的大私募。
我們不像一般公司,看重客戶下單量,我們的銷售賣多少和提成不是一開始就算好的,而會更鼓勵銷售去發展自己的圈子,認識更多人,產生更大影響力。
我們認為,一個讓客戶信任的正直的銷售,可能在短時間內做不到讓客戶來下單,但可以讓你覺得他是個靠譜的人。
05
從量化交易到人工智能,這是一個巨大的跨越,在您看來,做好一家人工智能公司,最重要的是什么?
梁文鋒:不管是 Google 實驗室,還是 OpenAI,甚至中國大廠的 AI Lab,都很有價值的。最后是 OpenAI 做出來,有歷史的偶然性。
我覺得創新首先是一個信念問題。為什么硅谷那么有創新精神?首先是敢。
ChatGPT 出來時,整個國內對做前沿創新都缺乏信心,從投資人到大廠,都覺得差距太大了,還是做應用吧。但創新首先需要自信。這種信心通常在年輕人身上更明顯。
創新就是昂貴且低效的,有時候伴隨著浪費。所以經濟發展到一定程度之后,才能夠出現創新。很窮的時候,或者不是創新驅動的行業,成本和效率非常關鍵。OpenAI也是燒了很多錢才出來。
這個世界存在很多無法用邏輯解釋的事,就像很多程序員,也是開源社區的瘋狂貢獻者,一天很累了,還要去貢獻代碼。
類似你徒步50公里,整個身體是癱掉的,但精神很滿足。不是所有人都能瘋狂一輩子,但大部分人,在他年輕的那些年,可以完全沒有功利目的,投入地去做一件事。
幻方時代,我們就很少自上而下地指派目標或任務。DeepSeek 也全是自下而上。而且我們一般不前置分工,而是自然分工。每個人有自己獨特的成長經歷,都是自帶想法的,不需要主導他。
探索過程中,他遇到問題,自己就會拉人討論。不過當一個想法顯示出潛力,我們也會自上而下地去調配資源。
我們每個人對于卡和人的調動是不設上限的。如果有想法,每個人隨時可以調用訓練集群的卡無需審批。同時因為不存在層級和跨部門,也可以靈活調用所有人,只要對方也有興趣。
我們選人的標準一直都是熱愛和好奇心,所以很多人會有一些奇特的經歷,很有意思。很多人對做研究的渴望,遠超對錢的在意。
06
當前,進入新一輪的科技革命,中美在人工智能不斷暗中較量,國內各個大廠也掀起“百模大戰”,您認為你們的優勢是什么?
梁文鋒:大廠肯定有優勢,但如果不能很快應用,大廠也不一定能持續堅持,因為它更需要看到結果。
頭部的創業公司也有技術做得很扎實的,但和老的一波AI創業公司一樣,都要面對商業化難題。
比如,我們發布產品后, 5 天后智譜 AI 就跟進了,之后是字節、阿里、百度、騰訊等大廠。
智譜 AI 降的是一個入門級產品,和我們同級別的模型仍然收費很貴。字節是真正第一個跟進的。
旗艦模型降到和我們一樣的價格,然后觸發了其它大廠紛紛降價。因為大廠的模型成本比我們高很多,所以我們沒想到會有人虧錢做這件事,最后就變成了互聯網時代的燒錢補貼的邏輯。
無論大廠,還是創業公司,都很難在短時間內建立起碾壓對手的技術優勢。
因為有OpenAI指路,又都基于公開論文和代碼,最晚明年,大廠和創業公司都會把自己的大語言模型做出來。
大廠和創業公司都各有機會。現有垂類場景不掌握在初創公司手上,這個階段對初創公司不太友好。
但因為這種場景說到底也是分散的、碎片化的小需求,所以它又是更適合靈活的創業型組織的。
從長期看,大模型應用門檻會越來越低,初創公司在未來20年任何時候下場,也都有機會。
我們主要的精力在研究下一代的大模型。還有很多未解決的問題。 所有的套路都是上一代的產物,未來不一定成立。
拿互聯網的商業邏輯去討論未來 AI 的盈利模式,就像馬化騰創業時,你去討論通用電氣和可口可樂一樣。很可能是一種刻舟求劍。
我們認為當前階段是技術創新的爆發期,而不是應用的爆發期。長遠來說,我們希望形成一種生態,就是業界直接使用我們的技術和產出,我們只負責基礎模型和前沿的創新,然后其它公司在 DeepSeek 的基礎上構建 toB、toC 的業務。
如果能形成完整的產業上下游,我們就沒必要自己做應用。當然,如果需要,我們做應用也沒障礙,但研究和技術創新永遠是我們第一優先級。
未來的世界很可能是專業化分工的,基礎大模型需要持續創新,大廠有它的能力邊界,并不一定適合。
技術沒有秘密,但重置需要時間和成本。英偉達的顯卡,理論上沒有任何技術秘密,很容易復制,但重新組織團隊以及追趕下一代技術都需要時間,所以實際的護城河還是很寬。
我們的目標也很明確,就是不做垂類和應用,而是做研究,做探索。
按照教科書的方法論來推導創業公司,在當下,他們做的事,都是活不下來的。
但市場是變化的,真正的決定力量往往不是一些現成的規則和條件,而是一種適應和調整變化的能力。
很多大公司的組織結構已經不能快速響應和快速做事,而且他們很容易讓之前的經驗和慣性成為束縛,而這波AI新浪潮之下,一定會有一批新公司誕生。
07
人工智能的競爭是公司的競爭,也是國家的競爭,您怎么看大模型創業公司的終局之戰,又如何看待人工智能公司的未來?
梁文鋒:在美國每天發生的大量創新里,這是非常普通的一個。
他們之所以驚訝,是因為這是一個中國公司,在以創新貢獻者的身份,加入到他們游戲里去。畢竟大部分中國公司習慣 follow,而不是創新。
過去三十年,我們都只強調賺錢,對創新是忽視的。創新不完全是商業驅動的,還需要好奇心和創造欲。我們只是被過去那種慣性束縛了,但它也是階段性的。
創新的成本肯定不低,過去那種拿來主義的慣性也和過去的國情有關。但現在,你看無論中國的經濟體量,還是字節、騰訊這些大廠的利潤,放在全球都不低。我們創新缺的肯定不是資本,而是缺乏信心以及不知道怎么組織高密度的人才實現有效的創新。
你們發布過代碼生成和數學的模型,也從 dense 模型切換到了 MOE,所以你們的 AGI 路線圖有哪些坐標?可能是 2 年、5 年或者 10 年,總之會在我們有生之年實現。至于路線圖,即使在我們公司內部,也沒有統一意見。
但我們確實押注了三個方向。一是數學和代碼,二是多模態,三是自然語言本身。
數學和代碼是 AGI 天然的試驗場,有點像圍棋,是一個封閉的、可驗證的系統,有可能通過自我學習就能實現很高的智能。
另一方面,可能多模態、參與到人類的真實世界里學習,對 AGI 也是必要的。我們對一切可能性都保持開放。
我們看到的是中國AI不可能永遠處在跟隨的位置。我們經常說中國 AI 和美國有一兩年差距,但真實的 gap 是原創和模仿之差。
如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。英偉達的領先,不只是一個公司的努力,而是整個西方技術社區和產業共同努力的結果。
他們能看到下一代的技術趨勢,手里有路線圖。中國 AI 的發展,同樣需要這樣的生態。很多國產芯片發展不起來,也是因為缺乏配套的技術社區,只有第二手消息,所以中國必然需要有人站到技術的前沿。
未來的終局之戰, 可能活下來的公司也就 2 到 3 家。現在都還處在燒錢階段,所以那些自我定位清晰、更能精細化運營的,更有機會活下來。
其它公司可能會脫胎換骨。有價值的東西不會煙消云散,但會換一種方式。
對于我們而言,短期內沒有融資計劃,我們面臨的問題從來不是錢,而是高端芯片被禁運。
我經常思考的是,一個東西能不能讓社會的運行效率變高,以及你能否在它的產業分工鏈條上找到擅長的位置。
只要終局是讓社會效率更高,就是成立的,中間很多都是階段性的,過度關注必然眼花繚亂。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.