99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

“復刻”幻方量化打造Deepseek 量化私募基金念空在大模型底層技術研發取得突破

0
分享至


5月以來,全球大模型研發公司在大模型語義理解、多模態等方面的“較勁”悄然升級。

中國深度求索(DeepSeek)公司表示,DeepSeek R1模型已完成小版本升級,令大模型的思維深度與推理能力顯著提升。

與此同時,美國Anthropic公司推出“克勞德4”系列兩款新模型,為業界提供更高標準的編程、推理和智能體應用。

面對大模型在推理能力、思維深度方面的較量日益“白熱化”,國內量化私募基金也加入“角逐”,在AI大模型底層技術研發方面也取得突破。

國內量化私募基金念空科技與上海交通大學計算機學院開展合作,提出一種全新的大模型訓練框架(SASR),并發表論文投向全球頂級人工智能會議期刊NIPS。

念空科技創始人王嘯在6月3日接受本報記者專訪時表示,這項全新的大模型訓練框架(SASR),在GSM8K任務中,在僅使用1.5B模型的情況下,準確率就超過了80%,接近GPT-4o的表現;而在KK邏輯推理任務中,其準確率比GPT-4o還高出約9個百分點。SASR讓通用大模型變得更“聰明”。

他告訴記者,當前大模型技術的訓練框架,主要圍繞監督微調(SFT)和強化學習(RL),所謂監督微調(SFT)就是不斷給大模型輸入資料和案例進行監督訓練,相當于“刷題”; 強化學習(RL)則側重強化大模型的邏輯推理能力,讓大模型更準確理解用戶需求,“生成”用戶所需的答案。但是,如何進一步優化大模型的刷題效果與邏輯推理能力的比重,正成為大模型能否更加“聰明”的一大挑戰。

“我們期待這個全新的大模型訓練框架,能夠解決這項挑戰,讓大模型在不增加數據量的情況下,通過優化SFT和RL的關系,也能達到預期的聰明效果。”王嘯向記者指出。

這項全新的訓練框架能否讓大模型更加“聰明”,仍需專業機構的評估與認證。

王嘯對此信心十足。

他向記者透露,念空科技已將這項訓練框架應用在量化投資策略研發領域,并發現相比以往的AI應用,它帶來兩大新變化,一是基于這項新訓練框架的大模型在市場預測準確性方面已達到傳統量化投資模型的約80%,隨著新訓練框架下的大模型日益“聰明”,其預測準確性有望超過傳統量化投資模型;二是新訓練框架下的大模型與傳統量化投資模型的相關性低于50%,這意味著兩者有較高帶來1+1大于2的效果,提升整個量化投資策略的成效。

多位量化私募業內人士向記者透露,隨著AI大模型迭代升級,如今量化私募基金對AI大模型底層技術的研發布局,日益側重算法優化。在這個過程,產學研的結合將是他們在大模型底層技術研發方面取得突破的“捷徑”。畢竟,大學研究機構具有先進的大模型算法優化理論基礎與科研能力,但缺乏更多的算力支持與工程能力,而這些短板恰恰是量化私募基金的“強項”,兩者可以形成“互補”,助力國內大模型變得更“聰明”,在全球AI發展格局擁有更大的話語權。

算法優化與訓練架構創新 量化私募開啟大模型研發“新征途”

幻方量化推出Deepseek,激發越來越多量化私募基金掀起大模型底層技術研發浪潮。

今年以來,多家量化私募基金紛紛設立AI Lab,專注大模型底層技術的研發。

在業內人士看來,量化私募基金要“再造”一個Deepseek,難度相當高。具體而言,一是通用大模型的研發需要大量資金、算力、數據訓練、算法研究的投入,未必是每家量化私募基金都能負擔得起,二是隨著通用大模型市場格局初步清晰,新生的通用大模型“脫穎而出”正面臨更多挑戰。因此,越來越多量化私募基金將目光瞄準通用大模型的算法優化,助力國內通用大模型變得“聰明”,令后者各項性能“趕超”海外知名的通用大模型。

王嘯向記者透露,近年,通用大模型的算法優化,正成為提升大模型整體能力的重要突破口。2023年ChatGPT的面世,主要基于龐大數據的預訓練與監督微調(SFT),年初Deepseek的強勢崛起,則讓市場意識到強化學習(RL)對提升大模型邏輯推理能力顯得至關重要。如今,越來越多AI公司對通用大模型的訓練方式升級與算法優化,都采取SFT+RL模式,比如Deepseek的論文介紹其訓練過程分成SFT-RL-SFT-RL四個過程。

“問題是固化的SFT+RL訓練模式未必能讓大模型聰明度快速提升。”他告訴記者。若大模型的訓練模式過度側重SFT,其結果是大模型刷了很多題,但缺乏思考與總結,聰明度提升存在天花板;反之過度側重RL,其結果是大模型盡管擅于思考總結,但缺乏大量刷題所積累的基礎知識,令幻覺問題難以明顯緩解。”他告訴記者。因此現有的通用大模型所構建的監督微調(SFT)與強化學習(RL)訓練框架,面臨數據精準擬合與高質量思維鏈(CoT)的高度依賴、以及訓練不穩定等方面的限制。為了解決這些影響大模型“聰明度”的掣肘,念空科技與交通大學計算機學院合作提出了一個新框架,即一個自適應的混合訓練框架,在算法優化過程能動態平衡SFT與RL。比如新訓練框架在使用SFT時,在預熱階段建立基本推理能力;在后續訓練階段又能自主切換SFT與GRPO算法混合訓練,通過梯度范數調整訓練概率,確保訓練方案之間的平滑過渡,在探索不同路徑同時保持大模型的良好邏輯推理能力。

通俗而言,在這個全新的訓練框架下,大模型會自主設定一個動態的評估體系,根據數據訓練環節的監督微調(SFT,刷題)效果,自主決定下一步是繼續“刷題”,還是切換成思考總結(強化學習,RL)從而通過動態調整監督微調(SFT)與強化學習(RL)的步驟與切換節奏,達到更好的訓練效果,讓大模型自己變得更“聰明”。

今年,王嘯創立上海全頻思維人工智能科技有限公司AllMind,主營業務是專注研究通用大語言模型(LLM)的相關底層算法和工程技術。AllMind的一項重要工作,是與交通大學計算機學院合作,創建這項全新的通用大模型訓練框架。

王嘯坦言,在創建這項大模型全新訓練框架過程,他們也走了一些彎路,包括技術路線的調整與研究方向的優化。最終,雙方在不懈努力下,設計了一種step by step的訓練方法,在下一個step訓練前,通用大模型可以根據所設計的自適應算法,決定下一個step使用SFT還是RL,從而達到更好的訓練效果。目前,通過在GSM8K、MATH和KK三個公開數據集的實驗表明,這項新訓練框架的性能優于單獨SFT、單獨RL、以及簡單混合的SFT+RL訓練方法。

在業內人士看來,訓練框架創新與算法優化,正成為通用大模型比拼綜合性能的重要突破口。如今,越來越多“聰明度更高”的通用大模型正呈現一個新特征,即他們的參數量未必很高,但綜合能力不亞于同行。這背后,是訓練框架創新與算法優化,令通用大模型在同等數據、算力的情況下具有更出色的訓練效果。

“當前能在算法優化與訓練框架創新方面取得突破的量化私募基金并不多,原因是這需要產學研的融合發展,一方面需要高校研究機構提供理論基礎與科研能力,另一方面需要量化私募基金充分應用自身的AI應用經驗與工程能力,以及提供足夠的算力支持,兩者缺一不可。”一位量化私募基金人士向記者直言。

王嘯告訴記者,AllMind很大程度得益于產學研的融合發展,創建全新的大模型訓練框架。

“AllMind將著眼于通用大模型的基礎學術研究與應用,不以盈利為目的。我們將推動這項訓練框架持續迭代,進一步提升通用大模型的邏輯推理能力與減少幻覺問題,讓大模型變得更聰明同時,為國內大模型在全球AI格局贏得更大的話語權。”他指出。

讓大模型在各個垂直領域“都聰明” 量化私募如何破題

記者多方了解到,訓練框架創新與算法優化能否令通用大模型變得“更聰明”,并不是實驗室“說了算”,還需“實踐出真知”。

王嘯對此向記者表示,所有垂直領域的大模型訓練核心框架是趨同的,都需要高質量的Prompt與CoT數據,在先做監督微調(SFT)的基礎上,讓大模型獲得某個垂直領域的基本認知后,再進行強化學習(RL),進而找到一個正確且高效的數據訓練模式,讓大模型變得越來越“聰明”,能自動生成這個垂直領域的各種準確“答案”。因此,AllMind的發展步驟,是強化通用大模型訓練算法優化與工程技術研究,以及高質量CoT數據生產方向的學術探索,增強通用大模型在金融場景的垂直應用,若這項工作取得良好成效,就有底氣將這套全新的訓練核心框架與訓練模式輸出給新材料、醫藥研發等垂直領域,讓更多垂直領域的大模型都變得“更聰明”。

他透露,念空科技正通過新訓練框架下的大模型,研發新的量化投資預測模型。具體而言,傳統的量化私募基金使用AI技術所搭建的量化投資模型,主要是針對以往股市交易數據等因素進行擬合與歸納總結,從而預測未來并尋找投資獲利機會。比如一種傳統的AI量化投資模型會將過去數年的股市基礎數據與一些特征,通過機器學習與深度學習算法進行訓練,讓模型對過去數年的股市波動規律進行總結歸納,從而預測未來并挖掘相應的投資獲利機會,這本質是基于統計驅動的量化投資模型,如今,他們正通過新訓練框架下的AI大模型進行預測,找到一種通過邏輯驅動的、全新的量化投資模型構建思路。

“目前,基于這項全新訓練框架的大模型在市場預測準確性方面達到傳統量化投資模型的約80%,而且其與傳統量化投資模型的相關性低于50%,有望帶來1+1大于2的效果,可以給現有傳統的量化投資模型提升投資準確性帶來有益的補充。”他告訴記者。這令他開始相信這項全新訓練框架有望令大模型在其他垂直領域應用方面同樣能取得一系列成績。

記者多方了解到,歷經訓練框架創新與算法優化的大模型能否在其他垂直領域同樣“變得聰明”,面臨的變數相當多。比如在數據量極其龐大與復雜的互聯網行業,大模型需要連接盡可能多的GPU與服務器進行高效的大規模數據訓練,因此算法與工程能力的挑戰或遠遠超過金融領域。

多位量化私募業內人士指出,這正成為不少量化私募基金探索大模型算法優化方面的新方向。為此他們也在與高校科研機構合作,將理論基礎與自身在大模型的算法與工程技術運用經驗進行結合,找到更優的算法與訓練框架。

王嘯告訴記者,金融大模型的難點,在于如何在過擬合與欠擬合之間找到最理想的平衡點。短期內,AllMind正著手解決這項挑戰。長期而言,念空科技希望能賦能大模型在更多垂直領域都變得更加聰明,推動中國大模型行業發展,增強中國大模型在未來全球AI格局的競爭力。

(作者 陳植)

免責聲明:本文觀點僅代表作者本人,供參考、交流,不構成任何建議。


陳植

長期關注銀行、保險、外匯、黃金、企業出海、科技金融、產融結合等領域報道,敏銳深入洞察全球經濟趨勢與中國經濟前景。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

經濟觀察報 incentive-icons
經濟觀察報
經濟觀察報是專注于財經新聞與經濟分析的全國性綜合財經類媒體。聚焦商道、商技和商機。
107194文章數 1605191關注度
往期回顧 全部

專題推薦

洞天福地 花海畢節 山水饋贈里的“詩與遠方

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 边坝县| 德清县| 宣威市| 耒阳市| 江西省| 莱州市| 延津县| 新干县| 伊川县| 桂东县| 阳原县| 称多县| 旬邑县| 阿勒泰市| 永春县| 新乡县| 集安市| 沐川县| 湘潭市| 庐江县| 武隆县| 福安市| 什邡市| 海南省| 兴海县| 泽州县| 黑龙江省| 政和县| 固镇县| 建宁县| 南康市| 芮城县| 故城县| 三明市| 秀山| 隆林| 陵川县| 孙吴县| 汨罗市| 富顺县| 读书|