99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

7B專業(yè)領(lǐng)域大模型,能打DeepSeek- R1?測試甚至不如QwQ:32B

0
分享至


大家好,我是 Ai 學(xué)習(xí)的老章

很久沒有聽到專業(yè)大模型的消息了

我記得大模型剛剛興起的時候,各行各業(yè)開啟了“大練”行業(yè)大模型的熱潮,能源、醫(yī)療、金融、政務(wù)、法律等等,每一個領(lǐng)域都有一堆行業(yè)大模型。后來各路通用大模型大放異彩,行業(yè)大模型有點沉寂了,尤其是 DeepSeek 來了之后,通用、推理大模型太能打了,訓(xùn)練領(lǐng)域大模型還不如直接接入 DeepSeek 靠譜了。

但是事物都有兩面性, DeepSeek R1 帶火了知識蒸餾,反而降低了行業(yè)大模型微調(diào)技術(shù)難度和成本。這不,上海財經(jīng)大學(xué)統(tǒng)計與數(shù)據(jù)科學(xué)學(xué)院張立文教授與其領(lǐng)銜的金融大語言模型課題組剛以 Qwen2.5-7B-Instruct 為基座,通過高質(zhì)量的可驗證金融問題微調(diào)訓(xùn)練出了 Fin-R1,號稱在多個金融領(lǐng)域基準(zhǔn)測試上的表現(xiàn)達(dá)到參評模型的 SOTA 水平。

我看了他們的技術(shù)報告:https://arxiv.org/abs/2503.16252,數(shù)據(jù)蒸餾過程確實采用了 DeepSeek - R1 官方提供的思路。

訓(xùn)練過程分兩個階段:1、通過高質(zhì)量金融推理數(shù)據(jù)的 SFT (Supervised Fine-Tuning) 幫助模型初步提升金融推理能力;2、在 GRPO(Group Relative Policy Optimization) 算法的基礎(chǔ)上結(jié)合格式獎勵和準(zhǔn)確度獎勵進(jìn)行強(qiáng)化學(xué)習(xí),以此進(jìn)一步提升金融推理任務(wù)的準(zhǔn)確性和泛化能力。


評測結(jié)果:在聚焦真實金融表格數(shù)值推理任務(wù)的 FinQA 以及多輪推理交互場景的 ConvFinQA 兩大關(guān)鍵任務(wù)測試上分別以 76.0 和 85.0 的得分在參評

Model

Parameters

FinQA

ConvFinQA

Ant_Finance

TFNS

Finance-Instruct-500k

Average

DeepSeek-R1

671B

71.0

82.0

90.0

78.0

70.078.2Fin-R1

7B

76.085.0

81.0

71.0

62.9

75.2

Qwen-2.5-32B-Instruct

32B

72.0

78.0

84.0

77.0

58.0

73.8

DeepSeek-R1-Distill-Qwen-32B

32B

70.0

72.0

87.0

79.0

54.0

72.4

Fin-R1-SFT

7B

73.0

81.0

76.0

68.0

61.0

71.9

Qwen-2.5-14B-Instruct

14B

68.0

77.0

84.0

72.0

56.0

71.4

DeepSeek-R1-Distill-Llama-70B

70B

68.0

74.0

84.0

62.0

56.0

69.2

DeepSeek-R1-Distill-Qwen-14B

14B

62.0

73.0

82.0

65.0

49.0

66.2

Qwen-2.5-7B-Instruct

7B

60.0

66.0

85.0

68.0

49.0

65.6

DeepSeek-R1-Distill-Qwen-7B

7B

55.0

62.0

71.0

60.0

42.0

58.0


? 模型部署、測試

??:modelscope、vllm、open-webui 等安裝,請參考我前幾天寫的:[[2025-03-22-大模型推理引擎vllm,啟動QwQ-32B]]

1、下載模型

Github 地址:https://github.com/SUFE-AIFLM-Lab/Fin-R1
模型地址:https://modelscope.cn/models/AI-ModelScope/Fin-R1

下載完整模型庫:sudo modelscope download --model AI-ModelScope/Fin-R1 --local_dir /home/data-local/Fin-R1,將模型下載到指定的本地目錄 "/home/data-local/Fin-R1" 中。

模型文件差不多 15GB


2、啟動模型

我有 2 張4090,我看新聞?wù)f一張卡也能跑,但是官方文檔也是使用的 2 張卡

CUDA_VISIBLE_DEVICES=4,5 vllm serve "/home/data-local/Fin-R1" --host 0.0.0.0 --port 8000 --gpu-memory-utilization 0.9 --max-model-len 16384 --tensor-parallel-size 2 --served-model-name "Fin-R1"    

模型權(quán)重僅占用了 7 個 GB 顯存,Pytorch 占用 1.5B、KV cache 占了 12.4GB


3、接入 open-webui

測試一個問題

貸款 100 萬元,期限 360 期,貸款利率 2.85%,等額本息法,計算還款總額,利息總額,每月還款額分別是多少?

先看標(biāo)準(zhǔn)答案


Fin-R1的計算過程,有模有樣但謬之千里


這結(jié)果和房貸利息網(wǎng)的計算結(jié)果相差也太大了。。

輸出速度倒是蠻快的


我最近很喜歡的 QwQ:32B 能不能搞定此題呢?

4 張卡本地部署的 QwQ:32B 計算的結(jié)果還是可以的,些許誤差,可以接受。

我又在通義千問官網(wǎng)問了一下,幾乎是分毫不差!

個人測試結(jié)果,不代表模型真實實力,后續(xù)我會再測測。

制作不易,如果這篇文章覺得對你有用,可否點個關(guān)注。給我個三連擊:點贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中國最缺人的4個專業(yè),就業(yè)率100%,千萬別錯過!

中國最缺人的4個專業(yè),就業(yè)率100%,千萬別錯過!

教育導(dǎo)向分享
2024-11-30 19:19:01
媒體人:籃協(xié)要求入籍必須退原籍,中國隊亞洲杯大概率無歸化

媒體人:籃協(xié)要求入籍必須退原籍,中國隊亞洲杯大概率無歸化

懂球帝
2025-05-08 17:22:29
遠(yuǎn)華集團(tuán)總裁賴昌星,在獄中對董文華的描述,聽后讓人咋舌

遠(yuǎn)華集團(tuán)總裁賴昌星,在獄中對董文華的描述,聽后讓人咋舌

蘭姐說故事
2025-02-17 22:00:03
一搶而空!認(rèn)購率超100%…很多上海人最近連軸轉(zhuǎn):下手要快!

一搶而空!認(rèn)購率超100%…很多上海人最近連軸轉(zhuǎn):下手要快!

申消費(fèi)
2025-05-08 09:35:45
危險信號,伊俄下場,印巴局勢嚴(yán)峻升級,中方必須做好最壞打算

危險信號,伊俄下場,印巴局勢嚴(yán)峻升級,中方必須做好最壞打算

Ck的蜜糖
2025-05-08 15:24:07
油價一夜突變!今日5月8日調(diào)整后,全國加油站92、95汽油最新價

油價一夜突變!今日5月8日調(diào)整后,全國加油站92、95汽油最新價

趣味萌寵的日常
2025-05-08 14:20:17
核電站一天吃掉多少鈾?算完了才不會“驚”掉下巴?

核電站一天吃掉多少鈾?算完了才不會“驚”掉下巴?

軍武數(shù)據(jù)庫
2025-05-08 11:18:11
突然!特朗普宣布:停火!

突然!特朗普宣布:停火!

數(shù)據(jù)寶
2025-05-08 11:09:37
特朗普拒絕降低關(guān)稅以推進(jìn)美中談判,但這類商品或是例外

特朗普拒絕降低關(guān)稅以推進(jìn)美中談判,但這類商品或是例外

北美商業(yè)電訊
2025-05-08 17:14:58
原來瑾汐一家著急回溫州是要辦件很重要的事,養(yǎng)父母把車都塞滿了

原來瑾汐一家著急回溫州是要辦件很重要的事,養(yǎng)父母把車都塞滿了

星光看娛樂
2025-05-08 14:13:56
女生穿瑜伽褲,到底是什么心理?原因太真實了!

女生穿瑜伽褲,到底是什么心理?原因太真實了!

健身S叔
2025-03-22 18:09:52
趙心童遇“送命問題”!央視讓快問快答:奧沙利文or丁俊暉二選一

趙心童遇“送命問題”!央視讓快問快答:奧沙利文or丁俊暉二選一

三十年萊斯特城球迷
2025-05-08 15:58:59
50萬平米,東北最大!遼寧這個“大項目”開工啦!快看看多厲害···

50萬平米,東北最大!遼寧這個“大項目”開工啦!快看看多厲害···

幸福沈陽人
2025-05-08 14:32:11
阿莫林:賽季結(jié)束時,我們可能是英超史上贏得歐戰(zhàn)冠軍的最差球隊

阿莫林:賽季結(jié)束時,我們可能是英超史上贏得歐戰(zhàn)冠軍的最差球隊

直播吧
2025-05-07 21:00:02
與你有關(guān)!王忠林的這次調(diào)研關(guān)乎武漢人一個大福利

與你有關(guān)!王忠林的這次調(diào)研關(guān)乎武漢人一個大福利

湖北e家庭
2025-05-08 10:34:34
印媒:印度今起在巴基斯坦邊境展開大規(guī)模空戰(zhàn)演習(xí)

印媒:印度今起在巴基斯坦邊境展開大規(guī)模空戰(zhàn)演習(xí)

參考消息
2025-05-07 19:59:58
以其昏昏,使人昭昭——借吹捧邏輯學(xué)貶低辯證法,吃相未免太難看

以其昏昏,使人昭昭——借吹捧邏輯學(xué)貶低辯證法,吃相未免太難看

一老沈一
2025-05-07 15:24:23
天上掉下來的國運(yùn):印度和巴基斯坦開戰(zhàn),無論輸贏,中方都將獲益

天上掉下來的國運(yùn):印度和巴基斯坦開戰(zhàn),無論輸贏,中方都將獲益

妙知
2025-05-07 22:06:13
控糖減重餓肚子? 收下這份低GI飲食“隱藏菜單”!

控糖減重餓肚子? 收下這份低GI飲食“隱藏菜單”!

人民體育
2025-05-08 17:19:56
澳門這一夜上演明星修羅場,張柏芝和李冰冰熱聊阿sa表情耐人尋味

澳門這一夜上演明星修羅場,張柏芝和李冰冰熱聊阿sa表情耐人尋味

曉風(fēng)說
2025-05-08 11:37:53
2025-05-08 17:56:49
機(jī)器學(xué)習(xí)與Python社區(qū) incentive-icons
機(jī)器學(xué)習(xí)與Python社區(qū)
機(jī)器學(xué)習(xí)算法與Python
2949文章數(shù) 11008關(guān)注度
往期回顧 全部

科技要聞

OpenAI任命"應(yīng)用CEO" 奧特曼聚焦研究/安全

頭條要聞

女子走路打電話轉(zhuǎn)身撞男子摔骨折 法院調(diào)解男子賠7萬

頭條要聞

女子走路打電話轉(zhuǎn)身撞男子摔骨折 法院調(diào)解男子賠7萬

體育要聞

面對一群天賦怪,阿森納只能接受失敗

娛樂要聞

劉畊宏老婆補(bǔ)刀 清場風(fēng)波口碑翻車!

財經(jīng)要聞

57政策解讀:力度空前的系統(tǒng)性穩(wěn)增長舉措

汽車要聞

23.68萬元起 新款途觀L Pro限時優(yōu)惠5.8萬

態(tài)度原創(chuàng)

游戲
家居
本地
藝術(shù)
公開課

《使命召喚:黑色行動6》第3賽季季中更新襲來 全新多人游戲地圖

家居要聞

侘寂美學(xué) 樸素而有生機(jī)

本地新聞

非遺里的河南|汴梁鳶舞千年韻!宋室風(fēng)箏藏多少絕活

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 永宁县| 江津市| 广宁县| 平山县| 什邡市| 勐海县| 长宁区| 蒙城县| 闻喜县| 砚山县| 克什克腾旗| 台安县| 乐陵市| 临沧市| 元江| 东丰县| 文山县| 随州市| 安平县| 延吉市| 榕江县| 镇坪县| 清水县| 汉阴县| 临洮县| 榆林市| 渭源县| 普格县| 五华县| 阳曲县| 威信县| 赣州市| 广德县| 肇源县| 新乐市| 万州区| 沂水县| 莎车县| 正安县| 扶绥县| 桐乡市|