99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

32B模型AM-Thinking-v1超越R1,即刻體驗推理

0
分享至

始智AI wisemodel.cn開源社區

始智AI wisemodel.cn社區是源自中國的中立開放的AI開源社區。正在,歡迎加入共同成長。wisemodel社區上線,價格實惠,靈活方便,支持在線微調訓練模型,及和,并。

2025年, 大模型競爭激烈且重心轉向推理能力發展。中國團隊A-M-team在Hugging Face開源了32B推理模型AM-Thinking-v1。該 團隊依托開源底座,深度優化訓練流程,在不依賴私有數據與大規模計算資源的情況下,成功打造開放社區32B規模推理性能領先的模型。 模型 現已上線始智AI-wisemodel開源社區,歡迎使用。


模型地址

https://wisemodel.cn/models/a-m-team/AM-Thinking-v1/intro

01.

成績亮眼:突破32B模型參數


在主流評測里,32B參數量的AM-Thinking-v1展現出強大實力。數學推理任務采用AIME系列題目測試,模型得分85.3;在代碼生成的LiveCodeBench評測中,獲得70.3分。相比之下,671B MoE架構的DeepSeek-R1在這兩項評測得分低于AM-Thinking-v1,并且成績接近甚至與Qwen3-235B-A22B、Seed1.5-Thinking等超大規模MoE模型相當 。

權威評測下的卓越表現:AIME系列題目來自美國數學邀請賽,是衡量模型邏輯思維能力的金標準;LiveCodeBench強調代碼可執行性和穩健性,數據污染難度高 。AM-Thinking-v1在這些嚴苛考驗中脫穎而出,展現“小體積,大推理”的極限范式。


AM-Thinking-v1 模型測試得分表


AIME2024 不同模型尺寸效果對比;x 軸為模型尺寸,y 軸為分數


LiveCodeBench 不同模型尺寸效果對比;x 軸為模型尺寸,y 軸為分數

  • 實際任務中的強大能力:在解決“旋轉三角形中紅球反彈”問題時,AM-Thinking-v1展現出極強的多步邏輯理解,能給出完整運動軌跡模擬和小球碰撞判斷;在邏輯推理任務中,保持穩定思考過程;在長文本寫作能力測試中,也展現出初步的表達邏輯和意象捕捉組織能力。


“旋轉三角形中紅球反彈”問題


邏輯推理任務


長文本寫作能力

02.

訓練方案:挖掘32B模型潛力


A-M-team團隊設計了一整套后訓練方案,旨在用有限計算和開源數據,最大化32B模型的推理能力,包括冷啟動式監督微調、通過率引導的數據篩選機制以及雙階段強化學習(Dual-stage RL)。

  • 監督微調(SFT)階段:采用激進但有效的設置,將學習率拉到8e-5,加大batch size,支持最長32K輸入長度。訓練樣本設計為“先思考再回答”格式,幫助模型養成“先想清楚、再說話”的習慣,且訓練中模型在控制長度、避免啰嗦方面有明顯進步。


  • 數據處理:完全依靠開源資源,整理出數學、代碼、科學推理、指令跟隨和通用對話五類核心任務數據。進行大量清洗工作,包括去重、改寫問題避免與評測集“撞題”,嚴格驗證數學數據,用DeepSeek-R1和o4-mini交叉比對標準答案。生成的訓練樣本經PPL算分、檢查重復短語和結構完整性等層層篩選,確保數據質量。


  • 強化學習(RL)階段:選用輕量級GRPO算法,采用“難度感知”策略,先針對模型薄弱題目訓練,熟練后加入通用對話和指令跟隨任務拓展能力。獎勵機制多樣,數學和代碼類問題用規則驗證或跑沙盒程序驗證答案;open - ended回答讓LLM從有用性、準確性、連貫性三方面打分。在工程上,將推理和訓練分開,采用streaming rollout方式,并配備前端負載均衡器動態分配任務,提升訓練效率、節省資源 。


不過,AM-Thinking-v1目前還存在局限性,不支持函數調用、多模態輸入,對低資源語言的能力也有待驗證。

03.

探索意義:32B推理模型的價值


當前大模型發展主流路線追求大參數規模、復雜架構、龐大訓練數據和昂貴訓練資源,但存在成本高、部署難、推理延遲高、適配門檻大等問題。A-M-team選擇專注32B“中尺度模型”參數區間,有明確考量:

  • 足夠強大:相比7B或13B模型,32B能支持復雜數學推理和代碼生成,具備執行嚴肅reasoning任務基礎。

  • 成本可控:與巨型模型相比,32B模型訓練與推理資源需求顯著更低,適合企業或研究機構內部復現、部署和迭代。

  • 部署友好:可在單節點或小規模集群上運行,應用于更多落地場景。

  • MoE替代探索:驗證不使用專家模型,僅靠稠密結構和扎實后訓練設計,能否達到甚至超越MoE模型表現。


AM-Thinking-v1的誕生與出色表現,印證了這一探索方向的潛力,它回答了“大模型能力的上限,能不能用更小的體量實現”這一關鍵問題,也為開源LLM社區提供了新的思路,即通過細致訓練設計,無需堆參數和私有數據,也能打造出足夠聰明的模型。

04.

在線體驗:速驗32B模型能力


W isemodel社區支持直接通過模型鏡像創建在線體驗或者API服務,在 AM-Thinking-v1 模型詳情 頁 點擊“在線部署-部署在線體驗”或者 “在線部署-部署API服務”按鈕。


然后選擇硬件配置,以及根據自己的需求選擇計費方式。


提交訂單之后,應用已經進入啟動中的狀態,正常情況下大概等待1分鐘左右就正常運營,進行在線體驗或者使用API服務了。


在線體驗


API服務

----- END -----

wisemodel相關:

系統升級:

大賽報名:

系列模型:

關于wisemodel更多

1

歡迎持續關注和支持

開源社區建設需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻和維護,歡迎大家加入wisemodel開源社區的志愿者計劃和開源共創計劃。期待更多開發者將開源成果,包括模型、數據集和代碼等發布到 wisemodel.cn 社區,共建中立、開放的AI開源社區生態。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續關注wisemodel.cn開源社區動態。

2

歡迎加盟wisemodel開源社區

始智AI wisemodel社區自2023年9月上線以來,逐漸成為影響力日益擴大的中立開放的AI開源社區,為了加快公司發展,我們長期需要技術、運營等人才加盟,技術側重在AI infra、后端開發,熟悉K8S、模型訓練和推理等技術, 以及熟悉開發者生態運營的成員,歡迎感興趣的朋友加盟,可以通過添加wisemodel微信,或者將簡歷投遞到郵箱:liudaoquan@wisemodel.cn

3

歡迎投稿優質內容

歡迎投稿分享人工智能領域相關的優秀研究成果,鼓勵高校實驗室、大企業研究團隊、個人等,在wisemodel平臺上分享各類優質內容,可以是AI領域最新論文解讀、最新開源成果介紹,也可以是關于AI技術實踐、應用和總結等。投稿可以發郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。

4

關于wisemodel開源社區

始智AI wisemodel.cn開源社區由清華校友總會AI大數據專委會副秘書長劉道全創立,旨在打造和建設中立開放的AI開源創新社區,將打造成“HuggingFace”之外最活躍的AI開源社區,匯聚主要AI開源模型、數據集和代碼等,歡迎高??蒲性核⒋笮突ヂ摼W公司、創新創業企業、廣大個人開發者,以及政府部門、學會協會、聯盟、基金會等,還有投資機構、科技媒體等,共同參與建設AI開源創新生態。

向上滑動查看

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
特朗普吹響決戰號角,32國對烏軍援,俄也等到東方強援

特朗普吹響決戰號角,32國對烏軍援,俄也等到東方強援

Ck的蜜糖
2025-07-17 14:48:06
波音787空難原因揭曉,確實很“印度”

波音787空難原因揭曉,確實很“印度”

觀察者網
2025-07-15 09:17:16
帕金斯:哈登總決賽期間還去夜店 新三少完全不會讓你有這種擔心

帕金斯:哈登總決賽期間還去夜店 新三少完全不會讓你有這種擔心

直播吧
2025-07-17 15:06:25
鄭愷和老婆晚上去打網球,苗苗露腰又露腿,身材太好了,皮膚好白

鄭愷和老婆晚上去打網球,苗苗露腰又露腿,身材太好了,皮膚好白

鄉野小珥
2025-07-17 12:04:05
當初掏空家底,舉債120億收購沃爾沃,如今15年過去,吉利賺了多少

當初掏空家底,舉債120億收購沃爾沃,如今15年過去,吉利賺了多少

楊哥歷史
2025-04-09 10:28:49
五臺山達云方丈去世,死因曝光,生前照片被扒,吃穿用度被噴奢侈

五臺山達云方丈去世,死因曝光,生前照片被扒,吃穿用度被噴奢侈

曉林說娛
2025-07-16 10:05:46
摩旅青海被牧民打頭后續!7峰駱駝丟失,當地人發聲 騎手有錯在先

摩旅青海被牧民打頭后續!7峰駱駝丟失,當地人發聲 騎手有錯在先

觀察鑒娛
2025-07-17 12:59:21
央企“退金令”已啟動!你手里的錢,建議做這3件事!

央企“退金令”已啟動!你手里的錢,建議做這3件事!

搬磚營Z
2025-07-17 06:40:36
女子故意網貸賴賬120萬,8家催收公司看到身份信息擺手:這賬不要了

女子故意網貸賴賬120萬,8家催收公司看到身份信息擺手:這賬不要了

罪案洞察者
2025-07-16 10:27:48
宮魯鳴:李緣是未來接過中國隊大旗的人 楊舒予未來會是主力前鋒

宮魯鳴:李緣是未來接過中國隊大旗的人 楊舒予未來會是主力前鋒

直播吧
2025-07-16 22:52:01
翁帆49歲生日,特意扮上了青衣戲裝,楊振寧望著妻子滿臉都是寵溺

翁帆49歲生日,特意扮上了青衣戲裝,楊振寧望著妻子滿臉都是寵溺

橙星文娛
2025-07-17 10:37:14
馮琳:入職東方臺一年之后,直言“主持人這碗飯其實不那么穩定”

馮琳:入職東方臺一年之后,直言“主持人這碗飯其實不那么穩定”

曉今娛
2025-07-17 10:24:13
比爾加盟快船,西部實力排名,雷霆第1,快船第3,湖人和勇士呢

比爾加盟快船,西部實力排名,雷霆第1,快船第3,湖人和勇士呢

歷史小胡
2025-07-17 04:58:07
德魯茲人是誰? 為什么以色列不惜轟炸敘利亞也要保護他們?

德魯茲人是誰? 為什么以色列不惜轟炸敘利亞也要保護他們?

魚莫語
2025-07-17 08:31:18
皇馬砸手里的球員 年薪2250萬歐 身價僅600萬歐 上賽季西甲踢7場

皇馬砸手里的球員 年薪2250萬歐 身價僅600萬歐 上賽季西甲踢7場

智道足球
2025-07-17 10:40:18
一對情侶乘車時貼貼,網友:看著歲數不小了,還這么相愛?

一對情侶乘車時貼貼,網友:看著歲數不小了,還這么相愛?

丫頭舫
2025-07-17 14:37:17
民間故事:尼姑書生同處破廟避雨,一番云雨,尼姑說:我們不該這樣

民間故事:尼姑書生同處破廟避雨,一番云雨,尼姑說:我們不該這樣

上古螃蟹
2025-04-09 10:12:44
5000萬到500萬,為何比爾放棄千萬買斷加盟快船?5大理由給出答案

5000萬到500萬,為何比爾放棄千萬買斷加盟快船?5大理由給出答案

鍋子籃球
2025-07-17 14:10:13
當年為什么查辦褚時健?

顧史
2025-06-09 20:26:22

國羽5勝1負!翁泓陽力壓林俊易,李詩灃突發退賽,混雙爆大冷

國羽5勝1負!翁泓陽力壓林俊易,李詩灃突發退賽,混雙爆大冷

阿覽
2025-07-17 13:47:09
2025-07-17 15:36:49
wisemodel開源社區 incentive-icons
wisemodel開源社區
始智AI wisemodel.cn開源社區,打造中國版“huggingface”
308文章數 12關注度
往期回顧 全部

科技要聞

沒有老黃不夸的中國公司了吧??

頭條要聞

女律師在愛康國賓體檢10年沒預警 在國外確診癌癥晚期

頭條要聞

女律師在愛康國賓體檢10年沒預警 在國外確診癌癥晚期

體育要聞

過去一年的頭號贏家,他說偶像永遠是媽媽

娛樂要聞

黃楊鈿甜星途被毀 戴假貨沒人找她代言

財經要聞

宗氏三兄妹在港起訴宗馥莉文書曝光

汽車要聞

8月初上市 長安第三代UNI-V勁擎型嘗鮮價11.49萬

態度原創

家居
教育
親子
本地
房產

家居要聞

空間分明 時尚風格并存

教育要聞

五年級期末:a×a+a×2=675,求a

親子要聞

夏天吃冰和不吃冰的孩子,長大后大不同,揭秘吃冰不傷身的真相

本地新聞

換個城市過夏天 | 誰打翻了濰坊的調色盤?

房產要聞

三亞又有好地要賣,起拍樓面價飆到了1.6萬/㎡!

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 鲜城| 密云县| 海城市| 慈溪市| 北碚区| 娄底市| 志丹县| 武强县| 南皮县| 偏关县| 故城县| 康乐县| 临西县| 博客| 静乐县| 阿图什市| 务川| 壶关县| 都安| 沁水县| 普格县| 开平市| 湖州市| 东台市| 内丘县| 中方县| 兴安盟| 香格里拉县| 苍山县| 灯塔市| 竹北市| 邛崃市| 平原县| 佛坪县| 崇义县| 西青区| 平果县| 长海县| 临武县| 吉林省| 涪陵区|