始智AI wisemodel.cn開源社區
始智AI wisemodel.cn社區是源自中國的中立開放的AI開源社區。正在,歡迎加入共同成長。wisemodel社區上線,價格實惠,靈活方便,支持在線微調訓練模型,及和,并。
2025年, 大模型競爭激烈且重心轉向推理能力發展。中國團隊A-M-team在Hugging Face開源了32B推理模型AM-Thinking-v1。該 團隊依托開源底座,深度優化訓練流程,在不依賴私有數據與大規模計算資源的情況下,成功打造開放社區32B規模推理性能領先的模型。 模型 現已上線始智AI-wisemodel開源社區,歡迎使用。
模型地址
https://wisemodel.cn/models/a-m-team/AM-Thinking-v1/intro
01.
成績亮眼:突破32B模型參數
在主流評測里,32B參數量的AM-Thinking-v1展現出強大實力。數學推理任務采用AIME系列題目測試,模型得分85.3;在代碼生成的LiveCodeBench評測中,獲得70.3分。相比之下,671B MoE架構的DeepSeek-R1在這兩項評測得分低于AM-Thinking-v1,并且成績接近甚至與Qwen3-235B-A22B、Seed1.5-Thinking等超大規模MoE模型相當 。
權威評測下的卓越表現:AIME系列題目來自美國數學邀請賽,是衡量模型邏輯思維能力的金標準;LiveCodeBench強調代碼可執行性和穩健性,數據污染難度高 。AM-Thinking-v1在這些嚴苛考驗中脫穎而出,展現“小體積,大推理”的極限范式。
AM-Thinking-v1 模型測試得分表
AIME2024 不同模型尺寸效果對比;x 軸為模型尺寸,y 軸為分數
LiveCodeBench 不同模型尺寸效果對比;x 軸為模型尺寸,y 軸為分數
實際任務中的強大能力:在解決“旋轉三角形中紅球反彈”問題時,AM-Thinking-v1展現出極強的多步邏輯理解,能給出完整運動軌跡模擬和小球碰撞判斷;在邏輯推理任務中,保持穩定思考過程;在長文本寫作能力測試中,也展現出初步的表達邏輯和意象捕捉組織能力。
“旋轉三角形中紅球反彈”問題
邏輯推理任務
長文本寫作能力
02.
訓練方案:挖掘32B模型潛力
A-M-team團隊設計了一整套后訓練方案,旨在用有限計算和開源數據,最大化32B模型的推理能力,包括冷啟動式監督微調、通過率引導的數據篩選機制以及雙階段強化學習(Dual-stage RL)。
監督微調(SFT)階段:采用激進但有效的設置,將學習率拉到8e-5,加大batch size,支持最長32K輸入長度。訓練樣本設計為“先思考再回答”格式,幫助模型養成“先想清楚、再說話”的習慣,且訓練中模型在控制長度、避免啰嗦方面有明顯進步。
數據處理:完全依靠開源資源,整理出數學、代碼、科學推理、指令跟隨和通用對話五類核心任務數據。進行大量清洗工作,包括去重、改寫問題避免與評測集“撞題”,嚴格驗證數學數據,用DeepSeek-R1和o4-mini交叉比對標準答案。生成的訓練樣本經PPL算分、檢查重復短語和結構完整性等層層篩選,確保數據質量。
強化學習(RL)階段:選用輕量級GRPO算法,采用“難度感知”策略,先針對模型薄弱題目訓練,熟練后加入通用對話和指令跟隨任務拓展能力。獎勵機制多樣,數學和代碼類問題用規則驗證或跑沙盒程序驗證答案;open - ended回答讓LLM從有用性、準確性、連貫性三方面打分。在工程上,將推理和訓練分開,采用streaming rollout方式,并配備前端負載均衡器動態分配任務,提升訓練效率、節省資源 。
不過,AM-Thinking-v1目前還存在局限性,不支持函數調用、多模態輸入,對低資源語言的能力也有待驗證。
03.
探索意義:32B推理模型的價值
當前大模型發展主流路線追求大參數規模、復雜架構、龐大訓練數據和昂貴訓練資源,但存在成本高、部署難、推理延遲高、適配門檻大等問題。A-M-team選擇專注32B“中尺度模型”參數區間,有明確考量:
足夠強大:相比7B或13B模型,32B能支持復雜數學推理和代碼生成,具備執行嚴肅reasoning任務基礎。
成本可控:與巨型模型相比,32B模型訓練與推理資源需求顯著更低,適合企業或研究機構內部復現、部署和迭代。
部署友好:可在單節點或小規模集群上運行,應用于更多落地場景。
MoE替代探索:驗證不使用專家模型,僅靠稠密結構和扎實后訓練設計,能否達到甚至超越MoE模型表現。
AM-Thinking-v1的誕生與出色表現,印證了這一探索方向的潛力,它回答了“大模型能力的上限,能不能用更小的體量實現”這一關鍵問題,也為開源LLM社區提供了新的思路,即通過細致訓練設計,無需堆參數和私有數據,也能打造出足夠聰明的模型。
04.
在線體驗:速驗32B模型能力
W isemodel社區支持直接通過模型鏡像創建在線體驗或者API服務,在 AM-Thinking-v1 模型詳情 頁 點擊“在線部署-部署在線體驗”或者 “在線部署-部署API服務”按鈕。
然后選擇硬件配置,以及根據自己的需求選擇計費方式。
提交訂單之后,應用已經進入啟動中的狀態,正常情況下大概等待1分鐘左右就正常運營,進行在線體驗或者使用API服務了。
在線體驗
API服務
----- END -----
wisemodel相關:
系統升級:
大賽報名:
系列模型:
關于wisemodel更多
1
歡迎持續關注和支持
開源社區建設需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻和維護,歡迎大家加入wisemodel開源社區的志愿者計劃和開源共創計劃。期待更多開發者將開源成果,包括模型、數據集和代碼等發布到 wisemodel.cn 社區,共建中立、開放的AI開源社區生態。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續關注wisemodel.cn開源社區動態。
2
歡迎加盟wisemodel開源社區
始智AI wisemodel社區自2023年9月上線以來,逐漸成為影響力日益擴大的中立開放的AI開源社區,為了加快公司發展,我們長期需要技術、運營等人才加盟,技術側重在AI infra、后端開發,熟悉K8S、模型訓練和推理等技術, 以及熟悉開發者生態運營的成員,歡迎感興趣的朋友加盟,可以通過添加wisemodel微信,或者將簡歷投遞到郵箱:liudaoquan@wisemodel.cn
3
歡迎投稿優質內容
歡迎投稿分享人工智能領域相關的優秀研究成果,鼓勵高校實驗室、大企業研究團隊、個人等,在wisemodel平臺上分享各類優質內容,可以是AI領域最新論文解讀、最新開源成果介紹,也可以是關于AI技術實踐、應用和總結等。投稿可以發郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。
4
關于wisemodel開源社區
始智AI wisemodel.cn開源社區由清華校友總會AI大數據專委會副秘書長劉道全創立,旨在打造和建設中立開放的AI開源創新社區,將打造成“HuggingFace”之外最活躍的AI開源社區,匯聚主要AI開源模型、數據集和代碼等,歡迎高??蒲性核⒋笮突ヂ摼W公司、創新創業企業、廣大個人開發者,以及政府部門、學會協會、聯盟、基金會等,還有投資機構、科技媒體等,共同參與建設AI開源創新生態。
向上滑動查看
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.