網易首頁 > 網易號 > 正文申請入駐

32B模型AM-Thinking-v1超越R1，即刻體驗推理

2025-05-22 19:33:59　來源: wisemodel開源社區

北京舉報

分享至

始智AI wisemodel.cn開源社區

始智AI wisemodel.cn社區是源自中國的中立開放的AI開源社區。正在，歡迎加入共同成長。wisemodel社區上線，價格實惠，靈活方便，支持在線微調訓練模型，及和，并。

2025年，大模型競爭激烈且重心轉向推理能力發展。中國團隊A-M-team在Hugging Face開源了32B推理模型AM-Thinking-v1。該團隊依托開源底座，深度優化訓練流程，在不依賴私有數據與大規模計算資源的情況下，成功打造開放社區32B規模推理性能領先的模型。模型現已上線始智AI-wisemodel開源社區，歡迎使用。

模型地址

https://wisemodel.cn/models/a-m-team/AM-Thinking-v1/intro

01.

成績亮眼：突破32B模型參數

在主流評測里，32B參數量的AM-Thinking-v1展現出強大實力。數學推理任務采用AIME系列題目測試，模型得分85.3；在代碼生成的LiveCodeBench評測中，獲得70.3分。相比之下，671B MoE架構的DeepSeek-R1在這兩項評測得分低于AM-Thinking-v1，并且成績接近甚至與Qwen3-235B-A22B、Seed1.5-Thinking等超大規模MoE模型相當。

權威評測下的卓越表現：AIME系列題目來自美國數學邀請賽，是衡量模型邏輯思維能力的金標準；LiveCodeBench強調代碼可執行性和穩健性，數據污染難度高。AM-Thinking-v1在這些嚴苛考驗中脫穎而出，展現“小體積，大推理”的極限范式。

AM-Thinking-v1 模型測試得分表

AIME2024 不同模型尺寸效果對比；x 軸為模型尺寸，y 軸為分數

LiveCodeBench 不同模型尺寸效果對比；x 軸為模型尺寸，y 軸為分數

實際任務中的強大能力：在解決“旋轉三角形中紅球反彈”問題時，AM-Thinking-v1展現出極強的多步邏輯理解，能給出完整運動軌跡模擬和小球碰撞判斷；在邏輯推理任務中，保持穩定思考過程；在長文本寫作能力測試中，也展現出初步的表達邏輯和意象捕捉組織能力。

“旋轉三角形中紅球反彈”問題

邏輯推理任務

長文本寫作能力

02.

訓練方案：挖掘32B模型潛力

A-M-team團隊設計了一整套后訓練方案，旨在用有限計算和開源數據，最大化32B模型的推理能力，包括冷啟動式監督微調、通過率引導的數據篩選機制以及雙階段強化學習（Dual-stage RL）。

監督微調（SFT）階段：采用激進但有效的設置，將學習率拉到8e-5，加大batch size，支持最長32K輸入長度。訓練樣本設計為“先思考再回答”格式，幫助模型養成“先想清楚、再說話”的習慣，且訓練中模型在控制長度、避免啰嗦方面有明顯進步。

數據處理：完全依靠開源資源，整理出數學、代碼、科學推理、指令跟隨和通用對話五類核心任務數據。進行大量清洗工作，包括去重、改寫問題避免與評測集“撞題”，嚴格驗證數學數據，用DeepSeek-R1和o4-mini交叉比對標準答案。生成的訓練樣本經PPL算分、檢查重復短語和結構完整性等層層篩選，確保數據質量。

強化學習（RL）階段：選用輕量級GRPO算法，采用“難度感知”策略，先針對模型薄弱題目訓練，熟練后加入通用對話和指令跟隨任務拓展能力。獎勵機制多樣，數學和代碼類問題用規則驗證或跑沙盒程序驗證答案；open - ended回答讓LLM從有用性、準確性、連貫性三方面打分。在工程上，將推理和訓練分開，采用streaming rollout方式，并配備前端負載均衡器動態分配任務，提升訓練效率、節省資源。

不過，AM-Thinking-v1目前還存在局限性，不支持函數調用、多模態輸入，對低資源語言的能力也有待驗證。

03.

探索意義：32B推理模型的價值

當前大模型發展主流路線追求大參數規模、復雜架構、龐大訓練數據和昂貴訓練資源，但存在成本高、部署難、推理延遲高、適配門檻大等問題。A-M-team選擇專注32B“中尺度模型”參數區間，有明確考量：

足夠強大：相比7B或13B模型，32B能支持復雜數學推理和代碼生成，具備執行嚴肅reasoning任務基礎。
成本可控：與巨型模型相比，32B模型訓練與推理資源需求顯著更低，適合企業或研究機構內部復現、部署和迭代。
部署友好：可在單節點或小規模集群上運行，應用于更多落地場景。
MoE替代探索：驗證不使用專家模型，僅靠稠密結構和扎實后訓練設計，能否達到甚至超越MoE模型表現。

AM-Thinking-v1的誕生與出色表現，印證了這一探索方向的潛力，它回答了“大模型能力的上限，能不能用更小的體量實現”這一關鍵問題，也為開源LLM社區提供了新的思路，即通過細致訓練設計，無需堆參數和私有數據，也能打造出足夠聰明的模型。

04.

在線體驗：速驗32B模型能力

W isemodel社區支持直接通過模型鏡像創建在線體驗或者API服務，在 AM-Thinking-v1 模型詳情頁點擊“在線部署-部署在線體驗”或者 “在線部署-部署API服務”按鈕。

然后選擇硬件配置，以及根據自己的需求選擇計費方式。

提交訂單之后，應用已經進入啟動中的狀態，正常情況下大概等待1分鐘左右就正常運營，進行在線體驗或者使用API服務了。

在線體驗

API服務

----- END -----

wisemodel相關：

系統升級：

大賽報名：

系列模型：

關于wisemodel更多

歡迎持續關注和支持

開源社區建設需要長期堅持和投入，更需要廣大用戶的積極參與、貢獻和維護，歡迎大家加入wisemodel開源社區的志愿者計劃和開源共創計劃。期待更多開發者將開源成果，包括模型、數據集和代碼等發布到 wisemodel.cn 社區，共建中立、開放的AI開源社區生態。歡迎掃碼添加wisemodel微信，申請加入wisemodel社群，持續關注wisemodel.cn開源社區動態。

歡迎加盟wisemodel開源社區

始智AI wisemodel社區自2023年9月上線以來，逐漸成為影響力日益擴大的中立開放的AI開源社區，為了加快公司發展，我們長期需要技術、運營等人才加盟，技術側重在AI infra、后端開發，熟悉K8S、模型訓練和推理等技術，以及熟悉開發者生態運營的成員，歡迎感興趣的朋友加盟，可以通過添加wisemodel微信，或者將簡歷投遞到郵箱：liudaoquan@wisemodel.cn

歡迎投稿優質內容

歡迎投稿分享人工智能領域相關的優秀研究成果，鼓勵高校實驗室、大企業研究團隊、個人等，在wisemodel平臺上分享各類優質內容，可以是AI領域最新論文解讀、最新開源成果介紹，也可以是關于AI技術實踐、應用和總結等。投稿可以發郵件到liudaoquan@wisemodel.cn，也可以掃碼添加wisemodel微信。

關于wisemodel開源社區

始智AI wisemodel.cn開源社區由清華校友總會AI大數據專委會副秘書長劉道全創立，旨在打造和建設中立開放的AI開源創新社區，將打造成“HuggingFace”之外最活躍的AI開源社區，匯聚主要AI開源模型、數據集和代碼等，歡迎高?？蒲性核⒋笮突ヂ摼W公司、創新創業企業、廣大個人開發者，以及政府部門、學會協會、聯盟、基金會等，還有投資機構、科技媒體等，共同參與建設AI開源創新生態。

向上滑動查看

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.