IT之家 6 月 12 日消息,面壁智能于本月 6 日晚發布端側大模型 MiniCPM 4.0。面壁智能官方今日發文稱,面壁 MiniCPM 4 與 Intel 全面適配,結合英特爾加速套件與 KV Cache 內存增強技術,實現 AI PC 2.2 倍長文本推理優化,端側 AI PC 在 Day 0 全面適配,128K 長上下文窗口等多方面突破。
據介紹,此次面壁推出的 MiniCPM 4.0 系列 LLM 模型擁有 8B、0.5B 兩種參數規模,針對單一架構難以兼顧長、短文本不同場景的技術難題,MiniCPM 4.0-8B 采用「高效雙頻換擋」機制,能夠根據任務特征自動切換注意力模式:在處理高難度的長文本、深度思考任務時,啟用稀疏注意力以降低計算復雜度,在短文本場景下切換至稠密注意力以確保精度,實現了長、短文本切換的高效響應。
目前,具有 CPU、GPU、NPU 三個 AI 運算引擎的英特爾酷睿 Ultra 處理器已對此適配,并借助 OpenVINO工具套件為 MiniCPM 4.0 系列模型提供優化的卓越性能表現。英特爾再次在 NPU 上對模型發布提供第零日(Day 0)支持,為不同參數量模型和應用場景提供更多樣化的、更有針對性的平臺支持。
據IT之家了解,MiniCPM 4.0 可在 vLLM、SGLang、LlamaFactory、XTuner 等開源框架部署。其內置自研 CPM.cu 極速端側推理框架,從投機采樣創新、模型壓縮量化創新、端側部署框架創新幾方面,帶來 90% 的模型瘦身和速度提升,官方宣稱將實現端側推理“從天生到終生”的絲滑。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.