英偉達(dá)最近開源了一個(gè)代碼推理模型 OpenCodeReasoning-Nemotron-7B ,測(cè)評(píng)數(shù)據(jù)相當(dāng)不錯(cuò),看了一下居然是基于 Qwen 2.5 訓(xùn)練的。
之前我還說 千問大模型(Qwen) 快要取代 Llama 了,沒想到事情轉(zhuǎn)變的如此突然,現(xiàn)在基本新的微調(diào)模型都是基于千問,衍生模型數(shù)量超10萬。
而且最近各個(gè)榜單 千問 3 的成績也都出來了,在Artificial Analysis、LiveBench、LiveCodeBench 等多個(gè)榜單上都是開源冠軍,很多中小企業(yè)如果在開源大模型上有需求,千問基本都是首選。
這背后主要還是因?yàn)榍栒麄€(gè)系列模型除了價(jià)格低、性能強(qiáng),還是業(yè)界率先實(shí)現(xiàn)“全尺寸、全模態(tài)”的開源大模型,從小到大各種參數(shù)的模型都有,開發(fā)者可以根據(jù)自己的算力挑選豐儉由人。
此外,本次千問3還特別支持119種語言,這下連很多小語種國家的朋友,也能體驗(yàn)到全球領(lǐng)先的開源大模型了。
外加上,此次千問3還原生支持MCP協(xié)議,并且具備強(qiáng)大的工具調(diào)用(function calling)能力,結(jié)合封裝了工具調(diào)用模板和工具調(diào)用解析器的Qwen-Agent 框架,將大大降低編碼復(fù)雜性,實(shí)現(xiàn)高效的手機(jī)及電腦Agent操作等任務(wù)。
可以說現(xiàn)在要是真的想要做一個(gè)低成本的或者高定制化的以來開源模型的產(chǎn)品,大家第一時(shí)間都會(huì)想到千問。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.