99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

登頂開(kāi)源大模型榜首 阿里Qwen3成色如何?|聚焦

0
分享至

《科創(chuàng)板日?qǐng)?bào)》5月1日訊(記者 黃心怡)阿里巴巴在“五一”節(jié)前開(kāi)源新一代通義千問(wèn)模型Qwen3,而且一口氣開(kāi)源了 8 個(gè)版本。

阿里千問(wèn)大模型官網(wǎng)用“思深,行速”來(lái)描述Qwen3,是指Qwen3 是中國(guó)公司推出的首個(gè)混合推理模型,在同一個(gè)模型中融合了 “推理” 和 “非推理” 模式,可以根據(jù)不同問(wèn)題選擇 “快、慢思考”。


最新數(shù)據(jù)顯示,阿里Qwen 系列大模型已被累計(jì)下載 3 億次,基于 Qwen 的衍生模型數(shù)量超 10 萬(wàn)個(gè),為全球第一。Qwen3 發(fā)布也引來(lái)眾多開(kāi)發(fā)者的使用和測(cè)評(píng)。

Qwen3 提供了不同參數(shù)的模型版本,包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。阿里方面稱,千問(wèn)3的30B參數(shù)MoE模型僅激活3B就能達(dá)到上代Qwen2.5-32B模型性能,而千問(wèn)3的稠密模型比如32B版本的千問(wèn)3模型,可超越上一代Qwen2.5-72B性能。

多名開(kāi)發(fā)者告訴《科創(chuàng)板日?qǐng)?bào)》記者,此次發(fā)布的千問(wèn)3系列中的小參數(shù)量模型表現(xiàn)突出。“32B模型表現(xiàn)突出,小參數(shù)量跑出了優(yōu)秀的效果,對(duì)大模型應(yīng)用研發(fā)人員或公司來(lái)說(shuō)是福利。畢竟大參數(shù)量還是成本太高。目前來(lái)看32B性價(jià)比最高,235B感覺(jué)相比千問(wèn)2.5提升不太大,而32B能跑出目前效果確實(shí)很不錯(cuò)了。”

有業(yè)內(nèi)人士推測(cè),千問(wèn)3選擇在小參數(shù)模型發(fā)力,主要是為了蘋果生態(tài)而準(zhǔn)備。此前,阿里董事局主席蔡崇信確認(rèn)了回應(yīng)阿里與蘋果在手機(jī)上合作落地AI的傳聞。而今年4月的最新消息稱,蘋果果正積極推進(jìn)在國(guó)行版iPhone上引入AI功能的計(jì)劃,并計(jì)劃于2025年中期前登陸國(guó)行iPhone。


▍并非全面碾壓DeepSeek R1

盡管Qwen3發(fā)布后,有媒體報(bào)道其性能全面碾壓同樣開(kāi)源的DeepSeek R1 。但《科創(chuàng)板日?qǐng)?bào)》記者注意到,每家大模型公司在公布自己大模型的測(cè)評(píng)數(shù)據(jù)時(shí),可能用的都是不同的指標(biāo),或者只公布自己得分高的測(cè)評(píng)測(cè)試。因此,比較公立的第三方測(cè)評(píng)比較有說(shuō)服力。

著名華裔AI學(xué)者吳恩達(dá)的公司Artificial Analysis對(duì)包括Qwen3和DeepSeek R1在內(nèi)的大模型測(cè)試顯示,Qwen3只是在某些指標(biāo)上超越DeepSeek R1,并非全面碾壓。

在“GPQA 鉆石:博士級(jí)多學(xué)科”項(xiàng)目測(cè)試中,Qwen3 235B測(cè)試結(jié)果70分,和 DeepSeek R1 的 71分 成績(jī)接近;在“LiveCodeBench:編碼能力”項(xiàng)目測(cè)試中,Qwen3 235B測(cè)試結(jié)果:71分,高于 DeepSeek R1 的 62分 成績(jī);在“MATH-500:高難度數(shù)學(xué)”項(xiàng)目測(cè)試中, Qwen3 235B測(cè)試結(jié)果93分,低于 DeepSeek R1 的 97分成績(jī); 在“MMLU:通用知識(shí)基準(zhǔn)” Qwen3 235B測(cè)試結(jié)果83分,接近 DeepSeek R1 的 84分成績(jī);在“AIME2024:數(shù)學(xué)推理中等挑戰(zhàn),泛化能力參考”項(xiàng)目測(cè)試中,Qwen3 235B測(cè)試結(jié)果84分,高于 DeepSeek R1 的 68分成績(jī)。

因此,業(yè)內(nèi)普遍的看法是,總體看Qwen3推理模型整體表現(xiàn)略好于R1,但相比R1也不算有太大突破,還稱不上“全面碾壓”。

▍小參數(shù)模型遠(yuǎn)超預(yù)期

另一名開(kāi)發(fā)者告訴《科創(chuàng)板日本》記者,此次千問(wèn)3系列的超大參數(shù)模型不及預(yù)期,但小參數(shù)的模型遠(yuǎn)超預(yù)期。“4B模型在數(shù)學(xué)能力上屬實(shí)驚到我了。”

小參數(shù)量模型的特點(diǎn)是能夠主要用于端側(cè)部署,比如4B模型可用于手機(jī)端,8B可在電腦和汽車端側(cè),32B可用于企業(yè)大規(guī)模部署,也適合有條件的開(kāi)發(fā)者上手。

開(kāi)放傳神(OpenCSG)聯(lián)合創(chuàng)始人陳冉認(rèn)為,通義大模型的出現(xiàn)充分驗(yàn)證大模型領(lǐng)域金律“模型天天變,不變的是數(shù)據(jù)沉淀“,也再次證明開(kāi)源是技術(shù)創(chuàng)新的壓箱石。技術(shù)上,還在繼續(xù)努力推進(jìn),目標(biāo)還是降本增效,種類齊全,但核心創(chuàng)新點(diǎn)還有待觀察。

《科創(chuàng)板日?qǐng)?bào)》記者注意到,在千問(wèn)3發(fā)布后,上下游供應(yīng)鏈第一時(shí)間進(jìn)行適配和調(diào)用。英偉達(dá)、英特爾、聯(lián)發(fā)科、AMD等多家頭部芯片廠商紛紛適配千問(wèn)3。

《科創(chuàng)板日?qǐng)?bào)》記者從英特爾方面獲悉,英特爾在車端艙內(nèi)對(duì)新發(fā)布的千問(wèn)3系列模型,也已經(jīng)完成匹配。國(guó)產(chǎn)芯片廠商海光信息則宣布其DCU完成對(duì)Qwen3全部8款模型的適配+調(diào)優(yōu),覆蓋235B、32B、30B、14B、8B、4B、1.7B、0.6B各種參數(shù)。

隨著算力成本的降低和性能的提升,業(yè)內(nèi)分析普遍認(rèn)為,千問(wèn)3為即將到來(lái)的智能體Agent和大模型應(yīng)用爆發(fā)提供了更好的支持。阿里云智能集團(tuán)副總裁霍嘉在接受《科創(chuàng)板日?qǐng)?bào)》采訪時(shí)表示,“模型推理模型能力不斷提高,使得當(dāng)前在業(yè)內(nèi)有共識(shí),今年會(huì)是 AI應(yīng)用爆發(fā)的真正元年。

▍通用Agent在工程和技術(shù)兩個(gè)方面仍面臨挑戰(zhàn)

華創(chuàng)證券在評(píng)價(jià)千問(wèn)3大模型時(shí)稱, Agent訓(xùn)練與落地成為了 AI+ 敘事的下一重心。天風(fēng)證券認(rèn)為,AI Agent市場(chǎng)規(guī)模有望超萬(wàn)億,通義千問(wèn)已發(fā)布多行業(yè)垂直生態(tài)體系,有望成為B端Agent鏈主。

《科創(chuàng)板日?qǐng)?bào)》注意到,在第八屆數(shù)字中國(guó)建設(shè)峰會(huì)期間,中國(guó)一汽正式發(fā)布企業(yè)智能體OpenMind。這是汽車行業(yè)首個(gè)面向全集團(tuán)運(yùn)營(yíng)管理的AI Agent,正是基于阿里通義大模型打造。

此外,中國(guó)電信、螞蟻集團(tuán)等也紛紛發(fā)布了智能體相關(guān)平臺(tái),以加速AI Agent在政務(wù)、金融等領(lǐng)域落地:中國(guó)電信正式發(fā)布星辰行業(yè)Agent平臺(tái);螞蟻數(shù)科則發(fā)布了面向金融機(jī)構(gòu)發(fā)布智能體開(kāi)發(fā)平臺(tái)Agentar。

不過(guò),通用Agent在工程和技術(shù)模型兩個(gè)方面仍面臨挑戰(zhàn)。一名業(yè)內(nèi)人士表示,“實(shí)際上能夠處理通用或復(fù)雜任務(wù)的并不多。這些產(chǎn)品要么不夠通用,要么無(wú)法應(yīng)對(duì)復(fù)雜的任務(wù)。

阿里云 CTO 和通義實(shí)驗(yàn)室負(fù)責(zé)人周靖人近日在接受媒體采訪時(shí)透露, 今年在大模型領(lǐng)域,相對(duì)確定的進(jìn)展是兩個(gè)主線,一是模型能力上,會(huì)繼續(xù)在類人思考和多模態(tài)上有提升;二是模型和底層云計(jì)算系統(tǒng)會(huì)更深度結(jié)合,能同時(shí)提升訓(xùn)練和推理效率,讓模型更好用、更普及。

在談及DeepSeek R1時(shí),周靖人表示,DeepSeek看起來(lái)有算力、有 Infra 層、有模型,但不構(gòu)成一個(gè)完整的云服務(wù)。"我們的一個(gè)核心認(rèn)知是,大模型發(fā)展和云體系的支撐不可分割。”

談及國(guó)外內(nèi)大模型競(jìng)爭(zhēng)對(duì)手的你追我趕,他認(rèn)為,市場(chǎng)空間很大,歡迎一起來(lái)推動(dòng) AI 產(chǎn)業(yè)的發(fā)展。至于誰(shuí)領(lǐng)先,他說(shuō):

“還是看市場(chǎng)反饋,把選擇權(quán)留給客戶。”

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
谷醫(yī)生可能要有大麻煩,怒撕原配歪打正著, 她的家世也不簡(jiǎn)單

谷醫(yī)生可能要有大麻煩,怒撕原配歪打正著, 她的家世也不簡(jiǎn)單

魔都姐姐雜談
2025-05-01 13:28:39
女子扔鼻涕紙后續(xù):身份被扒,同事都知道工作堪憂!華東師大淪陷

女子扔鼻涕紙后續(xù):身份被扒,同事都知道工作堪憂!華東師大淪陷

阿傖說(shuō)事
2025-05-01 22:29:36
大量少年兒童失蹤和器官移植合法化脫不了干系,應(yīng)該引起足夠重視

大量少年兒童失蹤和器官移植合法化脫不了干系,應(yīng)該引起足夠重視

逍遙論經(jīng)
2025-04-30 10:10:25
跑步才是當(dāng)代年輕人真正的賢者時(shí)間

跑步才是當(dāng)代年輕人真正的賢者時(shí)間

虎嗅APP
2025-04-30 22:35:16
打的人情世故?趙心童第一階段4-4奧沙利文,火箭多次離奇失誤

打的人情世故?趙心童第一階段4-4奧沙利文,火箭多次離奇失誤

真理是我親戚
2025-05-01 22:48:55
4月30日晚,滬寧高速擁堵不堪!網(wǎng)友:建議沿長(zhǎng)江修一條高速公路

4月30日晚,滬寧高速擁堵不堪!網(wǎng)友:建議沿長(zhǎng)江修一條高速公路

火山詩(shī)話
2025-05-01 09:50:30
定海神針!胡金秋23中17狂轟全場(chǎng)最高36分10板 正負(fù)值+19

定海神針!胡金秋23中17狂轟全場(chǎng)最高36分10板 正負(fù)值+19

直播吧
2025-05-01 21:41:29
韓德君淚灑直播間:即將38歲透露將退役 18年一人一城率隊(duì)奪4冠

韓德君淚灑直播間:即將38歲透露將退役 18年一人一城率隊(duì)奪4冠

醉臥浮生
2025-05-01 23:20:27
美定調(diào)病毒起源于實(shí)驗(yàn)室后,時(shí)隔12天,中方發(fā)布溯源重磅白皮書(shū)

美定調(diào)病毒起源于實(shí)驗(yàn)室后,時(shí)隔12天,中方發(fā)布溯源重磅白皮書(shū)

南宗歷史
2025-04-30 18:47:05
南京三甲醫(yī)院院長(zhǎng)一家三口被砍,行兇過(guò)程被揭露,知情人曝內(nèi)情

南京三甲醫(yī)院院長(zhǎng)一家三口被砍,行兇過(guò)程被揭露,知情人曝內(nèi)情

天天熱點(diǎn)見(jiàn)聞
2025-05-01 13:30:22
警惕國(guó)內(nèi)的某些“俄粉”,他們篡改歷史、顛倒黑白、無(wú)恥至極

警惕國(guó)內(nèi)的某些“俄粉”,他們篡改歷史、顛倒黑白、無(wú)恥至極

玖奌雜貨鋪
2025-05-01 21:55:31
編外人員“清退”開(kāi)始,輔警、城管協(xié)管、護(hù)士、教師或?qū)⒚媾R失業(yè)

編外人員“清退”開(kāi)始,輔警、城管協(xié)管、護(hù)士、教師或?qū)⒚媾R失業(yè)

華人星光
2025-04-30 13:05:33
曝央企總經(jīng)理出軌多人:在女下屬家中偷情20余次,出差嫖娼被捉奸

曝央企總經(jīng)理出軌多人:在女下屬家中偷情20余次,出差嫖娼被捉奸

博士觀察
2025-05-01 22:18:09
SU7 Ultra限制最大馬力,小米汽車回應(yīng):確保新手安全

SU7 Ultra限制最大馬力,小米汽車回應(yīng):確保新手安全

FM93浙江交通之聲
2025-05-01 17:36:17
印度國(guó)會(huì)議員大放厥詞:到2025年底,巴基斯坦這個(gè)國(guó)家將不復(fù)存在

印度國(guó)會(huì)議員大放厥詞:到2025年底,巴基斯坦這個(gè)國(guó)家將不復(fù)存在

凱撒談兵
2025-04-30 06:36:16
看完董小姐的進(jìn)階過(guò)程,我才明白她爸媽為啥允許她給肖飛未婚懷孕

看完董小姐的進(jìn)階過(guò)程,我才明白她爸媽為啥允許她給肖飛未婚懷孕

東方不敗然多多
2025-05-01 16:23:59
“鬼城”又添一座?房?jī)r(jià)從“1.2萬(wàn)元暴跌到600元”,還是無(wú)人問(wèn)津

“鬼城”又添一座?房?jī)r(jià)從“1.2萬(wàn)元暴跌到600元”,還是無(wú)人問(wèn)津

巢客HOME
2024-11-22 06:15:02
美烏協(xié)議已簽,普京和澤連斯基的處境變了

美烏協(xié)議已簽,普京和澤連斯基的處境變了

千里持劍
2025-05-01 09:13:09
美烏礦產(chǎn)協(xié)議暴露哪些戰(zhàn)略企圖?如何影響俄烏局勢(shì)?專家分析→

美烏礦產(chǎn)協(xié)議暴露哪些戰(zhàn)略企圖?如何影響俄烏局勢(shì)?專家分析→

國(guó)際在線
2025-05-01 17:35:58
白宮證實(shí):馬斯克被排擠出局

白宮證實(shí):馬斯克被排擠出局

魯中晨報(bào)
2025-05-01 10:44:11
2025-05-02 03:20:49
財(cái)聯(lián)社 incentive-icons
財(cái)聯(lián)社
以“準(zhǔn)確、快速、權(quán)威、專業(yè)”為新聞準(zhǔn)則,為投資者提供專業(yè)的投資資訊。
576487文章數(shù) 1009196關(guān)注度
往期回顧 全部

科技要聞

DeepSeek新數(shù)學(xué)模型刷爆記錄

頭條要聞

日本急著跟特朗普簽協(xié)議:中國(guó)正抓緊機(jī)會(huì)說(shuō)美有風(fēng)險(xiǎn)

頭條要聞

日本急著跟特朗普簽協(xié)議:中國(guó)正抓緊機(jī)會(huì)說(shuō)美有風(fēng)險(xiǎn)

體育要聞

無(wú)敵17歲vs飛翔泥頭車,歐冠史詩(shī)對(duì)決

娛樂(lè)要聞

梅婷慶50歲生日,兒女和她一起許愿

財(cái)經(jīng)要聞

知情人士:美方正多渠道主動(dòng)與中方接觸

汽車要聞

預(yù)售32.98萬(wàn)起 魏牌高山家族將于5月13日上市

態(tài)度原創(chuàng)

房產(chǎn)
教育
數(shù)碼
手機(jī)
時(shí)尚

房產(chǎn)要聞

火了!一二手房交易量大漲,五一購(gòu)房窗口期來(lái)了!

教育要聞

告訴你a-b和a乘b的值,求a+b的平方等于多少

數(shù)碼要聞

官方網(wǎng)頁(yè)確認(rèn)多個(gè) AMD 處理器代號(hào),Gorgon Point 含三種變體

手機(jī)要聞

盡管產(chǎn)量較低 三星Exynos 2500仍將在Galaxy Z Flip 7中首次亮相

中年女性穿搭秘籍,色不過(guò)三,穿著得體,才能輕輕松松美到老

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 永川市| 日土县| 五大连池市| 普安县| 慈利县| 伽师县| 三河市| 亚东县| 邯郸县| 陵川县| 辽阳县| 高淳县| 吉林省| 台前县| 楚雄市| 台江县| 昌乐县| 马山县| 滕州市| 平湖市| 永济市| 阿合奇县| 庄浪县| 大竹县| 洞头县| 河间市| 凤山市| 从化市| 泰顺县| 安宁市| 平度市| 明星| 汉源县| 准格尔旗| 梁平县| 洪洞县| 沂水县| 栾城县| 邵东县| 固安县| 安徽省|