99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

阿里開源多模態模型Qwen2.5-VL-32B,實測碾壓Gemma 3 27B,可本地部署

0
分享至

作者|子川

來源|AI先鋒官

原來AI圈也有自己的汪峰!

昨天DeepSeek前腳剛發布新版本DeepSeek-V3-0324,后腳阿里云通義千問開源了視覺理解模型Qwen2.5-VL-32B-Instruc。


結果也如大家看到的那樣,熱度全跑到DeepSeek那里去了。

在此之前,開源家族視覺語言模型Qwen2.5-VL系列已經有3B、7B和72B三種尺寸。

而此次發布Qwen2.5-VL-32B正好解決了一個痛點:7B太小,72B又太大,用來部署本地正正好。

雖然32B比72B尺寸小上不少,但能力卻絲毫不差。

在公布的測試成績中,Qwen2.5-VL-32B-Instruct 明顯要優于同規模的 Mistral-Small-3.1-24B、Gemma-3-27B-IT 模型,甚至在某些方面超越了更大規模的 72B 模型。


據了解,相較于此前的 Qwen2.5-VL 系列模型,32B 模型有三點顯著的改進:

  • 回復更符合人類主觀偏好:調整了輸出風格,使回答更加詳細、格式更規范,并更符合人類偏好。

  • 數學推理能力:復雜數學問題求解的準確性顯著提升。

  • 圖像細粒度理解與推理:在圖像解析、內容識別以及視覺邏輯推導等任務中表現出更強的準確性和細粒度分析能力。

那它的實際效果到底如何呢,我們來實際測試一波。

扔給它一張高速限速圖,并問Qwen2.5-VL-32B:我開著一輛卡車在這條路上行駛,現在是 12 點,我能在 13 點之前到達 110 公里外的地方嗎?


它的回答是這樣的——


Qwen2.5-VL-32B結合圖片上的限速規則,并通過計算,給出了“不能”的答案。

面對較難的看圖猜成語問題,Qwen2.5-VL-32B也能輕松拿捏。


不過面對一些較難猜的成語,也有翻車的時候。


Qwen2.5-VL-32B把“兩面三刀”猜成了“面面俱到”。

那Qwen2.5-VL-32B的實力到底如何呢?在同尺寸模型中是否具有領先的優勢呢?下面我們來對比一下。

此次用于測試的就是前段日子Google發布的Gemma 3 27B,畢竟尺寸差不多,而且都是主打的在本地部署這條賽道。

測試題一:一根8米長的竹竿是否能通過一個4米高、2米寬的門?

Qwen2.5-VL-32B:


Gemma 3 27B:


不愧是現在模型測試專用題,都沒有回答出來,這道題確實有點難,此前DeepSeek R1、o1等模型都在這道題栽跟頭了。

那就來一道中等的計算題來難為一下它們。

測試題二:你和朋友輪流從一堆金幣中取1、3或6枚。獲勝者是最后取走金幣的人。對于N<1000,第一位玩家有多少種贏得游戲的策略?

先公布正確答案:666

Qwen2.5-VL-32B:


Gemma 3 27B:


Qwen2.5-VL-32B回答正確,給出的答案是666,但Gemma 3回答錯誤了,給出的答案是667,居然多算出一種。

測試題三:如果昨天是明天的話就好了,那么今天就是周五了。請問:實際上,句中的今天可能是周幾?

Qwen2.5-VL-32B:


Gemma 3 27B:


呃呃呃.....,兩個都回答錯誤,標準答案是:周日和周三,Qwen2.5-VL-32B只推斷出周日,而Gemma 3則是一個沒對一個,給出的答案是周六。

測試題四:猜猜老師的生日

題目:老師告訴學生自己的生日是以下日期之一:3月4日、3月5日、3月8日、6月4日、6月7日、9月1日、9月5日、12月1日、12月2日、12月8日。老師只告訴了A月份,告訴了B日期。A說:“我不知道老師的生日,但B肯定也不知道。” B說:“我本來也不知道,但現在我知道了。” A說:“那我也知道了。” 請問老師的生日是哪一天?

Qwen2.5-VL-32B:


Gemma 3 27B:


結果如大家所看到的那樣,Gemma 3 27B又雙叒叕回答錯誤了,而Qwen2.5-VL-32B則是回答正確。

四道測試題, Qwen2.5-VL-32B答對兩道,而 Gemma 3 27B則是全軍覆沒。

雖然此次測試沒有基準測試那么全面,但可以看出 Gemma 3 27B在復雜任務的處理上是不如 Qwen2.5-VL-32B的。

目前, Qwen2.5-VL-32B已全面開源,并放在了 Hugging Face 上,該模型使用Apache 2.0協議開源。

同時在Qwen Chat上就能直接體驗Qwen2.5-VL-32B,感興趣的童鞋可以去試試。

附上體驗鏈接:https://chat.qwen.ai/

掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。

往期文章回顧

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
62歲葉童獲浪姐總冠軍,首談丈夫8次出軌不離婚原因,陪伴很重要

62歲葉童獲浪姐總冠軍,首談丈夫8次出軌不離婚原因,陪伴很重要

界史
2025-06-14 09:34:44
博主吐槽埃及旅游,一天被騙800遍,人麻了都!看完一點也不想去

博主吐槽埃及旅游,一天被騙800遍,人麻了都!看完一點也不想去

有趣的火烈鳥
2025-06-05 12:45:19
時隔26天,王曉晨終于回應,短短10個字,沒給俞灝明留一絲體面

時隔26天,王曉晨終于回應,短短10個字,沒給俞灝明留一絲體面

頭號劇委會
2025-06-12 18:42:36
33國槍口一致對華,解放軍將迎戰,中日軍機纏斗40分鐘,性質嚴重

33國槍口一致對華,解放軍將迎戰,中日軍機纏斗40分鐘,性質嚴重

吳欣純Deborah
2025-06-13 14:51:22
伊朗國家電視臺:伊朗將在數小時內再襲以色列

伊朗國家電視臺:伊朗將在數小時內再襲以色列

財聯社
2025-06-15 02:57:14
“財政吃緊”的真相,終于有人講明白了!原來錢是這樣花掉的

“財政吃緊”的真相,終于有人講明白了!原來錢是這樣花掉的

搬磚營Z
2025-06-12 23:49:39
伊朗反對派呼吁推翻德黑蘭政權

伊朗反對派呼吁推翻德黑蘭政權

一種觀點
2025-06-13 22:53:21
41歲漂亮女博士相親要520萬彩禮,提出不生娃,男方:我不買花瓶

41歲漂亮女博士相親要520萬彩禮,提出不生娃,男方:我不買花瓶

莎莉說情感
2025-06-14 17:50:03
重拳出擊!中方發出最后通牒,重裝部隊壓境直抵班公湖,不戰而勝

重拳出擊!中方發出最后通牒,重裝部隊壓境直抵班公湖,不戰而勝

Ck的蜜糖
2025-06-13 01:28:57
館長訪問四行倉庫后震撼感慨2段話,諷刺統派代表,飆罵獨派代表

館長訪問四行倉庫后震撼感慨2段話,諷刺統派代表,飆罵獨派代表

史潎的生活日記
2025-06-15 02:21:37
低估了“蒸荔枝”排寒的威力,吃了幾次,舒服多了!

低估了“蒸荔枝”排寒的威力,吃了幾次,舒服多了!

房產衫哥
2025-06-12 05:35:18
海牙傳來好消息,杜特爾特或將被保釋,已有第三國承諾擔保接收

海牙傳來好消息,杜特爾特或將被保釋,已有第三國承諾擔保接收

小鬼頭體育
2025-06-15 04:06:50
伊朗發動飽和式攻擊,以色列攔截失敗,內塔尼亞胡被曝早逃出國了

伊朗發動飽和式攻擊,以色列攔截失敗,內塔尼亞胡被曝早逃出國了

千里持劍
2025-06-14 09:35:43
朱自清長子因何在33時歲被判處死刑并立即執行?

朱自清長子因何在33時歲被判處死刑并立即執行?

深度報
2025-06-13 23:50:28
羅馬仕發布公開聲明致歉

羅馬仕發布公開聲明致歉

最江陰
2025-06-14 21:27:30
太突然!上海多家餐廳遭殃:大規模襲擊太嚇人,有的直接掉進客人碗里...太影響生意→

太突然!上海多家餐廳遭殃:大規模襲擊太嚇人,有的直接掉進客人碗里...太影響生意→

上觀新聞
2025-06-13 14:30:28
人社部定調!2025年養老金調整,8000元仍然會比2000元漲得多

人社部定調!2025年養老金調整,8000元仍然會比2000元漲得多

社保精算師
2025-06-14 16:01:16
上影節紅毯:倪妮眾星捧月,章子怡低調楊冪優雅,劉德華散發魅力

上影節紅毯:倪妮眾星捧月,章子怡低調楊冪優雅,劉德華散發魅力

巴塞電影
2025-06-14 20:59:24
歐陽娜娜內場

歐陽娜娜內場

鄉野小珥
2025-06-15 07:04:04
中日空中交鋒,日方稱日本沒有人員傷亡,并裝可憐向中方提要求

中日空中交鋒,日方稱日本沒有人員傷亡,并裝可憐向中方提要求

大道無形我有型
2025-06-12 12:25:33
2025-06-15 10:24:51
AI先鋒官 incentive-icons
AI先鋒官
AIGC大模型及應用精選與評測
295文章數 18關注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

印度空難幸存者:機身撞出巨大裂口 爬出去后發生爆炸

頭條要聞

印度空難幸存者:機身撞出巨大裂口 爬出去后發生爆炸

體育要聞

約戰天王山,步行者G4輸在了哪?

娛樂要聞

鳳凰傳奇曾毅塌房?網友:別連累玲花

財經要聞

以伊沖突持續升級,對全球市場影響多大

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

數碼
家居
游戲
時尚
本地

數碼要聞

為什么iPad不直接運行macOS系統?蘋果高管這樣說

家居要聞

森林幾何 極簡灰調原木風

《誅仙世界》首次回應銀價暴跌;騰訊網易紛紛做出違背祖訓的決定

夏天最值得入手的6件單品,全在這了

本地新聞

最近的打工人,都在熬夜看這劇逐幀學習職場小技巧

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 邛崃市| 洛扎县| 尼玛县| 罗平县| 古田县| 安达市| 土默特右旗| 汝南县| 定陶县| 延安市| 乐安县| 龙里县| 伊川县| 徐水县| 吉安市| 理塘县| 健康| 定远县| 随州市| 比如县| 峨眉山市| 马关县| 香港| 库尔勒市| 诏安县| 远安县| 南江县| 林周县| 郁南县| 青阳县| 江阴市| 南靖县| 介休市| 长治市| 青岛市| 江川县| 柘城县| 漳平市| 台东县| 岫岩| 安西县|