99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

在通義App實測Qwen3,這可能是2025年上半年最強大模型

0
分享至



原創@科技新知AI新科技組作者丨主木編輯丨茯神 主編丨九黎

2025年4月29日凌晨,阿里突然開源了新一代通義千問模型Qwen3(下稱千問3)。這個被開發者稱為「全球最強開源」的模型家族,一夜之間就刷屏了整個AI圈,并且和前一代千問系列模型一樣,千問3的發布也是滿屏的好評。

作為國內首個實現"混合推理"能力的開源模型,千問3不僅達到了36萬億token的訓練數據量,還支持119種語言和方言。通過混合專家(MoE)架構與混合推理機制的深度整合,在參數效率與任務適應性層面實現雙重突破。

而在數學證明、代碼生成等核心基準測試中,旗艦模型Qwen3-235B-A22B性能與DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等全球頂尖模型表現相當。



紙面數據這么強的模型,真實實力到底如何?

目前通義App以及通義網頁版(www.tongyi.com)已經全面上線千問3,我們也通過通義App的“千問大模型”智能體(默認搭載Qwen3-235B-A22B模型)進行了文字陷阱、邏輯思維、文案創作、信息獲取再創作等多輪測試,結果讓我們大吃一驚。

今年高考,國產AI要拿高分了

首先為了保證測試的是千問3更為純粹的邏輯以及推理能力,我們在測試前將聯網功能進行了關閉,并且僅使用旗艦模型進行測試。

我們先用了兩道經典的大模型測試問題為其“開開胃”:9.8和9.11誰大以及strawberry中有幾個r,千問3均能直接果斷的給出推理過程和答案,并且指出了常見誤區以及用了多種不同的方式來證明答案的正確性。



隨后我們又向千問3提出了此前難倒眾多大模型的國內小學奧賽題目:

奧利弗周五摘了 44 個獼猴桃,周六摘了 58 個,周日摘的數量是周五的兩倍,不過有5個更小一些。問奧利弗一共摘了多少個獼猴桃?

這道題目是北京海淀一所小學二年級的問題,邏輯很簡單,不需要多么復雜的數學推導,但在此前卻讓GPT4o等大模型“翻車”。

然而千問3僅用7秒便準確的給到了我們正確答案,并且給到的關鍵點解析中也明確的標注出易錯環節和驗證邏輯。



仔細看千問3的推理過程,也能看出其準確的識別到了題目的陷阱,并且對答案進行了多輪驗證。

簡單的文字游戲難不住千問3,那么更加需要推理的問題呢?

于是我們拿出了去年高考理科數學中最后一道選擇題,讓千問3來解答:

已知b是a,c的等差中項,直線ax+by+c=0與圓x2+y2+4y-1=0交于A,B兩點,則|AB|的最小值為?

對于這道需多輪推算與核對的難題,千問3并沒有掉鏈子,細細查看給到的推理過程以及答案,可以發現千問3不但答對了題目,更是用了多種解題手段,并且考慮到了多種情況,且每一步都會反復驗證,保證能夠給到準確的信息。









高考過的知道,數學最后一道選擇題,往往是卷子中最難的之一,千問3能夠準確且快速的給到答案,相信在今年的大模型PK高考數學的競賽中,定能脫穎而出。

AI加持,小白也能成大拿

除了這些常規問題,我們又深度測試了千問3在創意寫作、角色扮演、多輪對話、指令跟隨等多方面的能力。需要注意的是,這些問題往往實時性較高,所以在這個環節我們也打開了聯網功能。

首先,我們作為一個想要買黃金的小白,讓千問3扮演一個職業金融分析師的角色,看看其能否給到我們專業,同時又通俗易懂的市場分析建議。













從千問3給到的回答中,我們可以清晰的看到其調用了極其專業的知識庫信息,通過多維思考,給到了非常有邏輯的市場狀況、核心驅動因素以及技術層面的分析和建議。在其助力下,即便是對經濟市場完全不了解的小白用戶,也能做出理性判斷。

簡單的沒有難到千問3,那更為抽象的問題呢?我們給了千問3一個“擅長以莎士比亞風格來分析金融市場的研究員”的身份,然后讓其分析未來黃金的走勢。沒想到的是,千問3沒有丟掉任何一個要求,不僅有理有據的分析了市場,還將這些與莎士比亞的經典風格結合到了一起,這確實有點超前了。









當然,一個新的大模型問世,難免逃不過與同行的對比,于是我們也將千問3與目前較火的Deepseek-R1以及豆包1.5pro進行了對比測試。

不過對于大多數普通用戶來說,這些都還不夠日常,于是我們以最近比較火的“look in my eyes”作為考點,讓千問3進行相關情景創作。千問3不但準確的找到了該梗出處,創作出的文案也屬于直接能用的水準。



值得一提的是,其實這個環節我們也讓在創作者群體中比較火的Deepseek-R1以及豆包1.5pro參與了創作,但讓人意想不到的是豆包和Deepseek都沒能識別出這個梗的出處以及真實含義,創作出的文案也幾乎是無法直接使用。





02

一個指令,人人都可以是產品經理

除了解答問題、創作文案外,代碼生成也是千問3的亮點能力。

在網頁版的通義中(www.tongyi.com),用戶可以進入更擅長處理代碼問題的代碼模式,在這個模式中,只要一句話便可生成一個應用。



我作為一個完全的代碼小白,想讓千問3幫我生成一個摸魚小游戲,但沒有更為具體的想法,于是就直接向千問3下達了生成摸魚小游戲的指令。大概10S鐘的時間,一個接金幣小游戲便生成了,并且玩起來也十分絲滑。





隨后我提出新的需求,希望通義幫我做一個通勤助手,要求以卡片形式整合 “天氣+交通+日程”,一站式展示通勤關鍵信息。

通義給出的結果,再次讓人眼前一亮,不僅實現了功能需求,還對重點細節部分進行了詳細說明,以便用戶直接更改需求使用。



值得一提的是,通義網頁版還配備了指令優化功能,可以直接優化用戶指令,使其更豐富且更貼合代碼生成邏輯。



小球測試也是難倒眾多大模型代碼能力的測試,我們也拿這個來考考千問3,給到其要求:編寫一個動畫程序,模擬一個紅色小球在順時針旋轉的五邊形中晃動,并遵循重力規律。



千問3快速給到了代碼,并且給到了使用指南,而我們根據使用指南將代碼運行起來,得到了一個符合指令的展示效果。



其實通過一輪輪測試下來,可以明顯的感知到千問3在復雜任務處理上的碾壓級優勢——它不是簡單堆砌知識點的答題機器,而是真正具備思維鏈構建能力的智能體。

當然,一個出色的大模型也需要一個出色的落地產品。在使用通義App體驗千問3的過程中,也能確切的感受到新版通義App在多輪進化升級后,無論是產品界面還是交互體驗等設計層面的全方位變化,都變得更加易用,也更具溫度。

雖然過去的通義App同樣具備不俗的AI實力,但在用戶使用體驗上仍有優化空間。例如此前的通義App在主界面上集合了不少功能,這種設計雖然可以幫助用戶快速跳轉,但對于新用戶來說,難免會出現摸不著頭腦的情況,需要摸索后才能輕松上手。

如今的通義App整體界面大做減法,產品設計更加簡潔清爽,將提問、對話、圖片理解與生成、翻譯、寫作等多種核心以及常用的功能放到最顯眼的位置,主智能體“鄰家女孩”這一富有親和力的新形象,能勝任大部分應用場景中的需求,保證了所有用戶都能輕松體驗。



新版通義App在其他方面的設計和調整,也進一步降低了用戶使用的門檻。例如左滑便可直接看到對話記錄、我創建的、我聊過的智能體等資產沉淀,右滑就是通義過去積累起來的智能體平臺,有非常豐富的專業智能體,比如AI視頻、健康顧問、AI生圖、AI擴圖、表情包大師等等,通過這些名稱更直觀地找到自己所需的信息,并且整體界面顯得清爽了不少。



另外,通義App在視覺呈現上也下足了功夫,色彩搭配舒適,功能排版清晰,各種功能按鈕的位置設置合理??梢哉f,通義App通過這些貼心的設計,讓千問3的強大能力得以更好地展現,也讓用戶更加愿意沉浸其中,探索AI的無限可能 。

從榜單到場景,千問3真正做到了“能上手、能落地”,而當每個開發者都能基于這套最強開源底座創造價值,當每個用戶都能通過一個好用的App去釋放AI潛力,這種讓最強AI觸手可及的普惠性,或許才是千問3以及通義App定義的最強新內涵。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
國足出征印尼25人大名單:劉若釩落選,王鈺棟、楊明洋在列

國足出征印尼25人大名單:劉若釩落選,王鈺棟、楊明洋在列

直播吧
2025-06-02 14:53:34
2-0,世界第1完勝苦主,晉級法網8強,將與中國選手鄭欽文爭4強

2-0,世界第1完勝苦主,晉級法網8強,將與中國選手鄭欽文爭4強

側身凌空斬
2025-06-02 00:12:19
59.4%大學生不想生孩子!最新官方報告揭示年輕人婚育觀巨變

59.4%大學生不想生孩子!最新官方報告揭示年輕人婚育觀巨變

金融界
2025-05-30 14:57:43
正式退出,雨果發聲,官宣決定,名記回應,國乒計劃或打亂

正式退出,雨果發聲,官宣決定,名記回應,國乒計劃或打亂

樂聊球
2025-06-02 11:34:37
"你沒有牌了",足以載入史冊的一天,為烏克蘭的行動點贊

"你沒有牌了",足以載入史冊的一天,為烏克蘭的行動點贊

山河路口
2025-06-02 12:53:52
流入市場的“臨床試驗”抗癌藥

流入市場的“臨床試驗”抗癌藥

大象新聞
2025-06-02 09:31:46
80年去相親,岳父讓我和他兒媳睡在一屋,那晚的情形讓我終生難忘

80年去相親,岳父讓我和他兒媳睡在一屋,那晚的情形讓我終生難忘

民間精選故事匯
2025-05-29 06:10:03
馬斯克一條推文,造車新勢力幾年白卷了,Model Y自己“回家”了

馬斯克一條推文,造車新勢力幾年白卷了,Model Y自己“回家”了

小李車評李建紅
2025-06-02 07:23:56
俄民眾徒手掰斷烏軍自爆無人機旋翼,跳上卡車阻止無人機飛出

俄民眾徒手掰斷烏軍自爆無人機旋翼,跳上卡車阻止無人機飛出

大象新聞
2025-06-02 12:35:52
余承東稱看完后一身冷汗!“按華為質量標準,有車廠一臺車都不能發貨”

余承東稱看完后一身冷汗!“按華為質量標準,有車廠一臺車都不能發貨”

北京商報
2025-05-31 20:23:47
大瓜,趙櫻子懷上榜一金主的孩子?

大瓜,趙櫻子懷上榜一金主的孩子?

毒舌八卦
2025-06-02 13:50:00
李雙江家庭風波再起,出獄后的李天一歐洲生子,與夢鴿關系破裂?

李雙江家庭風波再起,出獄后的李天一歐洲生子,與夢鴿關系破裂?

柴叔帶你看電影
2025-05-30 22:48:23
再戰薩巴倫卡!鄭欽文展望:紅土比她得心應手,會拼搏到最后一刻

再戰薩巴倫卡!鄭欽文展望:紅土比她得心應手,會拼搏到最后一刻

全景體育V
2025-06-02 08:54:07
迪士尼互毆后續!衣服被撕開,眼睛流血,雙方身份曝光,警方回應

迪士尼互毆后續!衣服被撕開,眼睛流血,雙方身份曝光,警方回應

漣漪讀史
2025-06-02 11:00:12
又挖出一個“董小姐”?

又挖出一個“董小姐”?

鈞言堂
2025-06-02 00:00:10
法網1/4決賽:鄭欽文VS薩巴倫卡,比賽時間公布,贏球有多少獎金

法網1/4決賽:鄭欽文VS薩巴倫卡,比賽時間公布,贏球有多少獎金

體育大學僧
2025-06-02 09:18:00
李在明口出豪言,尹錫悅和他硅膠娃娃的麻煩大了!

李在明口出豪言,尹錫悅和他硅膠娃娃的麻煩大了!

妮妮玩不夠
2025-06-02 08:59:31
“環保少女”格蕾塔帶隊前往加沙,是正義還是作秀?

“環保少女”格蕾塔帶隊前往加沙,是正義還是作秀?

南文視界
2025-06-01 18:07:28
太可惜!網傳駐馬店一地600萬的克拉斯780發生自燃,20分鐘全燒毀

太可惜!網傳駐馬店一地600萬的克拉斯780發生自燃,20分鐘全燒毀

火山詩話
2025-06-02 10:42:49
毀天滅地!烏對俄發起驚天一擊,從戰略轟炸機到核潛艇基地

毀天滅地!烏對俄發起驚天一擊,從戰略轟炸機到核潛艇基地

史政先鋒
2025-06-02 10:49:45
2025-06-02 15:55:00
科技新知 incentive-icons
科技新知
洞察技術變化背后的產業變遷。
2634文章數 13063關注度
往期回顧 全部

科技要聞

新造車5月再洗牌:問界回前三,小米守第五

頭條要聞

美財長放話:美國永不會債務違約 我們不會公布"X日"

頭條要聞

美財長放話:美國永不會債務違約 我們不會公布"X日"

體育要聞

傲了一輩子的恩里克,心中永遠住著一個小天使

娛樂要聞

章子怡深夜曬娃,兒女正面照曝光

財經要聞

三大利空,突襲!

汽車要聞

吉利汽車5月銷量23.52萬輛 同比增長46%

態度原創

旅游
游戲
親子
藝術
軍事航空

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

《符文工房:龍之天地》總監采訪 歡迎來到東之國

親子要聞

媽媽和孩子之間的聯系遠遠比我們想象的要深

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

軍事要聞

中國記者拿著美菲勾結證據對質 菲律賓防長當場急了

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 六安市| 自治县| 龙里县| 比如县| 乌审旗| 太仆寺旗| 华安县| 河曲县| 高唐县| 双辽市| 金塔县| 彭泽县| 金秀| 东兴市| 宁海县| 阳春市| 浪卡子县| 潜江市| 梓潼县| 阿拉善左旗| 贵州省| 永登县| 天津市| 游戏| 延吉市| 永春县| 钟祥市| 新巴尔虎右旗| 新巴尔虎左旗| 望都县| 广元市| 滨海县| 桐庐县| 波密县| 长武县| 谢通门县| 汉寿县| 全南县| 开平市| 大悟县| 西藏|