99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Qwen3真香!通義App滿血接入,一手實(shí)測(cè)在此

0
分享至

開源大模型新王者,正在受到空前關(guān)注。

Qwen3預(yù)告一出,直接開啟不眠夜模式。



△來(lái)自編輯部本部

等到深夜正式上線并宣布登頂全球最強(qiáng)開源模型,更是瞬間引爆全網(wǎng)熱議。



網(wǎng)友們的反應(yīng)在meme中盡數(shù)體現(xiàn)(doge)。



畢竟,單看紙面參數(shù),Qwen3就是個(gè)妥妥的大工程:

  • 8款混合推理模型全部開源,參數(shù)量從0.6B235B全面覆蓋;
  • 32B模型就有超越OpenAI o1、DeepSeek R1的性能表現(xiàn),在編程基準(zhǔn)測(cè)評(píng)中還超過了風(fēng)頭正盛的Gemini 2.5 Pro;
  • 支持思考和非思考模式,支持119種語(yǔ)言和方言、加強(qiáng)對(duì)MCP支持……

還有網(wǎng)友認(rèn)為,這是“又一個(gè)DeepSeek時(shí)刻”。



這一次模型開源,通義App和網(wǎng)頁(yè)版也趕在第一時(shí)間滿血上線Qwen3,并且有專屬智能體體驗(yàn)。



新王究竟表現(xiàn)如何,我們第一時(shí)間深度實(shí)測(cè),以見真章。



Qwen3住進(jìn)App,還能這樣玩兒

打開通義App/通義網(wǎng)頁(yè)版首頁(yè),目前有兩種方式可以體驗(yàn)到Qwen3模型:

  • 直接用輸入框?qū)υ?em>(代碼/數(shù)學(xué)/翻譯類問題默認(rèn)調(diào)用Qwen3-235B,其它問題不調(diào)用Qwen3)
  • 選用“千問大模型”智能體(默認(rèn)使用旗艦版Qwen3-235B-A22B)

BTW,通義網(wǎng)頁(yè)版近期上線了新域名tongyi.com,不要走錯(cuò)。

OK,接下來(lái)進(jìn)入正題。

官方強(qiáng)調(diào)了新模型在Agent、編碼方面的能力提升,還增強(qiáng)了對(duì)MCP的支持。具體表現(xiàn)如何,我們直接在通義App里全方位實(shí)測(cè)。

第一關(guān):代碼生成

先來(lái)個(gè)新模型“入門挑戰(zhàn)”——空間內(nèi)彈小球。

這個(gè)經(jīng)典測(cè)試在考驗(yàn)?zāi)P痛a能力的同時(shí),還重點(diǎn)關(guān)注了它對(duì)物理世界的理解,幾乎每一個(gè)新模型都會(huì)被拉出來(lái)遛一遛。

提示詞如下(p5.js腳本、25個(gè)粒子、圓柱形容器)



而第一次接受挑戰(zhàn)的旗艦版Qwen3模型,用時(shí)1分鐘,唰唰唰就生成了一百多行代碼:



將上述代碼實(shí)際運(yùn)行一下,結(jié)果be like:



雖然一眼看去沒有“小球直接沖出圓圈”這樣明顯的錯(cuò)誤,但也確實(shí)缺少3D空間感。

作為對(duì)比,我們拉出官方測(cè)評(píng)圖中,和滿血Qwen3代碼實(shí)力最相近的Grok 3模型。



重復(fù)相同操作,讓Grok 3基于同一提示詞生成代碼,并實(shí)際運(yùn)行:



二者的區(qū)別相當(dāng)明顯,后者(Grok 3)的空間感肉眼可見更強(qiáng)。

為了進(jìn)一步探究?jī)啥未a的差別,我們又直接讓Qwen3“自己找找差距”(doge)。

結(jié)果,它真的很認(rèn)真地進(jìn)行了全方位對(duì)比,包括渲染模式、容器結(jié)構(gòu)、粒子運(yùn)動(dòng)與碰撞測(cè)試等等。



最終結(jié)論也用表格進(jìn)行了呈現(xiàn),一目了然:



甚至,基于它提出的改進(jìn)意見,我們繼續(xù)讓它出了一個(gè)新版本。



實(shí)際運(yùn)行后,這次的結(jié)果已經(jīng)非常符合我們的要求了。



事實(shí)上,深扒Qwen3的思考過程,我們才發(fā)現(xiàn)原來(lái)第一版的2D效果是它“深思熟慮”后的選擇。

這里主要考慮到了兼容性問題,所以簡(jiǎn)化成了俯視圖來(lái)呈現(xiàn)。



從上面這個(gè)簡(jiǎn)單測(cè)試,我們已經(jīng)能夠窺見Qwen3的程序員素養(yǎng)確實(shí)不錯(cuò)。

接下來(lái)難度升級(jí),直接讓它幫打工人設(shè)計(jì)一個(gè)提醒喝水的電腦端App



注意,為了能快速在瀏覽器端預(yù)覽生成效果,這里我們采用了“極簡(jiǎn)模式”,僅保留最基礎(chǔ)的功能,不涉及使用任何第三方庫(kù)。



結(jié)果生成的App有模有樣,還能真實(shí)點(diǎn)擊交互。

一旦讓具備工程能力的童鞋們上手,估計(jì)能實(shí)現(xiàn)更多復(fù)雜效果。

第二關(guān):邏輯推理

接下來(lái)我們考查一下Qwen3的邏輯推理能力。

老規(guī)矩,先上一道經(jīng)典邏輯陷阱題:

  • 農(nóng)夫要把一頭狼、一只羊和一盆菜帶過一條河。河邊只有一艘小船,農(nóng)夫每次只能帶一樣?xùn)|西過河。如果農(nóng)夫不在場(chǎng)時(shí),狼會(huì)吃羊,羊會(huì)吃菜。如何安排農(nóng)夫的安全過河方案?



故意關(guān)閉聯(lián)網(wǎng)模式后,Qwen3經(jīng)過一步步推理最終給出了正確答案。

  • 農(nóng)夫應(yīng)按照以下順序操作:
  • 帶羊過河,返回。
    帶狼過河,帶回羊。
    帶白菜過河,返回。
    帶羊過河。
  • 此方案通過7次移動(dòng)(4次過河,3次返回),確保所有物品安全抵達(dá)對(duì)岸。

而且從Qwen3的思考過程能夠看到,其思維方式和人類一樣,是通過不斷推翻各種方案來(lái)找出可行路徑。



再來(lái)一道超高難度專業(yè)數(shù)學(xué)題。

原題來(lái)自今年的普特南數(shù)學(xué)競(jìng)賽,該競(jìng)賽號(hào)稱最難本科數(shù)學(xué)考試,人類要考6小時(shí),并且所選取的題目據(jù)稱前500名選手均未能完整作答。

而扔給Qwen3后,可以看到整體的思考時(shí)間確實(shí)明顯變長(zhǎng),最終用時(shí)5分38秒給出了正確答案。

p.s. 千問智能體無(wú)法直接上傳圖片,最終選擇從App首頁(yè)上傳圖片,提取文字后繼續(xù)使用千問智能體作答。



更有趣的是,扒一扒其思考過程,還能看到模型在線表演“崩潰”:



當(dāng)然,雖然AI的解讀速度和正確率明顯勝于人類,但還是要和同類來(lái)比。

在國(guó)外網(wǎng)友的測(cè)試中,同一道題Grok 3(Think)在約8分鐘內(nèi)找到了解決方案。

所以對(duì)比下來(lái),這一局算Qwen3略勝一籌。



第三關(guān):多語(yǔ)言能力

另外據(jù)介紹,Qwen3的一大亮點(diǎn)是支持119種語(yǔ)言和方言,被網(wǎng)友戲稱“AI屆多鄰國(guó)”(doge)。

別的不說(shuō),直接讓它來(lái)挑戰(zhàn)一把國(guó)內(nèi)專業(yè)譯者的地位試試。

將莎士比亞《哈姆雷特》的經(jīng)典選段丟給它,讓它按照“信達(dá)雅”翻譯成中文。



它還知道參考優(yōu)秀譯本,并且注意避免直接抄襲造成侵權(quán)。



最終生成的結(jié)果如下(左側(cè)),對(duì)比我們熟知的朱生豪經(jīng)典譯本(右側(cè)),你覺得AI味兒濃度如何?



第四關(guān):賽博閨蜜、shopping比價(jià)、寫歌一網(wǎng)打盡

除了以上更側(cè)重模型基礎(chǔ)能力的考查,當(dāng)Qwen3被塞進(jìn)App后,我們還解鎖了更多玩法。

做旅游規(guī)劃這種就不必多說(shuō)了,關(guān)鍵還能充當(dāng)“賽博閨蜜”,幫忙選擇更適合發(fā)朋友圈的游客照。



日常也能用來(lái)購(gòu)物比價(jià),比如分析出當(dāng)下最值得入手的3000元預(yù)算內(nèi)平板。

不僅用表格清晰列出了各品牌的核心參數(shù),還按照不同需求進(jìn)行了推薦,一整個(gè)造福伸手黨。



此外,最近火上熱搜的“AI寫歌”,我們也用Qwen3嘗試了一把。

五一版·大張偉嗨歌這就新鮮出爐,光看歌詞確實(shí)有內(nèi)味兒了:



Okk,以上為我們的全部實(shí)測(cè)。

小結(jié)一下,通過在通義App使用Qwen3專屬智能體,我們能明顯感受到以下幾點(diǎn):

  • Qwen3旗艦?zāi)P偷纳伤俣确浅?欤w驗(yàn)很絲滑;
  • 模型擅長(zhǎng)推理,能夠解決經(jīng)典邏輯陷阱和復(fù)雜數(shù)學(xué)題;
  • 代碼能力方面,已經(jīng)能夠快速實(shí)現(xiàn)一些簡(jiǎn)單需求;
  • 由于載體是App,可拓展的玩法很多。

而且,通義App自上個(gè)月頁(yè)面改版后,整體設(shè)計(jì)更簡(jiǎn)潔,交互也更加完善了。

更多網(wǎng)友實(shí)測(cè)

與此同時(shí),隨著Qwen3模型的爆火,更多網(wǎng)友也第一時(shí)間進(jìn)行了試玩。

有和“空間內(nèi)彈小球”類似效果的頁(yè)面設(shè)計(jì):



還有用阿拉伯語(yǔ)、法語(yǔ)和印地語(yǔ)解釋愛因斯坦相對(duì)論的玩法,該博主聲稱:

  • 簡(jiǎn)單到連十歲的小孩都能理解。



當(dāng)然,大家一直尤為鐘愛的小游戲開發(fā)也安排上了:



開源界的新王者

Qwen3引發(fā)熱議背后,可以看到的是,在開源影響力上,以Qwen為代表的國(guó)產(chǎn)大模型,已經(jīng)有超越Llama之勢(shì)。

這一點(diǎn),從reddit LocalLLaMA等開發(fā)者聚集的板塊的最新話題中,亦可見一斑。



不僅是基準(zhǔn)評(píng)測(cè)數(shù)據(jù)的紙面超越,實(shí)測(cè)越多,模型實(shí)力究竟幾何就越能被客觀公允地認(rèn)知。

而如今的開源格局之變,并非一蹴而就。前有DeepSeek,今有Qwen3,背后體現(xiàn)的是來(lái)自中國(guó)的開源力量一以貫之的努力,和一如既往的“中國(guó)速度”

以Qwen為例:

2024年11月底,開源推理模型QwQ;

2025年春節(jié)檔,連發(fā)Qwen2.5百萬(wàn)上下文版本、視覺理解模型Qwen2.5-VL,還有超大規(guī)模MoE模型Qwen-2.5 Max;

2025年3月,QwQ-32B以1/10成本比肩DeepSeek-R1;

多模態(tài)方面,還有萬(wàn)相Wan的持續(xù)開源和迭代……

這還只是短短5個(gè)月內(nèi)的進(jìn)展。

再加上更加開放和商用友好的Apache 2.0協(xié)議,開發(fā)者們的轉(zhuǎn)向,自然在情理之中。





作為普通用戶,一方面,可以在通義App這樣的官方應(yīng)用上更快感知到滿血模型的能力。

另一方面,也可以期待開源,帶來(lái)更多衍生應(yīng)用的可能性。

那么,再次打開傳送門:

tongyi.com

如果你探索到了什么新鮮玩法,也歡迎在評(píng)論區(qū)跟大家分享~

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
孩子被蜱蟲咬阿婆手摳無(wú)果,媽媽一招救娃,網(wǎng)友:姨夫被蜱蟲咬死

孩子被蜱蟲咬阿婆手摳無(wú)果,媽媽一招救娃,網(wǎng)友:姨夫被蜱蟲咬死

菁媽育兒
2025-04-30 12:54:44
梅德韋杰夫:所有北約新成員會(huì)自動(dòng)成為俄軍目標(biāo)

梅德韋杰夫:所有北約新成員會(huì)自動(dòng)成為俄軍目標(biāo)

參考消息
2025-04-29 21:46:10
解放軍第12艘055下水,讓美軍徹底破防的,中國(guó)不到2年下水4艘055

解放軍第12艘055下水,讓美軍徹底破防的,中國(guó)不到2年下水4艘055

安安說(shuō)
2025-04-29 19:15:24
尷尬!趙心童國(guó)內(nèi)被禁賽,卻在沖擊世錦賽決賽,中臺(tái)協(xié)會(huì)慶祝嗎?

尷尬!趙心童國(guó)內(nèi)被禁賽,卻在沖擊世錦賽決賽,中臺(tái)協(xié)會(huì)慶祝嗎?

小李子愛體育
2025-04-30 11:54:27
監(jiān)利市2名干部接受審查調(diào)查

監(jiān)利市2名干部接受審查調(diào)查

荊頭條
2025-04-29 18:02:57
背水一戰(zhàn),快船隊(duì)科懷·倫納德直言不諱,直面對(duì)陣掘金的淘汰賽

背水一戰(zhàn),快船隊(duì)科懷·倫納德直言不諱,直面對(duì)陣掘金的淘汰賽

好火子
2025-05-01 05:10:42
張召忠預(yù)測(cè):中國(guó)不用核武器,4小時(shí)就能拿下日本!

張召忠預(yù)測(cè):中國(guó)不用核武器,4小時(shí)就能拿下日本!

文史旺旺旺
2025-04-30 19:21:05
董襲瑩的博士論文居然是研究人工智能的,但是有眾多硬傷疑點(diǎn)

董襲瑩的博士論文居然是研究人工智能的,但是有眾多硬傷疑點(diǎn)

火鍋局
2025-04-30 14:17:16
籌碼集中度達(dá)到12%,說(shuō)明主力完成最后吸籌,全部買進(jìn),漲停在即

籌碼集中度達(dá)到12%,說(shuō)明主力完成最后吸籌,全部買進(jìn),漲停在即

股經(jīng)縱橫談
2025-04-30 22:13:45
分析:打森林狼表現(xiàn)不佳,湖人應(yīng)考慮里夫斯未來(lái),可打包換字母哥

分析:打森林狼表現(xiàn)不佳,湖人應(yīng)考慮里夫斯未來(lái),可打包換字母哥

好火子
2025-05-01 05:03:42
清華博士稱,終于下載到董襲瑩的博士論文!直言像本科生畢業(yè)設(shè)計(jì)

清華博士稱,終于下載到董襲瑩的博士論文!直言像本科生畢業(yè)設(shè)計(jì)

火山詩(shī)話
2025-04-30 21:54:47
放過屠呦呦院士吧

放過屠呦呦院士吧

關(guān)爾東
2025-04-30 13:01:00
發(fā)現(xiàn)一個(gè)悲哀的現(xiàn)象:特別長(zhǎng)壽的老人,幾乎都是子女用生命在托舉

發(fā)現(xiàn)一個(gè)悲哀的現(xiàn)象:特別長(zhǎng)壽的老人,幾乎都是子女用生命在托舉

婉秋聊育兒
2025-04-26 05:24:04
閑魚變“黃魚”,表面賣女生自用自行車,實(shí)則做著見不得人的交易

閑魚變“黃魚”,表面賣女生自用自行車,實(shí)則做著見不得人的交易

西齋青簡(jiǎn)
2024-05-07 11:55:02
重磅座談會(huì)召開,7位省級(jí)黨委書記發(fā)言,還有5個(gè)重點(diǎn)

重磅座談會(huì)召開,7位省級(jí)黨委書記發(fā)言,還有5個(gè)重點(diǎn)

政知新媒體
2025-04-30 23:03:38
進(jìn)球大戰(zhàn)!巴薩3-3國(guó)米,鄧弗里斯2射1傳,亞馬爾破門+2中框

進(jìn)球大戰(zhàn)!巴薩3-3國(guó)米,鄧弗里斯2射1傳,亞馬爾破門+2中框

懂球帝
2025-05-01 05:05:22
建議睡覺時(shí)把手機(jī)放1.5米以外?不是因?yàn)檩椛洌恰?>
    </a>
        <h3>
      <a href=環(huán)球網(wǎng)資訊
2025-02-25 14:51:04
肖飛為啥選了董小姐,事實(shí)扎心!同行詳解:為啥董小姐本事通天?

肖飛為啥選了董小姐,事實(shí)扎心!同行詳解:為啥董小姐本事通天?

曉風(fēng)說(shuō)
2025-04-30 14:30:34
董襲瑩實(shí)習(xí)視頻曝光,她還真的給病人看病呢

董襲瑩實(shí)習(xí)視頻曝光,她還真的給病人看病呢

金牌娛樂
2025-04-30 10:07:56
中方已表態(tài),深知不能得罪中國(guó)的普京,在印巴問題上非常配合

中方已表態(tài),深知不能得罪中國(guó)的普京,在印巴問題上非常配合

阿天愛旅行
2025-05-01 03:19:41
2025-05-01 05:43:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
10413文章數(shù) 176123關(guān)注度
往期回顧 全部

科技要聞

DeepSeek發(fā)布Prover-V2模型 參數(shù)量6710億

頭條要聞

印度宣布即日起對(duì)所有巴基斯坦航班關(guān)閉領(lǐng)空

頭條要聞

印度宣布即日起對(duì)所有巴基斯坦航班關(guān)閉領(lǐng)空

體育要聞

“魚有一條尾巴,而我有一條腿。”

娛樂要聞

災(zāi)難性公關(guān) 毀掉曾黎二十年人緣積累

財(cái)經(jīng)要聞

美國(guó)經(jīng)濟(jì)萎縮 一季度GDP年化初值-0.3%

汽車要聞

智能升格滿載出發(fā) 全新攬境:再給燃油車一次機(jī)會(huì)

態(tài)度原創(chuàng)

數(shù)碼
家居
教育
時(shí)尚
公開課

數(shù)碼要聞

華碩天選 6 Pro 開售,國(guó)補(bǔ)后 7599 元起

家居要聞

輕奢婚房 自由隨性生活

教育要聞

這家長(zhǎng)有多作!家長(zhǎng)群里否定老師,也完全不去管孩子死活

今年最流行的風(fēng)格:舒適、簡(jiǎn)單、松弛感

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 北海市| 石台县| 丰都县| 陈巴尔虎旗| 巴东县| 大田县| 临夏县| 温宿县| 黔东| 社会| 永靖县| 娱乐| 鄂尔多斯市| 丰镇市| 青神县| 收藏| 通州区| 蛟河市| 阿拉善左旗| 高安市| 江山市| 新昌县| 泰来县| 博白县| 南宁市| 襄城县| 南康市| 宁安市| 山东| 建始县| 彰武县| 临武县| 万荣县| 宁明县| 诸暨市| 高碑店市| 松潘县| 马鞍山市| 时尚| 宜都市| 垣曲县|