99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

阿里又開源兩款Qwen3模型!拿下文本嵌入模型SOTA,技術(shù)報(bào)告公布

0
分享至


智東西
編譯 金碧輝
編輯 程茜

智東西6月6日消息,昨天,阿里巴巴宣布推出Qwen3-Embedding和Qwen3-Reranker系列模型,正式發(fā)布Qwen3-Embedding和Qwen3-Reranker系列大模型技術(shù)報(bào)告,首次公開開源模型Qwen3-Embedding和Qwen3-Reranker的推理架構(gòu)、訓(xùn)練策略及評(píng)測(cè)結(jié)果。

Qwen3-Embedding和Qwen3-Reranker,均基于Qwen3基礎(chǔ)模型訓(xùn)練,專為文本表征、檢索與排序任務(wù)設(shè)計(jì)。其中,Qwen3-Embedding接收單段文本,將其轉(zhuǎn)換為語義向量,以用于語義搜索、問答系統(tǒng)等場(chǎng)景。Qwen3-Reranker則接收文本對(duì),利用單塔結(jié)構(gòu)計(jì)算并輸出兩個(gè)文本的相關(guān)性得分,可在各類文本檢索場(chǎng)景中顯著提升搜索結(jié)果的相關(guān)性。在實(shí)際應(yīng)用中,二者常結(jié)合使用,比如在RAG系統(tǒng)里,Qwen3-Embedding用于初步檢索,Qwen3-Reranker用于優(yōu)化候選結(jié)果,兼顧效率和精度。

Qwen3-Embedding 8B以70.58分登頂MTEB(當(dāng)前全球公認(rèn)的文本嵌入模型評(píng)測(cè)基準(zhǔn),通過整合檢索、聚類、分類等7大場(chǎng)景,系統(tǒng)評(píng)估向量模型的語義表征能力)多語言榜全球第一,創(chuàng)歷史新高(截至2025年6月6日);Qwen3-Reranker在mMARCO跨語言檢索中MRR@10達(dá)0.42,超越行業(yè)標(biāo)桿。雙模型支持119種語言及編程語言,提供0.6B/4B/8B全尺寸覆蓋,其中Reranker對(duì)100文檔排序延遲壓至80ms內(nèi)(A100),長文本處理突破32k上下文。即日起雙模型在Hugging Face/GitHub/ModelScope開源免費(fèi)商用,阿里云API同步上線。


▲圖源阿里巴巴Qwen3-Embedding和Qwen3-Reranker系列模型技術(shù)報(bào)告

模型地址:

https://github.com/QwenLM/Qwen3-Embedding

https://huggingface.co/collections/Qwen/qwen3-reranker-6841b22d0192d7ade9cdefea

一、阿里巴巴發(fā)布Qwen3-Embedding模型,模型多語言得分超70

阿里巴巴昨天正式推出Qwen3-Embedding文本向量模型,提供0.6B、4B、8B三檔參數(shù)規(guī)模,全面覆蓋輕量級(jí)邊緣計(jì)算到高性能云端場(chǎng)景。該模型支持119種自然語言及Python、Java等編程語言,并突破性地實(shí)現(xiàn)32k tokens長文本處理能力。

目前Qwen3-Embedding模型以Apache 2.0協(xié)議免費(fèi)開源,開發(fā)者可通過Hugging Face、ModelScope及阿里云API一鍵部署。

在權(quán)威評(píng)測(cè)中,Qwen3-Embedding 8B版本以70.58分登頂MTEB多語言Leaderboard榜單(截至2025年6月6日),超越Google Gemini-Embedding等商業(yè)模型。


▲Qwen3-Embedding模型在MTEB多語言Leaderboard榜單中位列第一

Qwen3-Embedding模型在代碼檢索(MTEB-Code)任務(wù)中,搜索精準(zhǔn)度排名第一。


▲Qwen3-Embedding在代碼檢索任務(wù)中表現(xiàn)的性能

在多模態(tài)文本嵌入(MTEB)跨語言場(chǎng)景下,Qwen3-Embedding 8B模型在多語言檢索任務(wù)中取得了69.02的高分,在中文檢索任務(wù)中得分達(dá)到77.45,在英文檢索任務(wù)中得分達(dá)到69.76。


▲Qwen3 Embedding在多模態(tài)文本嵌入任務(wù)中表現(xiàn)的性能

除此,技術(shù)報(bào)告還透露,Qwen3 Embedding依托Qwen3基座模型的深度語言理解能力,創(chuàng)新采用雙編碼器架構(gòu),能獨(dú)立處理查詢文本與文檔內(nèi)容,生成高精度語義向量。

Qwen3-Embedding模型采用三階段訓(xùn)練框架:首階段基于36萬億token多語言數(shù)據(jù)弱監(jiān)督預(yù)訓(xùn)練,第二階段融合MS MARCO標(biāo)注數(shù)據(jù)進(jìn)行監(jiān)督微調(diào),最終通過模型融合技術(shù)提升泛化性。推理層面Qwen3-Embedding模型創(chuàng)新性支持自定義指令模板,使特定任務(wù)性能提升3%-5%。


▲Qwen3-Embedding的模型架構(gòu)

Qwen3-Embedding的核心優(yōu)勢(shì)在于多語言深度適配(跨語言檢索誤差率降低30%)、長文本處理標(biāo)桿級(jí)能力(32k窗口+雙塊注意力機(jī)制),以及靈活定制化設(shè)計(jì)(競(jìng)品如OpenAI text-embedding僅支持固定維度)。

同時(shí),Qwen3-Embedding模型的開源免費(fèi)策略顯著降低技術(shù)門檻,中小企業(yè)可零成本構(gòu)建文檔檢索、知識(shí)庫聚類等系統(tǒng),可能使多語言文本處理技術(shù)進(jìn)入普惠化應(yīng)用階段。

二、32k長文檔精準(zhǔn)排序:Qwen3-Reranker支持法律科研檢索99%穩(wěn)定性

阿里巴巴的Qwen3-Reranker系列模型專門用于提升搜索和推薦系統(tǒng)相關(guān)性排序能力的模型,該系列提供0.6B/4B/8B三檔參數(shù)規(guī)模。Qwen3-Reranker系列模型專為文本表征、檢索與排序任務(wù)設(shè)計(jì)。該系列模型采用基于Qwen3基礎(chǔ)模型的稠密版本,并與Qwen3-Embedding模型協(xié)同構(gòu)建端到端檢索鏈路。


▲Qwen3-Embedding與Qwen3-Reranker系列的訓(xùn)練流程

Qwen3-Reranker系列模型的32k tokens上下文窗口專為法律文書、科研論文等長文檔排序優(yōu)化,顯著提升長文本處理穩(wěn)定性。模型以Apache 2.0協(xié)議開源免費(fèi),開發(fā)者可通過Hugging Face、GitHub、ModelScope獲取,或通過阿里云API一鍵調(diào)用集成。

Qwen3-Reranker模型采用單塔交互結(jié)構(gòu),將用戶查詢與候選文檔拼接輸入,通過動(dòng)態(tài)計(jì)算查詢-文檔交互特征輸出相關(guān)性得分,實(shí)現(xiàn)非靜態(tài)向量匹配的實(shí)時(shí)排序。


▲Qwen3-Reranker的模型架構(gòu)

針對(duì)長文檔場(chǎng)景,Qwen3-Reranker模型集成RoPE位置編碼與雙塊注意(Dual Chunk Attention)機(jī)制,有效避免長程信息丟失,確保32k上下文內(nèi)語義連貫性。

同時(shí),Qwen3-Reranker模型支持任務(wù)指令微調(diào),開發(fā)者可通過自定義指令(如“按病例描述相關(guān)性排序”)優(yōu)化特定領(lǐng)域性能,實(shí)測(cè)可提升排序準(zhǔn)確率3%-5%,而競(jìng)品如ColBERT缺乏此類功能。

阿里巴巴Qwen3-Reranker系列模型提供了三種不同參數(shù)規(guī)模的模型配置,分別為0.6B、4B和8B參數(shù),以滿足不同場(chǎng)景下的性能與效率需求。

Qwen3-Reranker 0.6B模型參數(shù)量為0.6B,屬于超小型模型,適合端側(cè)設(shè)備部署。其上下文長度達(dá)32k,采用基于Transformer的架構(gòu),以RMSNorm對(duì)層輸入進(jìn)行歸一化,確保訓(xùn)練穩(wěn)定;Qwen3-Reranker 0.6B模型能無縫集成兩種思考模式,在保持推理效率的同時(shí),展現(xiàn)出良好的多語言處理能力。

Qwen3-Reranker 4B模型參數(shù)量為4B,性能匹敵Qwen2.5-72B-Instruct。Qwen3-Reranker 4B模型同樣具備32k的上下文長度,它通過多項(xiàng)架構(gòu)增強(qiáng)提升語義理解能力;Qwen3-Reranker 4B模型在AIME25(美國數(shù)學(xué)邀請(qǐng)賽)評(píng)測(cè)中得分為81.5,刷新了開源模型記錄,展現(xiàn)出強(qiáng)大的數(shù)學(xué)推理能力,能夠處理復(fù)雜的數(shù)學(xué)問題,進(jìn)行嚴(yán)謹(jǐn)?shù)挠?jì)算和多步推理。

Qwen3-Reranker 8B模型參數(shù)量為8B,上下文長度在標(biāo)準(zhǔn)配置下為32768個(gè) Token;Qwen3-Reranker 8B在多語言檢索任務(wù)中取得了69.02分,性能超越bge-reranker-large等開源競(jìng)品;在中文檢索任務(wù)中得分達(dá)到77.45,在英文檢索任務(wù)中得分達(dá)到69.76,顯著優(yōu)于傳統(tǒng)BM25和ColBERT等其他基線模型。

另外,Qwen3-Reranker模型或推動(dòng)高精度檢索技術(shù)普及,企業(yè)知識(shí)庫問答準(zhǔn)確率提升40%,大幅降低人工成本;跨境電商實(shí)現(xiàn)119語言商品精準(zhǔn)搜索,誤檢率下降35%;科研法律領(lǐng)域長文檔檢索效率突破90%,加速信息提取。

阿里巴巴的開源策略激活開發(fā)者生態(tài),通過Hugging Face快速微調(diào)行業(yè)模型,阿里云API支持5行代碼接入,極大降低技術(shù)門檻。同時(shí)推動(dòng)文本檢索從“關(guān)鍵詞匹配”升級(jí)至“語義理解+動(dòng)態(tài)交互”,為AI Agent與多模態(tài)應(yīng)用奠定基礎(chǔ)。

結(jié)語:告別通用泛化!阿里報(bào)告揭示:文本處理進(jìn)入精準(zhǔn)專用

Qwen3-Embedding/Reranker通過“多語言+長文本+可定制”三位一體設(shè)計(jì),解決了傳統(tǒng)文本處理模型泛化性差、成本高的痛點(diǎn)。其開源策略更將加速產(chǎn)業(yè)應(yīng)用創(chuàng)新,開發(fā)者可基于Hugging Face快速微調(diào),企業(yè)可通過阿里云API即時(shí)部署。阿里巴巴在文本嵌入領(lǐng)域的技術(shù)布局覆蓋從輕量級(jí)到高性能的全場(chǎng)景需求。

技術(shù)報(bào)告特別提醒,在實(shí)際檢索場(chǎng)景中,建議應(yīng)用者根據(jù)具體任務(wù)、語言和場(chǎng)景設(shè)計(jì)指令模板,否則可能影響效果。這一細(xì)節(jié)可能反映出AI模型正從“通用泛化”向“精準(zhǔn)專用”演進(jìn),也為行業(yè)提供了新的優(yōu)化思路。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中央明確:黨員干部,這些禮不能收送!

中央明確:黨員干部,這些禮不能收送!

未央看點(diǎn)
2025-06-23 02:15:37
偉偉道來| 美國鉆地彈炸開了戰(zhàn)爭(zhēng)之門,還是炸開了談判大門?

偉偉道來| 美國鉆地彈炸開了戰(zhàn)爭(zhēng)之門,還是炸開了談判大門?

經(jīng)濟(jì)觀察報(bào)
2025-06-23 10:51:08
全新天籟渲染圖曝光:轎跑風(fēng)、豪華內(nèi)飾,節(jié)能又省油!

全新天籟渲染圖曝光:轎跑風(fēng)、豪華內(nèi)飾,節(jié)能又省油!

車談怪杰
2025-06-23 07:44:06
你遇到過超級(jí)主動(dòng)的女生是啥樣?網(wǎng)友:為什么沒有女人主動(dòng)接近我

你遇到過超級(jí)主動(dòng)的女生是啥樣?網(wǎng)友:為什么沒有女人主動(dòng)接近我

娛樂圈人物大賞
2025-04-10 00:30:23
張含韻今日更新動(dòng)態(tài)附文:今年新疆kpi,陸續(xù)達(dá)成

張含韻今日更新動(dòng)態(tài)附文:今年新疆kpi,陸續(xù)達(dá)成

情感大頭說說
2025-06-23 17:48:42
絕不向中國低頭!寧愿裁員9000人公司破產(chǎn),也不接受中國的幫助?

絕不向中國低頭!寧愿裁員9000人公司破產(chǎn),也不接受中國的幫助?

近史博覽
2025-06-23 11:47:33
哈利伯頓拒絕離開!拄拐挨個(gè)抱隊(duì)友,跟兄弟們一起哭泣落淚太悲壯

哈利伯頓拒絕離開!拄拐挨個(gè)抱隊(duì)友,跟兄弟們一起哭泣落淚太悲壯

嘴炮體壇
2025-06-23 11:35:22
沖刺開業(yè),已在招商!王思聰選擇退出,此前官宣總投資37億元,還和市委書記面談!何猷君接盤,他將王思聰視作榜樣

沖刺開業(yè),已在招商!王思聰選擇退出,此前官宣總投資37億元,還和市委書記面談!何猷君接盤,他將王思聰視作榜樣

每日經(jīng)濟(jì)新聞
2025-06-23 11:51:09
紀(jì)實(shí):69歲老太被3個(gè)15歲少年強(qiáng)奸,荒唐無比的真相,讓3個(gè)家庭毀了

紀(jì)實(shí):69歲老太被3個(gè)15歲少年強(qiáng)奸,荒唐無比的真相,讓3個(gè)家庭毀了

談史論天地
2025-06-23 08:50:03
空襲伊朗,美軍欺騙了全世界!

空襲伊朗,美軍欺騙了全世界!

樞密院十號(hào)
2025-06-22 23:05:07
馬斯克怒批特朗普,他犯下兩戰(zhàn)略錯(cuò)誤,其中一個(gè)幫了中國大忙!

馬斯克怒批特朗普,他犯下兩戰(zhàn)略錯(cuò)誤,其中一個(gè)幫了中國大忙!

萬芝
2025-06-23 20:19:23
兩岸統(tǒng)一喜訊!沒等我軍出手,關(guān)鍵時(shí)刻,大陸收到一份“大禮”

兩岸統(tǒng)一喜訊!沒等我軍出手,關(guān)鍵時(shí)刻,大陸收到一份“大禮”

熒惑手心
2025-06-23 09:09:28
為期6個(gè)月!廣西正嚴(yán)打這些行為!涉及電動(dòng)自行車

為期6個(gè)月!廣西正嚴(yán)打這些行為!涉及電動(dòng)自行車

天氣觀察站
2025-06-23 16:36:30
女籃宮魯鳴主教練召回李夢(mèng)歸隊(duì)是明智之舉 是大局意識(shí)觀的體現(xiàn)

女籃宮魯鳴主教練召回李夢(mèng)歸隊(duì)是明智之舉 是大局意識(shí)觀的體現(xiàn)

kio魚
2025-06-23 00:05:15
絕不向中國低頭!寧愿裁員9000人公司破產(chǎn),也不接受中國的幫助?

絕不向中國低頭!寧愿裁員9000人公司破產(chǎn),也不接受中國的幫助?

小舟談歷史
2025-06-23 20:33:22
中美差距真相:這組數(shù)據(jù)讓14億人徹底清醒!

中美差距真相:這組數(shù)據(jù)讓14億人徹底清醒!

健身狂人
2025-06-23 04:15:02
雷軍談小米首款SUV不做6座:“彩電冰箱大沙發(fā)”很重要,駕駛體驗(yàn)也應(yīng)被關(guān)注

雷軍談小米首款SUV不做6座:“彩電冰箱大沙發(fā)”很重要,駕駛體驗(yàn)也應(yīng)被關(guān)注

界面新聞
2025-06-23 12:34:24
意媒:曼聯(lián)考慮支付5200萬解約金簽小基恩,本賽季已多次考察球員

意媒:曼聯(lián)考慮支付5200萬解約金簽小基恩,本賽季已多次考察球員

雷速體育
2025-06-23 21:16:28
香港鄭氏家族,靜待875億救命錢

香港鄭氏家族,靜待875億救命錢

21世紀(jì)商業(yè)評(píng)論
2025-06-23 23:36:17
毫無遮掩!杜蘭特:火箭是我點(diǎn)名要去的球隊(duì),離開太陽對(duì)大家都好

毫無遮掩!杜蘭特:火箭是我點(diǎn)名要去的球隊(duì),離開太陽對(duì)大家都好

移動(dòng)擋拆
2025-06-24 00:25:02
2025-06-24 01:47:00
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。
10056文章數(shù) 116781關(guān)注度
往期回顧 全部

科技要聞

售出千萬臺(tái)!他卻說"只想做下一代AI終端"

頭條要聞

玉淵譚天:美軍轟炸伊朗的武器僅美國有 但掏空了老本

頭條要聞

玉淵譚天:美軍轟炸伊朗的武器僅美國有 但掏空了老本

體育要聞

比起雷霆三少,他才是真正隊(duì)魂

娛樂要聞

魏大勛和秦嵐沒分手!

財(cái)經(jīng)要聞

以伊沖突升級(jí),對(duì)經(jīng)濟(jì)和股市影響有多大?

汽車要聞

真香價(jià)格+質(zhì)保承諾 別克E5很難讓人拒絕了

態(tài)度原創(chuàng)

教育
游戲
本地
親子
公開課

教育要聞

老師解答難題時(shí),全班同學(xué)認(rèn)真聽講,教室里充滿了求知的欲望

暴雪官宣國服登陸方式切換為網(wǎng)易賬號(hào)!6月25日開始

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

親子要聞

娃把剛買不久的298元積木變廢品?我用三招救回老母親血壓!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 安龙县| 南昌县| 泰来县| 中卫市| 大庆市| 阳城县| 繁昌县| 常州市| 嵊泗县| 方城县| 绿春县| 楚雄市| 茶陵县| 年辖:市辖区| 木兰县| 克山县| 兰坪| 刚察县| 论坛| 航空| 高要市| 盐边县| 桂东县| 曲阜市| 商河县| 安达市| 同心县| 济南市| 昌黎县| 师宗县| 宝清县| 开远市| 石首市| 无锡市| 炉霍县| 夏津县| 汾阳市| 华阴市| 阳信县| 凌海市| 台州市|