99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

剛剛,阿里又開源兩個知識庫領域的模型(向量化、重排)

0
分享至


大家好,我是 Ai 學習的老章


昨天阿里開源家族迎來兩個新成員——Qwen3-EmbeddingQwen3-Reranker,專為文本表征、檢索和排序任務設計,都基于Qwen3模型構建。

看了測評,Qwen3-Embedding-8B目前是 MTEB 多語言排行榜榜首,我最期待的是Qwen3-Embedding-0.6B,模型文件不足 1.2GB,Q4 量化版只有 639MB!

Qwen3-Reranker也很能打,我準備替換掉目前正在使用的BGE-reranker-v2-m3了。

下面咱們一起看看這兩個新模型

關于 Qwen3-Embedding 和 Qwen3-Reranker 的一切
知識庫

EmbeddingReranker都是應用于知識庫的兩個核心技術。

知識庫是一個結構化或非結構化的信息存儲系統,用于存儲、組織和檢索領域特定或通用知識,結合大模型技術(如語義搜索和生成模型)來提升檢索效率和回答質量。簡單說,就是給大模型外掛了新知識。

說起知識庫,大家更熟悉的技術是RAG,它通過結合檢索模型和生成模型,先從知識庫檢索相關信息,再由生成模型(如大語言模型)基于檢索結果生成自然語言回答,從而減少大模型的幻覺,提高回答的準確性和上下文相關性,特別適合知識庫問答場景。

RAG基本工作流程包括:

  1. 文檔處理:將原始文檔進行分塊、清洗和標準化處理

  2. 向量化:將文本轉換為高維向量表示

  3. 索引構建:構建高效的向量索引以支持快速檢索

  4. 檢索:根據用戶查詢,從索引中檢索相關文檔

  5. 重排序:對檢索結果進行精確排序,確保最相關的文檔排在前面

  6. 生成回答:基于檢索到的相關文檔,生成準確的回答

事實上 RAG 目前已經從上面最簡單的技術架構發展出各種變體


Qwen3-Embedding對應向量化環節

  • 定義:將文本、圖像或其他數據轉化為高維向量表示,捕捉其語義內容。嵌入模型通過深度學習生成這些向量,使語義相似的文本在向量空間中距離較近。

  • 作用:支持語義搜索,允許知識庫根據查詢內容的語義(而非僅關鍵詞)返回相關結果。例如,查詢“如何優化數據庫”可以匹配包含“數據庫性能提升”的文檔。

Qwen3-Reranker對應重排序環節

  • 檢索:從知識庫中初步篩選與查詢相關的文檔,通常基于嵌入向量的相似度(如余弦相似度)。

  • 重排序(Reranking):對初步檢索結果進行精細排序,使用交叉編碼器(cross-encoder)計算查詢與文檔的相關性得分,進一步提升結果精準度。

  • 作用:結合“粗篩(Embedding)+ 精排(Reranking)”的流程,確保返回最相關的知識片段。

Qwen3-Embedding

Qwen3-Embedding提供 0.6B、4B 和 8B 三種參數規模,滿足不同場景的性能與效率需求。

官方還放出了這三種參數模型的 GGUF 量化版


https://www.modelscope.cn/collections/Qwen3-Embedding-3edc3762d50f48

模型類型

模型

大小

層數

序列長度

嵌入維度

MRL 支持

指令感知

文本嵌入

Qwen3-Embedding-0.6B

0.6B

28

32K

1024

文本嵌入

Qwen3-Embedding-4B

4B

36

32K

2560

文本嵌入

Qwen3-Embedding-8B

8B

36

32K

4096

Qwen3-Embedding功能特點:

  • 支持自定義最終嵌入的維度和指令感知(根據不同的任務定制輸入指令,官方測試:使用指令通常比不使用指令能提高 1% 到 5% 的性能)

  • 支持 119 種語言,具備強大的多語言、跨語言和代碼檢索能力,適用于文檔檢索、RAG(檢索增強生成)、分類、情感分析、代碼搜索等任務。

性能方面:

8B 參數的 Embedding 模型在 MTEB 多語言排行榜上位列第一(得分 70.58)

4B 參數版就已經超越目前特能打的gemini-embedding-exp-03-07

而我目前使用的是 BGE-M3,也打不過Qwen3-Embedding-0.6B

這太誘人了,我看外面的評價,有人在測試把量化版放到 Raspberry Pi、手機端運行了

不過部署上,目前僅支持 transformers 的樣子,vllm 報錯了,應該需要更新

Qwen3-Reranker

Qwen3-Embedding也提供 0.6B、4B 和 8B 三種參數規模


https://www.modelscope.cn/collections/Qwen3-Reranker-6316e71b146c4f

模型類型

模型

大小

層數

序列長度

指令感知

文本重排序

Qwen3-Reranker-0.6B

0.6B

28

32K

文本重排序

Qwen3-Reranker-4B

4B

36

32K

文本重排序

Qwen3-Reranker-8B

8B

36

32K

測評:

Model

Param

MTEB-R

CMTEB-R

MMTEB-R

MLDR

MTEB-Code

FollowIR

Jina-multilingual-reranker-v2-base

0.3B

gte-multilingual-reranker-base

0.3B

BGE-reranker-v2-m3

0.6B

Qwen3-Reranker-0.6B

0.6B

5.41

Qwen3-Reranker-4B

4B

Qwen3-Reranker-8B

8B

8.05

Qwen3-Reranker模型在文本檢索場景中顯著提升搜索相關性,尤其在 MTEB-R、CMTEB-R、MMTEB-R 和 MTEB-Code 等檢索子集上表現優異

Qwen3-Reranker-0.6B就已經傲視群雄了

我用 vllm 部署了 4B 版,正在測試


下載,部署代碼

pip install modelscope mkldir Qwen3-Reranker-4B cd  Qwen3-Reranker-4B modelscope download Qwem/Qwen3-Reranker-4B --local_dir . vllm serve . --served-model-name Qwen3-Reranker-4B --port 8001

制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
你上下行速度多少!工信部:1000Mbps及以上接入速率的固網寬帶接入達2.23億戶

你上下行速度多少!工信部:1000Mbps及以上接入速率的固網寬帶接入達2.23億戶

快科技
2025-06-25 16:18:11
63歲吳鎮宇新造型太棒了,沒有老人味還越來越年輕,至少年輕20歲

63歲吳鎮宇新造型太棒了,沒有老人味還越來越年輕,至少年輕20歲

TVB的四小花
2025-06-16 02:57:47
杜蘭特攜手威少加盟火箭,掘金甩約基奇,火箭重組沖冠局

杜蘭特攜手威少加盟火箭,掘金甩約基奇,火箭重組沖冠局

秘密清風
2025-06-27 14:01:20
李湘和16歲女兒回國,直奔商場買鞋買衣服,王詩齡不化妝很清純

李湘和16歲女兒回國,直奔商場買鞋買衣服,王詩齡不化妝很清純

檸檬有娛樂
2025-06-27 10:13:46
追求標準答案危害無窮

追求標準答案危害無窮

水寒說語文
2025-06-26 17:30:16
黃一鳴自曝:王思聰每次約她,車費都給10萬,來給5萬,回再給5萬

黃一鳴自曝:王思聰每次約她,車費都給10萬,來給5萬,回再給5萬

漢史趣聞
2025-06-24 10:07:59
楊瀚森自評現役模板:同為16順位申京 吃煎餅調侃和周琦夢幻聯動

楊瀚森自評現役模板:同為16順位申京 吃煎餅調侃和周琦夢幻聯動

醉臥浮生
2025-06-27 15:48:22
財政部:截至5月末全國地方政府債務余額512475億元

財政部:截至5月末全國地方政府債務余額512475億元

澎湃新聞
2025-06-27 10:36:06
艱難抉擇!湖北一高二考生被屏蔽,走還是不走?家長和學校犯難了

艱難抉擇!湖北一高二考生被屏蔽,走還是不走?家長和學校犯難了

火山詩話
2025-06-26 06:42:34
當年為什么查辦褚時健?

當年為什么查辦褚時健?

顧史
2025-06-09 20:26:22
又一個經濟奇跡——孟加拉國

又一個經濟奇跡——孟加拉國

古老板的老巢
2025-06-24 23:41:45
博伊爾斯女友社媒曬照慶祝男友被猛龍選中:哦嘿呀

博伊爾斯女友社媒曬照慶祝男友被猛龍選中:哦嘿呀

懂球帝
2025-06-27 08:40:19
洪森惱羞成怒,竟曝光英拉秘事,佩通坦絕地反擊,泰專機直飛中國

洪森惱羞成怒,竟曝光英拉秘事,佩通坦絕地反擊,泰專機直飛中國

嘆知
2025-06-23 10:34:33
中國游戲超越日本!來自日本玩家の認可!IGN日本高度評價《歸唐》!甘肅文旅廳宣布支持開發組古跡掃描

中國游戲超越日本!來自日本玩家の認可!IGN日本高度評價《歸唐》!甘肅文旅廳宣布支持開發組古跡掃描

Steam社區
2025-06-26 11:57:21
絕了!碘伏才是隱藏的省錢刺客!我居然白白燒了五年冤枉錢!

絕了!碘伏才是隱藏的省錢刺客!我居然白白燒了五年冤枉錢!

墻頭草
2025-04-01 12:00:11
昔日女神成方圓老了!兩段婚姻失敗無子女,對愛失望選擇單身

昔日女神成方圓老了!兩段婚姻失敗無子女,對愛失望選擇單身

一盅情懷
2025-06-27 15:54:59
1小時賣了578億!小米YU7大定28.9萬輛遠超SU7,小米ADR暴漲12%,雷軍連喊三個“安全”

1小時賣了578億!小米YU7大定28.9萬輛遠超SU7,小米ADR暴漲12%,雷軍連喊三個“安全”

金融界
2025-06-26 23:50:34
塵埃落定,重返巴薩?內馬爾官宣,1年合同,年薪1500萬

塵埃落定,重返巴薩?內馬爾官宣,1年合同,年薪1500萬

東球弟
2025-06-27 12:34:08
笑暈!江蘇衛視又逮著常州一個勁嚯嚯!這回“遭殃”的你卻想不到

笑暈!江蘇衛視又逮著常州一個勁嚯嚯!這回“遭殃”的你卻想不到

深析古今
2025-06-27 17:14:39
萬萬沒想到!拒給馬筱梅做婚紗,緬懷大S的蘭玉,竟是他的前女友

萬萬沒想到!拒給馬筱梅做婚紗,緬懷大S的蘭玉,竟是他的前女友

史行途
2025-06-27 15:07:11
2025-06-27 21:44:49
機器學習與Python社區 incentive-icons
機器學習與Python社區
機器學習算法與Python
3014文章數 11024關注度
往期回顧 全部

科技要聞

雷軍:小米汽車成功沒靠營銷,靠的是能力

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

體育要聞

曼城“庫里”連線,送尤文晚安好夢

娛樂要聞

炸裂!榜一大姐深夜怒錘頂流

財經要聞

合新鐵路建設材料以次充好 多家單位被罰

汽車要聞

配置升級/貴賓座椅 全新GL8陸上公務艙售22.99萬

態度原創

游戲
旅游
房產
手機
時尚

英雄聯盟新英雄蕓阿娜模型圖 溫泉皮有“玉足”

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

房產要聞

最強黑馬殺出!海南這些區域,教育正悄悄崛起!

手機要聞

小米MIX Flip2線下上手:體驗后,說說真實感受

到了夏天,中年女人穿過膝裙不配運動鞋,才能美得優雅又得體

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 靖远县| 阳原县| 蓝田县| 翁牛特旗| 加查县| 临夏县| 南充市| 冕宁县| 曲松县| 仪陇县| 荆州市| 岫岩| 海淀区| 宣武区| 丁青县| 水富县| 儋州市| 贵港市| 凯里市| 益阳市| 东安县| 巴南区| 西安市| 铅山县| 饶河县| 绥中县| 巴塘县| 博爱县| 建瓯市| 瓦房店市| 新竹市| 都江堰市| 安塞县| 沅江市| 靖州| 阳谷县| 建德市| 石景山区| 玛曲县| 扬中市| 宜君县|