99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

厲害,阿里又放了一個大招 !

0
分享至

  2023年大模型(LLM)火了以后,很多人用它來寫文章、寫文案、寫總結,生成圖片、極大地提高了工作效率。

  但是用得多了以后就發現,這大模型還有很多缺陷的,它的訓練數據通常滯后,新的東西它根本不知道,由于訓練一次時間很長,成本很高,知識也很難更新。在高度專業化的領域,缺乏領域深度,并且可能會生成錯誤的回答。

  01

  RAG

  為了解決大模型的這些問題,RAG(Retrieval-Augmented Generation)被提了出來。

  RAG的想法很簡單,把傳統檢索和生成模型做結合,用戶在使用之前,先建立一個知識庫,把專業領域知識“向量化”以后,存到向量庫中。

  

  當用戶提出以后,RAG先利用檢索模塊從知識庫中查找與輸入問題或上下文相關的內容,然后將檢索到的信息與原始輸入一起提供給大模型,最后大模型再進行生成輸出。

  

  RAG通過檢索模塊訪問外部知識庫,突破生成模型的參數規模限制,提供最新且廣泛的知識。還能夠追蹤回答的來源,增強結果的可信度,知識更新也很方便。

  所以RAG在智能客服,法律問答、學術問答等領域中非常好用。

  02

  RAG的痛點

  但是RAG在工作的時候,需要用傳統的方法來檢索知識庫,從中檢索出來的很可能是“難負樣本”(Hard Negative Samples),什么是難負樣本呢?

  舉個例子,假設你正在訓練一個貓和狗分類模型:

  ?正樣本:貓的圖片。

  ?負樣本:不是貓的圖片,比如狗、鳥、汽車等。

  ?普通負樣本:一輛汽車的圖片,與貓完全無關。

  ?難負樣本:一只小貓形狀類似的狗(比如有貓的毛色特征)

  簡單來說,難負樣本就是和正樣本非常相似的負樣本,它們看起來與目標類別接近,實際上屬于錯誤類別。

  RAG的檢索模塊是利用傳統檢索去訪問知識庫的,這時候很有可能會把“難負樣本”給檢索出來,然后輸入給大模型生成回答,大模型分不清真假,基于“難負樣本”進行回答,不但無法生成正確答案,反而會被誤導,導致回答質量下降,甚至引入“幻覺”現象。

  

  RAG這么好的增強技術,難道就因為“難負樣本”給搞壞了嗎?能不能在檢索結果中把“難負樣本”給剔除出去?

  03

  阿里云百煉:RAG全新升級

  最近我發現阿里巴巴的百煉平臺對RAG框架做了升級,有效地解決了“幻覺”問題。

  通常情況下,在對知識庫進行搜索的時候,是根據文本相似度的閾值來進行判定的,例如下面的例子,閾值是0.4,chunk1和chunk2高于0.4,那就作為搜索結果返回了。chunk3的相似度是0.3,低于閾值,就被丟棄了。

  

  最終,chunk1和chunk2再加上用戶的問題被發給大模型。

  這種根據文本相似度判斷的方法速度比較快,但是準確一般,還有可能產生“難負樣本”,在大模型那里產生幻覺。

  阿里云的百煉平臺則在相似度的基礎上,引入了“拒識模塊”,系統首先通過相似度閾值篩選出初步的搜索結果,然后利用大模型對這些結果進行深入分析,判斷它們與用戶查詢的關聯程度。

  比如下圖,根據相似度閾值,chunk1和chunk2已經被取出,但是通過大模型的分析以后,發現chunk1和用戶的查詢沒有關聯,就被拋棄了。

  

  最終,只有chunk1加上用戶的查詢發給了大模型來生成答案,由于信息關聯性極高,幻覺就被消除了。

  通過這一機制,大模型在生成回答前,能夠先對候選信息進行一次全面的“質量檢查”,確保所有用于生成的信息都是高度相關且可靠的。

  從具體實現上來說,“拒識模塊“包括了三個重點的組成部分:

  1. 復雜的指令系統

  既然要使用大模型來判斷檢索結果與用戶問題的相關度,那必然要有一套指令系統來告訴大模型怎么處理,例如告訴大模型:檢索結果中涉及的實體與用戶問題中的實體要完全一致啊,否則就認為不相關。

  2. 大模型調用

  調用大語言模型,得到每條檢索文檔的相關性判斷。

  3. 后處理

  根據大模型輸出的相關性結果,過濾掉那些不相關的檢索文檔。如果相關文檔列表為空,則直接返回無答案,避免大語言模型產生幻覺答案。

  04

  使用全新的RAG

  “拒識模塊”的處理過程聽起來非常復雜,但是是阿里云百煉平臺上,已經把整個過程都封裝好了,用戶只需點幾下按鈕就可以啟用這個強大的功能。

  在阿里云百煉平臺上,選擇創建一個RAG應用:

  

  例如我創建RAG應用叫做“碼農翻身張大胖”,目的是把我公眾號的文章建立一個知識庫,讓這個智能體應用去檢索,回答用戶提出的問題。

  這里要打開“知識庫檢索增強”,把我的文章傳上去,讓檢索模塊去搜索。

  

  然后重點進行“檢索配置”,進行“回答范圍設定”,選擇“搜索閾值+大模型判斷”就可以了,剩下的就不用管了。

  

  接下來,就可以向這個RAG應用發問了:

  

  05

  總結

  阿里云百煉集成了200多款大模型的API,涵蓋通義千問、Llama、ChatGLM等國內外主流模型,可以直接調用模型進行推理,其中通義千問的QPS和TPM基本拉滿,可提升到500萬,完全可以滿足高并發場景的需求。

  如果你想訓練自己的模型,百煉也提供從數據管理、模型調優、評測到部署的全鏈路模型服務,用戶可彈性按需調用算力,無需關心底層架構。

  在百煉平臺上,還可以輕松地創建RAG應用,一鍵開啟知識檢索增強(RAG),建立知識庫,在檢索配置上,通過“搜索閾值+大模型判斷”的方式,更好地解決了大模型幻覺問題,讓大模型在復雜場景下的應用開辟了新的可能性,進一步推動了人工智能技術的發展和應用。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中國短劇殺瘋了!“特朗普愛上保潔婦”,美國觀眾罵著付錢停不住

中國短劇殺瘋了!“特朗普愛上保潔婦”,美國觀眾罵著付錢停不住

寒士之言本尊
2025-07-21 15:08:38
戰艦啟航!Shams:老將克里斯-保羅回歸快船 生涯最后一季

戰艦啟航!Shams:老將克里斯-保羅回歸快船 生涯最后一季

直播吧
2025-07-21 23:18:12
結婚證發成離婚證!網友調侃“第一次見合照的離婚證”,長春一民政局:發錯了,已道歉

結婚證發成離婚證!網友調侃“第一次見合照的離婚證”,長春一民政局:發錯了,已道歉

瀟湘晨報
2025-07-21 17:17:08
張韶涵“渣女站姿”刷屏網絡,腿縫近乎為零觀眾眼睛都直了 服了

張韶涵“渣女站姿”刷屏網絡,腿縫近乎為零觀眾眼睛都直了 服了

界史
2025-07-21 11:08:24
天水“血鉛事件”真相落幕:官方5907字通報,四大疑點,詳細披露

天水“血鉛事件”真相落幕:官方5907字通報,四大疑點,詳細披露

娜烏和西卡
2025-07-20 23:04:28
中紀委再劃紅線!黨員干部“八小時外”100條禁令正式發布!

中紀委再劃紅線!黨員干部“八小時外”100條禁令正式發布!

羅源縣人民檢察院
2025-07-21 20:47:37
坑了大馬45億美元!被多國通緝的華裔富豪,竟藏身上海豪宅

坑了大馬45億美元!被多國通緝的華裔富豪,竟藏身上海豪宅

財通社
2025-07-21 17:43:14
58歲金星在法國巴黎吃火鍋,越老越像男人,身上有了油膩感

58歲金星在法國巴黎吃火鍋,越老越像男人,身上有了油膩感

鄉野小珥
2025-07-21 00:34:37
對話636分報考福耀科技大學的湖南考生:愿做教育改革“小白鼠”,很滿意這個選擇

對話636分報考福耀科技大學的湖南考生:愿做教育改革“小白鼠”,很滿意這個選擇

紅星新聞
2025-07-21 19:27:26
特朗普更新一則視頻:我和奧巴馬在白宮,FBI當場把他拷走送進監獄

特朗普更新一則視頻:我和奧巴馬在白宮,FBI當場把他拷走送進監獄

不掉線電波
2025-07-21 13:14:32
曾志偉合影辱華藝人風波升級!致歉評論區控不住,多次涉爭議事件

曾志偉合影辱華藝人風波升級!致歉評論區控不住,多次涉爭議事件

萌神木木
2025-07-21 16:42:06
網友稱剛剛看完《戲臺》,覺得它能上映就是個奇跡

網友稱剛剛看完《戲臺》,覺得它能上映就是個奇跡

丫頭舫
2025-07-21 09:59:06
從喜劇黑馬到人設崩塌? 她的走紅,全靠賈玲讓位和抱團炒作!

從喜劇黑馬到人設崩塌? 她的走紅,全靠賈玲讓位和抱團炒作!

毒舌八卦
2025-07-21 20:03:12
蘇超擴軍或成真,“十三太保”將成歷史,外卡城市聯隊曝光

蘇超擴軍或成真,“十三太保”將成歷史,外卡城市聯隊曝光

冷桂零落
2025-07-21 11:14:46
印度強烈反對無效,世紀水電工程開工,將徹底改變中印戰略格局

印度強烈反對無效,世紀水電工程開工,將徹底改變中印戰略格局

現代小青青慕慕
2025-07-21 03:02:31
Skip:最老球隊快船將成雷霆的最大威脅 當年沒用SGA換喬治就好了

Skip:最老球隊快船將成雷霆的最大威脅 當年沒用SGA換喬治就好了

直播吧
2025-07-22 01:04:04
實錘?網傳杜建英有丈夫,還有一個36歲大兒子,宗慶后竟然是三哥

實錘?網傳杜建英有丈夫,還有一個36歲大兒子,宗慶后竟然是三哥

壹月情感
2025-07-20 22:06:40
40多歲,高管失業,有的已去擺地攤

40多歲,高管失業,有的已去擺地攤

南風窗
2025-07-21 15:48:38
馮德萊恩收到好消息,中方宣布取消對歐制裁,可以放手對付美國了

馮德萊恩收到好消息,中方宣布取消對歐制裁,可以放手對付美國了

兵說
2025-07-20 23:31:21
效果明顯!朝陽暴走團消失了,民警在現場巡控,白衣哥怒罵立大功

效果明顯!朝陽暴走團消失了,民警在現場巡控,白衣哥怒罵立大功

鋭娛之樂
2025-07-21 17:43:03
2025-07-22 01:23:00
碼農翻身 incentive-icons
碼農翻身
有趣且硬核的技術文章
146文章數 515關注度
往期回顧 全部

科技要聞

劉強東闊氣出手!兩月投了4家具身智能公司

頭條要聞

男子為終身質保花60萬買蔚來 1年跑17萬公里權益沒了

頭條要聞

男子為終身質保花60萬買蔚來 1年跑17萬公里權益沒了

體育要聞

這四位大兄弟,你們真敢要3000萬吶

娛樂要聞

五哈全員為寶石老舅送祝福

財經要聞

炒港美股"補稅潮"突襲?一文了解始末

汽車要聞

勞斯萊斯前設計師全新力作 榮威M7正式亮相

態度原創

健康
藝術
旅游
教育
房產

呼吸科專家破解呼吸道九大謠言!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

教育要聞

清華直通!7名學霸被保送,一中、南外、金中河西的學霸上榜!

房產要聞

歷時15年!廣州最難拆的一條村,也終于走到了句點

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 清原| 巴青县| 新民市| 阜阳市| 安龙县| 开远市| 随州市| 黔西县| 南充市| 定兴县| 定日县| 罗田县| 礼泉县| 孟连| 潮安县| 祁连县| 右玉县| 赣榆县| 诸城市| 城口县| 清镇市| 遂宁市| 张家界市| 呼伦贝尔市| 金门县| 老河口市| 黑河市| 兰溪市| 南平市| 连江县| 沂源县| 光泽县| 军事| 刚察县| 莱西市| 长武县| 金乡县| 临邑县| 翼城县| 汾阳市| 柳州市|