99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

厲害,阿里又放了一個大招 !

0
分享至

  2023年大模型(LLM)火了以后,很多人用它來寫文章、寫文案、寫總結,生成圖片、極大地提高了工作效率。

  但是用得多了以后就發現,這大模型還有很多缺陷的,它的訓練數據通常滯后,新的東西它根本不知道,由于訓練一次時間很長,成本很高,知識也很難更新。在高度專業化的領域,缺乏領域深度,并且可能會生成錯誤的回答。

  01

  RAG

  為了解決大模型的這些問題,RAG(Retrieval-Augmented Generation)被提了出來。

  RAG的想法很簡單,把傳統檢索和生成模型做結合,用戶在使用之前,先建立一個知識庫,把專業領域知識“向量化”以后,存到向量庫中。

  

  當用戶提出以后,RAG先利用檢索模塊從知識庫中查找與輸入問題或上下文相關的內容,然后將檢索到的信息與原始輸入一起提供給大模型,最后大模型再進行生成輸出。

  

  RAG通過檢索模塊訪問外部知識庫,突破生成模型的參數規模限制,提供最新且廣泛的知識。還能夠追蹤回答的來源,增強結果的可信度,知識更新也很方便。

  所以RAG在智能客服,法律問答、學術問答等領域中非常好用。

  02

  RAG的痛點

  但是RAG在工作的時候,需要用傳統的方法來檢索知識庫,從中檢索出來的很可能是“難負樣本”(Hard Negative Samples),什么是難負樣本呢?

  舉個例子,假設你正在訓練一個貓和狗分類模型:

  ?正樣本:貓的圖片。

  ?負樣本:不是貓的圖片,比如狗、鳥、汽車等。

  ?普通負樣本:一輛汽車的圖片,與貓完全無關。

  ?難負樣本:一只小貓形狀類似的狗(比如有貓的毛色特征)

  簡單來說,難負樣本就是和正樣本非常相似的負樣本,它們看起來與目標類別接近,實際上屬于錯誤類別。

  RAG的檢索模塊是利用傳統檢索去訪問知識庫的,這時候很有可能會把“難負樣本”給檢索出來,然后輸入給大模型生成回答,大模型分不清真假,基于“難負樣本”進行回答,不但無法生成正確答案,反而會被誤導,導致回答質量下降,甚至引入“幻覺”現象。

  

  RAG這么好的增強技術,難道就因為“難負樣本”給搞壞了嗎?能不能在檢索結果中把“難負樣本”給剔除出去?

  03

  阿里云百煉:RAG全新升級

  最近我發現阿里巴巴的百煉平臺對RAG框架做了升級,有效地解決了“幻覺”問題。

  通常情況下,在對知識庫進行搜索的時候,是根據文本相似度的閾值來進行判定的,例如下面的例子,閾值是0.4,chunk1和chunk2高于0.4,那就作為搜索結果返回了。chunk3的相似度是0.3,低于閾值,就被丟棄了。

  

  最終,chunk1和chunk2再加上用戶的問題被發給大模型。

  這種根據文本相似度判斷的方法速度比較快,但是準確一般,還有可能產生“難負樣本”,在大模型那里產生幻覺。

  阿里云的百煉平臺則在相似度的基礎上,引入了“拒識模塊”,系統首先通過相似度閾值篩選出初步的搜索結果,然后利用大模型對這些結果進行深入分析,判斷它們與用戶查詢的關聯程度。

  比如下圖,根據相似度閾值,chunk1和chunk2已經被取出,但是通過大模型的分析以后,發現chunk1和用戶的查詢沒有關聯,就被拋棄了。

  

  最終,只有chunk1加上用戶的查詢發給了大模型來生成答案,由于信息關聯性極高,幻覺就被消除了。

  通過這一機制,大模型在生成回答前,能夠先對候選信息進行一次全面的“質量檢查”,確保所有用于生成的信息都是高度相關且可靠的。

  從具體實現上來說,“拒識模塊“包括了三個重點的組成部分:

  1. 復雜的指令系統

  既然要使用大模型來判斷檢索結果與用戶問題的相關度,那必然要有一套指令系統來告訴大模型怎么處理,例如告訴大模型:檢索結果中涉及的實體與用戶問題中的實體要完全一致啊,否則就認為不相關。

  2. 大模型調用

  調用大語言模型,得到每條檢索文檔的相關性判斷。

  3. 后處理

  根據大模型輸出的相關性結果,過濾掉那些不相關的檢索文檔。如果相關文檔列表為空,則直接返回無答案,避免大語言模型產生幻覺答案。

  04

  使用全新的RAG

  “拒識模塊”的處理過程聽起來非常復雜,但是是阿里云百煉平臺上,已經把整個過程都封裝好了,用戶只需點幾下按鈕就可以啟用這個強大的功能。

  在阿里云百煉平臺上,選擇創建一個RAG應用:

  

  例如我創建RAG應用叫做“碼農翻身張大胖”,目的是把我公眾號的文章建立一個知識庫,讓這個智能體應用去檢索,回答用戶提出的問題。

  這里要打開“知識庫檢索增強”,把我的文章傳上去,讓檢索模塊去搜索。

  

  然后重點進行“檢索配置”,進行“回答范圍設定”,選擇“搜索閾值+大模型判斷”就可以了,剩下的就不用管了。

  

  接下來,就可以向這個RAG應用發問了:

  

  05

  總結

  阿里云百煉集成了200多款大模型的API,涵蓋通義千問、Llama、ChatGLM等國內外主流模型,可以直接調用模型進行推理,其中通義千問的QPS和TPM基本拉滿,可提升到500萬,完全可以滿足高并發場景的需求。

  如果你想訓練自己的模型,百煉也提供從數據管理、模型調優、評測到部署的全鏈路模型服務,用戶可彈性按需調用算力,無需關心底層架構。

  在百煉平臺上,還可以輕松地創建RAG應用,一鍵開啟知識檢索增強(RAG),建立知識庫,在檢索配置上,通過“搜索閾值+大模型判斷”的方式,更好地解決了大模型幻覺問題,讓大模型在復雜場景下的應用開辟了新的可能性,進一步推動了人工智能技術的發展和應用。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
教育反腐教重拳出擊!多名高中校長、書記因腐敗被查

教育反腐教重拳出擊!多名高中校長、書記因腐敗被查

王曉愛體彩
2025-06-01 16:23:48
教授的驚人調查:中國農村當前最嚴重的問題,并不是農民收入太低

教授的驚人調查:中國農村當前最嚴重的問題,并不是農民收入太低

尚曦讀史
2025-01-30 04:20:13
“真槍實彈”女明星遭搭戲男星來真的!

“真槍實彈”女明星遭搭戲男星來真的!

文刀萬
2025-05-30 06:05:03
朝鮮召開軍委擴大會議,金正恩頭發白了!

朝鮮召開軍委擴大會議,金正恩頭發白了!

IN朝鮮
2025-05-30 09:43:45
糖尿病患者越來越瘦,是好是壞?注意:大多是這些原因,趁早改善

糖尿病患者越來越瘦,是好是壞?注意:大多是這些原因,趁早改善

鬼菜生活
2025-05-30 06:45:13
今日起,我國全面進入……

今日起,我國全面進入……

云南新聞廣播
2025-06-01 14:37:27
尼日爾賴掉4億美元,驅逐中企高管,中方暗藏底牌漂亮反擊

尼日爾賴掉4億美元,驅逐中企高管,中方暗藏底牌漂亮反擊

南冥那只貓
2025-05-11 10:33:43
詹俊:國米的年齡結構不太合理;恩里克改造登貝萊是神來之筆

詹俊:國米的年齡結構不太合理;恩里克改造登貝萊是神來之筆

懂球帝
2025-06-01 05:31:31
這就是命!“小股東”杜蘭特祝賀巴黎奪冠,一年前剛投資巴黎

這就是命!“小股東”杜蘭特祝賀巴黎奪冠,一年前剛投資巴黎

直播吧
2025-06-01 10:05:16
俞灝明官宣結婚后,王曉晨終于發聲!曬美照與玫瑰花,幸福爆表

俞灝明官宣結婚后,王曉晨終于發聲!曬美照與玫瑰花,幸福爆表

小咪侃娛圈
2025-06-01 14:15:52
奇葩!業主房屋空置一年多,閣樓門前和露臺變成菜地

奇葩!業主房屋空置一年多,閣樓門前和露臺變成菜地

極目新聞
2025-05-31 20:11:44
撒貝寧和家人去千島湖過端午節,6歲女兒扎著臟辮,肉嘟嘟好可愛

撒貝寧和家人去千島湖過端午節,6歲女兒扎著臟辮,肉嘟嘟好可愛

悠閑歷史
2025-05-31 19:56:18
電動車越來越多,為什么很少有偷車的?主要這3個原因,才知道!

電動車越來越多,為什么很少有偷車的?主要這3個原因,才知道!

電動車的那些事兒
2025-05-13 07:59:55
采耳后真菌布滿耳道!你還在用棉簽、挖耳勺掏耳朵?醫生緊急提醒

采耳后真菌布滿耳道!你還在用棉簽、挖耳勺掏耳朵?醫生緊急提醒

極目新聞
2025-05-29 21:08:24
特朗普急了!中國這次絕不慣著!

特朗普急了!中國這次絕不慣著!

李榮茂
2025-06-01 06:59:25
他是開國上將,文革時卻帶頭詆毀劉少奇,批斗鄧小平,下場如何?

他是開國上將,文革時卻帶頭詆毀劉少奇,批斗鄧小平,下場如何?

史論縱橫
2023-06-23 15:19:43
4種茶葉已被列入“傷肝名單”,喝多了或傷肝!再愛喝也要管住嘴

4種茶葉已被列入“傷肝名單”,喝多了或傷肝!再愛喝也要管住嘴

平祥生活日志
2025-05-07 16:36:28
廣西兩名原高校領導同日被通報!

廣西兩名原高校領導同日被通報!

中國青年報
2025-05-30 21:30:13
北京41歲獨身女子病逝,未婚未育,無父無母,結果,500萬遺產遭瓜分......

北京41歲獨身女子病逝,未婚未育,無父無母,結果,500萬遺產遭瓜分......

二胡的歲月如歌
2025-04-24 18:32:34
印度“陣風”折翼,背后的真正較量……

印度“陣風”折翼,背后的真正較量……

大象新聞
2025-05-30 17:49:04
2025-06-01 17:39:00
碼農翻身 incentive-icons
碼農翻身
有趣且硬核的技術文章
129文章數 483關注度
往期回顧 全部

科技要聞

特朗普突然炒掉NASA準局長,嫌他不"忠誠"?

頭條要聞

奔馳4S店"忠誠客戶"過保半年發現車子"通病":接受不了

頭條要聞

奔馳4S店"忠誠客戶"過保半年發現車子"通病":接受不了

體育要聞

一邊倒的歐冠決賽,青春無敵的新科冠軍

娛樂要聞

張若昀夫婦國外遛娃 男方推平價兒童車

財經要聞

油價繼續下跌?歐佩克宣布將再度增產

汽車要聞

零跑汽車5月交付量達45,067臺 穩居新勢力前三

態度原創

藝術
本地
健康
時尚
公開課

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

云游中國 |來仰天湖大草原,一起策馬奔騰

唇皰疹和口腔潰瘍是"同伙"嗎?

今年夏天最火的10組搭配,都在這篇啦!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 东阿县| 金门县| 桂东县| 和平县| 东丰县| 无棣县| 新津县| 尼木县| 陇西县| 长宁县| 保德县| 罗源县| 唐河县| 许昌市| 罗田县| 红安县| 汾阳市| 手游| 黔东| 康马县| 玉溪市| 深圳市| 台南县| 台东市| 垦利县| 石狮市| 湘西| 广南县| 兴文县| 广汉市| 余干县| 龙岩市| 松原市| 盐边县| 通道| 古田县| 当雄县| 安平县| 长武县| 清苑县| 延津县|