99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

【教程】打造個人知識庫,線上、免費

0
分享至


大家好,我是 Ai 學習的老章

中簡單介紹了純互聯(lián)網(wǎng)的全托管 RAG 流水線,本文我們實操看看部署流程和效果。

AutoRAG

AutoRAG 是一個由 Cloudflare 提供的全托管檢索增強生成(RAG)流水線,旨在簡化開發(fā)者將上下文感知 AI 集成到其應(yīng)用程序中的方式。

RAG 是一種通過從您自己的數(shù)據(jù)中檢索信息并將其提供給大型語言模型(LLM)以生成更具體回答的方法。RAG 在查詢時從數(shù)據(jù)源檢索相關(guān)的信息,將其與用戶的查詢輸入結(jié)合起來,然后將兩者一起輸入到 LLM 中生成基于您數(shù)據(jù)的響應(yīng)。這使得 RAG 成為 AI 驅(qū)動的支持機器人、內(nèi)部知識助手、文檔中的語義搜索以及其他源為實真相不斷演化的應(yīng)用場景的理想選擇。


構(gòu)建 RAG 流水線需要拼湊多個組件——數(shù)據(jù)存儲、向量數(shù)據(jù)庫、嵌入模型、LLMs 以及自定義索引、檢索和生成邏輯等等工具和服務(wù)拼接在一起,才能開始。維護它更是難上加難,隨著數(shù)據(jù)的變化,須手動重新索引和重新生成嵌入,以使系統(tǒng)保持相關(guān)性和性能。

AutoRAG 要實現(xiàn)的就是將脆弱的膠水代碼管道、脆弱的集成和不斷的維護,變成一個簡單的“提問,獲得智能回答”的體驗。從導(dǎo)入數(shù)據(jù)、自動分塊和嵌入,到在 Cloudflare 的 Vectorize 數(shù)據(jù)庫中存儲向量,進行語義檢索,并使用 Workers AI 生成高質(zhì)量的響應(yīng)。AutoRAG 會持續(xù)監(jiān)控數(shù)據(jù)源和索引,使 AI 保持最新,無需手動操作。


AutoRAG Indexing process 索引過程
AutoRAG Querying process 查詢過程

Cloudflare 非常慷慨,目前 AutoRAG 完全免費,索引、檢索和增強的計算操作不會產(chǎn)生額外費用。每個賬戶的 Max AutoRAG 實例 10,最大文件數(shù) 10000 個。

R2、Vectorize Stores、Workers AI、AI Gateway 都可能產(chǎn)生費用,但是免費額度足夠個人測試使用了,比如我長期把 R2 當圖床,從沒產(chǎn)生過費用。Vectorize 也有每月 3000 萬的向量維度查詢。

具體可以看看:https://developers.cloudflare.com/autorag/platform/limits-pricing/

下面我們開始:

第一步,創(chuàng)建 R2 對象存儲

訪問https://dash.cloudflare.com/點擊 R2 對象存儲,創(chuàng)建存儲桶


名稱:html-bucker,點擊創(chuàng)建


第二步,創(chuàng)建 Worker 抓取網(wǎng)頁到 R2

本地創(chuàng)建一個空白文件夾

cd 過去后,創(chuàng)建一個名為browser-r2-worker的 Worker 項目:

npm create cloudflare@latest -- browser-r2-worker

設(shè)置時,請選擇以下選項:

  • What would you like to start with? Choose Hello World Starter.
    從哪里開始?選擇 Hello World 入門。

  • Which template would you like to use? Choose Worker only.
    使用哪個模板?選擇僅 Worker。

  • Which language do you want to use? Choose TypeScript.
    使用哪種語言?選擇 TypeScript。

安裝@cloudflare/puppeteer,這允許你控制瀏覽器渲染實例:

npm i @cloudflare/puppeteer

將以下配置添加到您的 Wrangler 配置文件中,以便您的 Worker 可以使用瀏覽器渲染并使用新的 R2 存儲桶:

{  "compatibility_flags": ["nodejs_compat"], "browser": { "binding": "MY_BROWSER"  }, "r2_buckets": [   {    "binding": "HTML_BUCKET",    "bucket_name": "html-bucket",   }  ], }


將 src/index.ts 的內(nèi)容替換為以下框架腳本:

import puppeteer from "@cloudflare/puppeteer"; // Define our environment bindings interface Env {  MY_BROWSER: any;  HTML_BUCKET: R2Bucket; } // Define request body structure interface RequestBody {  url: string; } export default { async fetch(request: Request, env: Env): Promise { // Only accept POST requests if (request.method !== 'POST') { return new Response('Please send a POST request with a target URL', { status: 405 });   } // Get URL from request body const body = await request.json() as RequestBody; // Note: Only use this parser for websites you own const targetUrl = new URL(body.url);  // Launch browser and create new page const browser = await puppeteer.launch(env.MY_BROWSER); const page = await browser.newPage(); // Navigate to the page and fetch its html await page.goto(targetUrl.href); const htmlPage = await page.content(); // Create filename and store in R2 const key = targetUrl.hostname + '_' + Date.now() + '.html'; await env.HTML_BUCKET.put(key, htmlPage); // Close browser await browser.close(); // Return success response return new Response(JSON.stringify({    success: true,    message: 'Page rendered and stored successfully',    key: key   }), {    headers: { 'Content-Type': 'application/json' }   });  } } satisfies ExportedHandler ;

可以通過運行以下命令將其部署到 Cloudflare 賬戶中:

cd browser-r2-worker  npx wrangler deploy

回到 Cloudflare 控制臺,可以看到 Worker 已經(jīng)創(chuàng)建好了



這個worker的核心功能是使用puppeteer訪問、閱讀網(wǎng)頁并將其保存為完整HTML到剛剛創(chuàng)建的 R2 存儲桶。但是我按照官方教程遇到 Couldn't connect to server 錯誤,暫未解決,所以后續(xù)用手動上傳文件來測試。

這一步本身也不夠傻瓜,后續(xù)開發(fā)成插件自動執(zhí)行會優(yōu)雅一點。

curl -X POST https://browser-r2-worker. .workers.dev \ -H "Content-Type: application/json" \ -d '{"url": "https://blog.cloudflare.com/introducing-autorag-on-cloudflare"}'

第二步,創(chuàng)建 AutoRAG 并監(jiān)控索引過程

  1. 在 Cloudflare 管理界面中,導(dǎo)航至 AI > AutoRAG

  2. 選擇創(chuàng)建 AutoRAG 并完成設(shè)置過程:

    1. 選擇包含知識庫的 R2 存儲桶,在這種情況下,選擇html-bucket

    2. 選擇用于將您的數(shù)據(jù)轉(zhuǎn)換為向量表示的嵌入模型。建議使用默認模型。

    3. 選擇一個 LLM 來生成你的響應(yīng)。建議使用默認項。

    4. 選擇或創(chuàng)建一個 AI 網(wǎng)關(guān)以監(jiān)控和控制您的模型使用情況。

    5. 將你的 AutoRAG 命名為my-rag


    6. 選擇或創(chuàng)建一個服務(wù) API 令牌以授予 AutoRAG 訪問權(quán)限以在你的賬戶中創(chuàng)建和訪問資源。

  3. 選擇“use”以啟動 AutoRAG。

測試一下:

未上傳任何文檔情況


上傳網(wǎng)頁或其他文件


再次測試


unsetunset第四步,測試并添加到應(yīng)用程序unsetunset

AutoRAG 提供了 REST API,可以基于 API 開發(fā)應(yīng)用:

curl https://api.cloudflare.com/client/v4/accounts/{ACCOUNT_ID}/autorag/rags/{AUTORAG_NAME}/ai-search \-H 'Content-Type: application/json' \-H "Authorization: Bearer {API_TOKEN}" \-d '{  "query": "How do I train a llama to deliver coffee?",  "model": @cf/meta/llama-3.3-70b-instruct-sd,  "rewrite_query": true,  "max_num_results": 10,  "ranking_options": {    "score_threshold": 0.6  },  "stream": true,}'

具體參考:https://developers.cloudflare.com/autorag/usage/rest-api/

unsetunset總結(jié)unsetunset

Cloudflare 提供的僅是 RAG 解決方案,而非完整 RAG 應(yīng)用。我覺得這一套流水線還是蠻方便流暢的,未來可以在網(wǎng)頁采集環(huán)節(jié)開發(fā)一個瀏覽器插件,一鍵采集網(wǎng)頁素材到自己的 R2 存儲桶,類似 Obsidian 的 clippings 插件。

制作不易,如果這篇文章覺得對你有用,可否點個關(guān)注。給我個三連擊:點贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中央決定:公職人員出差伙食費、交通費、住宿費、會議費標準!

中央決定:公職人員出差伙食費、交通費、住宿費、會議費標準!

小江網(wǎng)評
2025-05-07 22:59:08
今天A股沖到了3359點,無論你現(xiàn)在是幾成倉,明天開盤請聽我一句

今天A股沖到了3359點,無論你現(xiàn)在是幾成倉,明天開盤請聽我一句

阿鳧愛吐槽
2025-05-08 14:39:49
陳麗君致歉網(wǎng)暴仍鋪天蓋地,南大教授苗懷明:我只是做了我該做的

陳麗君致歉網(wǎng)暴仍鋪天蓋地,南大教授苗懷明:我只是做了我該做的

揚子晚報
2025-05-08 09:08:27
印巴這一戰(zhàn),撕掉法國遮羞布,耿爽那句話含金量還在上升

印巴這一戰(zhàn),撕掉法國遮羞布,耿爽那句話含金量還在上升

時時有聊
2025-05-08 07:01:54
劉耕宏直播失控!愛妻怒嗆黑粉:不信你們出去啊…掉粉900萬告急

劉耕宏直播失控!愛妻怒嗆黑粉:不信你們出去啊…掉粉900萬告急

ETtoday星光云
2025-05-08 12:38:08
紅場勝利日閱兵——2025年5月9日慶祝活動安排

紅場勝利日閱兵——2025年5月9日慶祝活動安排

俄羅斯衛(wèi)星通訊社
2025-05-08 15:17:50
火箭老板:謝潑德沒機會是因為我們戰(zhàn)績好,若他首發(fā)80場也能場均20分

火箭老板:謝潑德沒機會是因為我們戰(zhàn)績好,若他首發(fā)80場也能場均20分

懂球帝
2025-05-08 15:25:39
撈相機溺亡女游客身份被扒,年僅30是專業(yè)潛導(dǎo),犯了三大致命疏忽

撈相機溺亡女游客身份被扒,年僅30是專業(yè)潛導(dǎo),犯了三大致命疏忽

奇思妙想草葉君
2025-05-07 23:12:57
不舍!廣州一知名酒樓宣布即將停業(yè)!街坊:有太多的回憶……

不舍!廣州一知名酒樓宣布即將停業(yè)!街坊:有太多的回憶……

城事特搜
2025-05-07 20:03:36
擊落印度陣風戰(zhàn)機的PL-15導(dǎo)彈,竟是美國吹牛、中國被忽悠實現(xiàn)的產(chǎn)物

擊落印度陣風戰(zhàn)機的PL-15導(dǎo)彈,竟是美國吹牛、中國被忽悠實現(xiàn)的產(chǎn)物

不掉線電波
2025-05-08 13:22:43
中國開始“清理”混日子的留學生,掛3科就停錢,違紀直接遣返

中國開始“清理”混日子的留學生,掛3科就停錢,違紀直接遣返

毒哥的毒雞湯
2025-05-08 12:14:13
印巴沖突,中式裝備實戰(zhàn)效果驚人,中國的“敵對勢力”應(yīng)該小心了

印巴沖突,中式裝備實戰(zhàn)效果驚人,中國的“敵對勢力”應(yīng)該小心了

明叔雜談
2025-05-07 15:27:13
網(wǎng)傳臺球女助教涉“特殊服務(wù)”,記者暗訪調(diào)查

網(wǎng)傳臺球女助教涉“特殊服務(wù)”,記者暗訪調(diào)查

揚子晚報
2025-05-07 18:42:16
中國向世界宣告!新冠是美故意制造傳播,是該給全世界一個答案了

中國向世界宣告!新冠是美故意制造傳播,是該給全世界一個答案了

琉璃聊科學
2025-05-07 21:42:31
戴手套!戴手套!戴手套!致死率近100%

戴手套!戴手套!戴手套!致死率近100%

魯中晨報
2025-05-07 07:24:05
看看裁判波娃比賽中看趙心童的眼神,你就知道小伙子有多帥了

看看裁判波娃比賽中看趙心童的眼神,你就知道小伙子有多帥了

老高說體育
2025-05-08 11:59:49
加拿大零售商繞過美國中間商,與中國建立直接聯(lián)系

加拿大零售商繞過美國中間商,與中國建立直接聯(lián)系

參考消息
2025-05-08 09:44:13
超過6萬名乘客因無人機襲擊而滯留在俄羅斯機場

超過6萬名乘客因無人機襲擊而滯留在俄羅斯機場

桂系007
2025-05-08 09:27:02
飛天茅臺失守2000元,最難受的卻不是酒廠

飛天茅臺失守2000元,最難受的卻不是酒廠

中訪網(wǎng)
2025-05-08 10:15:11
66歲麥當娜被29歲黑人男友抱腿上,白到發(fā)光還無皺紋,卻引發(fā)爭議

66歲麥當娜被29歲黑人男友抱腿上,白到發(fā)光還無皺紋,卻引發(fā)爭議

一娛三分地
2025-05-06 19:33:48
2025-05-08 16:52:49
機器學習與Python社區(qū) incentive-icons
機器學習與Python社區(qū)
機器學習算法與Python
2949文章數(shù) 11008關(guān)注度
往期回顧 全部

科技要聞

OpenAI任命"應(yīng)用CEO" 奧特曼聚焦研究/安全

頭條要聞

國防部:做美國的朋友可能是致命的

頭條要聞

國防部:做美國的朋友可能是致命的

體育要聞

面對一群天賦怪,阿森納只能接受失敗

娛樂要聞

災(zāi)難性公關(guān) 毀掉曾黎二十年人緣積累

財經(jīng)要聞

57政策解讀:力度空前的系統(tǒng)性穩(wěn)增長舉措

汽車要聞

23.68萬元起 新款途觀L Pro限時優(yōu)惠5.8萬

態(tài)度原創(chuàng)

旅游
教育
時尚
手機
軍事航空

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

教育要聞

教育部大量撤銷的10個專業(yè),今年高考千萬別亂報!

主播塌房,他的人生如何被封殺?

手機要聞

真我宣布無憂備用機服務(wù)上線:維修提供備用機 0費用、0押金

軍事要聞

菲35號護衛(wèi)艇企圖侵闖中國黃巖島領(lǐng)海 南部戰(zhàn)區(qū)發(fā)聲

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 镇江市| 于都县| 新密市| 长白| 县级市| 石首市| 新闻| 方山县| 东安县| 内江市| 苗栗市| 北辰区| 无锡市| 鄂州市| 宁陵县| 肇州县| 鄢陵县| 金坛市| 山东| 紫云| 旬邑县| 青川县| 常德市| 烟台市| 农安县| 正蓝旗| 内丘县| 巴楚县| 合山市| 漳平市| 保康县| 泰宁县| 西峡县| 永济市| 疏附县| 铅山县| 平遥县| 建始县| 车险| 张家界市| 合山市|