99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

MindIE服務(wù)化部署實現(xiàn)監(jiān)控功能

0
分享至

作者 | 孫曉 李鋒

1 相關(guān)概念 1.1 MindIE 服務(wù)化監(jiān)控指標查詢接口

在 MindIE 服務(wù)化運行過程中,為了及時掌握服務(wù)的運行狀態(tài)、性能表現(xiàn)以及發(fā)現(xiàn)潛在問題,提供了服務(wù)監(jiān)控指標查詢接口(普羅 (Prometheus) 格式)。該接口能夠幫助開發(fā)者和運維人員獲取豐富的服務(wù)監(jiān)控指標數(shù)據(jù),為優(yōu)化服務(wù)配置、保障服務(wù)質(zhì)量提供有力支持。

本文將介紹如何使用 Prometheus 與 Grafana 來實現(xiàn) MindIE 服務(wù)可視化監(jiān)控功能。

當前接口支持以下指標監(jiān)控,詳情可以參考:服務(wù)監(jiān)控指標查詢接口(普羅格式)

https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0103.html

名稱 描述

請求相關(guān)指標

request_received_total

服務(wù)端接收到的推理請求總數(shù)。通過該指標可了解服務(wù)的訪問熱度。

request_success_total

推理成功的請求個數(shù),用于衡量服務(wù)的推理成功率。

request_failed_total

推理失敗的請求個數(shù),結(jié)合成功請求數(shù)可計算失敗率,評估服務(wù)的穩(wěn)定性。

num_requests_running

當前正在運行的請求個數(shù),反映服務(wù)當前的負載情況。

num_requests_waiting

當前等待處理的請求個數(shù),可用于判斷服務(wù)的處理能力是否滿足需求。

num_requests_swapped

當前被交換到 CPU 上的請求個數(shù),幫助了解資源調(diào)度情況。

num_preemptions_total

累計觸發(fā)請求搶占的次數(shù),用于分析服務(wù)資源競爭和調(diào)度策略的合理性。

Token 相關(guān)指標

prompt_tokens_total

處理的所有請求的輸入 prompt token 總數(shù),反映輸入數(shù)據(jù)量。

generation_tokens_total

推理后生成的 token 總數(shù),體現(xiàn)服務(wù)的輸出量。

avg_prompt_throughput_toks_per_s

平均 Prefill 吞吐量,衡量輸入階段的處理速度。

avg_generation_throughput_toks_per_s

平均 token 吞吐量,反映整體的推理生成速度。

request_prompt_tokens

請求輸入的 token 數(shù)量,用于分析單個請求的輸入規(guī)模。

request_generation_tokens

請求輸出的 token 數(shù)量,幫助了解單個請求的輸出規(guī)模。

性能和資源指標

failed_request_perc

推理失敗的請求率,直觀反映服務(wù)的可靠性。

npu_cache_usage_perc

KV Cache 的 NPU 顯存利用率,監(jiān)控 NPU 資源使用情況。

cpu_cache_usage_perc

KV Cache 的 CPU 利用率,掌握 CPU 資源使用狀況。

npu_prefix_cache_hit_rate

NPU 卡上 prefix cache 的命中率,評估緩存的使用效率。

時延指標

time_to_first_token_seconds

首 token 時延,衡量請求推理生成首個 token 的速度,對實時性要求較高的場景至關(guān)重要。

time_per_output_token_seconds

token 生成時延,反映連續(xù)生成 token 之間的時間間隔,影響服務(wù)的響應流暢度。

e2e_request_latency_seconds

端到端時延,代表請求從接收到執(zhí)行完成的總耗時,綜合體現(xiàn)服務(wù)的整體性能。

1.2 Prometheus 是什么

Prometheus 是一個開源的系統(tǒng)監(jiān)控和報警工具包,最初由 SoundCloud 開發(fā),現(xiàn)在是 Cloud Native Computing Foundation(CNCF)的一部分。Prometheus 以其強大的數(shù)據(jù)收集和查詢能力、易于擴展和高可用性在行業(yè)內(nèi)得到了廣泛應用。以下是 Prometheus 的核心概念:

  • 時間序列數(shù)據(jù)庫:Prometheus 主要用于存儲時間序列數(shù)據(jù),即帶有時間戳的指標數(shù)據(jù)。每個時間序列由一個指標名和一組標簽(key-value 對)標識。

  • 多維數(shù)據(jù)模型:Prometheus 的數(shù)據(jù)模型基于指標名稱和標簽,可以靈活地對監(jiān)控數(shù)據(jù)進行分類和過濾,從而實現(xiàn)復雜的查詢和分析。

  • PromQL:Prometheus 查詢語言(PromQL)用于實時查詢和分析存儲在 Prometheus 中的數(shù)據(jù)。它支持豐富的運算符和函數(shù),能夠滿足多種監(jiān)控和報警需求.

1.3 Grafana 是什么

Grafana 是一個開源的可視化和監(jiān)控平臺,廣泛應用于數(shù)據(jù)分析、監(jiān)控和報警。它支持多種數(shù)據(jù)源,提供豐富的可視化工具,使用戶能夠創(chuàng)建交互式的儀表盤。以下是 Grafana 的核心功能:

  • 數(shù)據(jù)可視化:Grafana 提供了多種圖表類型,包括折線圖、柱狀圖、餅圖、熱圖等,用戶可以通過拖拽的方式輕松創(chuàng)建和自定義儀表盤。

  • 支持多種數(shù)據(jù)源:Grafana 支持從多種數(shù)據(jù)源獲取數(shù)據(jù),包括 Prometheus、InfluxDB、Graphite、Elasticsearch、MySQL、PostgreSQL 等。

  • 靈活的查詢和過濾:通過集成的數(shù)據(jù)源查詢語言,Grafana 允許用戶靈活地對數(shù)據(jù)進行過濾、聚合和轉(zhuǎn)換。每種數(shù)據(jù)源都有專門的查詢編輯器,幫助用戶編寫查詢語句。

  • 報警和通知:Grafana 提供強大的報警功能,允許用戶基于查詢結(jié)果設(shè)置報警規(guī)則。當條件滿足時,可以通過郵件、Slack、PagerDuty 等多種渠道發(fā)送通知。

  • 用戶管理和權(quán)限控制:Grafana 提供詳細的用戶管理和權(quán)限控制功能,支持用戶、團隊和組織的管理。用戶可以根據(jù)需要設(shè)置不同的訪問權(quán)限,保護敏感數(shù)據(jù)。

2 實踐記錄 2.1 Prometheus 安裝

Prometheus 安裝方法參考:

https://prometheus.cloudnative.io/di-san-zhang-prometheus/di-2-jie-an-zhuang/installation

為方便起見,本次實踐筆者采用預編譯二進制文件安裝方法,在 Windows PC 上安裝。

安裝地址:https://prometheus.io/download/


2.2 Grafana 安裝

Grafana 同樣支持在不同操作系統(tǒng)安裝,詳見教程 https://grafana.com/docs/grafana/latest/setup-grafana/installation/

本次實踐選擇在 Windows 安裝,安裝地址 https://grafana.com/grafana/download?platform=windows


2.3 MindIE Service 服務(wù)部署啟動

需在服務(wù)器啟動 MindIE-Service 服務(wù),服務(wù)啟動教程不做贅述。

由于 MindIE 服務(wù)和 Prometheus+Grafana 在不同主機啟動,因此注意配置 config.json 文件。修改 ipAddress 和 managementIpAddress 為服務(wù)器 IP,保證 Prometheus+Grafana 服務(wù)可訪問該 IP 地址。同時需要注意端口設(shè)置。


另外,需要確保啟動服務(wù)前開啟服務(wù)化監(jiān)控開關(guān),開啟服務(wù)化監(jiān)控功能的命令如下:

export MIES_SERVICE_MONITOR_MODE=1

參考:https://www.hiascend.com/document/detail/zh/mindie/10RC3/mindieservice/servicedev/mindie_service0251.html


嘗試使用 curl 命令驗證 metricsPort 輸出正常:curl http://{ip}:{port}/metrics

發(fā)現(xiàn)能返回普羅格式 metric 輸出


2.4 啟動 Prometheus 和 Grafana

Step1 修改 prometheus 安裝目錄下的 promethues.yml 文件,添加 MindIE 服務(wù)的 IP 和 metricsport


點擊 Prometheus 安裝目錄下的 promethrus.exe 和 Grafana 安裝目錄下的 bin/grafana-server.exe 啟動 Prometheus 和 Grafana

Step2 打開 Grafana http://localhost:3000 ,預設(shè)賬號密碼是 admin@admin,第一次登錄會需要修改密碼。


Step3 點擊 Connection > Data sources > Add new data source,選擇 prometheus,之后把 prometheus 的 URL http://localhost:9090 / 填上去,點擊最下面 Save & test。


Step4 之后可以在 Grafana 頁面建立 dashboard,在 Home-Dashboards-New dashboard 建立 dashboard, Dashboard 手動構(gòu)建較麻煩,可以參考一些 Grafana 教程 https://imageslr.com/2024/grafana.html


好在可以通過 json 格式輸入或 json 文件 import 快速構(gòu)建 dashboard

這里選擇參考下面 vllm 的 grafana json 文件,將其中的 vllm: 字段去掉(因為 MindIE 的 metrics 字段和 vllm 的 metric 有區(qū)別)

http://www.gitpp.com/digiman/vllm/-/blob/main/examples/production_monitoring/grafana.json?ref_type=heads


最終得到 MindIE 指標監(jiān)控看板界面


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
震驚!李寧官方旗艦店直播間像捅了馬蜂窩,全都是為嬋寶鳴不平…

震驚!李寧官方旗艦店直播間像捅了馬蜂窩,全都是為嬋寶鳴不平…

火山詩話
2025-05-08 12:49:53
恭喜德布勞內(nèi)!空降意甲爭冠!3年長約+承諾核心,欲復仇曼城

恭喜德布勞內(nèi)!空降意甲爭冠!3年長約+承諾核心,欲復仇曼城

阿泰希特
2025-05-08 12:12:49
北青青年報這束光,曾照亮過司法前進的路!

北青青年報這束光,曾照亮過司法前進的路!

兵叔評說
2025-05-08 00:10:54
印巴大戰(zhàn)爆發(fā):地面部隊交火已造成150人傷亡,印軍6架戰(zhàn)機被摧毀

印巴大戰(zhàn)爆發(fā):地面部隊交火已造成150人傷亡,印軍6架戰(zhàn)機被摧毀

史政先鋒
2025-05-07 10:27:45
戴手套!戴手套!戴手套!致死率近100%

戴手套!戴手套!戴手套!致死率近100%

魯中晨報
2025-05-07 07:24:05
女子穿工裝吃九元拉面,被拉面店員工嘲笑威脅,當事人再回應!

女子穿工裝吃九元拉面,被拉面店員工嘲笑威脅,當事人再回應!

阿纂看事
2025-05-07 17:15:51
炸了!烏克蘭無人機襲擊了俄閱兵飛行特技表演隊基地

炸了!烏克蘭無人機襲擊了俄閱兵飛行特技表演隊基地

史政先鋒
2025-05-08 10:11:00
印巴沖突驚現(xiàn)“孤勇者”客機,戰(zhàn)云密布中直飛北京!

印巴沖突驚現(xiàn)“孤勇者”客機,戰(zhàn)云密布中直飛北京!

Ck的蜜糖
2025-05-08 12:07:40
66歲麥當娜被29歲黑人男友抱腿上,白到發(fā)光還無皺紋,卻引發(fā)爭議

66歲麥當娜被29歲黑人男友抱腿上,白到發(fā)光還無皺紋,卻引發(fā)爭議

一娛三分地
2025-05-06 19:33:48
接班李隼沒戲?秦志戩被放棄,王勵勤遇困難,國乒總教練人選出爐

接班李隼沒戲?秦志戩被放棄,王勵勤遇困難,國乒總教練人選出爐

忠橙家族
2025-05-08 14:35:47
陳麗君致歉網(wǎng)暴仍鋪天蓋地,南大教授苗懷明:我只是做了我該做的

陳麗君致歉網(wǎng)暴仍鋪天蓋地,南大教授苗懷明:我只是做了我該做的

揚子晚報
2025-05-08 09:08:27
印巴都贏了:擊落6架印戰(zhàn)機是假消息,印度摧毀恐怖組織是真的

印巴都贏了:擊落6架印戰(zhàn)機是假消息,印度摧毀恐怖組織是真的

移光幻影
2025-05-08 13:02:05
“最直接表態(tài)”,外媒:烏克蘭央行行長稱,烏方考慮放棄美元作為參考貨幣

“最直接表態(tài)”,外媒:烏克蘭央行行長稱,烏方考慮放棄美元作為參考貨幣

環(huán)球網(wǎng)資訊
2025-05-08 13:49:35
網(wǎng)傳臺球女助教涉“特殊服務(wù)”,記者暗訪調(diào)查

網(wǎng)傳臺球女助教涉“特殊服務(wù)”,記者暗訪調(diào)查

揚子晚報
2025-05-07 18:42:16
大四本科生已發(fā)14篇SCI論文,初中就已申請發(fā)明專利?學校工作人員回應:已記錄情況并匯報

大四本科生已發(fā)14篇SCI論文,初中就已申請發(fā)明專利?學校工作人員回應:已記錄情況并匯報

紅星新聞
2025-05-08 12:46:43
6729元!蘋果突然官宣:5月8日,正式上架!

6729元!蘋果突然官宣:5月8日,正式上架!

科技堡壘
2025-05-08 11:47:35
火箭老板:謝潑德沒機會是因為我們戰(zhàn)績好,若他首發(fā)80場也能場均20分

火箭老板:謝潑德沒機會是因為我們戰(zhàn)績好,若他首發(fā)80場也能場均20分

懂球帝
2025-05-08 15:25:39
又見雙面人!曝著名女星辱華,錄音曝光大罵中國人,遭劇方除名

又見雙面人!曝著名女星辱華,錄音曝光大罵中國人,遭劇方除名

界史
2025-05-08 11:23:40
電磁彈射艦暫停了?075五號艦秘密開工,中國兩棲戰(zhàn)力布局生變

電磁彈射艦暫停了?075五號艦秘密開工,中國兩棲戰(zhàn)力布局生變

Hi秒懂科普
2025-05-07 15:17:03
威少19+5,掘金慘敗雷霆43分!還驗出頭號打鐵匠:投籃18中3!

威少19+5,掘金慘敗雷霆43分!還驗出頭號打鐵匠:投籃18中3!

球場沒跑道
2025-05-08 12:18:24
2025-05-08 16:59:00
開源中國 incentive-icons
開源中國
每天為開發(fā)者推送最新技術(shù)資訊
7024文章數(shù) 34404關(guān)注度
往期回顧 全部

科技要聞

OpenAI任命"應用CEO" 奧特曼聚焦研究/安全

頭條要聞

國防部:做美國的朋友可能是致命的

頭條要聞

國防部:做美國的朋友可能是致命的

體育要聞

面對一群天賦怪,阿森納只能接受失敗

娛樂要聞

災難性公關(guān) 毀掉曾黎二十年人緣積累

財經(jīng)要聞

57政策解讀:力度空前的系統(tǒng)性穩(wěn)增長舉措

汽車要聞

23.68萬元起 新款途觀L Pro限時優(yōu)惠5.8萬

態(tài)度原創(chuàng)

親子
游戲
手機
房產(chǎn)
公開課

親子要聞

意外懷孕吧,在線求姨媽

游民采訪《死亡擱淺2》主創(chuàng):小島的創(chuàng)作風格令人興奮

手機要聞

真我宣布無憂備用機服務(wù)上線:維修提供備用機 0費用、0押金

房產(chǎn)要聞

廣州樓市全線飄紅!二手增長20%,一手暴漲244.7%!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 公安县| 辉南县| 邢台市| 兴安县| 育儿| 南木林县| 阳江市| 礼泉县| 抚顺县| 东乌| 义马市| 双柏县| 嘉定区| 泸溪县| 绥江县| 罗定市| 赤水市| 通渭县| 棋牌| 宁蒗| 张家口市| 灵石县| 苗栗市| 三穗县| 浪卡子县| 弥渡县| 昂仁县| 富阳市| 浦城县| 竹北市| 奇台县| 克拉玛依市| 永德县| 谷城县| 伊金霍洛旗| 恭城| 图木舒克市| 古蔺县| 平江县| 柏乡县| 兴业县|