99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

探索 AI 工廠的創收潛力

0
分享至

“首次價值實現時間”是 AI 開發領域最重要的指標之一。



AI 正在為所有人創造價值,從藥物發現領域的研究人員到應對金融市場變化的量化分析師均受益匪淺。

AI 系統生成“token”(用于串聯輸出結果的數據單元)的速度越快,其影響力就越大。這正是 AI 工廠的關鍵所在,它提供了從“首 token 時延”到“首次價值實現時間”的最高效路徑。

AI 工廠正在重新定義現代基礎設施的經濟學。它們通過大規模地將數據轉化為有價值的輸出內容(無論是 token、預測、圖像、蛋白質還是其他形式的內容)來生產智能。

AI 工廠有助于提升 AI 應用流程中的三個關鍵環節:數據攝取、模型訓練和高吞吐量推理。通過三大核心技術棧(AI 模型、加速計算基礎設施和企業級軟件),AI 工廠能夠更快、更精準地生成 token。

下面將介紹 AI 工廠是如何幫助全球各地的企業把最寶貴的數字商品——數據轉化為創收潛力的。

從推理經濟學到價值創造

在構建 AI 工廠之前,理解推理經濟學至關重要,推理經濟學意味著如何平衡成本、能效和日益增長的 AI 需求。

吞吐量指模型可生成的 token 總量。延遲是模型在特定時間內輸出的 token 數量,通常以首 token 時延(用戶輸入提示后,模型生成第一個輸出 token 所需的時間)和“首 token 后,每個輸出 token 的時延”(生成每個額外 token 所需的時間)來衡量。有效吞吐量(Goodput)是一個較新的指標,用于衡量一個系統在滿足延遲目標的同時可交付的有用輸出量。

用戶體驗是所有軟件應用的關鍵所在,AI 工廠也不例外。高吞吐量意味著更智能的 AI,低延遲則確保了及時的響應。當這兩項指標實現合理平衡時,AI 工廠就可通過快速提供有用的輸出,帶來卓越的用戶體驗。

例如,響應時間為 0.5 秒的 AI 客服比 5 秒響應的 AI 客服更具吸引力和價值,即使兩者最終生成的 token 數量相同。

企業可借此機會為其推理輸出設定具有競爭力的價格,從而提升每個 token 的創收潛力。

衡量和可視化這種平衡頗具挑戰,而這正是“帕累托”前沿概念的用武之地。

AI 工廠輸出:高效 Token 的價值

如下圖所示,在規模化部署 AI 時,帕累托前沿有助于直觀地表明如何在沖突的目標(如快速響應與同時服務更多用戶)之間達到最優的平衡。



縱軸代表給定能耗下的吞吐效率(單位為 TPS,也就是每秒 token 數)。該數值越高,AI 工廠可同時處理的請求就越多。

橫軸表示單個用戶的 TPS,代表模型響應用戶給出首個提示的用時。該數值越高,預期的用戶體驗就越好。對于聊天機器人和實時分析工具等交互式應用,更低的延遲和快速的響應尤為重要。

帕累托前沿的最大值(顯示為曲線頂點)代表了特定運行配置下的最佳輸出。目標是為不同的 AI 工作負載和應用找到吞吐量與用戶體驗之間的最優平衡。

頂尖的 AI 工廠通過加速計算來提升“每瓦 token 數”,即在優化 AI 性能的同時大幅提高 AI 工廠和應用的能效。



以上展示的動畫對比了在 NVIDIA Hopper GPU(配置為每用戶每秒 32 個 token)與 NVIDIA Blackwell Ultra GPU(配置為每用戶每秒 344 個 token)上運行時的用戶體驗。在上述用戶體驗設置下,Blackwell Ultra 實現了 10 倍以上的體驗提升和近 5 倍的更高吞吐量,實現了最高達 50 倍的創收潛力。

AI 工廠的實際運行

AI 工廠是一個系統,它包含了一套將數據轉化為智能的組件。它不一定是高端的本地數據中心,也可能是在加速計算基礎設施上運行的 AI 專用云或混合模型,甚至可能是同時優化網絡并執行邊緣推理的電信基礎設施。

任何配備了軟件的加速計算基礎設施,只要能通過 AI 將數據轉化為智能,本質上均可視為 AI 工廠。

AI 工廠的組件包括了加速計算、網絡、軟件、存儲、系統以及工具和服務。

當用戶向 AI 系統輸入提示時,AI 工廠的全棧系統就開始工作。它將提示 token 化,也就是將數據轉化為圖像、聲音、文字片段等語義單元。

每個 token 被輸入到 GPU 驅動的 AI 模型中,隨之在模型上進行計算密集型推理,以生成最佳響應。每個 GPU 通過高速網絡和互連技術執行并行處理,從而同時處理海量數據。

對于來自全球用戶的各種提示,AI 工廠都會運行上述流程。這種實時推理能夠以工業級規模來生產智能。



由于 AI 工廠整合了整個 AI 生命周期,該系統能夠持續改進:記錄推理過程,標記邊緣案例以進行再訓練,優化循環隨時間逐漸收斂。這一切均無需人工干預,這就是“有效吞吐量”的實際體現。

面向 AI 工廠的 NVIDIA 全棧技術

AI 工廠將 AI 從一系列零散的實驗轉化為可擴展、可重復且可靠的創新與商業價值生成引擎。

NVIDIA 提供構建 AI 工廠所需的所有組件,包括加速計算、高性能 GPU、高帶寬網絡和優化的軟件。

例如,NVIDIA Blackwell GPU 可以通過網絡連接,采用液冷技術提升能效,并由 AI 軟件統一編排。

開源推理平臺 NVIDIA Dynamo 為 AI 工廠提供了一種操作系統,該系統旨在以最高的效率和最低的成本加速并擴展 AI。通過智能地路由、調度和優化推理請求,Dynamo 確保每個 GPU 周期都能得到充分利用,從而以峰值性能生產 token。

NVIDIA Blackwell GB200 NVL72 系統和 NVIDIA InfiniBand 網絡專為最大化“每瓦 token 吞吐量”而設計,使 AI 工廠在總吞吐量和低延遲方面均實現高效運行。

通過驗證優化后的全棧解決方案,企業可以高效地構建和維護前沿 AI 系統。全棧 AI 工廠助力企業實現卓越運營,使他們能更快、更自信地駕馭 AI 的潛力。

了解更多 AI 工廠如何重新定義數據中心并開啟 AI 新時代,請閱讀:https://blogs.nvidia.cn/blog/ai-factory/?sessionid=348830655

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
大度!梅西被波爾圖球員穿襠后,反而微笑著與對方擁抱

大度!梅西被波爾圖球員穿襠后,反而微笑著與對方擁抱

雷速體育
2025-06-20 08:58:36
“抱歉,我家住在0.5環”,女孩曬滿墻獎狀質問差生,卻自討沒趣

“抱歉,我家住在0.5環”,女孩曬滿墻獎狀質問差生,卻自討沒趣

熙熙說教
2025-06-19 20:02:36
魔獸:孩子小學作業:你的父親最擅長什么?魔獸世界!

魔獸:孩子小學作業:你的父親最擅長什么?魔獸世界!

魔獸世界研究所
2025-06-17 19:56:27
特朗普同意參戰,普京很無奈,伊朗向中方求援,英媒:中國出手了

特朗普同意參戰,普京很無奈,伊朗向中方求援,英媒:中國出手了

文雅筆墨
2025-06-19 20:06:05
汪峰拋棄森林北,寧靜放棄小鮮肉!?

汪峰拋棄森林北,寧靜放棄小鮮肉!?

八卦瘋叔
2025-06-20 12:09:34
餐館無償為拾荒老人提供8年午餐,店快倒閉時,老人搬來一個箱子

餐館無償為拾荒老人提供8年午餐,店快倒閉時,老人搬來一個箱子

五元講堂
2025-06-18 15:02:24
李嘉誠再次給出神預測!不出5年,90%的家庭恐難逃這5大現實難題

李嘉誠再次給出神預測!不出5年,90%的家庭恐難逃這5大現實難題

詩詞中國
2025-06-18 13:14:10
突發!伊朗凌晨發射2噸高爆15馬赫導彈,結果下一刻遭遇恥辱一幕

突發!伊朗凌晨發射2噸高爆15馬赫導彈,結果下一刻遭遇恥辱一幕

暮云晨記
2025-06-20 06:35:03
伊朗戰火下的真相:一位在伊朗的中國人發聲,這些都別信!

伊朗戰火下的真相:一位在伊朗的中國人發聲,這些都別信!

科學傭人
2025-06-19 06:08:06
長途自駕游思路打開了!給愛車買張“火車票”目的地見

長途自駕游思路打開了!給愛車買張“火車票”目的地見

北青網-北京青年報
2025-06-19 07:31:08
李連杰的名字沒了,《鏢人》爭議不斷,吳京400億票房夢要碎了

李連杰的名字沒了,《鏢人》爭議不斷,吳京400億票房夢要碎了

影視高原說
2025-06-19 07:55:34
“劃清界限”,越南通報全球

“劃清界限”,越南通報全球

小陸搞笑日常
2025-06-20 05:09:00
特朗普威脅出兵,不到24小時,中方亮明態度,伊朗拒絕任何談判

特朗普威脅出兵,不到24小時,中方亮明態度,伊朗拒絕任何談判

掌青說歷史
2025-06-19 15:43:47
國足迎來降薪,徐亮直播間鳴不平,如果降薪自己將去國外打球!

國足迎來降薪,徐亮直播間鳴不平,如果降薪自己將去國外打球!

史書無明
2025-06-19 22:13:01
總決賽歷史第20次搶七!上一次就在9年前的今天...

總決賽歷史第20次搶七!上一次就在9年前的今天...

直播吧
2025-06-20 11:19:16
0.00000005克可致命!400克殺死全人類!浙江有醫院1個月接診90人

0.00000005克可致命!400克殺死全人類!浙江有醫院1個月接診90人

FM93浙江交通之聲
2025-06-19 22:21:23
勁爆!特斯拉甩出單顆2500TOPS王炸芯片!比上一代直接翻了5倍!小鵬3顆芯片2200TOPS算力又落后了?

勁爆!特斯拉甩出單顆2500TOPS王炸芯片!比上一代直接翻了5倍!小鵬3顆芯片2200TOPS算力又落后了?

大白聊IT
2025-06-20 12:12:26
步行者3-3雷霆!賽后聽聽各界媒體專家怎么說,不靠哨子要飯

步行者3-3雷霆!賽后聽聽各界媒體專家怎么說,不靠哨子要飯

二月侃事
2025-06-20 13:33:10
“男怕夏至,女怕冬至”,明日夏至,提醒男人:4事不做,3物不吃

“男怕夏至,女怕冬至”,明日夏至,提醒男人:4事不做,3物不吃

神牛
2025-06-20 06:43:00
62歲韋唯現狀:車禍脊柱斷裂,前夫去世,三個混血孩子已回國

62歲韋唯現狀:車禍脊柱斷裂,前夫去世,三個混血孩子已回國

深析古今
2025-06-19 17:17:30
2025-06-20 16:12:49
NVIDIA英偉達中國 incentive-icons
NVIDIA英偉達中國
英偉達(中國)官方賬號
3098文章數 1379關注度
往期回顧 全部

科技要聞

余承東:HarmonyOS 6啟動開發者Beta

頭條要聞

伊朗10名核科學家被"特殊武器"暗殺 以高官披露細節

頭條要聞

伊朗10名核科學家被"特殊武器"暗殺 以高官披露細節

體育要聞

印城最穩之人!西卡雙手隔扣杰威霸氣側漏

娛樂要聞

“小鞏俐”周顯欣,如今49歲模樣大變

財經要聞

寶能汽車接盤威馬?“正交接資產”

汽車要聞

五項訂車禮/四款車型 一汽奧迪A5L正式開啟預售

態度原創

親子
房產
游戲
時尚
軍事航空

親子要聞

懷孕就要放棄喜愛的美食嗎

房產要聞

坑慘2000多人!恒大財富海南高管被曝非吸12.6億元!

《劍星》聯動《妮姬》新官方圖:伊芙大雷翹臀太吸睛!

等你到了50歲,夏季穿衣服牢記這3個原則,輕松告別油膩感

軍事要聞

以方:有能力摧毀伊朗所有核設施

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 崇左市| 绍兴市| 常州市| 栾城县| 师宗县| 辽中县| 南溪县| 保亭| 阳春市| 望都县| 诸暨市| 五常市| 蓬安县| 集安市| 山阴县| 于田县| 沂南县| 白银市| 达州市| 额尔古纳市| 武汉市| 亳州市| 苍溪县| 交口县| 宜城市| 三门峡市| 水城县| 耿马| 新乡市| 安溪县| 云浮市| 康乐县| 福清市| 商南县| 阳东县| 鸡泽县| 紫金县| 嘉兴市| 五峰| 邢台县| 东宁县|