網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

清華創(chuàng)業(yè)團(tuán)隊(duì)打造！國(guó)內(nèi)首個(gè)專注AI推理Serverless GPU平臺(tái)

2025-05-28 14:38:56　來源: 機(jī)器之心Pro

北京舉報(bào)

分享至

機(jī)器之心發(fā)布

共績(jī)算力

你有沒有遇到過這樣的算力困境：買了 GPU，用不了幾次就閑置燒錢，偶爾想用的時(shí)候卻一卡難求？

現(xiàn)在，國(guó)內(nèi)終于有了自己的 RunPod——共績(jī)?cè)?AI 推理 Serverless 平臺(tái)，不僅支持極簡(jiǎn)快速部署，而且超級(jí)低價(jià) ——RTX 4090最高只要 1.68 元/小時(shí)，還能按毫秒計(jì)費(fèi)、自動(dòng)擴(kuò)容，真正做到了 “隨用隨租”。

這款來自清華系創(chuàng)業(yè)團(tuán)隊(duì)產(chǎn)品，似乎正在悄悄重塑 AI 推理的游戲規(guī)則。而現(xiàn)在，你也可以參與其中并享受優(yōu)惠！

1.68 元/小時(shí)的 RTX 4090 基礎(chǔ)上，即日起至 6 月 18 日，新用戶注冊(cè)并充值，將額外獲得20%積分！另外，用戶還可以通過邀請(qǐng)碼為自己和朋友賺取更多積分（各得50元積分）。

官網(wǎng)鏈接：suanli.cn

下面我們就來看看為什么你應(yīng)該將以上鏈接復(fù)制到瀏覽器，然后打開并注冊(cè)使用！另外，你還將了解共績(jī)算力究竟是如何打造出了中國(guó)版的 RunPod。

下面，就來看看這個(gè)清華創(chuàng)業(yè)團(tuán)隊(duì)的技術(shù)創(chuàng)新和模式創(chuàng)新吧！

當(dāng)前 AI 推理算力市場(chǎng)存在結(jié)構(gòu)性問題

隨著 AI 應(yīng)用的落地增長(zhǎng)，推理算力的需求持續(xù)提升。然而，當(dāng)下國(guó)內(nèi)的算力服務(wù)市場(chǎng)存在結(jié)構(gòu)性問題，使得推理計(jì)算成本居高不下，成為制約 AI 應(yīng)用大規(guī)模落地的 “隱形瓶頸”。

服務(wù)僵化，彈性不足：流量高峰時(shí)，GPU 一卡難求，應(yīng)用卡頓，用戶流失；流量低谷時(shí)，預(yù)購算力大量閑置，白白燒錢。剛性供給與彈性需求之間的矛盾，直接影響了 AI 應(yīng)用的效率和用戶體驗(yàn)。
模式傳統(tǒng)，阻礙增長(zhǎng)：多數(shù)廠商要求長(zhǎng)租，高昂的固定投入讓創(chuàng)業(yè)公司望而卻步，阻礙業(yè)務(wù)快速迭代和試錯(cuò)。
管理繁瑣 & 效率低下：跨平臺(tái)資源調(diào)度、復(fù)雜環(huán)境配置、持續(xù)運(yùn)維投入…… 大量工程師的精力被基礎(chǔ)設(shè)施 “綁架”，無法專注于產(chǎn)品創(chuàng)新。
供需錯(cuò)配，一卡難求：算力資源建設(shè)粗放，精細(xì)化運(yùn)營(yíng)缺失，算力供需嚴(yán)重不匹配，一方面有大量閑置算力資源未能被有效利用，另一方面，短租高性能 GPU 卻 “一卡難求”。

這些問題共同構(gòu)成了 AI 算力市場(chǎng)的 “彈性、穩(wěn)定、低價(jià)” 不可能三角。在現(xiàn)有模式下，企業(yè)往往只能在這三者中選擇其二，難以兼得。例如，追求極致彈性可能犧牲穩(wěn)定性或增加成本；追求穩(wěn)定和低價(jià)則可能失去彈性。這種困境成為 AI 開發(fā)者普遍面臨的巨大挑戰(zhàn)。

多數(shù)云平臺(tái)提供的三類服務(wù)：整租（低價(jià) & 穩(wěn)定）、按量租（高價(jià) & 穩(wěn)定）、搶占式 SPOT 實(shí)例（低價(jià) & 彈性）

傳統(tǒng) GPU 整租模式，其設(shè)計(jì)初衷更多是為了滿足持續(xù)、高負(fù)載的 AI 訓(xùn)練任務(wù)。然而，AI 推理的特點(diǎn)是請(qǐng)求量波動(dòng)大、突發(fā)性強(qiáng)、單次請(qǐng)求耗時(shí)短。這種模式與 AI 推理的實(shí)際需求存在根本性的不匹配。當(dāng)流量稀疏時(shí)，大量預(yù)購的 GPU 閑置，產(chǎn)生高昂的 “空閑成本”；當(dāng)流量激增時(shí)，又因擴(kuò)容慢而導(dǎo)致用戶排隊(duì)或服務(wù)中斷。這使得 AI 應(yīng)用的成本居高不下，商業(yè)模式難以閉環(huán)，從而阻礙了 AI 應(yīng)用的廣泛部署和創(chuàng)新。

剛性供給與彈性需求之間的矛盾，直接影響了 AI 應(yīng)用成本和用戶體驗(yàn)

Serverless GPU：重塑 AI 應(yīng)用部署范式

Serverless 計(jì)算是一種云原生開發(fā)模型，它將底層服務(wù)器的管理和維護(hù)工作完全抽象化，由云服務(wù)提供商負(fù)責(zé)。開發(fā)者只需將代碼打包成容器或函數(shù)，即可部署應(yīng)用。其核心優(yōu)勢(shì)在于：按需付費(fèi)（閑置不收費(fèi)）、自動(dòng)伸縮（根據(jù)需求彈性擴(kuò)縮容）、以及極大地簡(jiǎn)化運(yùn)維

將 GPU 能力與 Serverless 模式結(jié)合，意味著 AI 開發(fā)者可以按需調(diào)用強(qiáng)大的 GPU 算力，無需預(yù)先購買和維護(hù)昂貴的硬件，也無需擔(dān)心資源閑置。特別適用于 AI 推理這種計(jì)算密集型、但請(qǐng)求量不穩(wěn)定的工作負(fù)載，能夠大幅縮短處理時(shí)間，優(yōu)化成本。這種模式也適用于實(shí)時(shí)和批量推理、3D 渲染、大數(shù)據(jù)分析等典型用例。

Serverless 架構(gòu)工作機(jī)制示意

全球 Serverless GPU 市場(chǎng)正在蓬勃發(fā)展。在 AI 算力服務(wù)領(lǐng)域，國(guó)外已有先行者，如RunPod，其 Serverless 產(chǎn)品提供了按時(shí)計(jì)費(fèi)、零出入網(wǎng)費(fèi)、支持多種 GPU 型號(hào)、容器化部署、閃電般冷啟動(dòng)等優(yōu)勢(shì)。主要服務(wù)于 AI 訓(xùn)練和推理工作負(fù)載。

Runpod.io

但同時(shí)，國(guó)內(nèi)卻缺少專注于 Serverless GPU 服務(wù)的平臺(tái)，少數(shù)提供 Serverless GPU 服務(wù)的平臺(tái)往往資源極少（因?yàn)閴贺洺杀具^高），難以實(shí)現(xiàn)快速穩(wěn)定的擴(kuò)縮，使得多數(shù)本土應(yīng)用難以進(jìn)行大批量的 Serverless 部署，制約了 AI 應(yīng)用的增長(zhǎng)。

共績(jī)算力：專注 Serverless GPU 推理服務(wù)

在這一行業(yè)痛點(diǎn)日益凸顯之際，“共績(jī)算力”（suanli.cn）應(yīng)運(yùn)而生。專注提供 Serverless GPU 推理服務(wù)，打破行業(yè) “不可能三角”，實(shí)現(xiàn)真正的彈性&穩(wěn)定&低價(jià)，讓 AI 開發(fā)者不受算力制約，專注于產(chǎn)品本身，創(chuàng)造無限可能。

為支撐 AI 應(yīng)用的快速部署，共績(jī)算力平臺(tái)為 AI 推理服務(wù)部署打造了極簡(jiǎn)流程，為 AI 開發(fā)者帶來了多重核心價(jià)值，真正實(shí)現(xiàn)以下特性：

極致彈性，隨時(shí)擴(kuò)縮

隨流量快速擴(kuò)縮容：流量激增時(shí)秒級(jí)擴(kuò)容，流量回落時(shí)縮容歸零，告別浪費(fèi)與排隊(duì)。

毫秒級(jí)按量計(jì)費(fèi)：AI 模型推理有請(qǐng)求才付費(fèi)，沒請(qǐng)求不花錢，徹底告別空閑成本。

部署極簡(jiǎn)，無縫遷移

Docker 容器化：五步部署，一鍵托管，快速上云，實(shí)現(xiàn)真正 “零運(yùn)維”。

兼容各類平臺(tái)：提供預(yù)制鏡像與 7x24h 免費(fèi)技術(shù)支持，可順滑遷移。

資源管飽，價(jià)格最優(yōu)

獨(dú)家調(diào)度網(wǎng)絡(luò)：整合全國(guó)算力，提供萬卡資源。

保障充足低價(jià)：全網(wǎng)最實(shí)惠的算力（4090 單卡 1.68 元 /h，按量計(jì)費(fèi)）。

部署教程：實(shí)測(cè)兩分鐘內(nèi)完成部署。（手機(jī)也可操作）

支撐這一 “彈性、穩(wěn)定、低價(jià)” 算力服務(wù)的，是共績(jī)科技自研的閑時(shí)算力調(diào)度平臺(tái)。目前該平臺(tái)已經(jīng)調(diào)度整合了來自包括金山云、火山引擎在內(nèi)的 26 家智算平臺(tái)的算力資源，超越了單一云廠商的資源邊界，使得不可能三角變成可能，平臺(tái)不僅提供了 Serverless 的按需付費(fèi)特性，更通過資源整合擴(kuò)大了可用算力池，解決了 “供需錯(cuò)配” 這一結(jié)構(gòu)性問題。

共績(jī)科技團(tuán)隊(duì)擁有深厚的學(xué)術(shù)和技術(shù)背景，核心成員來自清華大學(xué)、北京大學(xué)以及 Intel、字節(jié)跳動(dòng)、阿里等知名企業(yè)。團(tuán)隊(duì)在分布式資源調(diào)度領(lǐng)域深耕多年，目前已承建青海省、河北省省級(jí)算力調(diào)度平臺(tái)，具備極強(qiáng)的工程落地能力，suanli.cn 已累計(jì)服務(wù) 90 余家人工智能企業(yè)。曾獲 2024 年互聯(lián)網(wǎng) + 亞軍（金獎(jiǎng)，創(chuàng)業(yè)組冠軍），并已獲得奇績(jī)創(chuàng)壇、水木創(chuàng)投等知名機(jī)構(gòu)的投資。

全網(wǎng)低價(jià)，助力 AI 創(chuàng)新

共績(jī)?cè)?AI 推理 Serverless 平臺(tái)

上線優(yōu)惠活動(dòng)

NVIDIA RTX 4090 單卡推理，價(jià)格最高 1.68 元 / 小時(shí)！

即日起至 6 月 18 日，新用戶注冊(cè)并充值，額外贈(zèng)送 20% 積分！

邀請(qǐng)好友，通過您的邀請(qǐng)碼成功拉新，您和被邀請(qǐng)人各得 50 元積分！

：活動(dòng)期間，通過共績(jī)科技官方網(wǎng)站登錄用戶后臺(tái)，選擇在線充值即可自動(dòng)參與并獲得贈(zèng)送金額。具體活動(dòng)細(xì)則以官網(wǎng)屆時(shí)公布為準(zhǔn)。

想要開啟您的 AI 推理新紀(jì)元，讓算力不再是您創(chuàng)新的瓶頸？

立即訪問：suanli.cn

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.