整理|褚杏娟
近日,網(wǎng)上曝出 Lepton AI 已通知用戶,Lepton 將于 2025 年 5 月 20 日正式停止運(yùn)營(yíng),此后用戶將無(wú)法再訪問(wèn) Lepton AI 平臺(tái)上的服務(wù)或提交的數(shù)據(jù),建議用戶在該日期之前盡快下載或備份所需數(shù)據(jù)。服務(wù)終止時(shí),若用戶賬戶中仍有未使用的積分,官方將會(huì)在關(guān)停后予以退款處理。
不僅如此,官方網(wǎng)站已經(jīng)禁止新賬戶注冊(cè),顯示正在維護(hù)。
Lepton AI 的官方推特顯示也已經(jīng)被注銷。
就在大約兩周前,The Information 報(bào)道,英偉達(dá)已完成對(duì) Lepton AI 的收購(gòu),交易價(jià)值數(shù)億美元,知情人士透露稱創(chuàng)始人賈揚(yáng)清及聯(lián)合創(chuàng)始人白俊杰都已加入英偉達(dá),目前還不清楚具體擔(dān)任職位。
值得注意的是,黃仁勛還一直稱英偉達(dá)是一家軟件公司, Lepton Al 創(chuàng)始團(tuán)隊(duì)都是軟件方面的頂尖人才,或許這也是雙方契合的一點(diǎn)。
收購(gòu)消息剛被曝出來(lái)時(shí),許多人猜測(cè)英偉達(dá)收購(gòu)后是會(huì)僅保留機(jī)器學(xué)習(xí)人才、大砍業(yè)務(wù),還是會(huì)繼續(xù)運(yùn)營(yíng) Lepton AI 的云平臺(tái)。目前看來(lái),英偉達(dá)似乎更在意的人才,而非其相關(guān)具體業(yè)務(wù),畢竟如今已經(jīng)選擇了關(guān)閉服務(wù)。
對(duì)此,InfoQ 向 Lepton Al 方面進(jìn)行了求證,賈揚(yáng)清對(duì)此回應(yīng)稱: 無(wú)法評(píng)論,不過(guò)不是人才收購(gòu)。
交易完成時(shí) Lepton AI 約有 20 名員工,目前還未有消息指出這些員工的去留。英偉達(dá)此番價(jià)值可能達(dá)數(shù)億美元的收購(gòu),實(shí)現(xiàn)了讓 LeptonAI 投資方紅杉中國(guó)、CRV 和 Fusion Fund 較為可觀的退出,大約在兩年前他們參與了該公司 1100 萬(wàn)美元的種子輪融資。
起于“百模大戰(zhàn)”
Lepton AI 成立還不到兩年的時(shí)間。兩位創(chuàng)始人在業(yè)內(nèi)都頗有名氣:賈揚(yáng)清在博士期間創(chuàng)立并開(kāi)源了深度學(xué)習(xí)框架 Caffe,白俊杰是開(kāi)放式神經(jīng)網(wǎng)絡(luò)交換標(biāo)準(zhǔn) ONNX 的共同創(chuàng)始人以及 Caffe2 的核心開(kāi)發(fā)者。賈揚(yáng)清先后在谷歌、Meta 任職多年,2019 年 3 月起在阿里擔(dān)任技術(shù)副總裁。白俊杰也曾分別在 Meta、阿里云任職。兩人擔(dān)任 AI 研究員時(shí),共同開(kāi)發(fā)了 PyTorch 框架。
2023 年 3 月,賈揚(yáng)清離開(kāi)阿里云,四個(gè)月后宣布聯(lián)合創(chuàng)立了 Lepton AI。他們創(chuàng)業(yè)時(shí),正值國(guó)內(nèi)“百模大戰(zhàn)”,賈揚(yáng)清等人沒(méi)有直接入局大模型,而是選擇成為大模型的基礎(chǔ)設(shè)施提供商。不過(guò),他們自己沒(méi)有購(gòu)買 GPU,而是用租用的方式,然后對(duì)外提供算力租賃等服務(wù)。這種模式被稱為是典型的“人工智能即服務(wù) (AIaaS) ”,即通過(guò)云計(jì)算平臺(tái)預(yù)配人工智能 (AI) 服務(wù)和工具。
Lepton AI 整個(gè)團(tuán)隊(duì)主要在海外,所以目標(biāo)客戶主要為海外企業(yè)和國(guó)內(nèi)想要拓展海外市場(chǎng)的企業(yè)。官網(wǎng)顯示,Lepton 的服務(wù)主要包括:
全托管的 AI 云平臺(tái) Lepton:支持模型的開(kāi)發(fā)、訓(xùn)練和部署,包括開(kāi)箱即用的 Serverless 接口,兼容 OpenAI API;完全自定義的專屬推理接口;支持運(yùn)行分布式訓(xùn)練或批處理作業(yè)等。
企業(yè)版 Lepton:管理節(jié)點(diǎn)組,同時(shí)允許用戶使用自有服務(wù)器創(chuàng)建自托管的節(jié)點(diǎn)組。
Python SDK,幫助用戶構(gòu)建 AI 應(yīng)用。
與 Lepton AI 同名的云平臺(tái)專為 AI 工作負(fù)載優(yōu)化,用戶可以在平臺(tái)上進(jìn)行模型訓(xùn)練和推理。該公司提供了一個(gè)可視化界面,幫助用戶在其云平臺(tái)上配置訓(xùn)練集群,并支持多款 Nvidia 顯卡選擇。對(duì)于需要并行訓(xùn)練多個(gè)模型的團(tuán)隊(duì),平臺(tái)還提供了一種集中管理每個(gè)項(xiàng)目分配硬件資源的工具。
在模型訓(xùn)練過(guò)程中,有時(shí)會(huì)出現(xiàn)降低輸出質(zhì)量的錯(cuò)誤,Lepton AI 的平臺(tái)具備檢測(cè)此類錯(cuò)誤的功能,同時(shí)還能發(fā)現(xiàn)更為隱蔽的技術(shù)問(wèn)題,比如神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過(guò)程中使用了超出預(yù)期的內(nèi)存等。
模型開(kāi)發(fā)完成后,Lepton AI 用戶可以將模型部署在平臺(tái)提供的推理優(yōu)化實(shí)例上。該平臺(tái)承諾,在推理過(guò)程中能夠?qū)崿F(xiàn)超過(guò)每秒 600 個(gè) token 的處理速度,同時(shí)將延遲控制在 10 毫秒以內(nèi)。平臺(tái)還具備自動(dòng)擴(kuò)展功能,當(dāng)推理需求增加時(shí),可自動(dòng)為客戶增加計(jì)算資源。
Lepton AI 還采用開(kāi)源工具 vLLM 來(lái)加速推理。該技術(shù)能夠?qū)⑾嗨频拇竽P吞崾竞喜⒊梢淮握?qǐng)求,從而減少模型所需處理的計(jì)算量。開(kāi)發(fā)者還可借助 vLLM 降低模型的內(nèi)存占用。
此前,賈揚(yáng)清在接受 時(shí)表示,團(tuán)隊(duì)在技術(shù)實(shí)現(xiàn)上沒(méi)用什么“黑科技”,而是將很多耳熟能詳?shù)膯吸c(diǎn)技術(shù)結(jié)合起來(lái),以實(shí)現(xiàn)成本的顯著降低,如大模型處理服務(wù)收到大量請(qǐng)求時(shí)的動(dòng)態(tài)批處理(Dynamic Batch)、用小模型預(yù)測(cè)數(shù)個(gè) token 的預(yù)測(cè)解碼等。具體如何實(shí)現(xiàn)單點(diǎn)技術(shù)的有機(jī)結(jié)合,就是他們工作的重點(diǎn)和難點(diǎn)。
期間,團(tuán)隊(duì)還基于 Lepton 做了一些產(chǎn)品 demo。比如,賈揚(yáng)清曾在其社交平臺(tái)分享了他基于 Lepton Al 實(shí)現(xiàn)的 AI 搜索引擎 (類似 Perplexity),而且只用了不到 500 行代碼。這個(gè)項(xiàng)目當(dāng)時(shí)引起了大家熱議,目前也已經(jīng)開(kāi)源,斬獲 8.1k 顆星。
Lepton Al 開(kāi)源了旨在通過(guò)主動(dòng)監(jiān)控 GPU 和有效管理 AI/ML 工作負(fù)載來(lái)確保 GPU 效率和可靠性的 GPUd。據(jù)悉,GPUd 基于團(tuán)隊(duì)多年來(lái)在 Meta、阿里云、Uber 和 Lepton AI 運(yùn)營(yíng)大規(guī)模 GPU 集群的經(jīng)驗(yàn)而構(gòu)建,能與 Docker、containerd、Kubernetes 和 Nvidia 生態(tài)系統(tǒng)等無(wú)縫集成。
“通過(guò)這些產(chǎn)品,我們可以展示自己在開(kāi)源模型上能做的事情,以及 Lepton 平臺(tái)幫助用戶構(gòu)建應(yīng)用的能力。”賈揚(yáng)清曾表示。團(tuán)隊(duì)希望通過(guò)這些產(chǎn)品或 demo 可以在用戶中形成好的口碑,當(dāng)有人需要部署大模型時(shí)就會(huì)想到 Lepton AI。
賈揚(yáng)清還積極對(duì)外分享最新的大模型進(jìn)展思考。比如 DeepSeek 爆火后,賈揚(yáng)清分析稱,它的成功更多體現(xiàn)了純粹的智慧與務(wù)實(shí):在計(jì)算資源和人力有限的前提下,通過(guò)聰明的研究方法,產(chǎn)出最好的成果。這與當(dāng)年 Alex Krizhevsky 在只有兩塊 GPU 的情況下造出 AlexNet 模型一樣,靠的不是超大規(guī)模集群,而是扎實(shí)的能力。
目前,賈揚(yáng)清的 x 分享停留在了 3 月中旬。
止步于算力巨頭的野望
AI 爆發(fā)后面臨的主要問(wèn)題就是缺算力。為了減少投入,不少企業(yè)“由買轉(zhuǎn)租”,這催生了算力租賃的誕生,算力租賃價(jià)格一年就可實(shí)現(xiàn)翻倍。
北美和歐洲地區(qū)仍是算力租賃市場(chǎng)的主導(dǎo)者。像 CoreWeave 是挖礦起家,英偉達(dá)通過(guò)投資支持、供貨保障等方式扶持 CoreWeave。CoreWeave 采用“GPU 即服務(wù)”(GAAS)模式,擁有 32 個(gè)數(shù)據(jù)中心,運(yùn)行超 25 萬(wàn) + GPU,主要服務(wù)微軟、英偉達(dá)、OpenAI、Meta、Google 等北美大客戶。而歐洲本地云服務(wù)商 Nebius,在芬蘭擁有一個(gè)部署了約 2 萬(wàn)個(gè) GPU 的數(shù)據(jù)中心。受益于歐洲扶持政策,Nebius 以短期租賃性價(jià)比取勝。值得注意的是,Nebius 也獲得了英偉達(dá)的投資。
值得注意的是, Lepton AI 與英偉達(dá)若干主要客戶的服務(wù)存在競(jìng)爭(zhēng)關(guān)系,其中包括 AI 云服務(wù)商 CoreWeave。賈揚(yáng)清去年 6 月時(shí)曾透露,Lepton AI 的客戶數(shù)量和整體營(yíng)收都處于非常健康的增長(zhǎng)狀態(tài),他對(duì)此也比較滿意,驗(yàn)證了團(tuán)隊(duì)之前的想法和產(chǎn)品在用戶中的接受度。
對(duì)于英偉達(dá)此次收購(gòu) Lepton Al 的目的,業(yè)內(nèi)猜測(cè)是其欲試圖完全掌控供應(yīng)鏈,而不僅僅是負(fù)責(zé)制造部分。與其只出售顯卡或 AI 芯片,英偉達(dá)選擇提供完整的解決方案:自己開(kāi)發(fā)芯片、組裝服務(wù)器、再提供租賃服務(wù)。這正是人們常說(shuō)的“垂直整合”——一家公司掌控從上游到下游的整個(gè)流程。
這種垂直整合策略讓英偉達(dá)能夠從芯片設(shè)計(jì)到算力租賃的全產(chǎn)業(yè)鏈中獲利,同時(shí)還能更好地控制其 GPU 芯片的使用方式和價(jià)格策略,進(jìn)一步增強(qiáng)其在 AI 計(jì)算領(lǐng)域的主導(dǎo)地位。
通過(guò)這一策略,英偉達(dá)還成功規(guī)避了一個(gè)行業(yè)中常見(jiàn)的問(wèn)題:庫(kù)存積壓。當(dāng)市場(chǎng)降溫、銷量下滑時(shí),許多公司往往會(huì)被大量滯銷的設(shè)備所拖累。但如果英偉達(dá)可以自己出租服務(wù)器,就能讓設(shè)備始終保持運(yùn)轉(zhuǎn)狀態(tài),同時(shí)還能繼續(xù)從中盈利。
SemiAnalysis 指出,通過(guò)收購(gòu) Lepton,英偉達(dá)不僅獲得了額外的收入來(lái)源,還可能擠壓其他云服務(wù)提供商的生存空間。通過(guò)打造這套自有體系,英偉達(dá)也更有能力與亞馬遜、谷歌和微軟等巨頭競(jìng)爭(zhēng),它們同樣在 AI 領(lǐng)域布局,并采用定制芯片(也就是常說(shuō)的 ASIC)提供服務(wù)。
這也對(duì)應(yīng)了黃仁勛的想法。他在今年 3 月的 GTC 大會(huì)上表示,英偉達(dá)不再是一家芯片公司,也不再是一家 AI 公司,而是一家算法和基礎(chǔ)設(shè)施公司。
目前,英偉達(dá)正在投入構(gòu)建 AI 基礎(chǔ)設(shè)施,規(guī)劃周期必須在上游和下游都延伸多年。黃仁勛想要把英偉達(dá)打造成一個(gè) AI 工廠,直接成為客戶的收入來(lái)源。“每個(gè)行業(yè)、每個(gè)國(guó)家、每家公司都來(lái)到這里,因?yàn)槲覀円呀?jīng)成為一個(gè)基礎(chǔ)平臺(tái),其他公司可以在此基礎(chǔ)上構(gòu)建自己的業(yè)務(wù)。”
https://www.theinformation.com/briefings/nvidia-closes-acquisition-gpu-cloud-startup-lepton
https://www.infoq.cn/article/w155KHeD4mR860s7cPEz?utm_source=chatgpt.com
https://siliconangle.com/2025/03/27/report-nvidia-close-acquiring-ai-cloud-provider-lepton-ai-nine-figure-deal/
https://tecfoco.com.br/nvidia-compra-lepton-ai-e-entra-de-vez-no-aluguel-de-servidores-com-ia
聲明:本文為 InfoQ 整理,不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止對(duì)全文或部分內(nèi)容進(jìn)行轉(zhuǎn)載。
InfoQ 老友!請(qǐng)留步!極客邦 1 號(hào)客服上線工作啦!
后續(xù)我將通過(guò)微信視頻號(hào),以視頻的形式持續(xù)更新技術(shù)話題、未來(lái)發(fā)展趨勢(shì)、創(chuàng)業(yè)經(jīng)驗(yàn)、商業(yè)踩坑教訓(xùn)等精彩內(nèi)容,和大家一同成長(zhǎng),開(kāi)啟知識(shí)交流之旅歡迎掃碼關(guān)注我的微信視頻號(hào)~
今日薦文
你也「在看」嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.