中國(guó)創(chuàng)業(yè)公司DeepSeek模型成本引發(fā)熱議,并且造成股市震蕩。研究機(jī)構(gòu)SemiAnalysis今天報(bào)告指出,至今硬件繪圖處理器(GPU)支出遠(yuǎn)超過(guò)5億美元。
SemiAnalysis指中國(guó)對(duì)沖基金幻方量化(High-Flyer)2023年5月成立“深度求索”(DeepSeek)以推動(dòng)AI研發(fā),之前幻方量化2021年,也就是任何出口管制生效前,投資買了一萬(wàn)顆英偉達(dá)(Nvidia)A100 GPU。
故DeepSeek的GPU投資花費(fèi)超過(guò)5億美元。
英偉達(dá)根據(jù)法規(guī)要求,生產(chǎn)多款H100變化版如H800、H20。目前僅H20可銷售至中國(guó)。英偉達(dá)過(guò)去九個(gè)月生產(chǎn)超過(guò)百萬(wàn)顆專供中國(guó)市場(chǎng)的H20 GPU。報(bào)告分析,DeepSeek服務(wù)器總資本支出(CapEx)約16億美元。
DeepSeek從中國(guó)本土招募人才,目前約有150名員工,急速擴(kuò)張中。DeepSeek價(jià)格和性能這周因出現(xiàn)模型訓(xùn)練成本低于600萬(wàn)美元的說(shuō)法引起討論。但報(bào)告強(qiáng)調(diào)預(yù)訓(xùn)練成本僅占總成本小部分,不代表完整支出。
DeepSeek論文提到的600萬(wàn)美元成本指的是預(yù)訓(xùn)練運(yùn)行(pre-training run)的GPU成本,只占模型總成本部分,未計(jì)入的重要支出還包括研發(fā)(R&D)、硬件總擁有成本(Total Cost of Ownership)等關(guān)鍵因素。報(bào)告也提到DeepSeek獲大量算力資源與出口管制與時(shí)間滯后(lag)有關(guān)。
美國(guó)智庫(kù)蘭德公司(RAND)研究員海姆(Lennart Heim)近期分析,硬件出口管制有時(shí)間滯后,尚未完全發(fā)揮影響力。真正考驗(yàn)將出現(xiàn)在數(shù)據(jù)中心需升級(jí)或擴(kuò)展時(shí),這對(duì)美國(guó)企業(yè)較容易,但對(duì)受出口管制的中國(guó)企業(yè)而言就是挑戰(zhàn)。
SemiAnalysis也評(píng)價(jià),DeepSeek開放權(quán)重模型表現(xiàn)出色,超越Meta Llama、法國(guó)人工智能創(chuàng)業(yè)公司Mistral AI及其他競(jìng)爭(zhēng)者。
(首圖來(lái)源:DeepSeek)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.