人工智能的世界一直是“燒錢”大賽,AI公司訓練一個大模型,動輒就是上億美元的算力成本,GPU芯片一買就是上萬塊,就跟不要錢一樣。
可就在大家以為“沒錢玩不轉”時,一家叫DeepSeek(深度求索)的中國公司,直接來了個降維打擊——他們只用2000塊芯片,就打造出了世界級的AI系統,而別的公司起步就要1.6萬塊!
DeepSeek-R1使用MIT協議開源,意味著任何人都可以自由使用該模型,包括商業用途。用戶可以在DeepSeek官方網站和App使用官方提供的服務。
DeepSeek-R1上線時提供的API服務定價為每百萬輸入tokens 1元人民幣(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元,輸出API價格僅僅只有OpenAI o1的3%
消息一出,全球科技圈一片嘩然,金融市場甚至都跟著抖了三抖。DeepSeek是怎么做到的?他們到底用了哪些“黑科技”?今天我們就來揭開這場“AI界的價格屠夫”行動!
AI訓練有多燒錢?
要訓練一個AI大模型,你得讓它在海量數據里“泡澡”,學習各種知識,從寫詩、編程,到做菜、講笑話,全都得拿下。而這一切,都靠神經網絡來實現。
簡單來說,神經網絡就像一個超大號考試刷題機,它瘋狂分析數據,總結規律,不斷調整自己,直到能精準回答各種問題。可問題是,這種“刷題機”太費電,太費芯片了!
現在訓練頂級AI,一般都要用英偉達的GPU芯片,一塊4萬美元起步,組裝起來就是一臺超級計算機。這些AI公司動輒上萬塊GPU,光是電費都夠你買好幾套房。
所以,DeepSeek想到了一個問題:“有沒有可能,花更少的錢,辦更大的事?” 于是,他們找到了一條不走尋常路的捷徑——“混合專家”+“省位存儲”+“精確計算”!
第一招:“混合專家”,讓AI團隊分工明確!
一般AI公司訓練模型的方法是“一鍋煮”——所有任務都讓同一個大模型來學,不管是寫情詩,還是寫代碼,全都一視同仁。這就像讓一個人既當詩人,又當程序員,還得兼職醫生、物理學家……你說累不累?
DeepSeek的想法是:“何必讓一個人全干?干脆讓不同的專家各管一攤!”
于是,他們采用了 “混合專家”(Mixture of Experts,MoE)的方法,把AI拆分成很多個小專家 ,比如:
- 寫詩的專家:專門學怎么寫優美的詩歌;
- 編程的專家:專門研究代碼的邏輯;
- 生物學專家:專門鉆研生命科學;
- 物理學專家:負責牛頓、愛因斯坦的活兒……
然后,再加一個“通才”模型,就像一個主編,負責協調所有專家的工作。這么一來,AI訓練的效率大幅提升,因為每個部分都專注自己的領域,不需要所有數據都滿世界亂傳,節省了大量計算資源!
第二招:“省位存儲”,AI也能“壓縮數據”!
還記得你上學時老師講的圓周率 π 嗎?完整值是3.1415926535……,但一般我們只用3.14,因為精度夠用了。DeepSeek的AI訓練也用了類似的技巧。
傳統AI訓練時,每次計算都會用16位存儲,但DeepSeek的工程師發現,其實用8位存儲也夠用了!相當于數據壓縮了一半,但精度幾乎不受影響。
這就好比你買了一堆薯片,袋子看著挺大,但實際里面90%都是空氣。DeepSeek直接把這些“空氣”擠掉,只留真正有用的數據,一舉減少了一半的計算量!
第三招:“精確計算”,該摳的地方摳,該精準的地方精準!
當然,光是“省位存儲”還不夠,DeepSeek在計算時還用了一個妙招——“該省就省,該精確就精確”!
在做普通計算時,他們用8位存儲,節省計算量。但當模型做關鍵計算(比如決定AI怎么回答你的問題)時,他們會臨時把數據擴展到32位,確保計算結果足夠精確。
這就像,你平時做飯可以隨便撒鹽,但做蛋糕的時候,就得精準到克,不然味道全毀了!DeepSeek的AI訓練也是這個道理,在不影響結果的地方省錢,在關鍵地方下足功夫!
DeepSeek的成功,讓AI降本成現實!
DeepSeek的這些“省錢大法”,讓他們用2000塊芯片,就干出了1.6萬塊芯片的活兒,訓練成本只花了600萬美元,比Meta的十分之一!
這就像別人開法拉利燒油狂飆,DeepSeek直接造了輛節能超跑,跑得一樣快,還超級省油!
DeepSeek的成功告訴我們,AI訓練不一定非要砸錢,關鍵在于技術創新。他們的做法,未來可能會被更多公司采用,讓AI訓練成本大幅下降,讓AI技術更加普及!
所以,DeepSeek到底做對了什么?答案很簡單:他們不是靠“砸錢”取勝,而是靠“聰明”取勝!
未來,AI的價格戰才剛剛開始,我們拭目以待!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.