網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

DeepSeek開源周壓軸神器：3FS文件系統(tǒng)，讀取吞吐量達(dá)6.6TiB/s！再次打臉OpenAI？

2025-03-02 14:05:30　來源: 大數(shù)據(jù)文摘

北京舉報(bào)

分享至

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自頭部科技

文丨都保杰

在DeepSeek開源周的最后一天，壓軸出場(chǎng)的是Fire-Flyer文件系統(tǒng) (3FS)，一種利用現(xiàn)代SSD和RDMA網(wǎng)絡(luò)的全部帶寬并行文件系統(tǒng)，以及基于此系統(tǒng)的數(shù)據(jù)處理框架Smallpond。

從性能參數(shù)來看，3FS文件系統(tǒng)助力實(shí)現(xiàn)了180節(jié)點(diǎn)集群中高達(dá)6.6TiB/s的聚合讀取吞吐量級(jí)，達(dá)到數(shù)據(jù)傳輸性能的前沿水平。

在25節(jié)點(diǎn)集群中GraySort基準(zhǔn)測(cè)試的吞吐量為3.66TiB/min，每個(gè)客戶端節(jié)點(diǎn)的KVCache查找峰值吞吐量超過40GiB/s，值得關(guān)注的是，Smallpond框架還可進(jìn)一步擴(kuò)展以處理PB級(jí)數(shù)據(jù)集。

網(wǎng)友們紛紛稱贊：“這些基準(zhǔn)正在為AI數(shù)據(jù)處理樹立新的標(biāo)桿！3FS可能會(huì)徹底改變?nèi)斯ぶ悄堋⒖茖W(xué)研究等領(lǐng)域的數(shù)據(jù)密集型工作流程。”

“堪稱文件系統(tǒng)中的尤塞恩·博爾特，開源這款渦輪增壓猛獸就像是免費(fèi)為AI社區(qū)提供了加速引擎，讓其他人都能爭(zhēng)先恐后地跟上。”

“難以置信，你們創(chuàng)造了真正的技術(shù)價(jià)值，期待V4+R2！”

與DeepSeek這邊風(fēng)景不同的是，今天同步推出的GPT-4.5模型正在因貴到離譜的價(jià)格受到吐槽，OpenAI這波操作要徹底失去人心了？

01 高性能數(shù)據(jù)處理的“秘訣”

具體而言，F(xiàn)ire-Flyer文件系統(tǒng)（3FS）是一種高性能分布式文件系統(tǒng)，旨在應(yīng)對(duì)當(dāng)前AI訓(xùn)練和推理工作負(fù)載的挑戰(zhàn)。

它利用現(xiàn)代SSD和RDMA網(wǎng)絡(luò)來提供共享存儲(chǔ)層，從而簡(jiǎn)化分布式應(yīng)用程序的開發(fā)，主要功能和優(yōu)勢(shì)包括包括兩個(gè)方面：

1、性能和可用性

分解式架構(gòu)結(jié)合了數(shù)千個(gè)SSD的吞吐量和數(shù)百個(gè)存儲(chǔ)節(jié)點(diǎn)的網(wǎng)絡(luò)帶寬，使應(yīng)用程序能夠以不受位置影響的方式訪問存儲(chǔ)資源。

強(qiáng)一致性實(shí)現(xiàn)帶有分配查詢（CRAQ）的鏈?zhǔn)綇?fù)制以實(shí)現(xiàn)強(qiáng)一致性，從而使應(yīng)用程序代碼簡(jiǎn)單且易于推理。

文件接口開發(fā)由事務(wù)鍵值存儲(chǔ)支持的無狀態(tài)元數(shù)據(jù)服務(wù)，文件接口眾所周知且隨處可用，無需學(xué)習(xí)新的存儲(chǔ)API。

2、多樣化的工作負(fù)載

數(shù)據(jù)準(zhǔn)備將數(shù)據(jù)分析管道的輸出組織成分層目錄結(jié)構(gòu)，并有效地管理大量中間輸出。

數(shù)據(jù)加載器通過跨計(jì)算節(jié)點(diǎn)隨機(jī)訪問訓(xùn)練樣本，消除了預(yù)取或混洗數(shù)據(jù)集的需要，此外，檢查點(diǎn)支持大規(guī)模訓(xùn)練的高吞吐量并行檢查點(diǎn)。

用于推理的KVCache提供了一種基于DRAM的緩存的經(jīng)濟(jì)高效的替代方案，可提供高吞吐量和更大的容量。

DeepSeek展示了一個(gè)大型3FS集群的讀壓測(cè)吞吐情況。

該集群由180個(gè)存儲(chǔ)節(jié)點(diǎn)組成，每個(gè)存儲(chǔ)節(jié)點(diǎn)配備2×200Gbps InfiniBand網(wǎng)卡和16個(gè)14TiB NVMe SSD。大約500+個(gè)客戶端節(jié)點(diǎn)用于讀壓測(cè)，每個(gè)客戶端節(jié)點(diǎn)配置1x200Gbps InfiniBand網(wǎng)卡。在訓(xùn)練作業(yè)的背景流量下，最終聚合讀吞吐達(dá)到約6.6TiB/s。

關(guān)于灰度排序，DeepSeek團(tuán)隊(duì)利用GraySort基準(zhǔn)對(duì)smallpond進(jìn)行了評(píng)估，該基準(zhǔn)可衡量大規(guī)模數(shù)據(jù)集的排序性能。

測(cè)試集群由25個(gè)存儲(chǔ)節(jié)點(diǎn)和50個(gè)計(jì)算節(jié)點(diǎn)組成。對(duì)8192個(gè)分區(qū)中的110.5TiB數(shù)據(jù)進(jìn)行排序耗時(shí)30分14秒，平均吞吐量為3.66TiB/分鐘。

從技術(shù)布局來看，基于DuckDB和3FS構(gòu)建的輕量級(jí)數(shù)據(jù)處理框架smallpond，已經(jīng)為擴(kuò)展處理PB級(jí)數(shù)據(jù)集做好了技術(shù)準(zhǔn)備。

至此，堪稱技術(shù)干貨滿滿的DeepSeek開源周正式結(jié)束，關(guān)鍵技術(shù)點(diǎn)在github社區(qū)吸引了非常高的關(guān)注度。

02 貴到離譜！OpenAI打出“情商”牌

趕在DeepSeek開源周結(jié)束之際，封閉模型代表OpenAI發(fā)布了一款迄今為止最大、最貴的AI模型GPT-4.5研究預(yù)覽版本，由于沒有太驚艷地超越各項(xiàng)測(cè)試基準(zhǔn)，因此備受爭(zhēng)議。

OpenAI官方表示，GPT-4.5是無監(jiān)督學(xué)習(xí)前沿的模型，交互感覺更加自然，它的知識(shí)庫(kù)更廣泛更有深度，跟蹤用戶意圖的能力也更強(qiáng)，而且“情商”更高。

這讓它在提高寫作、編程和解決實(shí)際問題等任務(wù)上非常有用，它知道何時(shí)要進(jìn)一步跟用戶對(duì)話，何時(shí)向用戶提供大量信息，擅長(zhǎng)代理規(guī)劃和執(zhí)行。

值得肯定的亮點(diǎn)是，通過擴(kuò)展無監(jiān)督學(xué)習(xí)，GPT-4.5提高了其識(shí)別模式、建立聯(lián)系和產(chǎn)生創(chuàng)造性見解的能力，從而無需推理，相比OpenAI旗下其他模型而言，在SimpleQA基準(zhǔn)測(cè)試中，GPT-4.5實(shí)現(xiàn)了更高的準(zhǔn)確度（62.5%）和更低的幻覺度（37.1%）。

但與DeepSeek的開源性價(jià)比路線大相徑庭，GPT-4.5服務(wù)價(jià)格比自家的4o貴15倍，比4o-mini貴了近250倍，API價(jià)格高達(dá)75美元/100萬個(gè)輸入代幣和150美元/100萬個(gè)輸出代幣，可能不適合大多數(shù)生產(chǎn)用例，在價(jià)格方面創(chuàng)下了新的“行業(yè)紀(jì)錄”。

根據(jù)LiveBench最新的評(píng)測(cè)榜單，GPT-4.5確實(shí)是目前最好的非思維模型，總體得分高于Anthropic最新發(fā)布的“混合推理模型”Cladue 3.7 Sonnet基礎(chǔ)型號(hào)，但靠“情商”這個(gè)賣點(diǎn)打出令人瞠目結(jié)舌的價(jià)格，網(wǎng)友們覺得不值。

可能也是擔(dān)心會(huì)被網(wǎng)友吐槽，OpenAI創(chuàng)始人Sam Altman并未出席參加GPT-4.5的線上發(fā)布直播，但在事后發(fā)了一個(gè)帖子進(jìn)行解釋。

Altman在帖子里說：“好消息：這是第一個(gè)讓我感覺像是在和一個(gè)有思想的人交談的模型。我驚訝地發(fā)現(xiàn)能從人工智能那里得到很好的建議。

壞消息：這是一個(gè)龐大且昂貴的型號(hào)。我們真的很想同時(shí)推出plus和pro用戶版本，但是我們的GPU已經(jīng)不夠用了，下周我們將添加數(shù)萬個(gè)GPU，然后再將其推廣到plus層。

注意：這不是一個(gè)推理模型，不會(huì)超越基準(zhǔn)。這是一種不同類型的智能，它有一種我從未感受過的魔力。真的很期待人們?nèi)L試它！”

至于在產(chǎn)品發(fā)布時(shí)干什么去了？Altman回復(fù)說：在醫(yī)院照顧我的孩子。

網(wǎng)友評(píng)論稱，DeepSeek拋出來的都是滿滿的技術(shù)干貨而且免費(fèi)分享，OpenAI拿出來個(gè)雞肋還要獅子大開口，拋開成本談能力就是耍流氓，對(duì)它沒有期待了。

03 “備戰(zhàn)”下一代模型

DeepSeek的下一代開源模型會(huì)挑戰(zhàn)GPT-4.5所謂的“高情商”么？?jī)r(jià)格會(huì)定成多少？這或許是接下來市場(chǎng)上最有趣的一場(chǎng)較量。

下一代AI模型怎么搞是個(gè)問題，需要有人改進(jìn)效率，也需要有人去探路。

目前來看GPT-4.5這次發(fā)布展示技術(shù)趨勢(shì)的成分遠(yuǎn)大于對(duì)商業(yè)層面的考量，也算是為整個(gè)行業(yè)在AI模型的探索前沿試了一次水，正如OpenAI聯(lián)創(chuàng)Greg Brockman所言，這是在下一規(guī)模級(jí)別訓(xùn)練的模型。

OpenAI團(tuán)隊(duì)預(yù)測(cè)，更有力的推理即將出現(xiàn)。GPT-4.5在做出反應(yīng)之前不會(huì)進(jìn)行很長(zhǎng)的思考，這使得它的優(yōu)勢(shì)與OpenAI o1等推理模型截然不同，與OpenAI o3-mini、DeepSeek R1相比，GPT-4.5是一種原生就更智能的模型。

OpenAI團(tuán)隊(duì)似乎想借此發(fā)布機(jī)會(huì)表示預(yù)訓(xùn)練和推理將相輔相成，隨著GPT-4.5等模型通過預(yù)訓(xùn)練變得更加智能和知識(shí)淵博，它們將成為高階AI代理更為強(qiáng)大的模型基礎(chǔ)。

而DeepSeek開源周所展示的技術(shù)，從各種核心架構(gòu)、加速技術(shù)和數(shù)據(jù)處理方式來看，都暗示已經(jīng)為進(jìn)一步打造更大更智能的AI模型鋪好了路。

開源模型和封閉式AI路線之間雖然在技術(shù)理念和商業(yè)利益上有沖突，但在技術(shù)的交匯和碰撞中，具有跨代意義的超級(jí)AI模型或許不遠(yuǎn)了。

GPU算力按需租用

A100/H100 GPU算力按需租用，

秒級(jí)計(jì)費(fèi)，平均節(jié)省開支30%以上！

掃碼了解詳情?

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.