大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自頭部科技
文丨都保杰
在DeepSeek開源周的最后一天,壓軸出場(chǎng)的是Fire-Flyer文件系統(tǒng) (3FS),一種利用現(xiàn)代SSD和RDMA網(wǎng)絡(luò)的全部帶寬并行文件系統(tǒng),以及基于此系統(tǒng)的數(shù)據(jù)處理框架Smallpond。
從性能參數(shù)來看,3FS文件系統(tǒng)助力實(shí)現(xiàn)了180節(jié)點(diǎn)集群中高達(dá)6.6TiB/s的聚合讀取吞吐量級(jí),達(dá)到數(shù)據(jù)傳輸性能的前沿水平。
在25節(jié)點(diǎn)集群中GraySort基準(zhǔn)測(cè)試的吞吐量為3.66TiB/min,每個(gè)客戶端節(jié)點(diǎn)的KVCache查找峰值吞吐量超過40GiB/s,值得關(guān)注的是,Smallpond框架還可進(jìn)一步擴(kuò)展以處理PB級(jí)數(shù)據(jù)集。
網(wǎng)友們紛紛稱贊:“這些基準(zhǔn)正在為AI數(shù)據(jù)處理樹立新的標(biāo)桿!3FS可能會(huì)徹底改變?nèi)斯ぶ悄堋⒖茖W(xué)研究等領(lǐng)域的數(shù)據(jù)密集型工作流程。”
“堪稱文件系統(tǒng)中的尤塞恩·博爾特,開源這款渦輪增壓猛獸就像是免費(fèi)為AI社區(qū)提供了加速引擎,讓其他人都能爭(zhēng)先恐后地跟上。”
“難以置信,你們創(chuàng)造了真正的技術(shù)價(jià)值,期待V4+R2!”
與DeepSeek這邊風(fēng)景不同的是,今天同步推出的GPT-4.5模型正在因貴到離譜的價(jià)格受到吐槽,OpenAI這波操作要徹底失去人心了?
01 高性能數(shù)據(jù)處理的“秘訣”
具體而言,F(xiàn)ire-Flyer文件系統(tǒng)(3FS)是一種高性能分布式文件系統(tǒng),旨在應(yīng)對(duì)當(dāng)前AI訓(xùn)練和推理工作負(fù)載的挑戰(zhàn)。
它利用現(xiàn)代SSD和RDMA網(wǎng)絡(luò)來提供共享存儲(chǔ)層,從而簡(jiǎn)化分布式應(yīng)用程序的開發(fā),主要功能和優(yōu)勢(shì)包括包括兩個(gè)方面:
1、性能和可用性
分解式架構(gòu)結(jié)合了數(shù)千個(gè)SSD的吞吐量和數(shù)百個(gè)存儲(chǔ)節(jié)點(diǎn)的網(wǎng)絡(luò)帶寬,使應(yīng)用程序能夠以不受位置影響的方式訪問存儲(chǔ)資源。
強(qiáng)一致性實(shí)現(xiàn)帶有分配查詢(CRAQ)的鏈?zhǔn)綇?fù)制以實(shí)現(xiàn)強(qiáng)一致性,從而使應(yīng)用程序代碼簡(jiǎn)單且易于推理。
文件接口開發(fā)由事務(wù)鍵值存儲(chǔ)支持的無狀態(tài)元數(shù)據(jù)服務(wù),文件接口眾所周知且隨處可用,無需學(xué)習(xí)新的存儲(chǔ)API。
2、多樣化的工作負(fù)載
數(shù)據(jù)準(zhǔn)備將數(shù)據(jù)分析管道的輸出組織成分層目錄結(jié)構(gòu),并有效地管理大量中間輸出。
數(shù)據(jù)加載器通過跨計(jì)算節(jié)點(diǎn)隨機(jī)訪問訓(xùn)練樣本,消除了預(yù)取或混洗數(shù)據(jù)集的需要,此外,檢查點(diǎn)支持大規(guī)模訓(xùn)練的高吞吐量并行檢查點(diǎn)。
用于推理的KVCache提供了一種基于DRAM的緩存的經(jīng)濟(jì)高效的替代方案,可提供高吞吐量和更大的容量。
DeepSeek展示了一個(gè)大型3FS集群的讀壓測(cè)吞吐情況。
該集群由180個(gè)存儲(chǔ)節(jié)點(diǎn)組成,每個(gè)存儲(chǔ)節(jié)點(diǎn)配備2×200Gbps InfiniBand網(wǎng)卡和16個(gè)14TiB NVMe SSD。大約500+個(gè)客戶端節(jié)點(diǎn)用于讀壓測(cè),每個(gè)客戶端節(jié)點(diǎn)配置1x200Gbps InfiniBand網(wǎng)卡。在訓(xùn)練作業(yè)的背景流量下,最終聚合讀吞吐達(dá)到約6.6TiB/s。
關(guān)于灰度排序,DeepSeek團(tuán)隊(duì)利用GraySort基準(zhǔn)對(duì)smallpond進(jìn)行了評(píng)估,該基準(zhǔn)可衡量大規(guī)模數(shù)據(jù)集的排序性能。
測(cè)試集群由25個(gè)存儲(chǔ)節(jié)點(diǎn)和50個(gè)計(jì)算節(jié)點(diǎn)組成。對(duì)8192個(gè)分區(qū)中的110.5TiB數(shù)據(jù)進(jìn)行排序耗時(shí)30分14秒,平均吞吐量為3.66TiB/分鐘。
從技術(shù)布局來看,基于DuckDB和3FS構(gòu)建的輕量級(jí)數(shù)據(jù)處理框架smallpond,已經(jīng)為擴(kuò)展處理PB級(jí)數(shù)據(jù)集做好了技術(shù)準(zhǔn)備。
至此,堪稱技術(shù)干貨滿滿的DeepSeek開源周正式結(jié)束,關(guān)鍵技術(shù)點(diǎn)在github社區(qū)吸引了非常高的關(guān)注度。
02 貴到離譜!OpenAI打出“情商”牌
趕在DeepSeek開源周結(jié)束之際,封閉模型代表OpenAI發(fā)布了一款迄今為止最大、最貴的AI模型GPT-4.5研究預(yù)覽版本,由于沒有太驚艷地超越各項(xiàng)測(cè)試基準(zhǔn),因此備受爭(zhēng)議。
OpenAI官方表示,GPT-4.5是無監(jiān)督學(xué)習(xí)前沿的模型,交互感覺更加自然,它的知識(shí)庫(kù)更廣泛更有深度,跟蹤用戶意圖的能力也更強(qiáng),而且“情商”更高。
這讓它在提高寫作、編程和解決實(shí)際問題等任務(wù)上非常有用,它知道何時(shí)要進(jìn)一步跟用戶對(duì)話,何時(shí)向用戶提供大量信息,擅長(zhǎng)代理規(guī)劃和執(zhí)行。
值得肯定的亮點(diǎn)是,通過擴(kuò)展無監(jiān)督學(xué)習(xí),GPT-4.5提高了其識(shí)別模式、建立聯(lián)系和產(chǎn)生創(chuàng)造性見解的能力,從而無需推理,相比OpenAI旗下其他模型而言,在SimpleQA基準(zhǔn)測(cè)試中,GPT-4.5實(shí)現(xiàn)了更高的準(zhǔn)確度(62.5%)和更低的幻覺度(37.1%)。
但與DeepSeek的開源性價(jià)比路線大相徑庭,GPT-4.5服務(wù)價(jià)格比自家的4o貴15倍,比4o-mini貴了近250倍,API價(jià)格高達(dá)75美元/100萬個(gè)輸入代幣和150美元/100萬個(gè)輸出代幣,可能不適合大多數(shù)生產(chǎn)用例,在價(jià)格方面創(chuàng)下了新的“行業(yè)紀(jì)錄”。
根據(jù)LiveBench最新的評(píng)測(cè)榜單,GPT-4.5確實(shí)是目前最好的非思維模型,總體得分高于Anthropic最新發(fā)布的“混合推理模型”Cladue 3.7 Sonnet基礎(chǔ)型號(hào),但靠“情商”這個(gè)賣點(diǎn)打出令人瞠目結(jié)舌的價(jià)格,網(wǎng)友們覺得不值。
可能也是擔(dān)心會(huì)被網(wǎng)友吐槽,OpenAI創(chuàng)始人Sam Altman并未出席參加GPT-4.5的線上發(fā)布直播,但在事后發(fā)了一個(gè)帖子進(jìn)行解釋。
Altman在帖子里說:“好消息:這是第一個(gè)讓我感覺像是在和一個(gè)有思想的人交談的模型。我驚訝地發(fā)現(xiàn)能從人工智能那里得到很好的建議。
壞消息:這是一個(gè)龐大且昂貴的型號(hào)。我們真的很想同時(shí)推出plus和pro用戶版本,但是我們的GPU已經(jīng)不夠用了,下周我們將添加數(shù)萬個(gè)GPU,然后再將其推廣到plus層。
注意:這不是一個(gè)推理模型,不會(huì)超越基準(zhǔn)。這是一種不同類型的智能,它有一種我從未感受過的魔力。真的很期待人們?nèi)L試它!”
至于在產(chǎn)品發(fā)布時(shí)干什么去了?Altman回復(fù)說:在醫(yī)院照顧我的孩子。
網(wǎng)友評(píng)論稱,DeepSeek拋出來的都是滿滿的技術(shù)干貨而且免費(fèi)分享,OpenAI拿出來個(gè)雞肋還要獅子大開口,拋開成本談能力就是耍流氓,對(duì)它沒有期待了。
03 “備戰(zhàn)”下一代模型
DeepSeek的下一代開源模型會(huì)挑戰(zhàn)GPT-4.5所謂的“高情商”么??jī)r(jià)格會(huì)定成多少?這或許是接下來市場(chǎng)上最有趣的一場(chǎng)較量。
下一代AI模型怎么搞是個(gè)問題,需要有人改進(jìn)效率,也需要有人去探路。
目前來看GPT-4.5這次發(fā)布展示技術(shù)趨勢(shì)的成分遠(yuǎn)大于對(duì)商業(yè)層面的考量,也算是為整個(gè)行業(yè)在AI模型的探索前沿試了一次水,正如OpenAI聯(lián)創(chuàng)Greg Brockman所言,這是在下一規(guī)模級(jí)別訓(xùn)練的模型。
OpenAI團(tuán)隊(duì)預(yù)測(cè),更有力的推理即將出現(xiàn)。GPT-4.5在做出反應(yīng)之前不會(huì)進(jìn)行很長(zhǎng)的思考,這使得它的優(yōu)勢(shì)與OpenAI o1等推理模型截然不同,與OpenAI o3-mini、DeepSeek R1相比,GPT-4.5是一種原生就更智能的模型。
OpenAI團(tuán)隊(duì)似乎想借此發(fā)布機(jī)會(huì)表示預(yù)訓(xùn)練和推理將相輔相成,隨著GPT-4.5等模型通過預(yù)訓(xùn)練變得更加智能和知識(shí)淵博,它們將成為高階AI代理更為強(qiáng)大的模型基礎(chǔ)。
而DeepSeek開源周所展示的技術(shù),從各種核心架構(gòu)、加速技術(shù)和數(shù)據(jù)處理方式來看,都暗示已經(jīng)為進(jìn)一步打造更大更智能的AI模型鋪好了路。
開源模型和封閉式AI路線之間雖然在技術(shù)理念和商業(yè)利益上有沖突,但在技術(shù)的交匯和碰撞中,具有跨代意義的超級(jí)AI模型或許不遠(yuǎn)了。
GPU算力按需租用
A100/H100 GPU算力按需租用,
秒級(jí)計(jì)費(fèi),平均節(jié)省開支30%以上!
掃碼了解詳情?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.