99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepSeek開源周壓軸神器:3FS文件系統(tǒng),讀取吞吐量達(dá)6.6TiB/s!再次打臉OpenAI?

0
分享至

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自頭部科技

文丨都保杰

在DeepSeek開源周的最后一天,壓軸出場(chǎng)的是Fire-Flyer文件系統(tǒng) (3FS),一種利用現(xiàn)代SSD和RDMA網(wǎng)絡(luò)的全部帶寬并行文件系統(tǒng),以及基于此系統(tǒng)的數(shù)據(jù)處理框架Smallpond。


從性能參數(shù)來看,3FS文件系統(tǒng)助力實(shí)現(xiàn)了180節(jié)點(diǎn)集群中高達(dá)6.6TiB/s的聚合讀取吞吐量級(jí),達(dá)到數(shù)據(jù)傳輸性能的前沿水平。

在25節(jié)點(diǎn)集群中GraySort基準(zhǔn)測(cè)試的吞吐量為3.66TiB/min,每個(gè)客戶端節(jié)點(diǎn)的KVCache查找峰值吞吐量超過40GiB/s,值得關(guān)注的是,Smallpond框架還可進(jìn)一步擴(kuò)展以處理PB級(jí)數(shù)據(jù)集。



網(wǎng)友們紛紛稱贊:“這些基準(zhǔn)正在為AI數(shù)據(jù)處理樹立新的標(biāo)桿!3FS可能會(huì)徹底改變?nèi)斯ぶ悄堋⒖茖W(xué)研究等領(lǐng)域的數(shù)據(jù)密集型工作流程。”

“堪稱文件系統(tǒng)中的尤塞恩·博爾特,開源這款渦輪增壓猛獸就像是免費(fèi)為AI社區(qū)提供了加速引擎,讓其他人都能爭(zhēng)先恐后地跟上。”

“難以置信,你們創(chuàng)造了真正的技術(shù)價(jià)值,期待V4+R2!”

與DeepSeek這邊風(fēng)景不同的是,今天同步推出的GPT-4.5模型正在因貴到離譜的價(jià)格受到吐槽,OpenAI這波操作要徹底失去人心了?

01 高性能數(shù)據(jù)處理的“秘訣”


具體而言,F(xiàn)ire-Flyer文件系統(tǒng)(3FS)是一種高性能分布式文件系統(tǒng),旨在應(yīng)對(duì)當(dāng)前AI訓(xùn)練和推理工作負(fù)載的挑戰(zhàn)。

它利用現(xiàn)代SSD和RDMA網(wǎng)絡(luò)來提供共享存儲(chǔ)層,從而簡(jiǎn)化分布式應(yīng)用程序的開發(fā),主要功能和優(yōu)勢(shì)包括包括兩個(gè)方面:


1、性能和可用性

分解式架構(gòu)結(jié)合了數(shù)千個(gè)SSD的吞吐量和數(shù)百個(gè)存儲(chǔ)節(jié)點(diǎn)的網(wǎng)絡(luò)帶寬,使應(yīng)用程序能夠以不受位置影響的方式訪問存儲(chǔ)資源。

強(qiáng)一致性實(shí)現(xiàn)帶有分配查詢(CRAQ)的鏈?zhǔn)綇?fù)制以實(shí)現(xiàn)強(qiáng)一致性,從而使應(yīng)用程序代碼簡(jiǎn)單且易于推理。

文件接口開發(fā)由事務(wù)鍵值存儲(chǔ)支持的無狀態(tài)元數(shù)據(jù)服務(wù),文件接口眾所周知且隨處可用,無需學(xué)習(xí)新的存儲(chǔ)API。

2、多樣化的工作負(fù)載

數(shù)據(jù)準(zhǔn)備將數(shù)據(jù)分析管道的輸出組織成分層目錄結(jié)構(gòu),并有效地管理大量中間輸出。

數(shù)據(jù)加載器通過跨計(jì)算節(jié)點(diǎn)隨機(jī)訪問訓(xùn)練樣本,消除了預(yù)取或混洗數(shù)據(jù)集的需要,此外,檢查點(diǎn)支持大規(guī)模訓(xùn)練的高吞吐量并行檢查點(diǎn)。

用于推理的KVCache提供了一種基于DRAM的緩存的經(jīng)濟(jì)高效的替代方案,可提供高吞吐量和更大的容量。


DeepSeek展示了一個(gè)大型3FS集群的讀壓測(cè)吞吐情況。

該集群由180個(gè)存儲(chǔ)節(jié)點(diǎn)組成,每個(gè)存儲(chǔ)節(jié)點(diǎn)配備2×200Gbps InfiniBand網(wǎng)卡和16個(gè)14TiB NVMe SSD。大約500+個(gè)客戶端節(jié)點(diǎn)用于讀壓測(cè),每個(gè)客戶端節(jié)點(diǎn)配置1x200Gbps InfiniBand網(wǎng)卡。在訓(xùn)練作業(yè)的背景流量下,最終聚合讀吞吐達(dá)到約6.6TiB/s。


關(guān)于灰度排序,DeepSeek團(tuán)隊(duì)利用GraySort基準(zhǔn)對(duì)smallpond進(jìn)行了評(píng)估,該基準(zhǔn)可衡量大規(guī)模數(shù)據(jù)集的排序性能。

測(cè)試集群由25個(gè)存儲(chǔ)節(jié)點(diǎn)和50個(gè)計(jì)算節(jié)點(diǎn)組成。對(duì)8192個(gè)分區(qū)中的110.5TiB數(shù)據(jù)進(jìn)行排序耗時(shí)30分14秒,平均吞吐量為3.66TiB/分鐘。


從技術(shù)布局來看,基于DuckDB和3FS構(gòu)建的輕量級(jí)數(shù)據(jù)處理框架smallpond,已經(jīng)為擴(kuò)展處理PB級(jí)數(shù)據(jù)集做好了技術(shù)準(zhǔn)備。


至此,堪稱技術(shù)干貨滿滿的DeepSeek開源周正式結(jié)束,關(guān)鍵技術(shù)點(diǎn)在github社區(qū)吸引了非常高的關(guān)注度。

02 貴到離譜!OpenAI打出“情商”牌

趕在DeepSeek開源周結(jié)束之際,封閉模型代表OpenAI發(fā)布了一款迄今為止最大、最貴的AI模型GPT-4.5研究預(yù)覽版本,由于沒有太驚艷地超越各項(xiàng)測(cè)試基準(zhǔn),因此備受爭(zhēng)議。


OpenAI官方表示,GPT-4.5是無監(jiān)督學(xué)習(xí)前沿的模型,交互感覺更加自然,它的知識(shí)庫(kù)更廣泛更有深度,跟蹤用戶意圖的能力也更強(qiáng),而且“情商”更高。

這讓它在提高寫作、編程和解決實(shí)際問題等任務(wù)上非常有用,它知道何時(shí)要進(jìn)一步跟用戶對(duì)話,何時(shí)向用戶提供大量信息,擅長(zhǎng)代理規(guī)劃和執(zhí)行。

值得肯定的亮點(diǎn)是,通過擴(kuò)展無監(jiān)督學(xué)習(xí),GPT-4.5提高了其識(shí)別模式、建立聯(lián)系和產(chǎn)生創(chuàng)造性見解的能力,從而無需推理,相比OpenAI旗下其他模型而言,在SimpleQA基準(zhǔn)測(cè)試中,GPT-4.5實(shí)現(xiàn)了更高的準(zhǔn)確度(62.5%)和更低的幻覺度(37.1%)。


但與DeepSeek的開源性價(jià)比路線大相徑庭,GPT-4.5服務(wù)價(jià)格比自家的4o貴15倍,比4o-mini貴了近250倍,API價(jià)格高達(dá)75美元/100萬個(gè)輸入代幣和150美元/100萬個(gè)輸出代幣,可能不適合大多數(shù)生產(chǎn)用例,在價(jià)格方面創(chuàng)下了新的“行業(yè)紀(jì)錄”。


根據(jù)LiveBench最新的評(píng)測(cè)榜單,GPT-4.5確實(shí)是目前最好的非思維模型,總體得分高于Anthropic最新發(fā)布的“混合推理模型”Cladue 3.7 Sonnet基礎(chǔ)型號(hào),但靠“情商”這個(gè)賣點(diǎn)打出令人瞠目結(jié)舌的價(jià)格,網(wǎng)友們覺得不值。


可能也是擔(dān)心會(huì)被網(wǎng)友吐槽,OpenAI創(chuàng)始人Sam Altman并未出席參加GPT-4.5的線上發(fā)布直播,但在事后發(fā)了一個(gè)帖子進(jìn)行解釋。



Altman在帖子里說:“好消息:這是第一個(gè)讓我感覺像是在和一個(gè)有思想的人交談的模型。我驚訝地發(fā)現(xiàn)能從人工智能那里得到很好的建議。

壞消息:這是一個(gè)龐大且昂貴的型號(hào)。我們真的很想同時(shí)推出plus和pro用戶版本,但是我們的GPU已經(jīng)不夠用了,下周我們將添加數(shù)萬個(gè)GPU,然后再將其推廣到plus層。

注意:這不是一個(gè)推理模型,不會(huì)超越基準(zhǔn)。這是一種不同類型的智能,它有一種我從未感受過的魔力。真的很期待人們?nèi)L試它!”


至于在產(chǎn)品發(fā)布時(shí)干什么去了?Altman回復(fù)說:在醫(yī)院照顧我的孩子。

網(wǎng)友評(píng)論稱,DeepSeek拋出來的都是滿滿的技術(shù)干貨而且免費(fèi)分享,OpenAI拿出來個(gè)雞肋還要獅子大開口,拋開成本談能力就是耍流氓,對(duì)它沒有期待了。

03 “備戰(zhàn)”下一代模型

DeepSeek的下一代開源模型會(huì)挑戰(zhàn)GPT-4.5所謂的“高情商”么??jī)r(jià)格會(huì)定成多少?這或許是接下來市場(chǎng)上最有趣的一場(chǎng)較量。

下一代AI模型怎么搞是個(gè)問題,需要有人改進(jìn)效率,也需要有人去探路。

目前來看GPT-4.5這次發(fā)布展示技術(shù)趨勢(shì)的成分遠(yuǎn)大于對(duì)商業(yè)層面的考量,也算是為整個(gè)行業(yè)在AI模型的探索前沿試了一次水,正如OpenAI聯(lián)創(chuàng)Greg Brockman所言,這是在下一規(guī)模級(jí)別訓(xùn)練的模型。


OpenAI團(tuán)隊(duì)預(yù)測(cè),更有力的推理即將出現(xiàn)。GPT-4.5在做出反應(yīng)之前不會(huì)進(jìn)行很長(zhǎng)的思考,這使得它的優(yōu)勢(shì)與OpenAI o1等推理模型截然不同,與OpenAI o3-mini、DeepSeek R1相比,GPT-4.5是一種原生就更智能的模型。

OpenAI團(tuán)隊(duì)似乎想借此發(fā)布機(jī)會(huì)表示預(yù)訓(xùn)練和推理將相輔相成,隨著GPT-4.5等模型通過預(yù)訓(xùn)練變得更加智能和知識(shí)淵博,它們將成為高階AI代理更為強(qiáng)大的模型基礎(chǔ)。

而DeepSeek開源周所展示的技術(shù),從各種核心架構(gòu)、加速技術(shù)和數(shù)據(jù)處理方式來看,都暗示已經(jīng)為進(jìn)一步打造更大更智能的AI模型鋪好了路。

開源模型和封閉式AI路線之間雖然在技術(shù)理念和商業(yè)利益上有沖突,但在技術(shù)的交匯和碰撞中,具有跨代意義的超級(jí)AI模型或許不遠(yuǎn)了。

GPU算力按需租用

A100/H100 GPU算力按需租用,

秒級(jí)計(jì)費(fèi),平均節(jié)省開支30%以上!

掃碼了解詳情?


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
第43屆香港金像獎(jiǎng),這次算是“涼透”了,吳鎮(zhèn)宇的話說對(duì)了

第43屆香港金像獎(jiǎng),這次算是“涼透”了,吳鎮(zhèn)宇的話說對(duì)了

八卦南風(fēng)
2025-04-29 15:49:18
廈門機(jī)場(chǎng)工地驚現(xiàn)2條巨蟒,一條重達(dá)百斤,現(xiàn)場(chǎng)一片嘩然

廈門機(jī)場(chǎng)工地驚現(xiàn)2條巨蟒,一條重達(dá)百斤,現(xiàn)場(chǎng)一片嘩然

史海流年號(hào)
2025-05-02 09:35:11
無人機(jī)跟拍下的視角,巴基斯坦空軍殲10CE戰(zhàn)斗機(jī)起飛

無人機(jī)跟拍下的視角,巴基斯坦空軍殲10CE戰(zhàn)斗機(jī)起飛

三叔的裝備空間
2025-05-02 11:51:42
41歲三級(jí)片女星下嫁山東農(nóng)村,2婚酒席條件簡(jiǎn)陋,更多內(nèi)幕曝光

41歲三級(jí)片女星下嫁山東農(nóng)村,2婚酒席條件簡(jiǎn)陋,更多內(nèi)幕曝光

聚合大娛
2025-03-05 11:52:51
王猛:盧不用西蒙斯&下半場(chǎng)用巴圖姆 做得恰到好處

王猛:盧不用西蒙斯&下半場(chǎng)用巴圖姆 做得恰到好處

直播吧
2025-05-02 15:01:10
又一次全國(guó)大拆遷開始了?這次和10年前暴富的那一次有啥區(qū)別?

又一次全國(guó)大拆遷開始了?這次和10年前暴富的那一次有啥區(qū)別?

巢客HOME
2025-05-01 05:35:04
烏克蘭失蹤女記者羅什奇娜遺體被發(fā)現(xiàn),生前遭俄軍酷刑折磨致死

烏克蘭失蹤女記者羅什奇娜遺體被發(fā)現(xiàn),生前遭俄軍酷刑折磨致死

國(guó)際情爆猿
2025-05-01 10:01:17
南陽(yáng)鄧州市中心醫(yī)院原黨委書記黃河清被查

南陽(yáng)鄧州市中心醫(yī)院原黨委書記黃河清被查

大河健康
2025-05-02 16:01:18
馬筱梅前夫硬剛到底!亮出證件,再發(fā)文!體面近零!筱梅受訪回應(yīng)

馬筱梅前夫硬剛到底!亮出證件,再發(fā)文!體面近零!筱梅受訪回應(yīng)

鑫鑫說說
2025-05-01 10:35:47
火箭稱趙心童會(huì)改寫歷史,亨得利警告:當(dāng)心他進(jìn)入狀態(tài)令觀眾屏息

火箭稱趙心童會(huì)改寫歷史,亨得利警告:當(dāng)心他進(jìn)入狀態(tài)令觀眾屏息

行舟問茶
2025-05-02 08:49:31
天氣 | 天津大風(fēng)預(yù)警!馬上有雨!帶傘+多穿!

天氣 | 天津大風(fēng)預(yù)警!馬上有雨!帶傘+多穿!

天津廣播
2025-05-02 13:59:33
天津醫(yī)科大學(xué)就業(yè)調(diào)查:就業(yè)越來越難,不做醫(yī)生,考公考編成趨勢(shì)

天津醫(yī)科大學(xué)就業(yè)調(diào)查:就業(yè)越來越難,不做醫(yī)生,考公考編成趨勢(shì)

勛哥教你填志愿
2025-05-02 12:22:42
咱就是說這尼姑裝怪不得李治不理智了

咱就是說這尼姑裝怪不得李治不理智了

楓塵余往逝
2025-05-01 02:48:28
六臺(tái):馬競(jìng)詢問安東尼情況,曼聯(lián)愿4000萬到5000萬歐出售球員

六臺(tái):馬競(jìng)詢問安東尼情況,曼聯(lián)愿4000萬到5000萬歐出售球員

懂球帝
2025-05-02 09:43:09
iOS 19深度劇透:蘋果這次真的要“改寫手機(jī)操作系統(tǒng)規(guī)則”了?

iOS 19深度劇透:蘋果這次真的要“改寫手機(jī)操作系統(tǒng)規(guī)則”了?

明美無限
2025-05-02 18:18:14
西班牙一女子,將太陽(yáng)注冊(cè)為私人財(cái)產(chǎn),要求每人交1美元,聯(lián)合國(guó)出資50萬美元購(gòu)買!

西班牙一女子,將太陽(yáng)注冊(cè)為私人財(cái)產(chǎn),要求每人交1美元,聯(lián)合國(guó)出資50萬美元購(gòu)買!

譚老師地理工作室
2025-04-28 15:14:09
湖人出局一天后!三人成非賣品,補(bǔ)強(qiáng)方向確定,東契奇扛旗在即

湖人出局一天后!三人成非賣品,補(bǔ)強(qiáng)方向確定,東契奇扛旗在即

阿柒體訊
2025-05-02 09:25:14
中考后回頭看,才發(fā)現(xiàn)那些考不上高中的孩子,大多都有這些特征

中考后回頭看,才發(fā)現(xiàn)那些考不上高中的孩子,大多都有這些特征

好爸育兒
2025-04-29 10:04:43
薪火相傳:時(shí)隔二十年 新狼王率隊(duì)復(fù)仇湖人

薪火相傳:時(shí)隔二十年 新狼王率隊(duì)復(fù)仇湖人

北青網(wǎng)-北京青年報(bào)
2025-05-02 19:23:04
中國(guó)資產(chǎn)爆發(fā)!多只中概股大漲,港股猛拉!

中國(guó)資產(chǎn)爆發(fā)!多只中概股大漲,港股猛拉!

證券時(shí)報(bào)e公司
2025-05-02 11:18:22
2025-05-02 20:03:00
大數(shù)據(jù)文摘 incentive-icons
大數(shù)據(jù)文摘
專注大數(shù)據(jù),每日有分享!
6611文章數(shù) 94407關(guān)注度
往期回顧 全部

科技要聞

微軟CEO和奧特曼失了和,OpenAI被“斷糧”

頭條要聞

27年前承包的"荒沙地"變"天然牧草地" 農(nóng)戶未退耕獲刑

頭條要聞

27年前承包的"荒沙地"變"天然牧草地" 農(nóng)戶未退耕獲刑

體育要聞

為了湖人的28號(hào)秀,森林狼差點(diǎn)沒換來戈貝爾

娛樂要聞

霍啟剛郭晶晶夫婦現(xiàn)身馬麗新片首映

財(cái)經(jīng)要聞

黃仁勛在美國(guó)又穿西裝表態(tài),怎么看?

汽車要聞

全路況 大格局 前路山海皆坦途

態(tài)度原創(chuàng)

時(shí)尚
健康
手機(jī)
教育
公開課

5件襯衫粗暴種草!顯瘦遮肉人手一件!

唇皰疹和口腔潰瘍是"同伙"嗎?

手機(jī)要聞

5999元巨屏如今只值千元?實(shí)測(cè)vivo X Note揭露殘酷真相

教育要聞

小學(xué)只有語(yǔ)數(shù)外科目能真正學(xué)到知識(shí),其他科目幾乎都在浪費(fèi)時(shí)間!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 青阳县| 曲麻莱县| 莫力| 湘潭市| 宜川县| 韶关市| 阿尔山市| 赣州市| 郧西县| 上蔡县| 抚州市| 秭归县| 淮南市| 赤峰市| 道真| 马尔康县| 周至县| 府谷县| 西林县| 广昌县| 乌海市| 南充市| 上杭县| 平谷区| 夹江县| 慈溪市| 吐鲁番市| 盐津县| 广丰县| 酒泉市| 上饶市| 普安县| 哈尔滨市| 秦皇岛市| 会东县| 余姚市| 晴隆县| 斗六市| 金华市| 武陟县| 云龙县|