99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek走紅:不學OpenAI靠GPU堆砌效果,英偉達的天要塌了

0
分享至



雷遞網 樂天 1月26日

DeepSeek正成為AI領域崛起的“黑馬”。DeepSeek的橫空出世,打破了國內大模型原有格局。

本周,DeepSeek發布 DeepSeek-R1,并同步開源模型權重。DeepSeek-R1遵循MIT License,允許用戶通過蒸餾技術借助R1訓練其他模型。



DeepSeek-R1 上線 API,對用戶開放思維鏈輸出,通過設置 model='deepseek-reasoner' 即可調用。



DeepSeek-R1在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。

DeepSeek-R1在開源DeepSeek-R1-Zero和DeepSeek-R1兩個 660B模型的同時,通過 DeepSeek-R1 的輸出,蒸餾6個小模型開源給社區,其中 32B 和 70B 模型在多項能力上實現了對標OpenAI o1-mini 的效果。

DeepSeek-R1 API 服務定價為每百萬輸入 tokens 1 元(緩存命中)/ 4 元(緩存未命中),每百萬輸出 tokens 16元。

DeepSeek震動美國科技界,不僅是因為其性能上比肩OpenAI的o1,并完全開源,且以極低的成本實現了這一突破。

知名投資人馬克·安德森也表示:“DeepSeek R1 是我見過的最令人驚嘆和印象深刻的突破之一,作為開源項目,這是給世界的一份重要禮物。”

AI科技初創公司Scale AI創始人亞歷山大·王(Alexandr Wang)稱,過去十年來,美國可能一直在人工智能競賽中領先于中國,但DeepSeek的AI大模型發布可能會“改變一切”。DeepSeek的AI大模型性能大致與美國最好的模型相當。



Alexandr Wang認為,DeepSeek-R1與GPT-4o和Claude 3.5 Sonnet 相當,訓練時計算量減少10倍。DeepSeek-V3展示給外界的教訓是:在美國人休息時,中國人在工作,并以更便宜、更快、更強的產品迎頭趕上。

“The bitter lesson of Chinese tech: they work while America rests, and catch up cheaper, faster & stronger。”



Alexandr Wang出生于1997年,他于19歲那年從美國麻省理工學院輟學創立公司,如今,Scale AI估值超百億美元,獲得包括Y Combinator、英偉達、AMD風投、亞馬遜、Meta等投資,該公司為OpenAI、谷歌和 Meta等提供訓練數據。

DeepSeek的動作讓Meta的生成式AI團隊陷入恐慌。Meta CEO扎克伯格宣布加速研發 Llama 4,計劃投資650億美元擴建數據中心,并部署130萬枚 GPU 以“確保2025年 Meta AI 成為全球領先模型”。



DeepSeek創始人梁文鋒也迅速奠定在AI圈地位。

據介紹,梁文鋒本碩均就讀于浙江大學信息與電子工程學專業。2015年,梁文鋒與校友共同創立幻方量化。2021年,幻方量化成為國內首家突破千億規模的的量化私募大廠,被稱為國內量化私募“四大天王”之一。

早年,幻方量化開始大規模布局 AI 算力,搭建起“螢火一號”集群。2021年,“螢火二號”落成,這給了DeepSeek快速奔跑的底層支撐。

有評論人士稱,中國股民給世界AI最大的的貢獻就是讓幻方量化賺了那么多錢。然后幻方量化創始人有錢買最好的GPU,收納一批中國最牛的精英,做出了不錯的Deepseek。

預訓練方面,DeepSeek團隊的貢獻在于超強的訓練穩定度、深入使用fb8混合精度、多詞同時預測、隱空間多注意力頭,MOE混合專家等大大降低訓練成本,用600萬美元訓練一個600B的大模型,被是工程上的奇跡。



分析人士指出,DeepSeek用10-15分之一的成本就訓練出比肩Openai o1水平的模型R1,而R1還都開源,這意味著算法有太多提高空間,不需要那么多GPU,不需要那么多算力,封鎖芯片,搞算力壁壘的思路行不通,而OpenAI和Meta等美國企業靠GPU堆砌效果的模式也大打折扣。

DeepSeek還可能形成一個效應,那就是很多購買了數千塊NVIDIA芯片的AI初創公司都可能破產,從而導致大量NVIDIA GPU 流入二手市場。此外,還有一些初創公司的模式是運營數據中心(例如Coreweave),并將NVIDIA GPU 出租給其他公司,以期獲得投資回報。最后,七巨頭最終將開始放緩或削減來自NVIDIA的未來訂單,有關NVIDIA的一切都會開始瓦解。

這可能刺激更多專用推理模型誕生,而創業公司、個人App等可能會大幅減少在OpenAI API上的支出,轉向開源。



另有評論人士稱,DeepSeek的橫空出世,體驗后發現其整合搜索信息的能力強于豆包,令人對英偉達股價的支撐產生懷疑,這會讓美國公司賴以維持的技術優勢和高估值可能會受到挑戰。而國內大模型也顯得尷尬,文心一言起了個大早,Kimi趕了個晚集,豆包左右失策。

有人總結說,中美科技底層差距雖然大,但中國擁有巨大人才紅利,6000萬工程師,超美德日韓印總和。人才紅利是繼續發展的底氣和希望。

雷遞由媒體人雷建平創辦,若轉載請寫明來源。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
國產大飛機C919完成支線機場商業首航

國產大飛機C919完成支線機場商業首航

上觀新聞
2025-06-05 06:51:08
藏海傳大結局:高明師傅臨死前爆出逆天大秘密,藏海崩潰泣不成聲

藏海傳大結局:高明師傅臨死前爆出逆天大秘密,藏海崩潰泣不成聲

手工制作阿殲
2025-06-04 16:51:00
早上7點,安帥巴西隊首秀!贏球=基本進世界杯,巴媒透露首發11人

早上7點,安帥巴西隊首秀!贏球=基本進世界杯,巴媒透露首發11人

小火箭愛體育
2025-06-04 18:16:52
偶遇鄭愷打網球,穿一身名牌,身高170出頭網球打很好

偶遇鄭愷打網球,穿一身名牌,身高170出頭網球打很好

悠閑歷史
2025-06-04 11:35:10
炸裂!51歲月嫂勾引男主人,發色情短信、不穿衣服進入房間

炸裂!51歲月嫂勾引男主人,發色情短信、不穿衣服進入房間

社會醬
2025-06-03 16:23:29
山東官宣“住院不用陪床” 避免“一人生病全家受累”

山東官宣“住院不用陪床” 避免“一人生病全家受累”

閃電新聞
2025-06-04 15:06:04
“八達嶺老虎咬人案”9年后:女兒仍未得到父親的原諒

“八達嶺老虎咬人案”9年后:女兒仍未得到父親的原諒

沈言論
2025-06-02 06:10:02
李斌個人能力到底有多恐怖?

李斌個人能力到底有多恐怖?

算法與數學之美
2025-06-04 16:18:27
意外發現了普通人消痔瘡肉球超簡單的辦法

意外發現了普通人消痔瘡肉球超簡單的辦法

烏啼清音
2025-06-03 14:28:25
男子買95萬二手房裝修,發現臥室面積少4平米,砸開墻后頓時愣住

男子買95萬二手房裝修,發現臥室面積少4平米,砸開墻后頓時愣住

程哥講堂
2025-06-02 18:21:32
家中的床不可空置?觀音菩薩說:無人睡時,也要擺放這3樣物品

家中的床不可空置?觀音菩薩說:無人睡時,也要擺放這3樣物品

風起青萍之未
2025-05-27 17:23:24
高考報名人數“大跳水”!23年1291萬,24年1342萬,25年令人意外

高考報名人數“大跳水”!23年1291萬,24年1342萬,25年令人意外

傲傲講歷史
2025-06-03 11:52:59
高考救老人誤考數學,3個月后老人兒子贈清華錄取通知書

高考救老人誤考數學,3個月后老人兒子贈清華錄取通知書

磊子講史
2025-06-04 14:02:43
判斷一個中國留學生是否優秀的標準非常簡單:就一個!

判斷一個中國留學生是否優秀的標準非常簡單:就一個!

愛下廚的阿椅
2025-06-03 14:18:53
美德樂沖刺北交所:比亞迪訂單驟降,第一大客戶業績也承壓,客戶高度集中隱憂下能否過關?

美德樂沖刺北交所:比亞迪訂單驟降,第一大客戶業績也承壓,客戶高度集中隱憂下能否過關?

每日經濟新聞
2025-06-04 23:00:14
浙江主帥:王鈺棟第一次訓練就征服我,曼城母公司也向我詢問過他

浙江主帥:王鈺棟第一次訓練就征服我,曼城母公司也向我詢問過他

直播吧
2025-06-04 23:00:28
73歲大爺伺候95歲母親12年后哭訴:家有長壽母親,是我晚年的噩夢

73歲大爺伺候95歲母親12年后哭訴:家有長壽母親,是我晚年的噩夢

烙任情感
2025-06-04 07:21:52
西媒:瓊·加西亞因準備轉投巴薩而遭球迷威脅,被罵是叛徒和老鼠

西媒:瓊·加西亞因準備轉投巴薩而遭球迷威脅,被罵是叛徒和老鼠

雷速體育
2025-06-05 08:24:32
不發南哥稱號!蘇超冠軍將獲獎杯&金牌,前8名均設名次獎金

不發南哥稱號!蘇超冠軍將獲獎杯&金牌,前8名均設名次獎金

直播吧
2025-06-04 15:56:39
喪鐘已敲響,新能源汽車金融泡沫已到崩的前夜?

喪鐘已敲響,新能源汽車金融泡沫已到崩的前夜?

米筐投資
2025-05-30 07:18:09
2025-06-05 08:43:00
雷遞 incentive-icons
雷遞
關注互聯網大產業
23369文章數 72786關注度
往期回顧 全部

科技要聞

人形機器人千億投入 年產量不如勞力士一周

頭條要聞

家長請事假陪孩子高考被開除 起訴公司官司打到高院

頭條要聞

家長請事假陪孩子高考被開除 起訴公司官司打到高院

體育要聞

從次輪末到樂透邊緣 楊瀚森的試訓有什么玄機?

娛樂要聞

彭于晏方出面澄清與蔡依林復合戀情!

財經要聞

美聯儲褐皮書:不確定性和關稅壓力加劇

汽車要聞

車機升級 新款AION Y Plus上市售9.98萬起

態度原創

手機
藝術
教育
親子
公開課

手機要聞

真我 GT Neo5 & Neo5 240W 手機獲 realme UI 6 15.0.0.500 更新

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

2025中小學“卓越校長”名校考察高研班暨特色課程建設與學校特色打造專題“思想塾”

親子要聞

補葉酸有必要嗎?活性葉酸更好嗎?一個視頻講清楚!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 平谷区| 潮安县| 怀化市| 泾阳县| 高台县| 六枝特区| 新巴尔虎左旗| 五莲县| 石柱| 老河口市| 麻江县| 彰化县| 太仆寺旗| 门头沟区| 务川| 榆树市| 盐亭县| 新乐市| 睢宁县| 安徽省| 连山| 穆棱市| 安阳县| 上虞市| 彰化市| 油尖旺区| 定南县| 册亨县| 阳城县| 晋宁县| 夹江县| 偃师市| 沙河市| 颍上县| 福州市| 滦平县| 太谷县| 峡江县| 吕梁市| 舞阳县| 乌鲁木齐市|