來自東方的神秘力量,這兩天還是持續的發酵,它居然超過了ChatGDP,登上了蘋果應用商店的免費榜的榜首,對整個西方科技界的沖擊非常大。
deepseek為什么這么牛呢?
今天我總結了5點。
第一,deepseek讓西方恐慌的最重要原因之一,就是正在改變算力的格局。
它用區區2,000張GPU就訓練出了比肩OpenAI的O1水平的大模型。
不光是英偉達自己,那些花了幾百億美金買了GPU的微軟和甲骨文等科技巨頭都要瑟瑟發抖。
那拼算力是規模定律scaging law的重要組成部分,也是我們被GPU卡脖子最嚴重的地方。
那這個來自東方的神秘力量deepseek打破了拼算力的格局,這個創新對于目前我們國內在芯片領域沒有突破的情況下,讓我們看到了追趕甚至是超越老美AI的時機。
第二,deepseek本身是百分之百開源的,這直接讓業界的開源大模型恐慌,那Meta 的CEO扎克伯格連夜開會,要求公司所有的AI工程師都來研究deepseek,就是因為 deepseek用了一個Meta高管的薪水,僅僅是600萬美元左右,就弄出了超越Meta花了幾百億美金搞出來的llama3大模型。
第三,deepseek論文里面提到它的一個重要的創新點是用的GRPO強化學習機制,可以跳過模型的微調,也就是讓模型自己訓練自己,自我改進,自我進化,那這個恐怖的能力會讓模型急速地、自動地進行進化,就像當年的alphaZero一樣,幾個小時就能完成訓練,打敗人類所有圍棋的頂尖高手。
第四,deepseek的創始人梁文峰不光是為億萬富翁,同時也是一位有遠大夢想的人。他給公司定下的愿景就是通用人工智能AGI。另外在母公司幻方量化的滋養下,deepseek可以做非常純粹的AI研究,不用考慮盈利的事情,這樣的路會走得非常長遠。
第五,還有一個很重要的點,那就是價格。deepseek是一個直接把大模型TOKEN的價格砍到的地板上,它的每百萬文本的價格是OpenAI收費的百分之一左右,訓練成本是 GBT4O的二十分之一。因此老美很多的科研人員、公司和機構都紛紛轉向這個物美價廉deepseek。
這直接導致OpenAI CEO山姆奧特曼的恐慌,揚言要和deepseek進行合作。所以你看到了deepseek的創新,對open AI,英偉達、 Meta,微軟和甲骨文等整個西方科技界都有巨大的沖擊,不愧是來自東方的神秘力量。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.