近日,國產(chǎn)AI DeepSeek在中國、美國的科技圈受到廣泛關(guān)注,甚至被認為是大模型行業(yè)的最大“黑馬”,在外網(wǎng),DeepSeek被不少人稱為“神秘的東方力量”。
截至發(fā)稿,DeepSeek在美區(qū)蘋果App Store的免費排行榜中飆升至第四,排行第一仍是ChatGPT。
本周,DeepSeek發(fā)布了其R1模型(DeepSeek R1),不僅在性能上超越了OpenAI、Meta和Anthropic等美國領(lǐng)先人工智能公司,更以其成本優(yōu)勢震撼了全球科技界。
性能卓越,成本極低
DeepSeek R1的最大亮點在于其卓越的性能和極低的成本。該模型采用了H800核心芯片,不僅能耗更低,計算效率也更高。在不到600,000美元的預(yù)算下,DeepSeek R1成功構(gòu)建完畢,并且在解決復(fù)雜問題的準確性上超越了Meta的Llama 3.1和OpenAI的GPT-4o等國際頂尖產(chǎn)品。這一性能的提升不僅展示了中國在人工智能領(lǐng)域的潛力,也加劇了硅谷科技巨頭們的焦慮。
更令人矚目的是,DeepSeek R1的成本優(yōu)勢極為明顯。據(jù)券商中國記者親測,單論文學(xué)素養(yǎng)、文字組織能力,DeepSeek R1已經(jīng)是秒殺一眾文字工作者的存在。而從其閱讀總結(jié)能力、數(shù)理邏輯處理能力來看,亦堪稱卓越。市場認為,DeepSeek R1的成功可能削弱了市場對英偉達AI芯片需求的預(yù)期。
技術(shù)創(chuàng)新,架構(gòu)革新
DeepSeek的成功并非偶然,其背后是全方位的技術(shù)創(chuàng)新和架構(gòu)革新。DeepSeek提出了一種嶄新的MLA(多頭潛在注意力機制)架構(gòu),把顯存占用降到了過去最常用的MHA架構(gòu)的5%-13%,同時,它獨創(chuàng)的DeepSeekMoESparse結(jié)構(gòu),也把計算量降到極致,所有這些最終促成了成本的下降。
此外,DeepSeek R1在多個高層次應(yīng)用場景中展現(xiàn)了其巨大的市場價值和應(yīng)用潛力。例如,在復(fù)雜提示詞/風格控制榜單上,R1位列第一;在衡量模型編程開發(fā)能力的WebDev分榜上,R1位列第二,與閉源的Claude 3.5 Sonnet相差不到40分。
行業(yè)影響,全球矚目
DeepSeek的崛起不僅在中國引起了轟動,更在全球范圍內(nèi)引發(fā)了廣泛關(guān)注。硅谷的科技公司們紛紛重新審視自身的發(fā)展戰(zhàn)略,DeepSeek R1的成功讓他們感受到了來自中國科技公司的競爭壓力。圖靈獎得主LeCun也為DeepSeek做出中肯評價,認為它代表了開源的力量,意味著開源模型正在超越專有模型。
DeepSeek的創(chuàng)始人梁文峰的中文采訪更是被翻譯成英文,“拿著放大鏡”逐字認真閱讀。他提出的觀點也被總結(jié)成箴言,在互聯(lián)網(wǎng)上流傳。梁文峰認為,真正的差距不是1年或2年,而在于是原創(chuàng)還是模仿。
未來展望,無限可能
DeepSeek的徹底爆發(fā)不僅展示了中國在人工智能領(lǐng)域的強大實力,也為全球科技行業(yè)帶來了新的機遇和挑戰(zhàn)。隨著DeepSeek R1的成功,我們可以預(yù)見,未來的人工智能市場將更加多元化和競爭激烈。中國科技公司將在全球舞臺上發(fā)揮越來越重要的作用,推動人工智能技術(shù)的不斷創(chuàng)新和發(fā)展。
DeepSeek的故事還在繼續(xù),它的成功不僅為中國科技界注入了新的活力,也為全球科技行業(yè)帶來了新的希望和啟示。讓我們共同期待DeepSeek在未來創(chuàng)造更多的奇跡,為人類的科技進步做出更大的貢獻。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.