編譯丨王聰
編輯丨王多魚
排版丨水成文
最近,一家來自中國杭州的初創公司深度求索(DeepSeek)憑借發布的兩款大語言模型(LLM),在全世界科技界掀起波瀾,這兩款模型的性能可與美國科技巨頭開發的主流工具相媲美,但研發成本和所需算力卻只是其一小部分。
2025 年 1 月 20 日 ,DeepSeek 發布了DeepSeek-R1,這是一個部分開源(訓練數據未公開,因此并非完全開源)的“推理”模型,能夠以與 OpenAI 于 2024 年年底發布的最先進的專注于“推理”的大語言模型GPT-o1相近的水平解決一些科學問題。
幾天后的 1 月 28 日,DeepSeek 推出了另一款模型——Janus-Pro-7B,能夠根據文本提示生成圖像,也就是所謂的“文生圖”,其性能與 OpenAI 的DALL-E 3以及 Stability AI 的Stable Diffusion相當。
國際頂尖學術期刊Nature在其官網連續發布了 3 篇文章報道 DeepSeek。
1 月 29 日,Nature發布了題為:Scientists flock to DeepSeek: how they’re using the blockbuster AI model 的新聞文章。
該文章指出,科學家們正在紛紛涌入 DeepSeek,從 AI 專家到數學家再到認知神經學家,他們為 DeepSeek-R1 的高性能和低成本所驚嘆。
1 月 30 日,Nature發布了題為:China’s cheap, open AI model DeepSeek thrills scientists 的新聞文章。
該文章指出,來自中國的便宜的、開放的 AI 模型 DeepSeek 讓科學家們興奮不已,DeepSeek-R1 執行推理任務的水平與 OpenAI 的 GPT o1 相當,而關鍵是,DeepSeek-R1 向研究人員開源。科學界認為,DeepSeek 的開放非常令人震驚,相比之下,OpenAI 推出的 GPT o1 以及最新成果 o3,基本上都是黑匣子。
當然,DeepSeek-R1 令人印象深刻的還包括其超低成本,DeepSeek 尚未公布訓練 DeepSeek-R1 的全部成本,但據估計,訓練 DeepSeek-R1 所需的算力租賃費用約為 600 萬美元,相比之下,Meta 公司訓練 Llama 3.1 405B 的算力是其 11 倍,訓練成本超過 6000 萬美元。盡管美國限制了中國公司獲取用于人工智能的最先進的計算機芯片,但 DeepSeek-R1 還是成功了,這也說明了高效利用資源比單純依靠計算規模更為重要。這也表明了美國在人工智能領域的建立的優勢正在快速縮小。
此外,使用 DeepSeek-R1 界面的用戶只需支付運行 ChatGPT o1 費用的不到三十分之一(10美元 vs 370 美元)。此外,DeepSeek 還創建了 DeepSeek-R1 的迷你“蒸餾”版本,以便算力有限的研究人員也能使用該模型。
1 月 30 日,Nature發布了題為:How China created AI model DeepSeek and shocked the world 的新聞文章。
該文章分析了中國是如何創造出震驚世界的 AI 模型 DeepSeek,文章中指出,政策支持、大量資金,以及大量的 AI 專業人才,幫助中國企業建立了先進的大語言模型。
如果 DeepSeek-R1 的表現讓中國以外的許多人感到驚訝,但國內的研究人員表示,這家初創企業的成功在意料之中,也符合政府成為全球人工智能(AI)領導者的雄心。
中國科學院計算技術研究所副所長陳云霽研究員表示, 鑒于中國在開發大語言模型的公司上投入了巨額風險資本,且擁有眾多在科學、技術、工程或數學領域 (包括人工智能) 擁有博士學位的人才,像 DeepSeek 這樣的公司在中國出現是不可避免的。即便不是 DeepSeek,中國也會有其他大語言模型能夠做出一番成就。
事實上,也確實有。
1 月 29 日,科技巨頭阿里巴巴發布了其迄今為止最先進的大語言模型——Qwen2.5-Max(通義千問旗艦版),并稱其性能優于 GPT-4o、DeepSeek-V3 以及 Llama-3.1-405B。而上周,月之暗面聯合字節跳動發布了新的推理模型Kimi 1.5和Kimi 1.5 1.5-pro,并稱其在某些基準測試中的表現優于 GPT-o1。
參考資料:
https://www.nature.com/articles/d41586-025-00275-0
https://www.nature.com/articles/d41586-025-00229-6
https://www.nature.com/articles/d41586-025-00259-0
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.