大數據文摘出品
近日,李開復在接受《南華早報》采訪時表示,他的公司已放棄此前訓練自研萬億大語言模型的策略,轉而完全依賴 Deepseek 的開源模型。
他還介紹,Deepseek 的發布在中國引發了“ChatGPT 時刻”,激發了人們對 AI 應用的廣泛熱情。這一變化促使眾多中國硬件和軟件供應商調整策略,將其服務與 Deepseek 模型對接。
“我們必須把 Deepseek 作為核心發展方向,”李開復說道。這一決定是在今年 1 月下旬作出的,當時中國眾多企業高管對 Deepseek 模型的需求激增。
另外,據科技媒體 the-decoder.com 轉述,李開復認為,Deepseek 采取免費、開源的模式,對 OpenAI 構成了根本性的挑戰。“對 Sam Altman 來說,最大的噩夢就是他的競爭對手是免費的,”李開復表示。“我已經遇到很多人,他們因為 Deepseek 是免費的而取消了 ChatGPT 訂閱?!?/p>
"The biggest nightmare for Sam Altman is that his competitor is free," Lee says. "I've already met many people who have canceled their ChatGPT subscriptions because Deepseek is free."
目前,李開復的初創公司零一萬物共有 200 多名員工,未來將專注于為企業客戶定制 Deepseek 模型,重點服務金融、游戲和法律行業。
同時據科技媒體 the-decoder.com 報道,李開復還有如下觀點:
“只有當一個預訓練模型能夠吸引數億用戶時,它的價值才真正成立,”李開復說道?!八?,阿里巴巴可以做到,Google 可以做到,Deepseek 可以做到,字節跳動也可以做到,但我們這些公司做不到。”
盡管戰略方向發生了變化,李開復仍強調零一萬物在技術上的核心競爭力?!叭绾斡柧毮P汀⑷绾握{整參數、如何進行強化學習、如何實現快速推理?這一最后一步,只有具備大模型能力的公司才能做到?!?/p>
在另一場接受彭博社的采訪中,李開復強調了美國和中國大語言模型領域正在進行的整合趨勢。他預測,開源模式最終將占據主導地位,而大模型的預訓練將仍然僅限于少數幾家主要公司。
李開復指出 OpenAI 和 Deepseek 之間在運營成本上的巨大差異。據報道,OpenAI 在 2024 年的運營成本高達 70 億美元,而李開復稱 Deepseek 僅需其中的 2% 左右。
“問題并不在于誰的模型比對手強 1%。我認為它們都已經非常優秀了。但真正的問題是,OpenAI 的模式是否可持續?”李開復表示。
他形容 Deepseek 為“可以無限持續”的企業,因為其創始人擁有足夠的資金來維持當前運營,并且計算成本已降低了 5 到 10 倍。“面對這樣一個強勁的競爭對手,我想 Sam Altman 可能睡得不太安穩?!?/strong>李開復說道。
關于Deepseek的最新動態
圖片來源:新華社
在大模型領域,Deepseek算得上是最爭氣的娃。這兩天它發布了 全新升級的 AI 模型,進一步提升編程能力。
這次的發布是,DeepSeek-V3 模型的升級版 DeepSeek-V3-0324,參數規模從原版 V3 的 6710 億略微提升至 6850 億。與此同時,DeepSeek 還調整了該模型的開源許可協議,改為 MIT 許可證,與此前的 DeepSeek-R1 模型保持一致。
最新的 V3-0324 版本在多個基準測試中實現了重大性能提升”,并針對以下關鍵領域進行了優化:
前端 Web 開發
中文寫作能力(新增“互動式改寫”功能)
中文搜索能力(增強報告分析功能)
圖注:新版 V3 模型的百科知識(MMLU-Pro, GPQA)、數學(MATH-500, AIME 2024)和代碼任務(LiveCodeBench)表現均有提升
據 DeepSeek 介紹,此次更新已在 開源 AI 社區平臺 Hugging Face 上發布,新模型不僅能夠應對現實世界的復雜挑戰,還在準確性和效率方面樹立了新的行業標準。
前端開發能力增強
在 HTML 等代碼前端任務上,新版 V3 模型生成的代碼可用性更高,視覺效果也更加美觀、富有設計感。
動圖展示了一個由模型生成的演示多個小球在指定空間范圍內運動的 p5.js 程序,包含若干可以調整重力、摩擦力等參數的滑動按鈕,并以賽博朋克風格的 HTML 呈現
中文寫作升級
在中文寫作任務方面,新版 V3 模型基于 R1 的寫作水平進行了進一步優化,同時特別提升了中長篇文本創作的內容質量。
中文搜索能力優化
新版 V3 模型可以在聯網搜索場景下,對于報告生成類指令輸出內容更為詳實準確、排版更加清晰美觀的結果。
上下滑動查看完整內容
今年 1 月,DeepSeek 發布的 R1 模型 以性能媲美 OpenAI 頂級產品的表現,引發了業界轟動,并一度登頂 蘋果美國 App Store 免費榜。這一現象甚至導致美國市場的 AI 概念股集體下跌。
DeepSeek 表示,其最新 V3 模型的訓練成本僅為 600 萬美元,遠低于 OpenAI 訓練 GPT-4 所花費的 1 億美元,同時使用的算力僅為 Meta 訓練 Llama 3.1 的 10%。這一低成本、高效率的策略,使 DeepSeek 成為全球 AI 領域 極具競爭力的挑戰者。與完全開源 AI 不同,DeepSeek 模型采用 “開放權重” 機制,允許開發者在一定限制下使用和修改模型,而非完全開放源代碼。
via https://www.scmp.com/tech/tech-trends/article/3303403/ai-entrepreneur-lee-kai-fu-bets-his-start-ups-future-deepseek-and-open-source?module=top_story&pgtype=section
https://the-decoder.com/kai-fu-lee-says-openais-sam-altman-probably-not-sleeping-well-as-01-ai-pivots-to-deepseek/
https://mp.weixin.qq.com/s/XK6ymJL7y0vo_GQXxmpuBA
GPU算力按需租用
A100/H100 GPU算力按需租用,
秒級計費,平均節省開支30%以上!
掃碼了解詳情?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.