2025 開年之際,厚積薄發的 DeepSeek 迎來技術井噴,這家潛心耕耘 AI 領域三年的中國公司,接連發布重磅模型,以開源硬剛 OpenAI,用低成本顛覆行業認知,一躍成為全球 AI 領域矚目的焦點。
為深入剖析 DeepSeek 的技術創新及其對 AI 未來發展的影響,2 月 8 日下午,CSDN 高端技術領導者社群「智研社-The Intelliger」于北京 CSDN 總部成功舉辦主題為“DeepSeek技術創新暨 AI 2025 進化”的閉門研討會。
本次研討會匯聚了國內人工智能領域的頂尖專家、行業領軍人物與技術先鋒,其中與會嘉賓包括:瀾舟科技創始人兼 CEO 周明;網易有道 CEO 周楓;國家人工智能學院,中關村人工智能研究院副院長鄭書新;清華大學國強教授聶再清;大數醫達創始人兼 CEO 鄧侃;智譜AI首席生態官劉江;Jina AI 創始人兼 CEO 肖涵,CSDN 創始人兼董事長蔣濤;CSDN 高級副總裁,Boolan 首席技術專家李建忠;CSDN 副總裁,內容事業部負責人孟迎霞以及 CSDN & Boolan 首席咨詢師李沫南共同出席會議,展開深度探討。
與會專家圍繞 DeepSeek 的創新模式與技術優勢展開激烈討論,研討會共包含十個深度議題:
1、如何看待 DeepSeek 引領的“國運級創新”,漸進改良 VS. 范式創新?為什么其他大模型公司相對落后?趕上的速度會有多快?
2、DeepSeek 創新為 Scaling Law 引入了新的變量,對算力生態有什么影響?國產算力發展機會如何?
3、強化學習驅動的推理計算,對語言模型的預訓練有什么影響?未來會否在多模態領域產生范式創新?
4、推理計算范式下,代碼能力越來越強,開發者生態會如何變化、人人都是程序員?
5、DeepSeek 是否會主導大模型開源生態?閉源模型(國內&海外) 的走向?
6、推理計算范式下,為 Agent 帶來什么機會,2025 會否迎來 Agent 的爆發?
7、DeepSeek 引發的中西技術之爭,會給地緣技術帶來什么樣的變化?
8、大模型成本極大降低,是否會引爆大模型應用生態,改變互聯網格局?
9、DeepSeek 對行業智能化應用發展(如醫療健康,金融,教育等),會帶來什么樣的影響和變化?
10、DeepSeek 對端側模型、具身智能應用會有什么樣的影響?
會議現場,專家們結合自身商業經驗及學術成果對 DeepSeek 成功之道進行揭秘復現,對其模型的編寫方式進行研究。指出 DeepSeek 領先于業界在于其數據訓練的扎實,強調數據的核心素質和推理能力的重要性。
從用戶視角出發,理解操作系統的重要性,并對未來可能出現的大模型產品進行預測。更有專家認為 DeepSeek 不僅在算力、數據訓練方面具備強大的核心競爭力,而且其創新性地突破了 Scaling Law 的傳統限制,開辟了計算生態的新天地。
DeepSeek 的成功并非偶然,而是長期技術投入和扎實數據訓練的結果。有專家將其比作“原本的微軟研究院角色”,強調其技術積累和對行業人才的吸引力。DeepSeek 在技術路線上有所突破,特別是強化學習驅動的推理計算,對行業具有啟發意義,打破了某些“傳統認知”。未來大模型的競爭,數據質量將成為超越算力規模的關鍵因素。
強化學習在提升推理能力方面具有重要作用,但對于預訓練階段,其必要性和效率仍存在爭議。有專家甚至認為 DeepSeek 在預訓練中應用強化學習可能只是噱頭,我們要理性看待強化學習的作用,避免對其進行過度解讀和神化,其并非解決所有問題的“萬能鑰匙”。
未來的大模型發展可能呈現“預訓練+推理”雙輪驅動的模式,兩者相輔相成,共同提升模型能力。因為文字預訓練可能已接近瓶頸,未來預訓練的突破可能需要新的數據(例如多模態數據)和算法創新(例如強化學習)。
DeepSeek 不僅在算力基礎設施和數據訓練方面構建了強大的競爭力,更重要的是,其創新性地挑戰和突破了 Scaling Law 的傳統認知,為計算生態的未來發展開辟了新的想象空間。DeepSeek 的推理計算創新,可能會降低對大規模預訓練算力的依賴,轉而更加重視推理算力的效率和優化。
同時,隨著 DeepSeek 的問世,Agent(智能體)的崛起將在各行業應用中掀起新的浪潮。研討會就自然語言大模型的發展和人工智能在國內的應用、芯片制造和產業化方面的策略和挑戰、國產專利的倒逼機制、強化學習在機器人預訓練中的應用等問題展開深入討論。
DeepSeek 的技術突破,特別是其在推理計算和 Agent 技術方面的創新,將有力推動智能體在各行業應用中的快速崛起,預示著 2025 年可能成為 Agent 技術爆發的關鍵節點。Agent 將重塑人機交互方式,“對話即交互” 或將成為主流,用戶可以通過自然語言與 Agent 交互,完成各種復雜任務。
“對絕大多數用戶而言,以后將不再有「軟件」這個概念。”Agent 的興起,或將重塑互聯網入口和流量分發模式,基于 Agent 的新型應用商店和流量平臺可能涌現,對現有互聯網巨頭形成挑戰。
多模態領域可能是強化學習發揮更大作用的方向,多模態的預訓練部分要上來,強化學習倒還真不一定。目前,文字預訓練可能已接近瓶頸,未來預訓練的突破可能需要新的數據(例如多模態數據)和算法創新(例如強化學習)。
國際算力封鎖在倒逼國產算力發展的同時,也可能限制國內大模型迭代速度,拉大與國際領先水平的差距。針對當前國際技術競爭日趨激烈的態勢,要通過強化專利保護和激勵創新,營造良好的創新環境,提升中國 AI 技術的國際競爭力。
代碼大模型將極大地提升開發效率,降低編程門檻,使得“人人都是程序員”成為可能。AI 代碼助手將成為開發者標配,改變開發模式,未來開發模式將從“人肉編碼”轉向“人機協同”,開發者更多扮演“架構師”和“產品經理”的角色。
在本次研討會中,DeepSeek 的技術創新和行業潛力得到行業先鋒們的充分肯定,認為其不僅將在大模型技術的范式創新中發揮領導作用,還將為產業升級和智能化轉型提供強有力的技術支撐,推動全球智能化浪潮的全面爆發。
DeepSeek 的徹底開源策略,極大地提升了其國際影響力,贏得了開發者社區的認可和尊重,更是這場“國運級創新”引發國外科技界震撼的根本原因。“DeepSeek 開源太徹底了,不是一般的開源,是真開源,這讓所有人震驚,要沒有這開源,同樣的水平,也不會有今天的局面”。
其他大模型公司并非技術落后 DeepSeek,而是在發展路線上有所差異,例如有的側重多模態,有的側重 ToB 應用,大家都在探索不同的方向和商業模式。當前,技術層面的追趕不會太慢,關鍵在于戰略格局和資源投入。
國內其他公司如果能調整戰略,重視破圈效應和生態建設,仍有機會趕上。但戰略機遇窗口可能稍縱即逝。
DeepSeek 在技術路線上展現出創新性,特別是強化學習在推理計算中的應用,為行業帶來了新的思路和方向,盡管是否為“范式創新”尚存討論,但其在技術上的突破和啟發意義不容忽視。
互聯網格局或將迎來新一輪洗牌,現有互聯網巨頭面臨挑戰,新型互聯網服務和應用形態將涌現,用戶體驗將迎來變革。大模型技術或將顛覆現有互聯網格局,新型互聯網服務和應用形態將不斷涌現,用戶體驗將迎來革命性升級”。
CSDN 舉辦的“DeepSeek 技術創新暨 AI 2025 進化”閉門研討會為業界提供了一個高端交流平臺,更是一次關于技術革新的討論,一場思想碰撞的盛宴。它為所有參與者提供了一個難得的機會來了解 AI 技術前沿,并共同思考如何塑造一個由 AI 賦能的美好未來。我們期待著這次會議所激發的想法能夠轉化為實際行動,推動整個行業向著更高層次發展,創造更多價值。
關于「智研社-The Intelliger」
「智研社-The Intelliger」由 CSDN 發起創立,前身為 CTO 俱樂部,自 2009 年創辦以來,一直是極具影響力的高端技術管理者分享與交流平臺。隨著大模型技術的迅猛發展,人工智能將成為未來 10 年最有影響力的技術力量。「智研社-The Intelliger」將繼續發揮平臺作用,連接技術領袖,推動行業發展,共同開創 AGI 新紀元。
解鎖更多高端會議精彩內容,請持續關注智研社。
此外,「DeepSeek 暨 AI 進化論十日談」仍在繼續,系列直播將繼續秉持開放、思辨、前沿的理念,邀請更多 AI 領域專家,帶來更多深度、尖銳、前瞻的思想碰撞。今晚 20:00,CSDN 創始人&董事長蔣濤將對話復旦大學教授李劍鋒與科幻小說《云球》作者白丁,探討在 AI 圈引起了軒然大波,引起了“AI 深度學習三巨頭”三方相互對立的“AI 意識”之爭!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.