網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

DeepSeek、Nvidia連發(fā)新研究！AI進入專才時代，你該怎么辦？

2025-04-13 06:42:26　來源: 王煜全

北京舉報

分享至

▲限時￥399早鳥優(yōu)惠

這周，特朗普持續(xù)霸占各大頭條，關(guān)稅成為新聞榜一大哥。

在關(guān)稅熱鬧的聲勢里，AI領(lǐng)域依然保持著高速進步的趨勢，我們注意到DeepSeek、TikTok、Nvidia連發(fā)新的研究成果。

從中我們注意到AI技術(shù)必然還會變得更強，雖然AGI仍然不會到來，但用上AI、用好AI的人還會持續(xù)受益。

如果你也希望享受這輪技術(shù)紅利，歡迎預(yù)約今晚8點的前哨AI小課，Tina會分享【如何用AI寫長文報告、自動提取和改寫視頻文案】

接下來，我們和大家介紹三家AI領(lǐng)軍企業(yè)的最新研究，看看AI技術(shù)的下一輪前沿在哪。

DeepSeek的強化學(xué)習(xí)探索

本周，DeepSeek和清華聯(lián)合發(fā)布最新研究，公布了一種名為“自律批判調(diào)優(yōu)”（Self-Principled Critique Tuning, SPCT）的新技術(shù)。

這個技術(shù)有什么用呢？

簡單說，DeepSeek R1的突破在于把傳統(tǒng)AI的訓(xùn)練方法成功用到了今天的AI大模型上，設(shè)計好獎勵方法，AI就能自己持續(xù)學(xué)習(xí)，掌握工作方法。

過去的獎勵模型多應(yīng)用于特定領(lǐng)域，比如數(shù)學(xué)題、編程問題等明確領(lǐng)域，但在處理復(fù)雜的開放性任務(wù)時表現(xiàn)不佳。

DeepSeek這個新方法通過動態(tài)生成評判標準（principles）和評價內(nèi)容（critiques），實現(xiàn)了在通用領(lǐng)域和主觀任務(wù)上的精準反饋，使AI應(yīng)用可以更廣泛、更高效地適應(yīng)各種真實場景。

在測試中，27B的小模型已經(jīng)超越了GPT-4o和Nemotron-4-340B-Reward等大型模型，為開發(fā)更強大的通用AI鋪平了道路。

DeepSeek論文原圖

大廠加緊追趕

與此同時，字節(jié)跳動也亮出了他們在AI推理領(lǐng)域的新成果——Seed-Thinking-v1.5。

采用DeepSeek類似的混合專家（MoE）架構(gòu)，還開發(fā)了定制的強化學(xué)習(xí)框架（VAPO、DAPO）和雙層獎勵模型（Seed-Verifier、Seed-Thinking-Verifier）。

新模型在多個基準測試中逼近甚至超越了谷歌的Gemini 2.5 Pro和OpenAI的o3-mini-high。

當然這個模型尚未開發(fā)，實際效果還得上線再說，畢竟論文數(shù)據(jù)再強都不如用起來的感受對比。

Nvidia本周也基于Meta的Llama-3.1發(fā)布了自家優(yōu)化版本Llama-3.1-Nemotron-Ultra-253B-v1。

Nvidia通過神經(jīng)架構(gòu)搜索（NAS）優(yōu)化模型結(jié)構(gòu)，實現(xiàn)了在單個8x H100 GPU節(jié)點上的高效部署，并引入了可切換的“推理模式”，允許開發(fā)者根據(jù)任務(wù)需求平衡復(fù)雜度和響應(yīng)速度，把近期熱門的軟硬件改進都用上了，也算是秀了把肌肉。

根據(jù)官方數(shù)據(jù)看，這款擁有2530億參數(shù)的模型，性能已經(jīng)與DeepSeek R1（6710億）匹敵。

Nvidia后訓(xùn)練負責(zé)人發(fā)文

AI進入專才時代

這些看似獨立的技術(shù)突破背后，涌動著一股清晰的產(chǎn)業(yè)趨勢：人工智能正在從“通才”向“專才”，尤其是具備深度推理能力的“專才”快速進化，各個領(lǐng)域都會持續(xù)受益。

首先，“推理能力”已成為頂級AI競爭焦點。

無論是DeepSeek對獎勵模型的革新以更好地指導(dǎo)復(fù)雜任務(wù)，還是字節(jié)跳動Seed-Thinking對STEM和邏輯推理的側(cè)重，亦或是Nvidia Nemotron Ultra強調(diào)的推理模式切換，都指向同一個目標：

讓AI不僅僅是模仿和生成，更能像人一樣進行深度思考、邏輯推演和解決復(fù)雜問題。

這意味著AI的應(yīng)用將從簡單的問答、文本生成，拓展到更需要智慧和洞察力的領(lǐng)域。

其次，底層性能優(yōu)化會讓成本持續(xù)降低。

字節(jié)跳動的MoE架構(gòu)、Nvidia對模型結(jié)構(gòu)的優(yōu)化和推理模式的設(shè)計，以及DeepSeek對獎勵模型推理時可擴展性的研究，都反映了業(yè)界在追求更強能力的同時，對計算資源消耗和響應(yīng)速度的高度關(guān)注。

如何用更少的資源、更快的時間獲得更高質(zhì)量的結(jié)果，已經(jīng)是上游研發(fā)的焦點，下游AI應(yīng)用的快速迭代和成本下降也將繼續(xù)發(fā)生。

第三，高質(zhì)量數(shù)據(jù)和先進的訓(xùn)練/評估方法是核心驅(qū)動力。

各家論文中都反復(fù)提及數(shù)據(jù)，繼續(xù)凸顯了數(shù)據(jù)質(zhì)量和訓(xùn)練策略的重要性。

不再是簡單地堆砌數(shù)據(jù)，而是需要結(jié)構(gòu)化、高質(zhì)量、針對性的數(shù)據(jù)，以及能夠有效引導(dǎo)模型學(xué)習(xí)復(fù)雜能力的訓(xùn)練框架和評估體系。

AI成為專才，你的通才時代到了

面對AI如此迅猛的發(fā)展，普通用戶和職場人士如何才能跟上步伐，將這些尖端技術(shù)轉(zhuǎn)化為實實在在的生產(chǎn)力提升呢？

這正是今晚8點前哨AI小課要解決的核心問題，今晚Tina會分享【如何用AI寫長文報告、自動提取和改寫視頻文案】

具體教你如何利用DeepSeek、DeepResearch等工具，實現(xiàn)快速翻譯網(wǎng)頁與長文件、自動生成視頻分鏡、以及快速高質(zhì)量地撰寫專業(yè)長文報告。

此外，Tina還將演示Coze工作流，教你如何自動抓取并改寫短視頻的文案內(nèi)容，讓你的工作效率翻倍提升。

掌握這些前沿的AI工具，不僅能夠幫助你在短短9分鐘內(nèi)撰寫出以往數(shù)小時才能完成的專業(yè)報告，更意味著你能更早地適應(yīng)AI時代，成為職場中的效率先鋒。

告別熬夜加班，告別重復(fù)繁瑣的工作流程，現(xiàn)在點擊預(yù)約我們的直播課，第一時間掌握最新AI工具的實操技巧，搶先一步抓住AI帶來的巨大紅利。

今晚8點，我們直播間不見不散！

↓點擊加入，讓你來領(lǐng)導(dǎo)AI，不要讓AI領(lǐng)導(dǎo)你

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.