▲限時¥399早鳥優(yōu)惠
這周,特朗普持續(xù)霸占各大頭條,關(guān)稅成為新聞榜一大哥。
在關(guān)稅熱鬧的聲勢里,AI領(lǐng)域依然保持著高速進步的趨勢,我們注意到DeepSeek、TikTok、Nvidia連發(fā)新的研究成果。
從中我們注意到AI技術(shù)必然還會變得更強,雖然AGI仍然不會到來,但用上AI、用好AI的人還會持續(xù)受益。
如果你也希望享受這輪技術(shù)紅利,歡迎預(yù)約今晚8點的前哨AI小課,Tina會分享【如何用AI寫長文報告、自動提取和改寫視頻文案】
接下來,我們和大家介紹三家AI領(lǐng)軍企業(yè)的最新研究,看看AI技術(shù)的下一輪前沿在哪。
DeepSeek的強化學(xué)習(xí)探索
本周,DeepSeek和清華聯(lián)合發(fā)布最新研究,公布了一種名為“自律批判調(diào)優(yōu)”(Self-Principled Critique Tuning, SPCT)的新技術(shù)。
這個技術(shù)有什么用呢?
簡單說,DeepSeek R1的突破在于把傳統(tǒng)AI的訓(xùn)練方法成功用到了今天的AI大模型上,設(shè)計好獎勵方法,AI就能自己持續(xù)學(xué)習(xí),掌握工作方法。
過去的獎勵模型多應(yīng)用于特定領(lǐng)域,比如數(shù)學(xué)題、編程問題等明確領(lǐng)域,但在處理復(fù)雜的開放性任務(wù)時表現(xiàn)不佳。
DeepSeek這個新方法通過動態(tài)生成評判標準(principles)和評價內(nèi)容(critiques),實現(xiàn)了在通用領(lǐng)域和主觀任務(wù)上的精準反饋,使AI應(yīng)用可以更廣泛、更高效地適應(yīng)各種真實場景。
在測試中,27B的小模型已經(jīng)超越了GPT-4o和Nemotron-4-340B-Reward等大型模型,為開發(fā)更強大的通用AI鋪平了道路。
DeepSeek論文原圖
大廠加緊追趕
與此同時,字節(jié)跳動也亮出了他們在AI推理領(lǐng)域的新成果——Seed-Thinking-v1.5。
采用DeepSeek類似的混合專家(MoE)架構(gòu),還開發(fā)了定制的強化學(xué)習(xí)框架(VAPO、DAPO)和雙層獎勵模型(Seed-Verifier、Seed-Thinking-Verifier)。
新模型在多個基準測試中逼近甚至超越了谷歌的Gemini 2.5 Pro和OpenAI的o3-mini-high。
當然這個模型尚未開發(fā),實際效果還得上線再說,畢竟論文數(shù)據(jù)再強都不如用起來的感受對比。
Nvidia本周也基于Meta的Llama-3.1發(fā)布了自家優(yōu)化版本Llama-3.1-Nemotron-Ultra-253B-v1。
Nvidia通過神經(jīng)架構(gòu)搜索(NAS)優(yōu)化模型結(jié)構(gòu),實現(xiàn)了在單個8x H100 GPU節(jié)點上的高效部署,并引入了可切換的“推理模式”,允許開發(fā)者根據(jù)任務(wù)需求平衡復(fù)雜度和響應(yīng)速度,把近期熱門的軟硬件改進都用上了,也算是秀了把肌肉。
根據(jù)官方數(shù)據(jù)看,這款擁有2530億參數(shù)的模型,性能已經(jīng)與DeepSeek R1(6710億)匹敵。
Nvidia后訓(xùn)練負責(zé)人發(fā)文
AI進入專才時代
這些看似獨立的技術(shù)突破背后,涌動著一股清晰的產(chǎn)業(yè)趨勢:人工智能正在從“通才”向“專才”,尤其是具備深度推理能力的“專才”快速進化,各個領(lǐng)域都會持續(xù)受益。
首先,“推理能力”已成為頂級AI競爭焦點。
無論是DeepSeek對獎勵模型的革新以更好地指導(dǎo)復(fù)雜任務(wù),還是字節(jié)跳動Seed-Thinking對STEM和邏輯推理的側(cè)重,亦或是Nvidia Nemotron Ultra強調(diào)的推理模式切換,都指向同一個目標:
讓AI不僅僅是模仿和生成,更能像人一樣進行深度思考、邏輯推演和解決復(fù)雜問題。
這意味著AI的應(yīng)用將從簡單的問答、文本生成,拓展到更需要智慧和洞察力的領(lǐng)域。
其次,底層性能優(yōu)化會讓成本持續(xù)降低。
字節(jié)跳動的MoE架構(gòu)、Nvidia對模型結(jié)構(gòu)的優(yōu)化和推理模式的設(shè)計,以及DeepSeek對獎勵模型推理時可擴展性的研究,都反映了業(yè)界在追求更強能力的同時,對計算資源消耗和響應(yīng)速度的高度關(guān)注。
如何用更少的資源、更快的時間獲得更高質(zhì)量的結(jié)果,已經(jīng)是上游研發(fā)的焦點,下游AI應(yīng)用的快速迭代和成本下降也將繼續(xù)發(fā)生。
第三,高質(zhì)量數(shù)據(jù)和先進的訓(xùn)練/評估方法是核心驅(qū)動力。
各家論文中都反復(fù)提及數(shù)據(jù),繼續(xù)凸顯了數(shù)據(jù)質(zhì)量和訓(xùn)練策略的重要性。
不再是簡單地堆砌數(shù)據(jù),而是需要結(jié)構(gòu)化、高質(zhì)量、針對性的數(shù)據(jù),以及能夠有效引導(dǎo)模型學(xué)習(xí)復(fù)雜能力的訓(xùn)練框架和評估體系。
AI成為專才,你的通才時代到了
面對AI如此迅猛的發(fā)展,普通用戶和職場人士如何才能跟上步伐,將這些尖端技術(shù)轉(zhuǎn)化為實實在在的生產(chǎn)力提升呢?
這正是今晚8點前哨AI小課要解決的核心問題,今晚Tina會分享【如何用AI寫長文報告、自動提取和改寫視頻文案】
具體教你如何利用DeepSeek、DeepResearch等工具,實現(xiàn)快速翻譯網(wǎng)頁與長文件、自動生成視頻分鏡、以及快速高質(zhì)量地撰寫專業(yè)長文報告。
此外,Tina還將演示Coze工作流,教你如何自動抓取并改寫短視頻的文案內(nèi)容,讓你的工作效率翻倍提升。
掌握這些前沿的AI工具,不僅能夠幫助你在短短9分鐘內(nèi)撰寫出以往數(shù)小時才能完成的專業(yè)報告,更意味著你能更早地適應(yīng)AI時代,成為職場中的效率先鋒。
告別熬夜加班,告別重復(fù)繁瑣的工作流程,現(xiàn)在點擊預(yù)約我們的直播課,第一時間掌握最新AI工具的實操技巧,搶先一步抓住AI帶來的巨大紅利。
今晚8點,我們直播間不見不散!
↓點擊加入,讓你來領(lǐng)導(dǎo)AI,不要讓AI領(lǐng)導(dǎo)你
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.