近期,中國AI初創(chuàng)企業(yè)深度求索(DeepSeek)發(fā)布的開源模型DeepSeek-R1,以破圈之勢在全球范圍內(nèi)爆火,受到了廣泛關(guān)注。在中美科技戰(zhàn)的背景下,社會對我國科技創(chuàng)新的關(guān)注達(dá)到了前所未有的高度。為深入分析和探討DeepSeek爆火對中國創(chuàng)新路徑的影響及如何借鑒其成功經(jīng)驗,盤古智庫于2月12日舉辦“DeepSeek之爆對中國創(chuàng)新路徑的啟發(fā)”研討會。現(xiàn)特將會上專家、業(yè)內(nèi)權(quán)威人士的觀點(diǎn)整理提煉,供大家參考。
一、
背景
春節(jié)前夕,中國AI初創(chuàng)公司DeepSeek發(fā)布的開源模型DeepSeek-R1,以較低的訓(xùn)練成本,達(dá)到與OpenAI的頂尖模型o1接近的性能,并實現(xiàn)開源,顛覆了AI行業(yè)認(rèn)知。而這家初創(chuàng)公司脫胎于一家以量化交易為主的對沖基金,公司85后創(chuàng)始人梁文峰成長于“廣東一個五線城市”,浙大碩士學(xué)歷出身,其團(tuán)隊成員均為本土研究人員。
不在外面融資、不是正規(guī)的學(xué)術(shù)機(jī)構(gòu),幻方量化創(chuàng)始人梁文鋒用量化基金的利潤,根據(jù)自己的愛好,做成了爆火全球的DeepSeek-R1,低成本做出了一個原理接近ChatGPT o1的模型并且開源給了全世界。算力低成本、類o1原理、開源這三個關(guān)鍵點(diǎn),是它產(chǎn)生巨大反響的原因。
二、
DeepSeek的創(chuàng)新點(diǎn)
1. DeepSeek成功地進(jìn)行了非常系統(tǒng)的再創(chuàng)新。DeepSeek的亮點(diǎn),按實際價值其實依次是強(qiáng)化學(xué)習(xí)、混合專家模型MoE、知識與模型蒸餾、多頭注意力、多Token預(yù)測、混合精度訓(xùn)練和PTX等,排序越往前對模型水準(zhǔn)的技術(shù)價值越大,排序越往后對成本效率的工程價值越高。實質(zhì)上準(zhǔn)確地講,這些技術(shù)沒有一項是DeepSeek自己完全原創(chuàng),但是DeepSeek成功地進(jìn)行了非常系統(tǒng)的再創(chuàng)新。再創(chuàng)新也是非常重要的創(chuàng)新角度。不管是強(qiáng)化學(xué)習(xí)還是MoE架構(gòu),在每一個方面DeepSeek都有新的突破,這些系統(tǒng)的再創(chuàng)新,使得DeepSeek模型在推理能力方面大大提升,并實現(xiàn)了降本增效,也讓模型能力的展開成為可能。
2. DeepSeek的成功是工程學(xué)優(yōu)化的證明。在目前AI領(lǐng)域幾乎很難有從0到1的原創(chuàng),OpenAI第一個走出來,利用算力、數(shù)據(jù)、算法作出了智能涌現(xiàn)。DeepSeek則是把每一個環(huán)節(jié)做到極致,達(dá)到了高質(zhì)量、低成本的效果。它的成功證明了,以工程學(xué)的路徑達(dá)到整個系統(tǒng)優(yōu)化是完全可行的。
三、
DeepSeek產(chǎn)生的影響
1. DeepSeek對人工智能大模型第二階段的產(chǎn)業(yè)發(fā)展速度有極大的貢獻(xiàn)。OPEN AI 做出了成果卻沒有告訴大家如何實現(xiàn),還發(fā)了一篇論文說過程性激勵和獎勵非常重要,把大家都誤導(dǎo)了。DeepSeek做了一件事情,它發(fā)現(xiàn)極簡單:直接給一個結(jié)果獎勵,最后推理的路徑就涌現(xiàn)出來了,它對人工智能大模型第二階段的產(chǎn)業(yè)發(fā)展速度有極大的貢獻(xiàn)——全世界都被OPEN AI帶歪了,而DeepSeek把大家?guī)Щ貋砹耍@是特別巨大的貢獻(xiàn)。
2. DeepSeek引起了美西方對中國創(chuàng)新能力的認(rèn)識轉(zhuǎn)變,引起了國際資本市場對中國戰(zhàn)略性投資的再思考。
3. DeepSeek給中國在科技領(lǐng)域的形象帶來了很好的改觀。中國在人工智能領(lǐng)域給世界的印象一直是跟隨,諸多人工智能重大貢獻(xiàn)當(dāng)中來自中國的較少。這次中國公司以“開源”的形式把最好的東西拿出來,顯著提升了中國在人工智能領(lǐng)域的國際形象,展現(xiàn)了中國在科技創(chuàng)新中的主動貢獻(xiàn)。
4. DeepSeek給了整個行業(yè)很大的信心。DeepSeek的出現(xiàn),讓走向最終AGI的信心被確認(rèn)了。因為系統(tǒng)效率和質(zhì)量的提高,單位Token的成本急劇下降,一定會導(dǎo)致智算產(chǎn)業(yè)的爆發(fā),“杰文斯悖論”再現(xiàn)。DeepSeek給了整個行業(yè)很大的信心,無論是政府、投資人,還是上下游鏈條。DeepSeek提振了資本市場信心。DeepSeek對于加大一級市場、二級市場對AI 2.0的信心,對后市場、腰部市場、長尾市場的信心非常重要。
5. DeepSeek出圈提振了各方信心。DeepSeek事件超越了一般的技術(shù)創(chuàng)新范疇,產(chǎn)生了極大的影響。DeepSeek的出現(xiàn)讓我們看到中國企業(yè)的競爭力不差,甚至可能是在提高的。政府、企業(yè)、百姓等各方的信心都有了提升。
6. 對現(xiàn)在DeepSeek的成績,可以感到振奮,但是也不要太高估。因為在歷史上,作為跟隨者、后發(fā)者,以更快的速度、更低的成本趕上、甚至某些領(lǐng)域有所超越,這類事情并不少見。對這方面的成績一方面要高興,另一方面要保持清醒的頭腦。
7. 預(yù)計很快DeepSeek就會被無數(shù)的創(chuàng)新淹沒。如果把DeepSeek爆火這件事放回人工智能2.0發(fā)展的時間軸上看,它的影響力可能是有限的,預(yù)計很快,這件事在國際上的影響力就會被無數(shù)的創(chuàng)新淹沒掉了。DeepSeek是開源的,一旦方向指明了就會有人前赴后繼。未來幾個月的時間里,國際上就會有多款產(chǎn)品超過它,國內(nèi)也是。
8. 三個“沒有變”使我們在思維上不能過于樂觀。第一,AI發(fā)展的大方向沒有變。我們預(yù)計在“十五五”末期會看到AGI的更多成果,今天DeepSeek在這個領(lǐng)域取得的成績只是我們在人工智能發(fā)展長河當(dāng)中的一步。第二,中美戰(zhàn)略競爭的位置并沒有根本轉(zhuǎn)變,我們?nèi)匀惶幵谥髁鞲S、局部突破的位置。第三,人工智能創(chuàng)新發(fā)展的底層邏輯沒有變,就是算力、算法、數(shù)據(jù)。這三個“沒有變”使得我們在思維上不能過于樂觀。長遠(yuǎn)看,包括如何突破算力的芯片,如何突破云計算算力服務(wù)的普惠性,依然有很多的工作需要做。
9. DeepSeek帶來了對于創(chuàng)新進(jìn)行多角度思考的氣象。DeepSeek讓人們對于中國什么樣的地方、什么樣的體系有可能出現(xiàn)創(chuàng)新有了多角度的思考。DeepSeek事件在中國企業(yè)創(chuàng)新思想上,可能帶來“文藝復(fù)興”的影響力,最近出現(xiàn)了各個角度的探索、分析,的確有這樣的氣象。
三、
關(guān)于目前及后續(xù)的一些判斷
1. 現(xiàn)在是一個生態(tài)涌現(xiàn)時刻,是中國AI 2.0產(chǎn)業(yè)市場開始起飛的狀態(tài)。從生態(tài)涌現(xiàn)角度講,AI大模型會出現(xiàn)一個體量龐大的后市場,大家會用開源模型包括基于閉源模型的API做許許多多的事情,每個開源模型會有成千上萬個分身,各個方面的開發(fā)者都會利用這種能力。總體來講,現(xiàn)在是一個生態(tài)涌現(xiàn)時刻,是中國AI 2.0產(chǎn)業(yè)市場開始起飛的狀態(tài)。
2. 各行各業(yè)都將做出頂尖的成果,世界將發(fā)生巨大的改變。DeepSeek只是我們走向AGI的高峰之一,不是終極的喜馬拉雅山,很快會出現(xiàn)更多的“DeepSeek”。按照目前的方法論和工程學(xué)的優(yōu)化,很多企業(yè)也能做出DeepSeek-R1甚至比R1更好的版本。甚至,大家用它的方法論或者工程學(xué),可以在模型、基礎(chǔ)設(shè)施、芯片、軟件等各行各業(yè)都做出頂尖的成果,這個時候世界就將發(fā)生巨大的改變。
四、
關(guān)于目前及后續(xù)的一些判斷
(一)城市發(fā)展
1. 有專家認(rèn)為,DeepSeek的成功與城市無關(guān)。關(guān)于“哪個城市更適合于創(chuàng)新”這個話題,DeepSeek這件事跟這些沒有關(guān)系——DeepSeek大部分的人是在北京招的,梁文鋒在杭州。DeepSeek對城市、地點(diǎn)這個話題沒有任何啟發(fā),沒有必要花太多時間在地點(diǎn)上。城市應(yīng)該多思考自己有什么特長,而不是希望重復(fù)另外城市的成功經(jīng)驗。
2. 也有專家認(rèn)為,DeepSeek和《哪吒2》的成功與城市環(huán)境高度相關(guān)。從城市發(fā)展的角度來看,最近爆火的DeepSeek和《哪吒2》背后的成都和杭州兩個城市有比較類似的特點(diǎn),一是有很多小微企業(yè),二是親近小微。這兩個地方產(chǎn)生兩個震驚中國和世界的成績不是偶然的。這兩座城市都有類似的注重生態(tài)、親近小微和柔性治理的特點(diǎn),這可能對我們未來的創(chuàng)新路徑和政府在其中應(yīng)該扮演什么角色有很大的借鑒意義。此外,無論是可可豆還是阿里,從創(chuàng)新到引起關(guān)注都走過了差不多10年的歷程,提示我們要有耐心培養(yǎng)環(huán)境。
3. DeepSeek這件事引發(fā)了一些地方政府的反思,以某城市為例。該城市原來的創(chuàng)新資金投入更多的是和硬件、供應(yīng)鏈結(jié)合在一起,純軟件方向根本無人支持。原來更多的把錢投在高校和科研機(jī)構(gòu),以后可能要分出一部錢給中小企業(yè),讓土壤更加肥厚,讓更多的小草長大。政府開始注重個性化服務(wù),特別成立了AI的專班,正在研究推出新的政策。
4. 各城市要避免在“比較”中的過度投資。DeepSeek的出現(xiàn)引發(fā)了廣泛討論,各地紛紛相互“比較”,探討如何培育類似企業(yè)。在此過程中,應(yīng)避免重蹈覆轍:過去國家主導(dǎo)某些產(chǎn)業(yè)政策時,部分城市盲目跟風(fēng),導(dǎo)致過度投資和產(chǎn)能過剩,最終依賴低價競爭,損害行業(yè)和自身利益。導(dǎo)致我們在許多領(lǐng)域雖有頂尖技術(shù),卻未能實現(xiàn)盈利,如光伏和電動汽車。若不改變這種模式,未來新領(lǐng)域的突破也可能陷入同樣困境。
5. 不要迷信DeepSeek。AI產(chǎn)業(yè)每天都有讓人眼前一亮的進(jìn)展。DeepSeek的成功是曇花一現(xiàn)還是“哪吒問世”依然需要時間來驗證。過早總結(jié)和固化DeepSeek的發(fā)展模式,并按照這個模式制定監(jiān)管規(guī)則、產(chǎn)業(yè)政策,或是投入公共資金遴選、資助特定項目或是公司都將是短視和狹視的行為。
(二)政策與監(jiān)管
1. 把握好政府的角色。在不同產(chǎn)業(yè)和不同發(fā)展階段,政府與市場所扮演的角色是不太一樣的。以芯片和AI為例,在芯片領(lǐng)域,我們目前處于明顯的追趕階段,且這一領(lǐng)域的主要挑戰(zhàn)并非來自科學(xué)理論,而是工程實踐中的經(jīng)驗積累。因此,在這一領(lǐng)域,政府的作用較為重要。相比之下,在AI等前沿顛覆性創(chuàng)新領(lǐng)域,政府應(yīng)更多地扮演“園丁”的角色,專注于營造良好的市場環(huán)境,讓創(chuàng)新自然生長。特別是80后、90后和00后,他們往往能夠基于興趣和理想進(jìn)行創(chuàng)新研究,未來的顛覆性創(chuàng)新有望在這一群體中不斷涌現(xiàn)。
2. 營造更好的創(chuàng)新環(huán)境,政府要做好服務(wù),減少不必要的干預(yù)。創(chuàng)新的涌現(xiàn)依賴于良好的生態(tài),政府對創(chuàng)新企業(yè)最好的支持是在合法前提下減少干預(yù)。對初創(chuàng)企業(yè)應(yīng)避免過度監(jiān)管和大量補(bǔ)貼,容忍類似“千團(tuán)大戰(zhàn)”的競爭“亂”象,自然競爭有助于市場自我規(guī)范。提供包容審慎的監(jiān)管環(huán)境,讓企業(yè)在健康生態(tài)中成長,而非拔苗助長。
3. 創(chuàng)新點(diǎn)需要慢慢培養(yǎng)。依靠興趣驅(qū)動的項目更容易百花齊放、孕育創(chuàng)新點(diǎn)。這些點(diǎn)滴積累為國家實現(xiàn)原創(chuàng)性突破、尤其是從0到1的創(chuàng)新至關(guān)重要。它們可以逐步成長,借助創(chuàng)投和企業(yè)力量,最終形成具有前沿性和原創(chuàng)性的成果。
4. 要重視企業(yè)的主體地位。當(dāng)前企業(yè)的主體地位越來越明顯但政策尚未配套,科研經(jīng)費(fèi)和科技力量如何向企業(yè)轉(zhuǎn)移仍需機(jī)制支持。盡管高校、院所和國家實驗室成果顯著,但如何賦能企業(yè)仍是短板。此外,國企與民企的定位與合作也需進(jìn)一步明確,以充分發(fā)揮各自優(yōu)勢。
5. 當(dāng)前形勢對創(chuàng)投提出了更高要求,其能否跟上并發(fā)揮作用至關(guān)重要。以歐盟為例,其報告指出,歐盟缺乏足夠創(chuàng)投,導(dǎo)致30%在本土創(chuàng)立的獨(dú)角獸企業(yè)赴美融資并最終成為美國公司。國內(nèi)類似情況也對創(chuàng)投提出了挑戰(zhàn),尤其是美元資本回流后創(chuàng)投能否填補(bǔ)空缺成為關(guān)鍵問題。此外,目前創(chuàng)投資金主要依賴國有資本,如何在道德風(fēng)險與不確定性中取得平衡仍未解決,這可能是未來的一大隱憂。
6. 堅持開放。我們要堅持開放,我國科技取得今天的成就是因為開放,未來的發(fā)展也要開放。要站在世界舞臺,匯聚全人類的成果。DeepSeek用的是英偉達(dá)的芯片和最前沿的、世界通用的Transformer架構(gòu)以及中國的優(yōu)秀人才,才有這個結(jié)果,也是因為開源得到了世界的認(rèn)可。
7. 不能把創(chuàng)新的視野局限在眼下的大模型或者其他與此相近的一些創(chuàng)新上。面向AI未來的發(fā)展,要打開思路。面向未來,不排除還有其他的模型和其他的路徑。創(chuàng)新的環(huán)境要寬泛寬松,當(dāng)取得目前成績的時候,千萬不要把我們的視野只局限在當(dāng)下的大語言模型、DeepSeek等等,要注重各種其他的創(chuàng)新,千萬不要把視野鎖定了。
(三)行業(yè)與企業(yè)
1. 內(nèi)卷會影響創(chuàng)新,反內(nèi)卷特別重要。在DeepSeek的API漲價200%-500%區(qū)間時,很多云商實施大幅度降價。這種“你漲價我降價”的現(xiàn)象,可以稱之為AI大模型的內(nèi)卷以及反內(nèi)卷。AI大模型領(lǐng)域比任何其他領(lǐng)域都更需要反內(nèi)卷,如果大家都沒有錢掙,就變成了少數(shù)人的游戲,創(chuàng)新的玩家沒有造血功能就難以持續(xù)、逐漸退出,行業(yè)只剩下少數(shù)玩家,這會極大妨礙整個創(chuàng)新的進(jìn)程。我們要警惕高度內(nèi)卷文化帶來創(chuàng)新成本過高的問題,要警惕“蝗蟲過境寸草不生”的思路,要反內(nèi)卷。
2. 不要迷信大廠,中小型企業(yè)是創(chuàng)新主力。無論是DeepSeek,還是openAI,都不是大廠。事實上,今天的移動互聯(lián)網(wǎng)萬人大廠,絕大多數(shù)(除了微軟)也不是更早的互聯(lián)網(wǎng)大廠。科技產(chǎn)業(yè)的顛覆性創(chuàng)新已經(jīng)多次證明,DeepSeek再次證明,AI產(chǎn)業(yè)中,中小型企業(yè)是是創(chuàng)新主力。
(四)創(chuàng)新文化
1. 我們不缺錢,不缺技術(shù),也不缺高密度的人才,但是缺包容創(chuàng)新的文化。我們的文化當(dāng)中要給“非共識”一些土壤,從機(jī)制上保證,資源上保證,文化上保證。DeepSeek這件事給中國創(chuàng)新路徑一個最大的啟發(fā),是社會和各級組織要包容那些非共識、非主流、非中庸的人,不光是個人的包容,要變成機(jī)制的包容、文化的包容。所有的創(chuàng)新都是對原來領(lǐng)域權(quán)威和規(guī)則的否定,有時候越前沿的東西越是非共識的,越不是中庸的。“高質(zhì)量的中庸”就是要包容他們——不是無原則的大力支持,而是包容,給他足夠的空間,中國的文化當(dāng)中特別需要“高質(zhì)量的中庸”。在主賽道之外留一塊自留地給那些“非主流”的人,給他們自由生長的空間。
(五)人才與教育
1. 要認(rèn)識到我國的人才與教育是有優(yōu)勢的。中國人才基礎(chǔ)龐大,80、90后出生人口最密集,按比例,人才的絕對數(shù)量很大。我國人才培養(yǎng)模式也有良好的基礎(chǔ)。目前的北大、清華、浙大等更多更好的學(xué)校,包括這幾年國家在教育改革上成立了一些人工智能學(xué)院等等,對加速推進(jìn)在前沿領(lǐng)域的改革創(chuàng)新和落地是非常重要的。據(jù)一位專家親身調(diào)研觀察,硅谷有兩個現(xiàn)象:一是大廠中華人工程師不低于30%,二是如果初創(chuàng)公司中華人工程師低于30%則表明該公司實力并非特別突出。可見中國的教育體系是有優(yōu)勢的,培養(yǎng)工程師的制度碾壓世界其他國家。
(六)其他
1. 在創(chuàng)新中,情懷與愛好力量巨大。梁文鋒是根據(jù)興趣愛好去做的。他不去做產(chǎn)品,不為了做大公司去融資。他想要做的就是怎么能在 AGI上有突破。因為他本身的動因是情懷,因此他能夠?qū)eepSeek開源,形成如此巨大的影響力。否則的話,DeepSeek就是另外一個模型。
2. 理想的研究環(huán)境與激勵模式。DeepSeek的研究環(huán)境有三個關(guān)鍵要素:足夠的資源、足夠好的工資、足夠聚焦——找一些足夠好的人,聚焦在一件事情上,做一段時間。OPEN AI在發(fā)布ChatGPT之前就是這種狀態(tài)。幻方在DeepSeek發(fā)布之前也是這種狀態(tài)。且中小企業(yè)有一定的模式優(yōu)勢。DeepSeek核心人員可以分享產(chǎn)品商業(yè)化過程中一定比例的收益,科學(xué)家非常年輕,但對科研自主權(quán)的掌握度非常高,所以某種意義上是一種使命驅(qū)動、但又有很高回報的激勵模式。
3. 匱乏有時候反而是財富。正是因為算力的匱乏,倒逼DeepSeek做匯編語言方面的編程,做出一系列的創(chuàng)新,最終取得了很好的效果。就像以色列,以色列資源極度匱乏,但反而極度創(chuàng)新,這是值得國內(nèi)目前處于弱勢地位的行業(yè)和機(jī)構(gòu)思考的。
(七)對創(chuàng)新方向的啟示
1. 場景驅(qū)動創(chuàng)新。DeepSeek的成功在于其高度優(yōu)化的場景方法論,通過MoE架構(gòu)和精細(xì)的系統(tǒng)設(shè)計,實現(xiàn)了工程學(xué)的涌現(xiàn)。其獎勵模型基于真實數(shù)據(jù)和環(huán)境反饋,而非傳統(tǒng)數(shù)據(jù)標(biāo)注,差異顯著。同時,DeepSeek通過抓場景讓千行百業(yè)找到可結(jié)合、可部署的應(yīng)用場景,這是其破圈的關(guān)鍵。
2. 體驗驅(qū)動創(chuàng)新。DeepSeek的成功源于產(chǎn)品體驗形成的競爭壁壘,盡管存在幻覺問題,但其低門檻和快速提升的結(jié)構(gòu)化輸出能力支持了廣泛的應(yīng)用場景。DeepSeek才剛剛起步,未來將涌現(xiàn)更多AI+應(yīng)用。體驗驅(qū)動不僅是DeepSeek的啟示,也是2025年AI應(yīng)用創(chuàng)業(yè)和產(chǎn)品創(chuàng)新的重要方向。
3. 知識驅(qū)動創(chuàng)新。無論是什么行業(yè),都有獨(dú)有的知識庫——從個人知識庫到企業(yè)知識庫。迅速進(jìn)入到細(xì)分場景和領(lǐng)域,迅速進(jìn)入到千行百業(yè)的知識庫,去創(chuàng)造獨(dú)有的小場景、小模型和應(yīng)用,成為更加生生不息的創(chuàng)新生態(tài),也是重要的創(chuàng)新方向。
(感謝陳曉暉、鄧永強(qiáng) 、葛頎 、胡延平 、李志龍 、梁春曉、劉淼、梅德文、孟祥武、秦朔、盛希泰、吳聲、夏春、邢杰、熊園、熊智輝、易鵬、張備、張宏江、張旭、張中祥等提供主要觀點(diǎn)。)
盤古智庫課題組
2024.02.16
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.