01 價(jià)格戰(zhàn)第一槍的意外打響
DeepSeek V2模型發(fā)布后,引發(fā)了大模型價(jià)格戰(zhàn),創(chuàng)始人梁文鋒表示并非有意成為行業(yè)“鯰魚”,只是按成本定價(jià),沒想到價(jià)格敏感度如此之高。智譜AI等跟進(jìn)降價(jià),梁文鋒認(rèn)為智譜AI降的是入門級產(chǎn)品,字節(jié)才是第一個(gè)真正跟進(jìn)的,觸發(fā)了其他大廠降價(jià)。DeepSeek降價(jià)并非為搶用戶,而是探索下一代模型結(jié)構(gòu)降低成本,且認(rèn)為API和AI應(yīng)普惠、人人可用。
02 真正差距在于原創(chuàng)與模仿
DeepSeek V2讓硅谷驚訝,是因?yàn)橹袊疽詣?chuàng)新貢獻(xiàn)者身份加入游戲。梁文鋒指出,中國公司過去習(xí)慣跟隨,缺乏創(chuàng)新信心和高密度人才組織有效創(chuàng)新的能力。大模型是重投入游戲,DeepSeek選擇只做研究探索,是因?yàn)橄雲(yún)⑴c全球創(chuàng)新浪潮,推動生態(tài)發(fā)展,而非趁機(jī)賺錢。
03 幻方做大模型的初心與目標(biāo)
幻方?jīng)Q定下場做大模型,與量化金融無直接關(guān)系,是出于好奇心驅(qū)動。梁文鋒表示,要做通用人工智能AGI,語言大模型是通往AGI的必經(jīng)之路。他們專注大模型本身,不做垂類和應(yīng)用,而是做研究探索,想驗(yàn)證人類智能本質(zhì)與語言的關(guān)系等猜想,也對GPT4的待解之謎進(jìn)行揭秘。
04 萬卡儲備背后的好奇心
DeepSeek在2021年就儲備了1萬枚GPU,梁文鋒解釋,從最早的1張卡逐步發(fā)展到萬卡,是出于對AI能力邊界的好奇。研究員對算力渴求無止境,想做更大規(guī)模實(shí)驗(yàn)。他們對算力的儲備并非為量化投資,而是想搞清楚金融市場更簡潔的表達(dá)方式等。
05 V2模型研發(fā)的本土人才力量
DeepSeek V2模型的研發(fā)團(tuán)隊(duì)并非海外挖來的頂尖人才,而是本土的Top高校應(yīng)屆畢業(yè)生、實(shí)習(xí)生等。梁文鋒認(rèn)為,前50名頂尖人才雖可能不在中國,但中國也能自己打造這樣的人才。MLA創(chuàng)新最早來自一個(gè)年輕研究員的個(gè)人興趣,從想法到落地歷經(jīng)漫長過程。
06 創(chuàng)新的偶然性與信念
梁文鋒覺得創(chuàng)新首先是個(gè)信念問題,硅谷有創(chuàng)新精神是因?yàn)楦摇鴥?nèi)對前沿創(chuàng)新曾缺乏信心,但創(chuàng)新需要自信,年輕人身上這種信心更明顯。DeepSeek的管理方式自下而上,自然分工,當(dāng)idea有潛力時(shí)會自上而下調(diào)配資源。
07 對未來大模型競爭格局的洞察
梁文鋒認(rèn)為大廠有優(yōu)勢,但若不能很快應(yīng)用,也不一定能持續(xù)堅(jiān)持。頭部創(chuàng)業(yè)公司技術(shù)扎實(shí),但面臨商業(yè)化難題。他覺得大模型終局會是專門公司提供基礎(chǔ)模型和基礎(chǔ)服務(wù),有長鏈條專業(yè)分工,更多人在其上滿足社會多樣化需求。
08 招聘進(jìn)展與創(chuàng)新組織的打造
DeepSeek初始團(tuán)隊(duì)已集結(jié),仍需更多人加入。梁文鋒表示,不刻意去海外挖人,更看重基礎(chǔ)能力、創(chuàng)造性、熱愛等。幻方招人看能力不看經(jīng)驗(yàn),核心團(tuán)隊(duì)多為應(yīng)屆和畢業(yè)一兩年的人。創(chuàng)新組織需少干預(yù)管理,給自由發(fā)揮空間和試錯機(jī)會,創(chuàng)新是自己產(chǎn)生的,非刻意安排或教出來。
09 對原創(chuàng)式創(chuàng)新的堅(jiān)持與樂觀
梁文鋒認(rèn)為中國產(chǎn)業(yè)結(jié)構(gòu)調(diào)整會更依賴硬核技術(shù)創(chuàng)新,經(jīng)濟(jì)下行、資本冷周期未必抑制原創(chuàng)式創(chuàng)新,當(dāng)人們發(fā)現(xiàn)賺快錢靠運(yùn)氣,會更愿做真正創(chuàng)新。他以自己在廣東五線城市長大的經(jīng)歷為例,說明觀念會隨時(shí)代改變,硬核創(chuàng)新會越來越多,只是需要事實(shí)和過程。
10 開源與未來規(guī)劃
DeepSeek不會閉源,梁文鋒認(rèn)為先有強(qiáng)大技術(shù)生態(tài)更重要。短期內(nèi)無融資計(jì)劃,面臨問題是高端芯片被禁運(yùn)。他們不做應(yīng)用是因?yàn)楫?dāng)前是技術(shù)創(chuàng)新爆發(fā)期,長遠(yuǎn)希望形成生態(tài),讓業(yè)界直接使用技術(shù)和產(chǎn)出,只負(fù)責(zé)基礎(chǔ)模型和前沿創(chuàng)新。
11 競爭與大模型創(chuàng)業(yè)公司的終局
梁文鋒表示,創(chuàng)業(yè)公司與大廠競爭的新解法未看到,大廠有現(xiàn)成用戶但現(xiàn)金流業(yè)務(wù)也是包袱。他認(rèn)為DeepSeek之外的6家大模型創(chuàng)業(yè)公司可能活下來2到3家,那些自我定位清晰、能精細(xì)化運(yùn)營的更有機(jī)會,有價(jià)值的東西不會消失,會換種方式存在。
12 創(chuàng)新的精神獎賞與持續(xù)性
梁文鋒覺得搞清猜想是否事實(shí)很興奮,創(chuàng)新是昂貴低效的,經(jīng)濟(jì)發(fā)展到一定程度才出現(xiàn)。他以程序員開源社區(qū)瘋狂貢獻(xiàn)為例,說明存在精神獎賞。雖然不是所有人都能瘋狂一輩子,但大部分人年輕時(shí)可無功利目的投入做事。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.