99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

這匹中國大模型黑馬,讓扎克伯格破防了!

0
分享至



DeepSeek用實例給風投們上了一課,不用高薪聘請擁有浮夸頭銜的資深從業者,以免費的AI開源項目為基礎,利用有限資源同樣能夠做出一流的AI大模型。

撰文丨周隆斌

1月13日,美國拜登政府在卸任前最后一周出臺了《人工智能擴散暫行最終規則》。

這份規則將全球各國和地區劃分為3個等級,在獲取美國最先進的AI芯片時,分別接受不同級別的限制。讓人非常不希望看到的是,中國被劃分進了最嚴格的三級管控,數據中心將被全面禁止進口尖端AI芯片。

這項規則是否施行,將在120天的公眾意見征詢期后再行商討。不過,顯而易見的是,美國政府試圖通過行政手段干擾全球芯片和AI行業正常發展。

AI技術中蘊藏著無限潛力已經被廣泛證實,尖端AI芯片更是訓練模型時必不可少的基礎。在獲取算力資源難度加大的背景下,國內AI行業的出路究竟在何方?

近期,被稱作“AI界拼多多”的國產AI大模型——DeepSeek(深度求索),用有限的算力資源,給出了一個解決方案。

01

有起錯的名字,沒有叫錯的綽號。去年底剛剛發布的DeepSeek-V3開源AI大模型,以史無前例的性價比,刷新了全球AI行業的認知。

先來看看這個AI大模型的性能,DeepSeek在自家公眾號中這么介紹V3模型:

DeepSeek-V3多項評測成績超越了Qwen2.5-72B和Llama-3.1-405B等其他開源模型,并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

簡單來講就是,DeepSeek-V3已經成為現在全球最強開源大模型,可以與頭部閉源大模型掰掰手腕。從測評結果上看,DeepSeek好像并沒有吹牛,在百科知識、代碼生成等場景中,DeepSeek-V3確實取得了第一梯隊的成績。

不過,行業內的評測是一份公開試卷,完全可以有針對性地對模型進行訓練。就像電腦的跑分測試,未必就那么客觀。在實際使用體驗上,DeepSeek-V3的數學和編程能力確實非常強,這也是評測的重點方向。不過,它在一些特殊語境或者創造性思維方面還是差點意思。

例如,向DeepSeek-V3詢問,香菇掉到了馬桶中,那它還能被稱作香菇嗎?它只會一本正經地給出回答,GPT-4o則是先點明這是一句幽默的提問,再進行回答。

對于將AI大模型當作搜索引擎的我來說,DeepSeek-V3是合格的。盡管在一些總結歸納上與GPT-4o略有差距,考慮到后者的使用限制,我還是愿意將免費的DeepSeek列為首選AI工具。

令人想不到的是,DeepSeek-V3整個模型的預訓練成本花費為557.6萬美元,僅需GPT-4o的二十分之一。“低廉”的成本給了DeepSeek砸穿行業底價的勇氣,開發者調用DeepSeek-V3的支出只要GPT-4o的十分之一,性價比爆棚。

更加難能可貴的是,DeepSeek-V3在訓練時使用的GPU是英偉達的H800,一款在性能上被閹割的特供AI芯片。OpenAI手握上萬塊英偉達一流的AI芯片,愿意為其融資的投資者絡繹不絕,成本從來都不是他們考慮的第一要素。

后來者大部分以OpenAI為標桿,AI大模型只有砸錢、砸算力才能做出來的觀念在行業中深入人心。正因如此,花小錢辦大事的DeepSeek才讓一眾硅谷大佬們驚呼這是“來自東方的神秘力量”。

扎克伯格在談到DeepSeek時,罕見地表示:“他們的技術真的很不錯,這個模型非常先進。(在AI大模型領域)中國正在全力沖刺,我們當然該支持美國的公司。實際上,這是一場差距很小的競爭。”

02

早在去年5月,DeepSeek發布DeepSeek-V2模型時,超低的價格就引起了AI大模型降價的血雨腥風。彼時DeepSeek尚未推出面向消費者的應用,大眾知名度遠沒有現在這么高。

直到去年12月26日,DeepSeek-V3推出網頁版后一夜爆火,月度訪問量迅速突破千萬。與大模型一同發布的,還有一篇53頁的論文,詳細介紹了DeepSeek-V3模型的技術細節,將如何用有限資源進行模型優化的策略全部公之于眾。

DeepSeek采用的主要技術總結下來有三點,創新的模型架構、高效的訓練技術以及優化資源利用。我認為,其中MLA(多頭潛在注意力機制)架構最值得稱道。DeepSeek將用戶任務分解為多個子任務,由不同的專家模型分別處理,再將各專家模型的結果匯總輸出結果。

這就意味著,大模型在接到用戶需求時,不用調動全部資源進行處理。提升模型運行效率的同時,顯著降低了運行成本,有種“專人專辦”的感覺。

如果仔細研究DeepSeek的解決方案,會發現DeepSeek更多是在進行“工程創新”。它雖然沒有創造出一套全新的技術,卻改進了業內原有的模型訓練方式。

有人認為業內對于DeepSeek的評價有些過高,它只是對原有技術進行了優化。這樣的看法顯然過度關注技術層面,而忽略了AI行業無限光明前景的背后,是有些陰暗的現實。

過去一年中,全球科技公司幾乎都鉚足了勁在AI項目上發力,全球AI初創公司如雨后春筍般冒出,“用AI重塑所有行業”的口號喊得震天響。然而,擺在所有企業面前的窘境是,AI商業化路徑并沒有被完全打通。

對于傳統企業而言,如果需要AI大模型為業務賦能,選擇開源模型進行微調,定制專屬大模型試錯成本更低。廣大消費者為AI功能付費的意愿也不高,大部分用戶都是“白嫖黨”,尚且屬于培養用戶習慣的階段。

就連作為AI行業的領軍企業OpenAI至今都尚未實現盈利,很大一部分原因在于尖端AI模型的訓練耗資驚人,運行成本也十分高昂。據測算,僅維持ChatGPT的運營,每天成本就高達70萬美元。OpenAI首席執行官山姆·奧特曼則表示,未來的AI模型成本預計將超過10億美元。

《紐約時報》獲得的融資文件顯示,OpenAI 2024年預計收入達到37億美元,但預計虧損也將達到50億美元,而2026年虧損可能會高達140億美元,這一估算還不包括給員工的股票激勵兌現。

可以說,高度依賴融資的OpenAI在破產的邊緣反復搖擺。如果明天投資界厭倦了看不到盈利希望的AI行業,OpenAI僅憑自身的造血能力,恐怕難以為繼,其他AI初創企業更是如此。

這樣的擔憂并非空穴來風,知名數據分析機構 CB Insights 發布的《2024年第三季度全球人工智能投融資報告》顯示,2024年第三季度生成式AI領域的投資額環比下降了29%,10億美元以上的大額融資量環比下降77%。

任何生意的核心都是成本與收入的平衡,DeepSeek為AI行業提供了一種嶄新的思路,既然收入端暫時難以大規模提升,不妨先從成本端發力。或許DeepSeek在技術上沒有多么驚天動地的創新,卻讓國內AI行業看到了一絲在夾縫中生存的可能性,也為全球AI行業長久存續提供了新范式。

DeepSeek的成功離不開前輩們技術開源的支持,DeepSeek也愿意將自己的成果以開源的方式反哺整個行業。在通往AGI(通用人工智能)的漫漫石階中,DeepSeek刻下了屬于自己的名字。

03

降低成本這件事并不是什么精妙的點子,更是中國企業最擅長的事情。為什么從百度、騰訊、阿里這些互聯網大廠,到月之暗面、智譜AI、零一萬物等號稱中國大模型領域“六小虎”的創業公司,沒有一家能夠提早想到呢?

如果深入了解DeepSeek這家公司后,就會發現這絕非偶然。

DeepSeek在V3模型發布前相當低調,模型發布后也沒有如國內同行一樣,鋪天蓋地地打廣告,知名度更多來自于用戶們口口相傳。但如果說到它的全資母公司幻方量化,股民朋友們肯定十分熟悉。

幻方量化,迄今為止國內唯一規模曾經超過千億元大關的量化私募。根據私募排排網數據顯示,幻方量化的代表產品九章幻方中證500量化多策略1號,從2017年1月19日成立至今(2025年1月10日),累計收益率超過300%,年化收益率達到19%,與巴菲特年化收益率的20%十分相近。

ChatGPT 3.5問世時,業內測算想要做出這種級別的大模型,至少需要1萬張英偉達A100芯片。彼時全球算力競賽尚未正式開啟,國內擁有萬卡算力的公司,滿打滿算也就6家,百度、騰訊、字節、阿里、商湯,還有一位手握入場券的正是幻方量化。

DeepSeek由幻方量化創始人梁文峰一手創辦,雖然公司成立時間是在2023年7月,但DeepSeek項目在幻方內部已經孵化很久。

2021年幻方量化私募規模破千億元時,梁文峰選擇主動降低管理規模,暫停旗下所有產品的申購,并免除所有基金的贖回費用。目前,幻方量化的管理規模已降至200億-300億元。

彼時外界幾乎沒有任何人能理解梁文峰的決定。主動降低管理規模固然有行業監管趨嚴、市場風險等客觀因素,但很少有私募基金會和送上門的錢過不去。以幻方量化當時的體量和名氣,不說業績提成,單是管理費每年都能躺賺數十億元。

現在看來,或許梁文峰早就看到了AI技術爆發的曙光。梁文峰在接受采訪時提到:“我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展。中國也要逐步成為貢獻者,而不是一直搭便車。”

04

DeepSeek這家公司的企業文化也十分獨特。其他國內科技企業習慣重金聘請行業大佬,DeepSeek的團隊則十分年輕化。

據梁文峰自己透露:“我們的核心技術崗位,基本以應屆和畢業一兩年的人為主。”就連公司的管理層,也都是一些畢業5年左右的年輕人。當然,這些年輕人沒有很深厚的工作背景,卻也都是國內一流院校的天之驕子。

DeepSeek內部采用扁平化管理模式,每一位員工的想法都會得到充分尊重。只要有新點子,不論職級,在經過內部討論后,都可以調動公司資源進行項目研究。DeepSeek-V3的MLA架構,最初正是由一位年輕研究員的個人興趣所誕生。

除此之外,背靠幻方的DeepSeek是業內罕見的不依靠外部融資生存的初創公司。沒有投資人給的壓力,商業化自然也不是DeepSeek的首要任務。所以直到V3模型之前,DeepSeek都沒有選擇上線面向大眾的產品。或許是巧合,OpenAI的ChatGPT也是迭代到3.5版本,才選擇公之于眾。

成員年輕化,組織結構扁平化,不以商業化為首要目標,這一切組合在一起,使得DeepSeek在行業中顯得格格不入。梁文峰主動跳出私募行業的舒適圈,帶領一群壓根沒有找到自己舒適圈的年輕員工,開辟出了一條未曾設想的道路。

有人說,DeepSeek閃亮登場,用少量算力資源訓練出超強大模型,英偉達慌了,芯片要賣不動了。然而,DeepSeek提供的是一種現有大模型訓練的優化方案,要想達成AGI光憑現有技術肯定是不夠的,下一代大模型還是要仰仗算力堆砌。

真正應該慌的,是那些AI初創企業們。

正如小米造車前,雷軍計劃5年投入1000億元。沒想到研發、建廠、營銷一系列開支下來,僅花費300億元,第一款車型小米SU7就火爆全國。國內投資圈這才明白過來,那些砸進去大幾百億連年虧損,毛利率轉正都難的造車新勢力們有多無能。

DeepSeek同樣用實例給風投們上了一課,不用高薪聘請擁有浮夸頭銜的資深從業者,以免費的AI開源項目為基礎,利用有限資源同樣能夠做出一流的AI大模型。

沒有對比就沒有傷害,其余AI初創公司的精美PPT中,究竟有多少是高管給投資人畫的大餅,無數輪募資中拿到的錢是不是用在了刀把上?DeepSeek論文發布后,不知道有多少AI初創公司的高管正在連夜開會,琢磨新的說辭。

在中美AI競賽中,DeepSeek以業界黑馬的形象出現,給硅谷帶來了一點小小的中國震撼。作為一家以量化交易起家的中國公司,DeepSeek并不被視為技術引領者,但他在有限的算力資源條件下,卻依然能夠做出令整個AI行業為之側目的技術創新。

這也讓世人看到,在這場前途未卜的AI大競賽當中,中國公司仍然有很大機會,結合自身優勢,在先進AI領域擁有自己的話語權,進而迸發出改變世界的力量。

*本文為冰川思想庫原創文章,未經授權禁止轉載,否則追究相關法律責任

聲明:個人原創,僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
《歌手2025》第四期雙補位賽制歌手曝光:衛蘭、范瑋琪

《歌手2025》第四期雙補位賽制歌手曝光:衛蘭、范瑋琪

東方不敗然多多
2025-06-03 00:44:33
2025金球獎實力排名:大巴黎軍團集體登陸,前兩名已無懸念?

2025金球獎實力排名:大巴黎軍團集體登陸,前兩名已無懸念?

仰臥撐FTUer
2025-06-02 19:33:08
中國殘聯聲明:將追責!

中國殘聯聲明:將追責!

新京報政事兒
2025-06-02 10:08:44
美國多希望中國能夠拋售美債,但中國不但沒上套,穩穩握住了美債

美國多希望中國能夠拋售美債,但中國不但沒上套,穩穩握住了美債

大道無形我有型
2025-05-06 23:25:41
謝霆鋒兒子曝光!父子關系引發熱議,張柏芝態度令人關注!

謝霆鋒兒子曝光!父子關系引發熱議,張柏芝態度令人關注!

舞指飛揚
2025-06-01 06:20:06
廣東龍舟劃完后,河面浮起很多暈厥小魚,網友笑麻:被船槳扇暈了

廣東龍舟劃完后,河面浮起很多暈厥小魚,網友笑麻:被船槳扇暈了

深析古今
2025-06-02 14:07:25
世界被搞糊涂了!轟炸機被排隊摧毀后,俄軍安靜,2天內或有大事

世界被搞糊涂了!轟炸機被排隊摧毀后,俄軍安靜,2天內或有大事

觀察者小海風
2025-06-03 06:38:30
多達5萬俄軍集結,烏克蘭蘇梅州準備應對大規模進攻

多達5萬俄軍集結,烏克蘭蘇梅州準備應對大規模進攻

楓葉君評
2025-06-03 03:24:06
比洞洞鞋還丑的鞋,被中產搶瘋了

比洞洞鞋還丑的鞋,被中產搶瘋了

中國新聞周刊
2025-06-02 22:41:10
多位網壇名宿分析鄭欽文潰敗根源:被靈教耍得團團轉

多位網壇名宿分析鄭欽文潰敗根源:被靈教耍得團團轉

網球之家
2025-01-16 13:14:26
就在今天!油價大反轉

就在今天!油價大反轉

魯中晨報
2025-06-03 07:02:02
韓媒:韓國無黨派總統候選人黃教安宣布退選,支持執政黨候選人金文洙

韓媒:韓國無黨派總統候選人黃教安宣布退選,支持執政黨候選人金文洙

環球網資訊
2025-06-01 18:34:54
高速公路收費價格,25年05月31日,全國各地高速公路收費價格分析

高速公路收費價格,25年05月31日,全國各地高速公路收費價格分析

金哥說新能源車
2025-06-03 03:24:25
中印邊境又有視頻流出,印軍罵罵咧咧,看到解放軍刺刀后瞬間老實

中印邊境又有視頻流出,印軍罵罵咧咧,看到解放軍刺刀后瞬間老實

阿龍聊軍事
2025-06-02 09:19:03
“葳蕤”的“蕤”字該怎么讀?“葳蕤”是什么意思?

“葳蕤”的“蕤”字該怎么讀?“葳蕤”是什么意思?

凡知
2025-06-02 17:51:28
沙特媒:新月與米蘭就特奧達成協議,轉會費3500萬&只差球員同意

沙特媒:新月與米蘭就特奧達成協議,轉會費3500萬&只差球員同意

直播吧
2025-06-03 06:43:07
花4萬體驗子宮激活療法,能持續高潮兩小時,治療方法:有手就行

花4萬體驗子宮激活療法,能持續高潮兩小時,治療方法:有手就行

社會醬
2025-06-01 09:51:58
楊絳說:記住,和周圍人搞好關系的秘訣就是,不要和他們分享任何成功的喜悅,和任何開心的事兒!

楊絳說:記住,和周圍人搞好關系的秘訣就是,不要和他們分享任何成功的喜悅,和任何開心的事兒!

LULU生活家
2025-03-11 18:21:18
晚年苦不苦,要看五十五:人到55,還沒擁有這三樣,晚年多半凄涼

晚年苦不苦,要看五十五:人到55,還沒擁有這三樣,晚年多半凄涼

詩詞中國
2025-01-10 14:30:18
男子哈工大本碩被裁員4個月,投200份簡歷后找到工作,薪資降7000

男子哈工大本碩被裁員4個月,投200份簡歷后找到工作,薪資降7000

奇思妙想草葉君
2025-06-01 21:27:32
2025-06-03 09:55:00
冰川思想庫 incentive-icons
冰川思想庫
匯聚思想,分享銳見。
2390文章數 123878關注度
往期回顧 全部

科技要聞

李斌:樂道一線減員40% 銷量反要大漲40%

頭條要聞

經銷商因銷量慘淡關店 80多輛電動車被廠家遠程鎖死

頭條要聞

經銷商因銷量慘淡關店 80多輛電動車被廠家遠程鎖死

體育要聞

傲了一輩子的恩里克,心中永遠住著一個小天使

娛樂要聞

大S女兒來北京!馬筱梅帶她喝下午茶

財經要聞

特朗普升級貿易戰 歐盟警告

汽車要聞

吉利汽車5月銷量23.52萬輛 同比增長46%

態度原創

手機
家居
旅游
本地
公開課

手機要聞

三星聯手英國內政部推廣 Galaxy 手機防盜功能

家居要聞

原木純白 邂逅自然本真

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

云游中國 |來仰天湖大草原,一起策馬奔騰

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 平湖市| 泌阳县| 日喀则市| 化州市| 那坡县| 平定县| 信丰县| 镇江市| 平果县| 根河市| 蓬莱市| 思茅市| 泾源县| 恩平市| 石嘴山市| 石屏县| 民和| 德州市| 三都| 搜索| 万荣县| 如皋市| 沛县| 仪征市| 浦江县| 乐安县| 无棣县| 昌乐县| 疏附县| 丰宁| 金塔县| 宜君县| 罗平县| 和平县| 孟村| 吉安县| 陕西省| 青川县| 宜城市| 莆田市| 高平市|