99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek需要感恩美國嗎?

0
分享至


文 | 北方朔風

在上周,DeepSeek開源了五個代碼庫,這些代碼庫不是大模型本身,而是大模型運行所需要的構(gòu)架內(nèi)容——這是之前預告過的內(nèi)容,五天分別開源五個用來優(yōu)化大模型效率的庫。不過到了上周六,來了個意外驚喜,他們公布了V3/R1模型運行的成本利潤率,理論上可以高達545%,這給業(yè)界驚訝的同時,也難免讓人聯(lián)想,為什么會額外公布這方面的信息呢?


因為在公布這篇內(nèi)容的時候,DeepSeek專門注冊了一個官方知乎賬號,而就在之前,國內(nèi)一家從事大模型云服務的公司潞晨科技,這家公司的老板尤洋公開在知乎發(fā)布長文炮轟maas(模型即服務)在中國市場跑不通,DeepSeek的模式一個月要虧幾個億。


DeepSeek公布成本利潤率是否是對炮轟言論的一種回復,我們不得而知。但是面對這篇內(nèi)容,這位來自于伯克利的高材生顯然有些破大防,不僅攻擊其他友商,而且還說出了一些非常匪夷所思的話,比如說指責DeepSeek沒有感恩之心之類的話,隨后還宣布停止DeepSeek的模型服務,雖然后續(xù)也有一貫的刪文道歉,但是觀感上實在是很糟糕。并且這家公司還被扒出之前曾經(jīng)涉嫌盜用代碼等問題。




其實這個事情背景并不復雜,V3/R1模型爆火之后,各家云服務廠商都在自家平臺上線了模型,國內(nèi)各路大模型云服務的使用率飆升,這當然是好事,可是定價卻有點麻煩了。一下子爆發(fā)出的藍海市場競爭激烈,家大業(yè)大的云服務巨頭可以短時間免費,哪怕是較小的云服務廠商,也選擇了和DeepSeek官方一樣的定價,因為V3/R1模型的復雜性,以這個價格運行是否能賺錢,確實是個很看技術水平的事情。


至于尤洋的伯克利身份,這個倒是不必過多糾結(jié),畢竟DeepSeek在MOE(專家混合模型)領域的優(yōu)化設計,大概率是世界第一,美國人的高等學府比不上倒也正常。

簡單的介紹一下,MOE模型和普通的大模型的區(qū)別在于,當遇到一個token的時候,MOE模型只會激活其中的一部分參數(shù),也就是其中的一個小模型,這類模型模型雖然可能會占據(jù)更多的內(nèi)存,但是優(yōu)勢在于,進行大規(guī)模并行推理服務的時候MOE的并行能力更加優(yōu)秀,所以大廠為外界提供服務的模型往往是這類模型,而單純的密集模型,更適合部署在本地。

比起目前世界上公開的其他同類模型,DeepSeek的模型更加復雜,類似的模型往往是幾個類似的小模型堆在一起,而V3/R1有大量大小不一的模型,是目前開源模型之中最復雜的MOE,考慮成本上的優(yōu)勢,美國大廠閉源的那些模型里也很難有超過它的,在這方面的設計,確實可以說是世界第一。

甚至有一種猜想,是DeepSeek的技術人員先設計出了這一套高效運行的構(gòu)架,在這個基礎上才才開發(fā)出了V3/R1。

因為DeepSeek的復雜設計,如何高效部署模型無疑是個挑戰(zhàn),讓很多工作者都掉了不少頭發(fā),DeepSeek以極具開源精神的方式,公布了運行的多個關鍵代碼庫,這樣透徹的開源,全球是獨一家的,從這個角度來說,全球大模型行業(yè)中,DeepSeek無疑是對開源社區(qū)最有感恩精神的了。

而潞晨科技的業(yè)務除了提供服務器之外,很大程度還要提供大模型運行的構(gòu)架,當開源的構(gòu)架比他們自研版本都好的時候,確實就被砸到了飯碗,后面如何回答投資人的質(zhì)問就很有挑戰(zhàn)性了。



在之前文里我們提到過,在大模型時代,互聯(lián)網(wǎng)的開源精神受到了沖擊,除了扎克伯格的llama之外,美國的AI大廠幾乎不進行開源。OpenAI變成了closeai,馬一龍雖然日常攻擊OpenAI,但是Grok開源了早期型號之后,后續(xù)依然沒有開源。

相反,國內(nèi)企業(yè)的開源倒是一直很有精神,不說DeepSeek,阿里的qwen系列一直在各路開源榜單上霸榜,騰訊混元開源了他們的混元模型,階躍星辰開源了多個多模態(tài),minimax開源了線性注意力的模型,哪怕是之前認為開源沒有前途的百度,也宣布即將開源多個模型。相比之下,美國的大廠雖然各個表示受到了震撼,但是依然不改,OpenAI的奧特曼可是在2023年底就承諾2024要開源一些有價值的東西,然而他還是鴿了。

很多人會感慨美國企業(yè)是否失去了開源精神,但是筆者對此倒是有其他的理解,那就是關于大模型這筆經(jīng)濟賬,到底應該怎么算的問題。這或許也是尤洋陷入迷茫的重要原因。在大模型之前的時代,有很多開源項目,是由大廠進行,并且不收費的。那么這些硅谷大廠是否是大善人呢?雖然確實還有點開源精神,但是更大的價值在于,通過免費推廣自家的產(chǎn)品,來建立標準,這背后往往會有更大的利益。

Deepseek選擇開源,應該也有這方面的考慮,不過這估計很有挑戰(zhàn),一來是標準的確立和運行,需要時間,二來是美國對于中國開源模型的阻礙,三來是DeepSeek的思路確實天馬行空,其他人能不能跟得上不好說,比如說在這次開源的代碼庫中,有一個叫做是flashMLA的,就是優(yōu)化DeepSeek v2和v3的MLA框架效率,但是按照DeepSeek公布的新研究,他們下一代的構(gòu)架很可能就不是這個,而是叫做NSA的構(gòu)架,這二者能不能融合,融合之后是什么樣的,是個很難說的事情。


但是到了大模型時代,通過開源獲得更多收益的思路為什么不太行了呢?因為大模型的開發(fā)成本太高了,按照硅谷標準,當下頂級的大模型開發(fā)成本是十億美元級別的,如果考慮數(shù)據(jù)中心建設成本還會更高,下一代模型規(guī)劃的成本已經(jīng)到達了百億美元級別。硅谷各家企業(yè)的技術路線雖然有所不同,但是堆卡都搞的挺猛的,在這種情況,如果開源,如何回收成本呢?

雖然智算算力當然是個好東西,可是這樣堆卡的路線,恐怕并非是唯一解。我們看到馬斯克堆了二十萬張卡的Grok3雖然有了提升,但是很難說是否有性價比,而GPT4.5的token價格則是離譜到了抽象的地步,而很多傳言告訴我們,OpenAI的很多訂閱服務是要倒貼錢的。


這也是之前DeepSeek沖擊美國AI市場的一個邏輯,雖然美國的AI大廠依然可以靠財力支持堆卡,但是如果性能領先的優(yōu)勢是如此之小,那么又應該靠什么方式才能收回前期巨額投資的成本呢?要知道,當下美國AI市場,數(shù)據(jù)中心的投資回報率和資產(chǎn)折舊率,如果不是有AGI這塊大餅畫著,很難有人認為這是一個有價值的投資。雖然美股市場肯定會保證AI巨頭們暫時不爆炸,但是DeepSeek代表中國AI向美國業(yè)界提出的質(zhì)問,并沒有消失。

因為現(xiàn)實條件的限制,我國的AI企業(yè),則是選擇了不太一樣的路線,在成本控制上做出了很多努力,在去年上半年開始,國內(nèi)AI企業(yè)進入了價格戰(zhàn)之后,各方的成本優(yōu)化進步了很多,并且很多廠商可以保持不錯的利潤率。而這樣的模式繼續(xù)發(fā)展,導向又會是什么呢?

其實很多從業(yè)者已經(jīng)提出了一個可能性,未來的大模型會作為一種社會基礎設施,就像是自來水和電力一樣。他們沒有高額的利潤,但是依靠這些模型誕生的種種應用,會有更大的價值。這樣的模式,聽起來似乎比賽博朋克的世界線好不少,但是這恐怕并不符合硅谷AI人的想象。

過去幾年,我們看到硅谷諸位AI大佬吹捧的模式里,AI似乎更類似某種神秘的工具,能提供壟斷式的利潤,而他們可以賺的盆滿缽滿,在他們的眼里,似乎賽博朋克式的世界觀并不是什么壞事。再考慮到這幫人士和黑暗啟蒙右翼之間的關系,這想一想就讓人腦仁疼。而最近不約而同的,OpenAI和Anthropic的老板都開始吹大語言模型能讓人長生不老,也不知道是要給特朗普獻上長生不老藥,還是要轉(zhuǎn)移熱點。



雖然在如此復雜的技術領域話題,筆者并不喜歡誰戰(zhàn)勝誰,誰領先誰多少年的說法,但筆者還是要說,AI作為某種未來的基礎設施來推進社會運行,似乎比賽博朋克巨企壟斷的世界觀要好上不少。如果可能的話,我們還是不要進入賽博朋克式世界觀比較好,反烏托邦只停留在小說和游戲里邊就得了,我們又不是大名鼎鼎的V,沒必要真的去夜之城。這或許也是我國人工智能企業(yè)開源的意義之一了。

回到潞晨科技,其實類似的問題不光是陷入AI競賽的云服務企業(yè),而是整個云服務企業(yè)的挑戰(zhàn)。過去的十年,云服務是十分關鍵的熱點,但是云服務這事,巨頭總是有很大的優(yōu)勢,這是個贏者通吃的行業(yè),巨頭砸錢擴張乃是常態(tài)。

人工智能的云服務也是如此,DeepSeek的moe模型就是典型的越多人用效率越高的那種,雖然545%這個數(shù)據(jù)是理想情況,實際利潤率是明顯低于這個水平的,但是DeepSeek高負載帶來的高效率確實是小的云服務商難以做到的。在這種情況下,較小的AI云服務提供商,確實有很多需要思考的東西,如何做出特色,在全新的競爭之中存活下來,這可能是比攻擊友商更有價值的事情。

回到尤洋先生的問題,在討論這件事情的時候,有人會討論尤洋先生愛國不愛國,他在這次關于DeepSeek和攻擊友商的發(fā)言確實十分奇異搞笑,但是問題的關鍵也不是愛國不愛國這么簡單。



尤洋后續(xù)在小紅書上的陰陽怪氣和找補

在GhatGPT橫空出世之后,國內(nèi)的輿論場無疑很混亂,其中人工智能從業(yè)人士的發(fā)言很是有趣,雖然有很多理性的人工智能從業(yè)者冷靜的分析了相關的內(nèi)容,但是也有一部分人工智能從業(yè)者對國內(nèi)發(fā)表了比現(xiàn)在的尤洋還陰陽怪氣冷嘲熱諷得多的言論。

現(xiàn)在兩年多過去,我們可以理性一點來說,人工智能技術很有價值,但是并沒有那么夸張的價值,人工智能技術存在門檻,但是也沒有那么夸張,對人工智能進行船貨崇拜,是一種非常非常無趣的行為。

程序員群體的立場一直很復雜,但是當我們討論一個群體的立場時,就不能單純用心理學那一套。長期以來,國內(nèi)學計算機的主要理想之一就是去硅谷大廠就業(yè),畢竟有更高的待遇和更體面的地位;而要搞個什么項目,往往也是參考美國那邊開源的東西;各種論文研究,也確實是美國占了大頭。

這種情況下,對美國的研究有光環(huán)實在是人之常情。從這個角度來說,我們也可以理解部分程序員對美國的崇拜和對中國的偏見。在技術上有建樹,不代表對于各方面事務都有深刻的理解,相反,他們的看法可能會更加幼稚,相信最近大企業(yè)家馬斯克先生的各種表演,已經(jīng)告訴了大家這一點。

當然,事情正在起變化。雖然硅谷人工智能熱度很高,但是現(xiàn)在去硅谷就業(yè)的難度大了不少,特朗普先生推進的各項事業(yè),肯定會加劇對華人的歧視。而且在大語言模型領域的開源方面,中國企業(yè)和開發(fā)者做出了比美國同行更多的貢獻。或許很多之前陷入某種偏見的程序員,可以回頭看一看自己的觀點是否有些偏見了?


在一個更公平的世界中,這些偏見或許從一開始就不應該形成,而不是需要靠DeepSeek他們?nèi)ゴ蚱啤V傲何姆逭務搫?chuàng)新的時候就說到,中國人是有能力創(chuàng)新的,但是很多從業(yè)者和投資者不相信。很顯然,這樣的思想鋼印已經(jīng)嚴重背離了現(xiàn)實,已經(jīng)成為當下創(chuàng)新的阻礙。DeepSeek團隊并沒有什么在國外大廠工作的人,這種本土化是十分難得的,也告訴我們有些思想鋼印到了必須被打破的時候了。

人工智能技術的發(fā)展無疑是剛剛起步,中國人肯定會在這方面有很多的貢獻,我們沒理由因為美國人做不到,就覺得中國人也一定做不到,用這套邏輯去衡量國內(nèi)這些新一代的技術工作者非常不公平。這完全不是科學,而是某種宗教。新的時代,我們已經(jīng)不再需要這樣的宗教,不是嗎?

近期文章導讀:

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
佛山女教師婚內(nèi)出軌多人,被“弟弟”頂?shù)醚郏稳展创盍硪荒腥?>
    </a>
        <h3>
      <a href=社會醬
2025-05-16 17:30:43
42歲天后穿熱褲“跪著立蛋”引熱議,一細節(jié)惹網(wǎng)民擔心

42歲天后穿熱褲“跪著立蛋”引熱議,一細節(jié)惹網(wǎng)民擔心

粵睇先生
2025-06-03 11:10:54
懸著的心還是放下了,鹿晗發(fā)文手上的戒指說明一切,答案不言而喻

懸著的心還是放下了,鹿晗發(fā)文手上的戒指說明一切,答案不言而喻

讓世界看到你的
2025-06-05 13:32:13
女跑者真實經(jīng)歷分享:天熱跑步謹慎走光,小心“春光乍泄”

女跑者真實經(jīng)歷分享:天熱跑步謹慎走光,小心“春光乍泄”

馬拉松跑步健身
2025-05-29 13:53:35
今夜生死戰(zhàn)!國足客戰(zhàn)印尼23人大名單

今夜生死戰(zhàn)!國足客戰(zhàn)印尼23人大名單

直播吧
2025-06-05 12:07:34
深夜,中國資產(chǎn)突然爆發(fā)!A50直線拉升,黃金跳水

深夜,中國資產(chǎn)突然爆發(fā)!A50直線拉升,黃金跳水

每日經(jīng)濟新聞
2025-06-06 00:36:06
伊能靜做夢也沒想到,自己頂級名校留學回來的兒子,撕了她的體面

伊能靜做夢也沒想到,自己頂級名校留學回來的兒子,撕了她的體面

楊哥歷史
2025-06-05 09:48:28
新華時評·鍥而不舍落實中央八項規(guī)定精神|假調(diào)研解決不了真問題

新華時評·鍥而不舍落實中央八項規(guī)定精神|假調(diào)研解決不了真問題

新華社
2025-06-05 18:41:10
299元!小米推出新款米家無線直發(fā)梳:滿電用3-4次 能上飛機

299元!小米推出新款米家無線直發(fā)梳:滿電用3-4次 能上飛機

快科技
2025-06-06 00:39:45
什么是“性成癮”?患者自白:我每天要弄十幾次,比戒毒還難!

什么是“性成癮”?患者自白:我每天要弄十幾次,比戒毒還難!

坦然風云
2025-05-22 14:05:05
近日曝光!被印軍包圍,兩名落單解放軍嘴咬手雷,誓死不當俘虜

近日曝光!被印軍包圍,兩名落單解放軍嘴咬手雷,誓死不當俘虜

涵豆說娛
2025-06-05 13:26:31
裁員3500人!花旗銀行在華大裁員,網(wǎng)友和老公是雙職工一起被裁

裁員3500人!花旗銀行在華大裁員,網(wǎng)友和老公是雙職工一起被裁

小人物看盡人間百態(tài)
2025-06-05 19:24:44
張雪峰醒來“天塌了”,家長翻出四年前舊賬,天價志愿卡禍不單行

張雪峰醒來“天塌了”,家長翻出四年前舊賬,天價志愿卡禍不單行

熙熙說教
2025-06-03 18:34:35
樓市變局突襲!近半數(shù)家庭將迎來“4道生存大考”

樓市變局突襲!近半數(shù)家庭將迎來“4道生存大考”

搬磚營Z
2025-06-04 21:13:18
網(wǎng)約車司機:外籍乘客的充電寶引燃了我的車子,該找誰賠償?

網(wǎng)約車司機:外籍乘客的充電寶引燃了我的車子,該找誰賠償?

數(shù)讀網(wǎng)約車
2025-06-04 10:20:57
賽季40勝6負、今年7進決賽,薩巴倫卡領跑WTA全體女將

賽季40勝6負、今年7進決賽,薩巴倫卡領跑WTA全體女將

懂球帝
2025-06-06 00:09:35
沈梓捷高薪加盟廣東,周鵬回歸助力杜鋒沖冠!

沈梓捷高薪加盟廣東,周鵬回歸助力杜鋒沖冠!

小孩侃文體
2025-06-05 09:40:35
玩不起了?新疆1000元燒烤當自助,吃太多老板翻臉,付2000才走人

玩不起了?新疆1000元燒烤當自助,吃太多老板翻臉,付2000才走人

娛樂看阿敞
2025-06-03 10:05:07
突發(fā)!載3000輛汽車輪船在太平洋起火,800輛為電動汽車

突發(fā)!載3000輛汽車輪船在太平洋起火,800輛為電動汽車

墨染情詩
2025-06-05 08:15:04
美俄總統(tǒng)通話后,澤連斯基發(fā)聲

美俄總統(tǒng)通話后,澤連斯基發(fā)聲

參考消息
2025-06-05 18:18:11
2025-06-06 01:36:49
新潮沉思錄 incentive-icons
新潮沉思錄
新潮沉思錄
134文章數(shù) 117關注度
往期回顧 全部

科技要聞

對話盛景網(wǎng)聯(lián)彭志強:跳出SaaS虧損黑洞!從“賣工具”到“賣結(jié)果”的AI RaaS轉(zhuǎn)型法則

頭條要聞

特朗普:對馬斯克“非常失望”

頭條要聞

特朗普:對馬斯克“非常失望”

體育要聞

提前無緣美加墨世界杯 國足眾將賽后落淚

娛樂要聞

陳赫宴請好友,李乃文攜妻子罕見亮相

財經(jīng)要聞

習近平同美國總統(tǒng)特朗普通電話

汽車要聞

旗艦+大六座+百萬級 阿維塔全新SUV預計明年量產(chǎn)

態(tài)度原創(chuàng)

本地
家居
時尚
房產(chǎn)
公開課

本地新聞

非遺里的河南 | 黃河泥變身千年墨寶,寫字都帶仙氣兒~

家居要聞

潔白奶油 簡約舒適之家

泰權威!復刻三分已成濃顏貴女

房產(chǎn)要聞

再奪荔灣銷冠!誰是主城改善標準制定者,終于有了答案!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 太和县| 门源| 阿拉善盟| 鸡东县| 青冈县| 栾城县| 商南县| 南乐县| 靖宇县| 资阳市| 时尚| 洞口县| 萨嘎县| 玛纳斯县| 新乐市| 措勤县| 蕉岭县| 泸水县| 洪雅县| 萨迦县| 饶平县| 宜宾县| 平潭县| 沙坪坝区| 姜堰市| 磐石市| 牡丹江市| 海南省| 夏邑县| 南昌县| 白山市| 丘北县| 宁明县| 南宫市| 靖边县| 饶平县| 应用必备| 泾川县| 连平县| 收藏| 琼结县|