99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

大模型價(jià)格戰(zhàn),還能再狠一點(diǎn)

0
分享至


誰(shuí)也不曾想到,大模型產(chǎn)業(yè)的首次“集體會(huì)戰(zhàn)”,居然圍繞價(jià)格展開(kāi)。

5月6日,私募巨頭幻方旗下的深度求索,打響了降價(jià)第一槍。深度求索發(fā)布的模型DeepSeek-V2(32k),在數(shù)學(xué)、編程、中英文等能力上已逼近GPT-4;然而,DeepSeek-V2的使用價(jià)格僅約為GPT-4o的1/35。

DeepSeek-V2的輸入與輸出價(jià)格分別為1元/百萬(wàn)tokens和2元/百萬(wàn)tokens,遠(yuǎn)低于市場(chǎng)價(jià)。

比拼多多砍一刀還便宜的價(jià)格,驚動(dòng)了不少美國(guó)專(zhuān)家。知名分析師Dylan Patel讀完DeepSeek-V2的論文后,激動(dòng)地表示,“這可能是今年最好的一篇。[1]”


DeepSeek-V2的論文

一周后,“卷王”字節(jié)跳動(dòng)又添一把火。

豆包通用模型Pro-32k的輸入價(jià)格,被一刀砍到了更低的0.8元/百萬(wàn)tokens?;鹕揭婵偛米T待表示,“豆包比行業(yè)價(jià)格低了99.3%,大模型從此以厘計(jì)價(jià)?!?/p>

眼看友商如此不講武德,其他科技公司再也坐不住了。

阿里率先回?fù)?,一狠心,大舉下調(diào)了所有模型的價(jià)格。

幾個(gè)小時(shí)后,百度干脆沖向競(jìng)價(jià)終點(diǎn):宣布兩款輕量級(jí)模型全面免費(fèi)。緊接著,科大訊飛星火Lite API、騰訊混元大模型lite 256k也相繼宣布免費(fèi)。


如此盛況,很難不讓人夢(mèng)回那段滴滴大戰(zhàn)快的、ofo摩拜互扯頭發(fā)的激情歲月。

然而,圍繞大模型的價(jià)格戰(zhàn),遠(yuǎn)不如網(wǎng)約車(chē)、共享單車(chē)那般直觀,各種專(zhuān)業(yè)名詞讓人摸不著頭腦。所以,這些大模型公司,到底在熱鬧些什么?


價(jià)格戰(zhàn)的B面

想要理解這點(diǎn),首先得知曉大模型的商業(yè)模式。以阿里云為例,它所提供的大模型服務(wù),共有3種[2]:

(1)基礎(chǔ)服務(wù):模型推理。

模型推理,指的是根據(jù)輸入的信息內(nèi)容,給出回答的過(guò)程。換句話(huà)說(shuō),推理就是“實(shí)際使用”模型的過(guò)程。

阿里云預(yù)置了多個(gè)性能不同的“標(biāo)準(zhǔn)版模型”,供用戶(hù)推理。該服務(wù)的計(jì)費(fèi)方式很簡(jiǎn)單,即“以量計(jì)價(jià)”:以消耗的token數(shù)量為單位,用得越多,費(fèi)用越高。并且性能越好的模型,收費(fèi)越貴。

token是大模型用來(lái)衡量文本長(zhǎng)度的一種計(jì)數(shù)單位,可以簡(jiǎn)單理解為“字?jǐn)?shù)”。3本篇幅為75萬(wàn)字的《三國(guó)演義》,大約需要125萬(wàn)個(gè)token。


(2)進(jìn)階服務(wù):模型微調(diào)。

如果覺(jué)得“標(biāo)準(zhǔn)版模型”不好用,阿里云還提供了“定制研發(fā)”服務(wù),即模型微調(diào)。具體收費(fèi),則取決于“定制研發(fā)”消耗的計(jì)算資源與開(kāi)發(fā)周期。

(3)超進(jìn)階服務(wù):模型部署。

當(dāng)用戶(hù)需要長(zhǎng)期使用大模型時(shí),最好的方式是將它部署到獨(dú)占實(shí)例中。

獨(dú)占實(shí)例,指的是直接承包一個(gè)或多個(gè)物理服務(wù)器的全部資源。翻譯成人話(huà)就是,不再只是租一個(gè)商鋪,而是將整個(gè)商業(yè)廣場(chǎng)都租下來(lái)。

這么做的好處在于,沒(méi)有別的商戶(hù)和你搶計(jì)算資源,響應(yīng)速度更快。

其收費(fèi)模式,也是以量計(jì)價(jià),但有兩種形式:阿里是直接按照“商業(yè)廣場(chǎng)”消耗的計(jì)算資源計(jì)費(fèi);除此之外,百度還支持按照模型推理的token數(shù)量計(jì)費(fèi)。


這3種收費(fèi)模式,面向的是企業(yè)與個(gè)人開(kāi)發(fā)者,代表了大模型開(kāi)發(fā)由淺入深的過(guò)程。而各大科技公司瘋狂砍價(jià)的,其實(shí)是上文提到的“基礎(chǔ)服務(wù)”,即“標(biāo)準(zhǔn)版模型”的推理費(fèi)用。

推理費(fèi)用的具體定價(jià),又分成了“輸入”和“輸出”兩部分。

簡(jiǎn)單來(lái)說(shuō),輸入就是用戶(hù)提問(wèn)的內(nèi)容,而輸出則是大模型的回答。科技公司往往會(huì)根據(jù)輸入和輸出的token數(shù)量(字?jǐn)?shù)),進(jìn)行兩次計(jì)費(fèi)。

這種復(fù)雜又細(xì)微的差異,很容易成為科技公司的套路。

例如字節(jié)跳動(dòng)的“0.8元/百萬(wàn)tokens”“比行業(yè)價(jià)格低99.3%”,其實(shí)只是輸入價(jià)格。豆包通用模型Pro-32k的輸出價(jià)格仍是2元/百萬(wàn)tokens,與DeepSeek-V2等同行持平。

由此可見(jiàn),別看大模型價(jià)格戰(zhàn)打得火熱,背后實(shí)則另有洞天。


降價(jià)的千層套路

可以發(fā)現(xiàn),本輪價(jià)格戰(zhàn)最為活躍的,基本上都是云計(jì)算公司,代表廠商是BAT和字節(jié)跳動(dòng)。

它們之所以敢如此降價(jià),還是因?yàn)槟軓膭e的地方彌補(bǔ)損失,羊毛出在羊身上。

正如前文提到,降價(jià)乃至免費(fèi)的,其實(shí)只是基礎(chǔ)服務(wù)。

毫無(wú)疑問(wèn),這可以幫助中小開(kāi)發(fā)者以更低的成本構(gòu)建應(yīng)用。然而,當(dāng)開(kāi)發(fā)者或者企業(yè),需要更貼合自身業(yè)務(wù),深入使用大模型時(shí),往往繞不開(kāi)進(jìn)階的模型微調(diào)和模型部署——這兩項(xiàng)服務(wù),可不是本次價(jià)格戰(zhàn)的主角。

例如百度宣布免費(fèi)的ERNIE-Speed-8K,如果實(shí)際部署,收費(fèi)就變成了5元/百萬(wàn)tokens[3]。

與此同時(shí),各家降價(jià)最狠的,其實(shí)都是輕量級(jí)的預(yù)置模型;相比之下,性能更強(qiáng)悍的“超大杯”模型,實(shí)際降價(jià)幅度沒(méi)有那么夸張。

例如阿里的Qwen-Max,實(shí)際與字節(jié)跳動(dòng)的豆包通用模型Pro-32k一樣,只是降低了輸入的價(jià)格;而隔壁的百度,壓根沒(méi)提超大杯模型。


云計(jì)算廠商的價(jià)格戰(zhàn),更像是用“免費(fèi)游戲”的形式吸引更多玩家加入;但若想繼續(xù)“升級(jí)變強(qiáng)”,該氪金還得氪金。

當(dāng)然,云計(jì)算廠商并非唯一的參與者。

以深度求索與智譜AI為代表的明星初創(chuàng)公司,之所以也敢跟進(jìn)內(nèi)卷,很大程度上是因?yàn)橛谐渥愕膹椝?,尤其是算力資源。

早在大模型尚未爆發(fā)的2020年,背靠私募巨頭幻方的深度求索,就投資了上億元籌建AI超級(jí)計(jì)算機(jī)。

目前,幻方是除BAT、商湯、字節(jié)跳動(dòng)外,第六家擁有1萬(wàn)張以上英偉達(dá)A100 GPU儲(chǔ)備的中國(guó)公司[4]。

而智譜AI則背靠阿里和騰訊,是估值過(guò)百億的AI獨(dú)角獸公司。

2020年時(shí),智譜AI也碰巧囤積了不少GPU資源。 其CEO張鵬曾在接受《中國(guó)企業(yè)家》采訪時(shí)提到:

當(dāng)時(shí),他認(rèn)識(shí)的一家云計(jì)算廠商,有一批GPU積灰了。 這批GPU原本是供應(yīng)給游戲公司的,但陰差陽(yáng)錯(cuò)之下,對(duì)方又不買(mǎi)了。 張鵬知道這個(gè)消息后,順勢(shì)接盤(pán)了這批計(jì)算資源[5]。

現(xiàn)金流、算力資源都充足的情況下,即便燒錢(qián)換市場(chǎng),這些初創(chuàng)公司也能扛得住。

那么問(wèn)題來(lái)了:當(dāng)年移動(dòng)互聯(lián)網(wǎng)補(bǔ)貼換市場(chǎng),尚可以簡(jiǎn)單粗暴地歸因?yàn)椤凹夹g(shù)門(mén)檻低”;主打一手高科技的大模型,怎么也沒(méi)走出價(jià)格戰(zhàn)的怪圈?


必經(jīng)之路

大模型智能化帶給世人的震撼,往往讓人忽視它的本質(zhì),其實(shí)是一種基礎(chǔ)設(shè)施。

去年,知名計(jì)算機(jī)科學(xué)家吳恩達(dá)曾在公開(kāi)演講中提到:

AI其實(shí)是一系列工具的集合。這些工具包括了監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí),以及現(xiàn)在的生成式人工智能。 所有這些都是通用技術(shù),意味著它與電力和互聯(lián)網(wǎng)等其他通用技術(shù),并沒(méi)有什么區(qū)別[6]。

電力與互聯(lián)網(wǎng),并沒(méi)法直接創(chuàng)造價(jià)值;真正改變世界的,其實(shí)電燈、電腦、電商、電子游戲。

然而,應(yīng)用的爆發(fā)其實(shí)有一個(gè)前提:即基礎(chǔ)設(shè)施足夠便宜。此前,大模型應(yīng)用沒(méi)能快速鋪開(kāi)的一個(gè)主要困境,正是使用成本過(guò)高。

哄哄模擬器就是一個(gè)典型的案例。

今年年初,一位名叫王登科的獨(dú)立開(kāi)發(fā)者,開(kāi)發(fā)了一款模擬“生氣女朋友”形象的AI應(yīng)用。該應(yīng)用的玩法很簡(jiǎn)單,用戶(hù)必須斗智斗勇哄好對(duì)話(huà)窗口里的AI女友。

因?yàn)榻换ズ?jiǎn)單和立意頗有情趣,哄哄模擬器上線第一天就吸引了60多萬(wàn)用戶(hù)。

突然的爆紅,卻讓王登科哭笑不得。哄哄模擬器使用了預(yù)置的GPT-3.5模型,運(yùn)營(yíng)一早上就花了他2000多美金的推理費(fèi)用。

這就相當(dāng)于,開(kāi)發(fā)了個(gè)App,還沒(méi)想到咋賺錢(qián),先交了1萬(wàn)塊錢(qián)電費(fèi)。


縱觀歷史可以發(fā)現(xiàn),當(dāng)年移動(dòng)互聯(lián)網(wǎng)的大規(guī)模普及,也是建立在基礎(chǔ)設(shè)施降本之上的。

2014年的一份調(diào)查報(bào)告顯示,當(dāng)時(shí)由于流量費(fèi)用高昂,手機(jī)用戶(hù)每天使用流量不會(huì)超過(guò)3小時(shí)。且不使用移動(dòng)網(wǎng)絡(luò)時(shí),很多用戶(hù)會(huì)選擇將其關(guān)閉,以防止手機(jī)應(yīng)用在后臺(tái)消耗流量[7]。

彼時(shí),大多數(shù)用戶(hù),都曾做過(guò)“一覺(jué)醒來(lái)房子歸中國(guó)移動(dòng)”的噩夢(mèng)。

2013年的時(shí)候,快手就明確了“短視頻社區(qū)”的定位,但增長(zhǎng)相對(duì)緩慢。這背后,很難說(shuō)沒(méi)有大環(huán)境的原因。

事實(shí)上,直到電信運(yùn)營(yíng)商開(kāi)始大搞“降費(fèi)提速”,短視頻行業(yè)才真正開(kāi)始爆發(fā)。

2019年,手機(jī)上網(wǎng)流量資費(fèi)較2014年時(shí)已下降了超90%[8]。至此,手機(jī)淘寶、微信、抖音等才逐漸成為字面意義上的“國(guó)民應(yīng)用”。

由此可見(jiàn),降價(jià)其實(shí)是大模型產(chǎn)業(yè)發(fā)展的必經(jīng)之路。

也許在這輪價(jià)格戰(zhàn)中,云計(jì)算廠商與初創(chuàng)公司,各有各的小九九;但對(duì)開(kāi)發(fā)者和普通用戶(hù)來(lái)說(shuō),建議可以打得再狠一點(diǎn)。



參考資料

[1] OpenAI Is Doomed,SemiAnalysis

[2] 阿里云大模型服務(wù)平臺(tái)百煉

[3] 千帆大模型平臺(tái)

[4] 量化巨頭發(fā)布第一代大模型:免費(fèi)商用,完全開(kāi)源,澎湃新聞

[5] 智譜AI CEO張鵬:中國(guó)大模型創(chuàng)業(yè)者,不再追隨OpenAI,中國(guó)企業(yè)家

[6] Andrew Ng: Opportunities in AI - 2023,Stanford Online

[7] 2014年中國(guó)手機(jī)流量使用報(bào)告:近四成用戶(hù)流量不夠用,中國(guó)新聞網(wǎng)

[8] 工業(yè)和信息化部組織召開(kāi)“提速降費(fèi)”用戶(hù)面對(duì)面座談會(huì)

編輯:陳彬

視覺(jué)設(shè)計(jì):疏睿

責(zé)任編輯:陳彬


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
付政浩:楊瀚森最后一場(chǎng)夏聯(lián)不打 將回國(guó)備戰(zhàn)8月開(kāi)打的男籃亞洲杯

付政浩:楊瀚森最后一場(chǎng)夏聯(lián)不打 將回國(guó)備戰(zhàn)8月開(kāi)打的男籃亞洲杯

直播吧
2025-07-19 17:08:07
韓國(guó)教授:漢朝前中國(guó)一直歸屬韓國(guó)統(tǒng)治,外國(guó)網(wǎng)友評(píng)論出奇一致

韓國(guó)教授:漢朝前中國(guó)一直歸屬韓國(guó)統(tǒng)治,外國(guó)網(wǎng)友評(píng)論出奇一致

劉森森
2025-07-19 10:28:54
從民國(guó)四論看知識(shí)分子的自由與抉擇

從民國(guó)四論看知識(shí)分子的自由與抉擇

尚曦讀史
2025-07-17 10:52:27
英媒:熱刺已通知孫興慜,若有合適報(bào)價(jià)他就可以離隊(duì)

英媒:熱刺已通知孫興慜,若有合適報(bào)價(jià)他就可以離隊(duì)

懂球帝
2025-07-18 16:25:06
有人拿孟晚舟和宗馥莉做對(duì)比,說(shuō)孟晚舟有格局,不對(duì)姚安娜下死手

有人拿孟晚舟和宗馥莉做對(duì)比,說(shuō)孟晚舟有格局,不對(duì)姚安娜下死手

小娛樂(lè)悠悠
2025-07-19 14:28:33
準(zhǔn)備開(kāi)搶?zhuān)±潞灱s后美媒曬剩余大魚(yú)TOP20:保羅8威少7庫(kù)明加2

準(zhǔn)備開(kāi)搶?zhuān)±潞灱s后美媒曬剩余大魚(yú)TOP20:保羅8威少7庫(kù)明加2

鍋?zhàn)踊@球
2025-07-18 17:59:00
楊議回應(yīng)“楊少華4億遺產(chǎn)”是玩笑,真有4億的相聲藝人,僅這兩位

楊議回應(yīng)“楊少華4億遺產(chǎn)”是玩笑,真有4億的相聲藝人,僅這兩位

探源歷史
2025-07-19 09:55:32
“敗犬效應(yīng)”下裁判無(wú)視規(guī)則針對(duì)張子宇,中國(guó)籃協(xié)向國(guó)際籃協(xié)申訴

“敗犬效應(yīng)”下裁判無(wú)視規(guī)則針對(duì)張子宇,中國(guó)籃協(xié)向國(guó)際籃協(xié)申訴

云隱南山
2025-07-19 12:21:41
資本狂歡!宇樹(shù)科技正式啟動(dòng)IPO,王興興占股35%,又一個(gè)超級(jí)科技富豪即將誕生!

資本狂歡!宇樹(shù)科技正式啟動(dòng)IPO,王興興占股35%,又一個(gè)超級(jí)科技富豪即將誕生!

EETOP半導(dǎo)體社區(qū)
2025-07-19 09:40:45
周末重磅!宇樹(shù)科技即將IPO,核心參股的公司只有這8家

周末重磅!宇樹(shù)科技即將IPO,核心參股的公司只有這8家

八百者也
2025-07-19 09:29:39
10年大喊“我爸是李剛”的李啟銘,出獄后單位不敢收,如今咋樣了

10年大喊“我爸是李剛”的李啟銘,出獄后單位不敢收,如今咋樣了

諾言卿史錄
2025-07-17 14:23:52
5只狼崽被狗媽媽養(yǎng)大,狼成年后,對(duì)狗媽媽的態(tài)度令所有人愣住

5只狼崽被狗媽媽養(yǎng)大,狼成年后,對(duì)狗媽媽的態(tài)度令所有人愣住

磊子講史
2025-07-17 12:49:24
常州隊(duì),進(jìn)一個(gè)!

常州隊(duì),進(jìn)一個(gè)!

上觀新聞
2025-07-19 16:25:19
紅魔新引擎:姆貝烏莫與庫(kù)尼亞加盟,曼聯(lián)2025/26賽季陣容浮現(xiàn)

紅魔新引擎:姆貝烏莫與庫(kù)尼亞加盟,曼聯(lián)2025/26賽季陣容浮現(xiàn)

星耀國(guó)際足壇
2025-07-19 15:57:49
ETC終于被整治了,各大銀行紛紛認(rèn)慫妥協(xié),車(chē)主:早該這樣

ETC終于被整治了,各大銀行紛紛認(rèn)慫妥協(xié),車(chē)主:早該這樣

阿傖說(shuō)事
2025-07-11 08:13:05
男子超市買(mǎi)347瓶五糧液207瓶是假貨,超市:入庫(kù)酒為真品,但被員工周某換成假酒,法院判超市對(duì)假酒退款,并賠12萬(wàn)余元

男子超市買(mǎi)347瓶五糧液207瓶是假貨,超市:入庫(kù)酒為真品,但被員工周某換成假酒,法院判超市對(duì)假酒退款,并賠12萬(wàn)余元

揚(yáng)子晚報(bào)
2025-07-18 23:56:55
男子當(dāng)兵11年默默無(wú)聞,退伍證剛到手,部隊(duì)電話(huà)響個(gè)不停

男子當(dāng)兵11年默默無(wú)聞,退伍證剛到手,部隊(duì)電話(huà)響個(gè)不停

今天說(shuō)故事
2025-07-14 18:15:20
有錢(qián)人夏天和你的夏天有啥區(qū)別? 網(wǎng)友:富人選擇生活 窮人適應(yīng)生活

有錢(qián)人夏天和你的夏天有啥區(qū)別? 網(wǎng)友:富人選擇生活 窮人適應(yīng)生活

我不叫阿哏
2025-07-19 08:51:02
俄軍大炮越打越多,西方終于發(fā)現(xiàn)異常,原來(lái)有人悄悄送來(lái)關(guān)鍵設(shè)備

俄軍大炮越打越多,西方終于發(fā)現(xiàn)異常,原來(lái)有人悄悄送來(lái)關(guān)鍵設(shè)備

松林看世界
2025-07-19 07:32:22
“新4大火爐”曝光:不是武漢,第一名熱瘋了

“新4大火爐”曝光:不是武漢,第一名熱瘋了

觀察鑒娛
2025-07-17 12:39:49
2025-07-19 18:04:49
遠(yuǎn)川科技評(píng)論 incentive-icons
遠(yuǎn)川科技評(píng)論
用投資視角,扒巨頭秘史
353文章數(shù) 2270關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

娃哈哈爭(zhēng)產(chǎn)大戰(zhàn):杜建英的進(jìn)擊

頭條要聞

越南前國(guó)家領(lǐng)導(dǎo)人阮春福、武文賞等3人被解除黨內(nèi)職務(wù)

頭條要聞

越南前國(guó)家領(lǐng)導(dǎo)人阮春福、武文賞等3人被解除黨內(nèi)職務(wù)

體育要聞

韋德:楊瀚森讓我想起王治郅 打球都非常聰明

娛樂(lè)要聞

肖戰(zhàn)微博改名:去掉X玖少年團(tuán)頭銜

科技要聞

工信部等約談17家車(chē)企巨頭,競(jìng)爭(zhēng)劃新紅線

汽車(chē)要聞

中汽中心新能源檢驗(yàn)中心煥新發(fā)布"汽車(chē)行車(chē)控制安全技術(shù)驗(yàn)證VCTA"

態(tài)度原創(chuàng)

本地
家居
時(shí)尚
手機(jī)
公開(kāi)課

本地新聞

換個(gè)城市過(guò)夏天 | 誰(shuí)打翻了濰坊的調(diào)色盤(pán)?

家居要聞

簡(jiǎn)構(gòu)智居 現(xiàn)代功能美學(xué)

造城者“她”,用設(shè)計(jì)重塑城市溫度

手機(jī)要聞

OPPO K13 Turbo 系列手機(jī)參數(shù)匯總,7 月 21 日發(fā)布

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 东海县| 宁晋县| 赞皇县| 调兵山市| 清原| 泸溪县| 汪清县| 平昌县| 共和县| 奈曼旗| 龙口市| 祁阳县| 许昌市| 武隆县| 焉耆| 巫溪县| 山阴县| 潜山县| 远安县| 来凤县| 乳源| 邢台市| 皮山县| 枝江市| 聂荣县| 萨迦县| 泰安市| 孙吴县| 东平县| 祁门县| 枣阳市| 宽甸| 当涂县| 永靖县| 阿拉善左旗| 大悟县| 双柏县| 宁城县| 封丘县| 外汇| 白沙|