??新博弈
文丨王也
最近,國內大模型領域掀起了一波降價潮,字節跳動的豆包通用模型pro-32k版輸入價格定價0.0008元/千tokens后,阿里云旗下的通義千問立馬宣布將Qwen-Long的輸入價格從0.02元/千tokens降至0.0005元/千tokens。
沒有最低,只有更低。如今騰訊、科大訊飛等頭部玩家都已經加入這場降價大作戰中。
2023年國內大模型賽道進入創業高峰期,一年不到,整個市場又馬不停蹄步入洗牌期。虧錢換市場這套屢見不鮮的打法確實是不可持續的,但也是每波互聯網浪潮下大廠們卡風口必不可少的戰術。
只是如今的“百模大戰”與此前的“千團大戰“”千播大戰”等還是有所不同的。大模型廠商們不斷擊穿底價背后,固然有爭奪市場份額的考量,但也是在通過降低下游企業的應用成本來推動大模型市場的提前爆發。
“百模大戰”必將打響
2023年年初百度、阿里、騰訊等頭部互聯網企業陸續推出自家的大模型后,國內大模型市場就開始進入狂飆期,2023年第二季度開始幾乎每個月都有多款大模型發布。截至2024年年初,國內大模型數量已經超過300個,市場規模突破100億元,且未來仍將持續高速增長。
具體來看,如今國內通用大模型數量達到40個左右,但僅有四分之一出圈度較高,比如百度的文心一言、字節跳動的豆包大模型、科大訊飛的星火模型、阿里巴巴的通義千問、騰訊的混元大模型、華為的盤古大模型、百川智能的百川大模型等。在應用側,這些通用大模型的B端市場正在一步步打開,但C端市場感知度仍稍欠火候。
比如在APP Store應用排行榜TOP100行列中,目前只有發力較早的文心一言的身影,即便將范圍放寬到TOP200也很難看到其他上榜的通用大模型,在部分深度用戶群體中,影響力較高也幾乎都是上述頭部大模型。僅看C端市場的話,在“百模大戰”打響之前,行業就已經呈現出第一梯隊的頭部企業與明星產品同臺競技的競爭格局了。
不僅是通用大模型,過去一年來垂直大模型也卷瘋了,金融、教育、醫療、文娛傳媒、企業服務、零售、制造業等多個領域的垂直大模型競爭都在白熱化。比如金融領域就相繼出現了螞蟻金融、LightGPT、天鏡、麒麟、泛海言道、軒轅等數十款大模型,背后站著的則是馬上消費、螞蟻集團、東方財富證券、度小滿等企業。
圖源:億歐智庫
在文娛領域,中央廣播電視臺、抖音、知乎、閱文集團、掌閱等多家外界較為熟悉的文娛企業都進入了大模型賽道。整體來看,現階段大模型在金融、教育、文娛傳媒等垂直賽道的落地步伐更快,比如在影視內容的生產上,早在今年三月份央視頻便發布了首部AI全流程微短劇《中國神話》。
大模型服務商零一萬物創始人李開復接受媒體采訪時表示,大模型的瘋狂降價是一種雙輸的不理智策略,如果技術不達標,僅僅依靠賠錢做生意是不可持續的,零一萬物也絕對不會跟這樣的定價來做對標。但問題在于,通用賽道和垂類賽道都如此擁擠的大背景下,通過價格戰讓市場提前進入洗牌期幾乎是必然趨勢,因為誰都耗不起。
對大模型這一高資源投入、高成本、高人才密集度的領域而言,競爭格局未定之前,比起追求極致的技術,先活下來才是最重要的。因此現階段整個大模型市場更需要先從野蠻生長期快速步入產業整合期,等市場集中度達到一定程度后,再去談更為精細化的行業洗牌。
況且,如今大模型行業所面臨的“有限算力”問題也未得到解決。億歐智庫在《2024中國“百模大戰”競爭格局分析報告》給出了一組數據:據工業和信息化部預測,2023年年底國內將有5%至8%的企業大模型參數從千億級躍升至萬億級,算力需求增速會達到320%,而國內智能算力規模在2023年至2027年的復合年均增長率僅為28.2%。
在2023年的中國計算機大會上,中國通信學會副理事長徐文偉表示只有芯片、應用、架構等系統全域協同優化,才能有效解決算力提升問題,也就是說,在算力供給問題解決之前,大模型市場維持現有規模高速向前邁進是不現實的。無論從何種角度來看,瘋狂卷都是整個市場避不開的命運。
不過,抵制價格戰的李開復也為自己預留了退路,即如果以后國內大模型市場還是如此卷,那零一萬物就走國際化路線。但就目前的形勢來看,國內卷不贏國外更走不通,且不說OpenAI在海外影響力一騎絕塵,就資本競爭來看,谷歌、亞馬遜等諸多頭部互聯網公司也在大模型領域打得如火朝天,想要突圍并非易事。
以讓利推動市場爆發
大模型價格戰打響后,相關新聞中高頻出現的“免費”“底價”“平價時代”等字眼,所營造出的氛圍似乎是“所有大模型廠商都在無腦燒錢換市場”,但事實并非如此。觀察全球大模型行業的發展現狀,以及字節跳動、百度、阿里等此次價格戰的領頭玩家所制定的詳細降價策略,便會發現由價格戰掀起的“百模大戰”與以往其他風口的花式大戰還是有所區別的。
首先,降價是全球大模型市場的共同趨勢,海外市場同樣也在卷價格。去年至今,OpenAI多次下調價格,今年GPT-4o輸入價格下調到了0.0005美元/千tokens,輸出價格下調到了0.0015美元/千tokens,降價幅度分別為83%和75%。為了應對OpenAI的多波降價,去年谷歌的Gemini模型也在瘋狂降價。
今年年初, OpenAI CEO薩姆·奧爾特曼與比爾·蓋茨在播客節目中探討AI的發展與未來時曾表示,如今AI技術正處于一個非常陡峭的成長曲線上,成本也在飛快地下降。在日前的微軟發布會上,微軟CEO 薩提亞·納德拉透露,過去一年GPT-4o 的性能提升了6倍,但生成的成本降低了12倍。
近一兩年,國內外的大模型廠商都在想方設法從降低訓練成本、提高推理性能等多維度入手壓縮大模型成本,比如盤古大模型就在去年嘗試采用稀疏加稠密架構來降低訓練成本。這也是海內外集體卷價格的一大背景,長期來看,作為技術驅動型行業,隨著技術的持續升級,未來大模型的算力成本仍有望優化。
其次,大模型廠商的降價策略也大有門道。以阿里的通義千問為例,Qwen-Turbo、Qwen-Plus、Qwen-Long、Qwen-Max四大商業化模型的輸出價格中,Qwen-Long降價幅度達到90%,Qwen-Turbo和Qwen-Plus降價幅度分別為25%和40%,Qwen-Max價格保持不變,而Qwen-Max正是Qwen系列中參數規模最大的模型。
旗艦大模型價格穩如泰山的并非阿里一家,比如百度宣布輸入與輸出雙免費的ERNIESpeed、ERNIELite都是今年才推出的輕量級大模型,李彥宏曾在2024百度AI開發者大會上表示,這幾款輕量級模型在一些特定場景的使用效果可以媲美大模型。目前,百度文心大模型的旗艦系列ERNIE3.5和4.0價格并非發生變動。
這幾乎是頭部玩家的通用打法,騰訊的混元-Pro輸出價格同樣保持不變,大模型本就是“碎鈔機”,未來一段時間,“百模大戰”中各家成本最高的大模型價格都很難大跳水。由此可見,大模型價格戰中廠商們確實在讓利應用端,但底層邏輯之一仍是通過低價或免費的基礎款產品吸引客戶,從而為旗艦產品的長線發展蓄水。
除了為旗艦大模型蓄水外,價格戰指向的也是通過低價策略推動大模型應用市場的提前爆發。如今,多數企業正處于AI轉型的關口,從億歐智庫報告提到的數據來看,2023年國內已經有一半以上的企業開始了AI相關嘗試,其中34%的企業正在做一些應用場景的初步探索,可見B端市場大有可為。
B端客群的拓展,則會進一步強化大模型的應用價值,同時形成更為可觀的生態效應與集群效應。一者,大模型降低后B端大量企業客戶的涌入,將在交互中帶來海量行業新數據,加速大模型的優化進程,推動大模型的智能化程度進一步提升。二者,行業越快進入創造實際價值的階段,理論上就越有利于廠商完善大模型的商業化服務生態,形成更成熟更良性的產業循環。
整體來看,如今業內正在等待并積極推動大模型在應用端的集中爆發。如果不出意外,大模型領域也會和此前諸多從狂飆期邁入洗牌期的風口一樣,一步步提高新玩家的準入門檻,并淘汰越來越多的舊玩家,最終形成個別國民級應用分割市場的寡頭競爭格局。如今價格戰已然打響,淘汰賽自然也已經隨之開啟。
鏡象娛樂(ID:jingxiangyuler)原創
轉載請注明來源、作者署名,違者必究
━━ 已入駐平臺 ━━━━ 視頻號 已入駐平臺 ━━
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.