作者:林書
編輯:楊曉鶴
2024年,眼看著就要走到年終了。
這一年,對于AI行業(yè)而言,無疑是希望與痛苦交織的一年。希望的地方在于,AI又取得了一些實(shí)實(shí)在在的進(jìn)展。
例如以GPT 4o 為代表的實(shí)時語音AI的興起,以及o1為代表的深度推理類LLM的問世。
痛苦的地方在于,在商業(yè)化方面(尤其是C端),AI仍未能真正打開局面。
可以說,這一年,每個還在堅持的AI企業(yè),都在這兩種狀態(tài)間反復(fù)掙扎,OpenAI據(jù)傳2023年虧損額度將達(dá)到50億美金。而國內(nèi)的大模型鼻祖智譜AI,也無疑是這種困境下的代表。
起初,身為“ 大模型六小虎 ”之一的智譜AI,因其創(chuàng)始人張鵬等清華出身的背景,以及在大模型上最早的探索,在國內(nèi)引領(lǐng)了AGI的發(fā)展。
經(jīng)過近幾年的殘酷歷練后,存活下來的智譜AI,開始逐漸自信, 采取了“全面出擊”的戰(zhàn)略,在文本、視頻、語音、代碼等多個方向上全線出擊。在產(chǎn)品層面,AI搜索、AI繪畫、AI視頻、AutoGLM等等也都有布局;甚至在資本層面,也完成首期15億資金的生態(tài)基金。
智譜目前的產(chǎn)品線
從商業(yè)層面來看,這種現(xiàn)象背后,折射出的是中國AI創(chuàng)業(yè)公司普遍面臨的一個戰(zhàn)略困境:在資本和市場的雙重壓力下,企業(yè)不得不在“深耕”和“廣拓”之間做出選擇。
在算力并不充裕的情況下,整個行業(yè)是否會陷入“大而不強(qiáng)”的怪圈?
智譜AI的轉(zhuǎn)變,恰恰是這種行業(yè)普遍現(xiàn)象的一個縮影。
01
全線出擊下的疲態(tài)
采取“全線出擊”策略后,智譜AI變得比之前更好了嗎?
至少從最核心的文本大模型來看,這個答案是不確定的。
要知道,在今年年初,智譜AI的 GLM-4,曾經(jīng)在多項測試中直逼GPT-4,在當(dāng)時被認(rèn)為是最有希望追趕上后者的國產(chǎn)大模型之一。
可 后來,情況卻發(fā)生了變化。
到了今年九月份的時候,在國內(nèi)外通用大模型SuperCLUE基準(zhǔn)榜單中,智譜AI的GML-4,已經(jīng)排到了第10名開外。
到了這時,智譜AI在語言大模型方面,已經(jīng)泯然眾人矣,失去了當(dāng)初身為“佼佼者”的突出地位。
這樣的情況,直到今年10月,其發(fā)布了最新的旗艦大模型——GLM-4-Plus,才得到了一定程度的扭轉(zhuǎn),重回優(yōu)勢地位。
除了文本模型的優(yōu)勢,在多模態(tài)方向上,智譜AI的表現(xiàn),并沒有呈現(xiàn)領(lǐng)先的姿態(tài)。
以智譜AI的“清言”視頻大模型為例,就現(xiàn)階段而言,其生成的部分畫面模糊、粗糙,而且人物或物體的運(yùn)動軌跡都較為僵硬,與可靈AI等一線視頻模型相比,有著很大差距。
同樣地,在語音AI方面,雖然今年智譜AI推出了類似GPT-4o那樣,可以進(jìn)行實(shí)時進(jìn)行語音交流的端到端語音AI。
但在實(shí)際表現(xiàn)中,該語音大模型,雖然確實(shí)做到了“說話流暢”,但在智力水準(zhǔn)上,卻與文本大模型存在著較大差距。
同樣一個問題,在詢問GML-4的文本大模型時,得到了較為詳盡的回答,而在實(shí)時語音狀態(tài)下,回答得卻很簡略、敷衍。
雖然在今年10月,智譜AI通過AutoGML,在AGent技術(shù)、端側(cè)AI這一領(lǐng)域打了場翻身仗,并一度引得相關(guān)概念股暴漲,比OpenAI在這一領(lǐng)域還快了一步。很多人聲稱AI操控電腦時代要來臨,但這一技術(shù)要更大的應(yīng)用場景是AI手機(jī),還需要時間來落地。
AutoGML能執(zhí)行的8款應(yīng)用
圖片來源于網(wǎng)絡(luò)
于是,在強(qiáng)敵環(huán)伺,自身護(hù)城河并不十分牢固的情況下,一個明顯的危機(jī),正在逐漸籠罩智譜AI,那就是:
企業(yè)越是想通過多元化來降低經(jīng)營難度,反而可能加大了戰(zhàn)略失焦的風(fēng)險。
但某種程度上說,這樣“大而全”的策略,也是當(dāng)下大模型商業(yè)化困境的一種縮影。
在大模型商業(yè)化不明朗的當(dāng)下,缺乏自我造血能力的企業(yè),要想活下來,往往就只有依靠融資。
而要想獲得大量融資,企業(yè)就只能按照投資人的預(yù)期,不斷擴(kuò)大戰(zhàn)略版圖,在短期內(nèi)制造繁榮的市場表象。
目前,智譜AI的總估值在30億美元左右,而OpenAI的估值則在千億美元級別。在資源有限的情況下,其著實(shí)難以做到后者那樣“廣博而強(qiáng)大。”
不過,對于核心競爭力被稀釋的危機(jī),智譜AI也不是毫無應(yīng)對之策。
02
創(chuàng)業(yè)公司的生態(tài)奇招
智譜AI的第一個策略,看似稀松平常,但卻經(jīng)過了一定的構(gòu)思。
這個策略,就是開源,而且是“分層開源”。
他們有選擇地將模型能力開源,但在此基礎(chǔ)上構(gòu)建了一個商業(yè)化閉環(huán):基礎(chǔ)層開源獲取開發(fā)者青睞,MaaS層則通過定制化服務(wù)實(shí)現(xiàn)收費(fèi)。
具體來說,在今年6月的開發(fā)者大會上,智譜AI發(fā)布了自己最新的開源成果 ——GLM-4-9B,性能、功能、多模態(tài)能力,還有多語言支持,樣樣都能打。幾乎全面超過了當(dāng)時的開源王者Llama-3 8B。
此舉很快吸引了大批開發(fā)者的好評,在開源社區(qū)Github上收獲了5.2K的Star。
而在MaaS層面,智譜則通過開放平臺加持行業(yè)垂直生態(tài),加上階梯折扣權(quán)益和送token,吸引了一批B端的客戶。
所謂階梯折扣權(quán)益,換言之就是模型用量越多,計費(fèi)折扣越大,例如B開發(fā)者在調(diào)用智譜模型的API,獲得相應(yīng)的權(quán)益積分,以其最新的旗艦?zāi)P虶LM-4-Plus為例,每消耗1萬 Tokens可獲得2積分。
按照積分的不同,智譜將B端用戶分成了從V0到V3四個等級,其中V3最高可享6折優(yōu)惠。
這種策略本質(zhì)上是在用開源來降低獲客成本,同時通過服務(wù)差異化來實(shí)現(xiàn)商業(yè)變現(xiàn)。
更深層次來看,這種策略還暗含著一個商業(yè)邏輯:在AI領(lǐng)域,技術(shù)優(yōu)勢的保持周期越來越短,與其投入大量資源來維持技術(shù)壁壘,不如將精力集中在服務(wù)能力和生態(tài)構(gòu)建上。
智譜AI的開源策略,實(shí)際上是在用“非技術(shù)壁壘化”來換取更快的市場擴(kuò)張和生態(tài)積累。
這樣的做法,和Meta的開源策略相似,其核心在于:雖然開源了,但開多少,還是智譜自己說了算。
具體來說,在最強(qiáng)大的旗艦?zāi)P虶LM-4-Plus方面,智譜仍然保持著閉源,但其卻通過開源GLM-4-9B這樣能力稍遜,卻在開源生態(tài)中較有競爭力的模型,獲取了開發(fā)者的青睞。
如此一來,不斷涌入的開發(fā)者,豐富和完善了智譜的技術(shù)生態(tài),但最核心的技術(shù),仍然被智譜牢牢掌握在手中。
同時,與百川智能、零一萬物等開源玩家不同的是:由于創(chuàng)始人張鵬清華出身的背景,智譜AI背可以背靠清華這一學(xué)術(shù)高地,持續(xù)地獲得學(xué)術(shù)界的反饋和改進(jìn)建議。
例如,早先智譜開源的ChatGLM3模型,就是和清華大學(xué) KEG 實(shí)驗(yàn)室聯(lián)合訓(xùn)練的結(jié)果。而其他開源玩家,雖然也在構(gòu)建開發(fā)者社區(qū),但缺乏這種學(xué)術(shù)資源的深度整合,其開源更多停留在技術(shù)層面的共享。
智譜也在收購清華系公司,收購AI情感公司聆心智能,投資無問芯穹、清程極智等AI Infra公司,已在大模型生態(tài)投資超13家企業(yè)。
這樣的優(yōu)勢,也是智譜AI在開源方面,更敢于“放手一搏”的原因。
03
商業(yè)化落子的成與敗
在采取“全線出擊”策略后,在智譜AI各個方向的擴(kuò)張版圖中,To C一直不是重點(diǎn)。智譜至今也沒有一款類似Kimi一樣,出圈的AI產(chǎn)品。
但To B生意也比較考驗(yàn)定力,很多業(yè)務(wù)落地并不會順暢,其和某上市咨詢公司共建的生態(tài)公司,其內(nèi)部人員表示,在2023年商業(yè)化進(jìn)程中就不如人意。
張鵬曾在一年前預(yù)言,針對開發(fā)者這類有技術(shù)需求,但不是定制化服務(wù)的大C小b客戶,付費(fèi)服務(wù)應(yīng)該好做。
這個戰(zhàn)略巧妙地利用了開發(fā)者群體的“路徑依賴”特性。一旦開發(fā)者在日常工作中深度依賴了某個編程助手工具,就會形成極強(qiáng)的使用慣性,這種慣性所形成的壁壘,某種程度上比技術(shù)壁壘更難突破。
以業(yè)界當(dāng)紅的AI代碼應(yīng)用Cursor為例,雖然其沒有達(dá)到那種高級 / 首席工程師所能達(dá)到的水平,但就用戶體驗(yàn)來說,Cursor確實(shí)讓開發(fā)者產(chǎn)生了某種“粘性”。
當(dāng) Cursor 推出月費(fèi)模式時,硅谷的開發(fā)者們并沒有猶豫,反而是興奮地掏出信用卡。
外媒最新消息,Cursor宣布獲得 A 輪 6000 萬的融資,其母公司Anysphere 估值達(dá)到 25 億美元,而 Cursor 的訂閱收入顯著增長,ARR(年化收入) 已接近 5000 萬美元。
為什么開發(fā)者愿意為Cursor付費(fèi)?因?yàn)樵谒麄兊氖澜缋铮示褪巧a(chǎn)力。一個能讓編碼過程更順暢、更智能的工具,哪怕只能帶來10%的效率提升,對他們來說都是值得投資的。
Cursor 從一開始就精準(zhǔn)地抓住了這個商業(yè)邏輯。他們不是在賣一個軟件,而是在賣一種效率的可能性。
而智譜AI推出的免費(fèi)AI編程助手CodeGeeX,實(shí)際上也沿用了類似的邏輯。
通過代碼的生成和補(bǔ)全、注釋生成、代碼翻譯等功能,CodeGeeX實(shí)現(xiàn)了能夠根據(jù)自然語言注釋生成代碼,以及實(shí)現(xiàn)多種編程語言之間的互譯,包括Python、Go、Java、JavaScript等。
由于這樣的便捷性,加之其對個人用戶完全免費(fèi),目前CodeGeeX的個人用戶數(shù)量已經(jīng)超過100萬。
這樣的積累,實(shí)際上幫助智譜AI在市場建立了一個獨(dú)特的切入點(diǎn):當(dāng)開發(fā)者在個人工作中習(xí)慣使用智譜AI的工具后,自然而然會在企業(yè)采購決策中,傾向于選擇智譜AI的解決方案。
這是一種典型的“自下而上”的市場滲透策略,比傳統(tǒng)的“自上而下”的企業(yè)級銷售更具可持續(xù)性。
這樣的戰(zhàn)略,與之前提到的開源戰(zhàn)略相結(jié)合,揭示了智譜的“技術(shù)圈養(yǎng)”邏輯。所以這也是智譜在純粹C端產(chǎn)品上并沒有太重視的原因,這些產(chǎn)品的用戶、數(shù)據(jù)、能力等反饋回大模型的路徑較長,有些也存在隔斷。
CodeGeeX后續(xù)實(shí)施收費(fèi)后,市場情況會怎樣,能不能成為智譜一個新的營收支點(diǎn),還不得而知。確定的是,大模型能力輸出與產(chǎn)品化營收,智譜都在在努力探索中,盡管由于資源限制,其在很多方向上覆蓋的火力并不是最強(qiáng)。
結(jié)語
回望2024年的AI產(chǎn)業(yè),我們看到的是一個充滿矛盾的景象:技術(shù)進(jìn)步與商業(yè)化困境并存,創(chuàng)新激情與現(xiàn)實(shí)壓力交織。
在這樣的背景下,智譜AI選擇了一條看似冒險實(shí)則明智的道路:當(dāng)技術(shù)創(chuàng)新的半衰期越來越短,建立護(hù)城河的方式或許需要從“技術(shù)壁壘”轉(zhuǎn)向“生態(tài)壁壘”。
截至本篇文章完稿時,智譜AI又推出了升級版的視頻生成大模型——“新清影”,為其多元化的產(chǎn)品版圖再添一磚。
展望未來,AI企業(yè)的成功也許不在于成為某個細(xì)分領(lǐng)域的“獨(dú)角獸”,而在于能否構(gòu)建起一個有機(jī)的技術(shù)生態(tài)系統(tǒng)。
與互聯(lián)網(wǎng)時代一個個互為孤島,甚至彼此間互相爭搶用戶的APP不同,AI技術(shù)的發(fā)展,現(xiàn)在已經(jīng)呈現(xiàn)出一種獨(dú)特的“網(wǎng)絡(luò)效應(yīng)”:不同技術(shù)方向的突破,會產(chǎn)生意外的協(xié)同。在這個系統(tǒng)中,每一個技術(shù)突破都不是孤立的,而是能夠通過技術(shù)遷移和交叉應(yīng)用,產(chǎn)生倍增效應(yīng)。
但這并不意味著“全面布局”就一定優(yōu)于“垂直深耕”。關(guān)鍵在于企業(yè)如何在這兩種策略間找到平衡點(diǎn)。
從OpenAI的強(qiáng)敵Anthropic最新的實(shí)踐來看,這種“平衡”可能的形式是:以核心能力為錨,進(jìn)行有節(jié)奏的能力擴(kuò)展。
從商業(yè)角度看,這個問題的答案可能不在技術(shù)層面,而在于企業(yè)對自身資源和市場定位的準(zhǔn)確認(rèn)知。
作者交流:
加入專屬私域AI行業(yè)社區(qū):
純血鴻蒙上線一周,能讓用戶放棄 iOS 和安卓嗎?
15億流量,為何沒帶來AI游戲的『王者榮耀 』
鯨選視頻:
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.