一個有著超大“內存”的智能助手,可以一口氣讀完二十萬字的小說,還會上網沖浪,這是一款名為Kimi的AI助手的官方介紹。
如果是作為一位電子文檔和生成式AI高頻使用者,你在此之前可能未必聽說過這款助手;但如果你是一個A股的資深股民,你一定在這幾天內聽說過這個名字。
兩周之前,國內AI獨角獸月之暗面宣布其對話式AI助手產品Kimi智能助手現已支持200萬字的無損上下文輸入。
但AI界還沒有反應過來的時候,資本市場的狂歡突然之間開始了。首先開始大漲的,居然是昔日A股“妖王”九安醫療。自3月19日起,九安醫療股價起飛。從當日開盤41.96元/股,在4個交易日內一度漲至最高54.98元/股。這是因為在2023年8月時,九安醫療曾經投資過月之暗面這家公司。
但事情發展的速度太快,隨后幾天里,A股市場上冉冉升起了一個全新的概念——“kimi概念股”,并且多家上市公司股價因此而受益。
圖片來源:邏輯挖掘社
比如華策影視擁有國內影視行業最大的全版權片庫,掌閱科技接入Kimi嘗試打造智能閱讀App,中文在線擁有可用于模型的IP數據,中廣天擇為其提供數據支持和交易平臺,深信服參與了月之暗面的融資。值得注意的是,就連人民網都是Kimi內容合規的核心合作方和訓練數據審核方……
而如上列舉的,僅僅也只是一眾Kimi概念股中的一部分。一周時間里,沉寂已久的A股市場上迎來了一場久違的概念股炒作狂歡,其爆火的熱度,以至于讓一眾互聯網大廠們都坐不住了,相繼開始布局kimi所在的長文本賽道。
不過,從這一周開始,Kimi概念股就開始相繼熄火,比如此前漲幅不錯的九安醫療和華策影視,股價都開始掉頭向下,華策影視一度跌超9%。
這場關于AI的炒作盛宴,還沒正式開始,似乎就要結束了。
到底發生了什么?
01
Kimi的爆火,從最開始就透露出了一股迷之氣息——因為它所主打的長文本賽道,本身并不算是什么新的技術路線。甚至在Sora推出之前,單一的大語言模型就被認為遲早是要轉向多模態的。
也正因為是這樣,Kimi的爆火就仿佛是,進入IOS時代之后,一款塞班系統的機器突然被認為是國產手機之光。
當然,Kimi也并非沒有優點。比如和其他文生文大模型應用相比,Kimi 這款產品自誕生起的核心競爭力就在于長文本分析聯網搜索、文檔處理等功能。特別是在深度解析厚重書籍內容方面,其性能遠超其他模型。
有人實測了Kimi在長文本閱讀上的表現,發現其在理解超長文本,比如小說和長篇文件上確實具有獨到優勢。輸入一本《紅樓夢》,數秒內就能給你一篇漂亮的總結報告。但是,目前市面上的主流大模型產品在promot的輸入上都是有字數限制的。
比如GPT-3.5上下文輸入長度約在1.6萬token,GPT-4在3.2萬token(token:模型輸入和輸出的基本單位)。把token量化成人類語言的話,3.2萬token的GPT-4達到了閱讀一篇短篇小說的程度,但并不支持閱讀長篇小說。
在理解長篇著作這一點上,Kimi確實有強大優勢。
而且,對于中國市場的理解,要完爆OpenAI的ChatGPT好幾條大街。比如,向kimi提問“構建房地產市場新發展模式”最早是在哪份文件中提出的,kimi能夠以極快的速度給出正確答案,這也是ChatGPT和Gemini們一輩子難以企及的覺悟。但問題是,這個優點其他國產大模型也有。
因此,市場對于Kimi的商業模式價值判斷主要還是集中在第一點——長文本上。
但從技術上來看,作為文生文模型上的衍生,長文本在技術上并沒有太多的實現難度。無非是加大算力支撐。但也正因為這樣,長文本在現實中會遇到一個致命bug,就是成本和收益是否匹配。
一般來說,增加模型規模可能會提高模型的性能,如語言理解能力、生成文本的質量等。更大的上下文范圍可以提供更多信息來輔助模型做出更準確的預測或生成更自然的文本。
這本身并沒有什么技術門檻,但隨著模型規模的增加,需要更多的計算資源來訓練和運行這些模型。這可能包括更多的GPU/TPU資源以及更長的訓練時間。因此,在考慮模型規模時,需要權衡性能提升和資源成本之間的關系。
去年10月,月之暗面創始人楊植麟去年向行業媒體稱,不同于OpenAI只提供ChatGPT一個產品和最先進的多模態基礎能力,月之暗面瞄準的是下一個C端超級APP:以長文本技術為突破,在其基礎通用模型基礎上去裂變出N個應用。
02
換句話說,Kimi打一開始就是沖著商業化變現轉化去的。這又是一個典型的中國AI產品特點。當然這并不是壞事,畢竟不是誰都能有微軟投入OpenAI的冒險和決心的。
但問題是,月之暗面所設想的C端,到底有多少人存在長文本解析的需求?除了學術研究需要,起碼從目前來判斷,看不到什么更大的場景。
更關鍵的是,只看見了出項,卻沒有看到進項。
據七麥數據下載量預估,近一個月來,Kimi 在App Store日均下載量5445,在安卓端全渠道日均下載量12360,合計日均下載量為17805。目前Kimi投放廣告的獲客成本約在10元,如果算上拉新后用戶問答互動產生的算力成本,每個用戶的獲客成本達到12-13元。根據第三方平臺的下載量預估,近一個月來,Kimi在蘋果端和安卓端的日均下載量為17805。按此計算,Kimi每天的獲客成本將燒掉至少20萬元。
不論金額多少,這個數據本身就充滿了吊詭和荒誕。因為你基本很少看見關于ChatGPT和Gemini的討論是聚焦在他們的獲客成本上的。相反,ChatGPT自誕生之后,就成為史上最快用戶破億的消費級應用。
也就是說,當國外的大模型已經正在思考技術變革是否會威脅人類時,我們的大模型目標是如何抓取更多的人類注意力。
商業模式之外,技術也并非完全沒有門檻存在。考慮長文檔規模大小的時候還需要看智能水平,目前包括GPT-4、Gemini、Claude等模型均未達到理想水平。另外,長文檔規模與智能水平也需要進行工程方面的ROI考量。這些都在技術上還存在需要克服的門檻。
當然,這并不是否認kimi母公司月之暗面的能力。從創始團隊背景來看,公司創始人楊植麟為中國35歲以下NLP領域引用最高的研究者,Transformer-XL和XLNet兩篇論文的第一作者,公司另外兩位聯合創始人周昕宇和吳育昕也在大模型道路上探索多年。
由此也可見,技術基本盤還是有的。但是如果對比目前國內大模型賽道上的創業團隊來看,每一家其實都不會太差。除了一眾互聯網大廠,百川智能、智譜AI等從創始人到團隊,背景都不會輸給月之暗面。
但為什么,目前只有Kimi在Sora的強大光環之下還算是“出圈”了呢?
上面問題的答案,可能并不在月之暗面公司本身。
03
眾所周知,自2023年開始,中國市場就掀起了轟轟烈烈的百模大戰。
自從2022年12月ChatGPT-3.5的發布之后,生成式AI的技術革命浪潮就已經開啟。2023年2月開始,中國國內就涌現出眾多的通用大模型和垂類大模型,目前國內公布的大模型數量已超過300個,市場競爭極度激烈,其中不乏也存在著號稱要在幾個月追平ChatGPT的選手。
過去四十年來,中國企業的競爭方式一直是追趕、復制、模仿。然而,到了2024年開年,OpenAI新發布的Sora震驚四座卻在中國市場應者寥寥。這一次,辛苦追趕一年的各路大模型們猛然發現,曾經以為中美的AI差距也就是幾個月時間,但在OpenAI的顛覆式創新面前,差距比想象的要大得多。
但市場情緒總需要找到一個標的——Kimi恰好搭上了這班流量和情緒的高速列車。本質上,市場并不在乎它到底是Kimi還是別的什么,也不關心這家公司是不是存在顛覆式創新,只在乎我是不是能通過AI概念的炒作,來收割韭菜。
目前來看,中國的大模型究竟能不能跑出可與OpenAI叫板的選手還是一個巨大的未知數。我只知道,去年6月我在和OpenAI的一位知名科學家聊起中國市場正在進行的“百模大戰”時,他所表現的茫然和尷尬,最后不得已回我一句——
我們并沒有注意到中國AI產業的這些變化。但我想真正的標準還是需要評估它的創新程度,而不是追逐創新的能力。
We'd want to evaluate the extent to which they are either cutting edge or innovative, as opposed to simply chasing the cutting edge.
當然,還是非常期待看到借助A股市場力量的Kimi,到底能在互聯網大廠、李開復、王小川等人至今也未能取得突破性進展的賽道上取得怎么樣的創新。
畢竟,目前中國AI產業還有一大后發優勢——馬斯克前段時間選擇給旗下的生成式AI開源,中國AI又一次獲得了追趕和學習的機會。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.