摘要:據鳳凰網科技了解,今年楊植麟的關注重心早已發生改變。2月底,Kimi內部在重點推進模型表現的提升,“楊植麟親自帶隊”。近期,Kimi則專注垂直領域,核心都是提升模型能力上限。
鳳凰網科技 出品
作者|董雨晴
幾個大模型初創企業里,Kimi當下最為安靜。
“(Kimi)最核心的任務就是提升留存,或者把留存作為一個重要的衡量指標” 去年11月,在Kimi上線一周年之際,創始人兼CEO楊植麟曾在一場小型溝通會中亮相并提出了這一觀點。
“有一輪大廠的錢進來后,投資人確實會要求看數據,楊植麟作為創始人肯定要在這方面用心”,接近Kimi的人士告訴鳳凰網科技,根據披露,那時Kimi的月活用戶突破了3600萬,躋身國內AI原生應用TOP3的席位。
據鳳凰網科技了解,今年楊植麟的關注重心早已發生改變。
2月底,Kimi內部專注模型能力的提升,最直觀的體現就是榜單,“楊植麟親自帶隊”,接近Kimi的人士表示。參與打榜的模型為K1.6,其結果顯示,在全球動態基準測試平臺 LiveCodeBench,K1.6超過了 GPT o3mini、o1 等模型,在代碼生成測試中實現登頂。不過,K1.6和坊間傳聞的K2至今沒有發布。
與打榜同期進行的,是招聘法律相關的數據專家。5月,Kimi被傳進軍醫療賽道,實際上同樣是招聘醫療領域的相關數據專家,目標是為了提升醫療內容的信息檢索質量。
近日,Kimi又悄悄上線了學術搜索。
“很明顯,Kimi在加強垂直領域的能力”,另一行業人士對鳳凰網科技表示。
“Kimi作為閉源模型,想要去證明自己的能力,打榜是一個很重要的途徑,這也是為什么之前楊植麟會帶隊上場”,多位行業人士對鳳凰網科技表示,“早就聽說Kimi回歸基模了”。而入局垂類賽道,同樣不失為一種提升模型能力,減少幻覺的有效手段之一。
在新的對壘格局下,Kimi仍在努力留在牌桌上。
再度撞車DeepSeek
頗為巧合的是,DeepSeek5月在招聘的新數據百曉生,便是以醫學方向為主。
所謂百曉生,主要做的是文本語料標注工作,并與AI工程師進行合作提升大模型的能力和反饋質量。
通過加強專業內容的索引,可以有效的減少模型的幻覺率。有行業人士對鳳凰網科技表示,“大量專業用戶,在財經、醫療、法律、代碼等領域對模型的專業和可靠存在需求”。
更早之前,DeepSeek與Kimi都瞄準了法律賽道。
今年2月,Kimi開放了AI數據專家法律方向的招聘,職位要求應聘者具備2年以上法律相關垂類場景工作的經驗,有對相關垂類場景較好的專業功底和知識儲備,并能理解在法律相關垂類場景中用戶的訴求。
據前述行業人士分享,Kimi在2024年曾有相當長的時間保持Web端用戶量的第一,擁有大量專業用戶,也在外界心中形成了AI可以被當作生產力工具的認知。
昆侖萬維CEO方漢在發布新agent產品時也曾對鳳凰網科技表示,AI在生產力場景下有著廣闊的商業化前景。但現階段,很多模型在垂類領域的表現只能打60到70分,可用性還不夠強。
這也恰恰是當前基座大模型企業發展垂直領域的難點,“想把垂直領域做好了,還是非常考驗模型能力的。同時還得做好專業數據的深度挖掘,這是Kimi當前面臨的考驗”,前述行業人士對鳳凰網科技表示。
同樣是在4月,Kimi宣布與財新傳媒正式達成內容合作。在Kimi提問財經相關內容時,Kimi將結合財新傳媒旗下報道內容,通過模型生成答案,意圖是提高真實性,降低幻覺。
目標依舊是AGI
今年以來,國內月活Top3的AI原生應用座次,從豆包、Kimi和文心一言,搖身一變成了DeepSeek、豆包和騰訊元寶。Kimi落到了第四的位置。
與此同時,Kimi暫停了此前的投流營銷策略。有接近Kimi的人士對鳳凰網科技表示,“Kimi今年更關注自然增長和用戶留存”,另有多位博主表示,春節后就沒再接到過Kimi的需求。
該行業人士認為,不同時期會有不同市場形勢,“DeepSeek的出圈,包括Kimi去年憑借200萬字長文本的出圈,都說明了創新的重要性”。這在今天的市場上,也成為了一個新共識。
階躍星辰CEO姜大昕在不久前的一場小范圍溝通會中表達,“DeepSeek給我們的經驗就是,投流的邏輯實際上(對AI的c端產品來說)是不成立的”。
“根據我對Kimi的了解,他們一直是把探索AGI、提升模型能力作為目標的”,前述行業人士對鳳凰網科技表示,發力垂類賽道不等于放棄對基座模型的預訓練,“相反需要在基建上做得更扎實,才能支撐起垂類賽道的專業和領先”。
盡管AI六小虎的概念人們開始提得越來越少了,但其中還是有不少小規模公司仍在追求模型能力的上限。
楊植麟在去年底的溝通中提過一個觀點,其認為“AI的發展就像蕩秋千,我們會在兩種狀態之間來回切換:有時候,算法、數據都很ready了,但是算力不夠,我們要做的就是加算力;但今天我們發現,不斷擴大算力規模已經不一定能直接解決問題了,所以這時就需要通過改變算法,來突破這個瓶頸。”
當前,各個公司從不同路線入手,以期達到模型更高的可用性。
就在端午節前夕,DeepSeek更新了R1模型的小版本升級,并透露該版本模型是基于去年12月發布的V3 Base模型作為基座模型,但在后訓練中投入了更多算力,顯著提升了模型的思維深度和推理能力。特別是在編程等基準測試中,評分表現已與o3、Gemini-2.5-Pro相當。
DeepSeek官方還著重強調了幻覺改善,稱“與舊版相比,更新后的模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了 45~50% 左右,能夠有效地提供更為準確、可靠的結果”。
阿里云創始人王堅也在不久前的采訪中對鳳凰網科技表示,當下是基礎模型能力最強的時期,鼓勵更多開發者去做潛在顛覆式應用的開發。
不過,王堅也坦言,個人并不認可“通用人工智能(AGI)”這一新概念,認為AI的核心價值應回歸技術本身。“如果一定要談未來,AI的發展階段和能力邊界將遠超今天人類的想象,至于是否會被定義為AGI,答案或許并不重要。”他強調,技術的顛覆性突破往往誕生于“未被預設的領域”,而當前大模型展現出的能力已讓許多傳統認知被重新定義。
王堅還以OpenAI的發展歷程為例:“ChatGPT的誕生并非一蹴而就,而是建立在GPT-3.5、GPT-4等多次迭代的基礎上。關鍵在于,開發者能否跳出傳統思維,主動探索模型潛藏的能力。”他特別表示,如今AI基礎模型的成熟度已遠超OpenAI初創時期,且技術門檻的降低讓更多企業站上同一起跑線。“今天具備這樣模型能力的有很多家公司,那在杭州就有DeepSeek,也有千問。(所以)先不要擔心大模型能做什么,不能做什么,我覺得這是唯一我們往前走(通往AGI)的方法”。
值得一提的是,最新消息稱,兩名 OpenAI 公司代表在墨西哥舉辦的 AI Summit 峰會上透露,公司正在開發下一代基礎模型 GPT-5,并計劃通過該模型與競爭對手展開更激烈角逐。他們還明確表示,GPT-5即將面世,另有消息稱或許是7月。
如若GPT-5如期面世,AI行業或將再度迎來飛躍性時刻。
題圖出自電影《沙丘2》
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.