撰文| 郝 鑫
編輯| 吳先之
“510”阿里日上,“吳媽”發(fā)布內(nèi)網(wǎng)帖,重申電商、AI+云計(jì)算、互聯(lián)網(wǎng)平臺(tái)產(chǎn)品三大核心戰(zhàn)役。
與此同時(shí),針對組織機(jī)制調(diào)整和人才考核也被提上日程。此前,阿里打通內(nèi)網(wǎng)權(quán)限,宣告張勇“1+6+N”時(shí)代破產(chǎn),可被視為起點(diǎn)。在AI的大背景下,阿里后期的焦點(diǎn)可能在人才上,涉及跨部門流動(dòng)、年輕高潛人才升遷、大模型搶人等。
AI的終極戰(zhàn)役是人才大戰(zhàn),但這成為了現(xiàn)下阿里大模型上的“一道裂痕”。通義實(shí)驗(yàn)室團(tuán)隊(duì)作為阿里AI的主力軍,承擔(dān)了基礎(chǔ)研發(fā)任務(wù),卻經(jīng)歷了十個(gè)月之內(nèi),三位核心人物離職的動(dòng)蕩。隨著周暢(原通義千問大模型技術(shù)負(fù)責(zé)人)、鄢志杰(原語音團(tuán)隊(duì)負(fù)責(zé)人)和薄列峰(原多模態(tài)、視覺負(fù)責(zé)人)相繼離職,通義實(shí)驗(yàn)室出現(xiàn)了“斷代”。
在“吳媽”扶持年輕人的號(hào)召下,老阿里人口中“查無此人”的林俊旸被提拔了上來。
有消息稱,年僅32歲的林俊旸現(xiàn)已升至P10。另有獵頭回復(fù),“至少已經(jīng)是P9級別”。截至目前,阿里官方?jīng)]有任何回應(yīng),但對其重視程度可見一斑。在“螞蟻527技術(shù)開放日”上,林俊旸對外最新的tittle為阿里通義千問(Qwen)技術(shù)負(fù)責(zé)人。
諷刺的是,上述被譽(yù)為“元老”或“領(lǐng)頭人”式的人物在離職前,也才堪堪P9、P10,其中包括當(dāng)時(shí)的業(yè)界大牛楊紅霞。
就在不久前,通義實(shí)驗(yàn)室招聘官網(wǎng),悄悄更新了“世界模型”的相關(guān)崗位。在人才青黃不接的處境下,押注世界模型方向,是阿里通義的“遮羞布”還是技術(shù)迭代使然?
人事之變
阿里“1+6+N”變革奠定了動(dòng)蕩的基調(diào),從達(dá)摩院分拆出來的通義實(shí)驗(yàn)室同樣如此(詳細(xì)始末見下篇)。通義實(shí)驗(yàn)室的總負(fù)責(zé)人是周靖人,下屬有自然語言智能實(shí)驗(yàn)室、應(yīng)用視覺實(shí)驗(yàn)室等,包含了通義千問、通義萬相、通義聽悟等產(chǎn)品。
通義團(tuán)隊(duì)核心人物變動(dòng),要追溯到2022年楊紅霞的離職,其帶領(lǐng)研發(fā)的“多模態(tài)預(yù)訓(xùn)練模型M6”,是現(xiàn)在通義千問底座模型的前身。而后,2024年通義千問大模型技術(shù)負(fù)責(zé)人周暢被字節(jié)挖走,徹底開啟了通義的“人事之變”。
鄢志杰,曾擔(dān)任達(dá)摩院機(jī)器智能語音實(shí)驗(yàn)室負(fù)責(zé)人,彼時(shí)達(dá)摩院的十三位“掃地僧”之一。大模型之后,他曾擔(dān)任通義聽悟技術(shù)負(fù)責(zé)人,負(fù)責(zé)聚焦音視頻內(nèi)容的工作學(xué)習(xí)AI助手“聽悟”。薄列峰,原多模態(tài)、視覺負(fù)責(zé)人,其主導(dǎo)研發(fā)的“全民舞王”玩法曾從外網(wǎng)火到了國內(nèi)。受益于此,通義App也短暫地成為過“爆款”。
十個(gè)月,三位一線核心人物離職,直接導(dǎo)致了語音、視覺、模型三個(gè)方向的“真空”,而這恰恰是邁向世界模型的關(guān)鍵。在大模型競爭中,阿里的AI人才儲(chǔ)備算不上充沛,出走的三位人員兼具了技術(shù)研發(fā)和領(lǐng)導(dǎo)決策的特質(zhì),一時(shí)難以找到合適的“補(bǔ)位”。
截至目前,仍在崗的還有自然語言處理方向負(fù)責(zé)人黃非,通義千問負(fù)責(zé)人林俊旸,通義萬相負(fù)責(zé)人劉宇以及開源社區(qū)魔搭負(fù)責(zé)人周文猛。
據(jù)悉,周暢走后,林俊旸在通義實(shí)驗(yàn)室的存在感逐漸增強(qiáng)。
通義千問系列模型研發(fā)構(gòu)成了林俊旸的工作主線。據(jù)arXiv官網(wǎng)顯示,截至目前,其已經(jīng)發(fā)布了將近二十篇學(xué)術(shù)論文和技術(shù)報(bào)告,內(nèi)容涉及多模態(tài)模型、模型優(yōu)化與訓(xùn)練技術(shù)、代碼生成與推理、數(shù)學(xué)推理與邏輯評估等多個(gè)主題。這或許也是林俊旸被重用的主要原因,有阿里內(nèi)部人士稱其為“AI技術(shù)明星”。
錯(cuò)位與拉鋸
據(jù)達(dá)摩院官方披露信息,林俊旸曾參與過M6大模型研發(fā),楊紅霞是當(dāng)時(shí)團(tuán)隊(duì)主要負(fù)責(zé)人。2021年,千億參數(shù)版本的M6剛發(fā)布,楊紅霞、林俊旸等人收到谷歌邀請,與Transformer第一作者探討訓(xùn)練大模型經(jīng)驗(yàn)。當(dāng)時(shí),達(dá)摩院稱林俊旸為“團(tuán)隊(duì)中的年輕人”。
2022年,M6團(tuán)隊(duì)曾對外做過一次技術(shù)分享,楊紅霞、周暢和林俊旸同時(shí)出席。彼時(shí),楊紅霞的tittle是“達(dá)摩院人工智能科學(xué)家”,周暢為“達(dá)摩院高級算法專家”,林俊旸為“達(dá)摩院智能計(jì)算實(shí)驗(yàn)室算法專家”。
楊紅霞離職前職級停留在P9,周暢同樣P9,鄢志杰和薄列峰停留在P10。誰也沒想到,僅三年后,名不見經(jīng)傳的林俊旸已經(jīng)達(dá)到與“老江湖”并駕齊驅(qū)甚至超越的程度。在很多阿里老人記憶中,仿佛從來沒出現(xiàn)過這個(gè)人,提起林俊旸晉升,多數(shù)人表達(dá)了驚訝,“不知道從哪里冒出來的后輩”。
誠然,在大廠苦熬不如趕上風(fēng)口,但林俊旸晉升背后,也折射出阿里激勵(lì)與晉升體系的問題。一如蹺蹺板的兩頭,一頭是沒有功勞也有苦勞的“老人”,一頭是渴望向上冒頭的“新人”。
有阿里內(nèi)部人士告訴光子星球,“掃地僧”苦熬多年升不上去,一個(gè)新人踩著火箭直升P10,“難免讓一眾老阿里人寒了心”。這也解釋了近些年阿里高P頻繁跳槽對家大廠的原因,特別是字節(jié)連下猛料,職稱和薪酬待遇一步到位。
前輩給后輩讓位,提拔年輕人,少不了周靖人和吳泳銘的授意。但一刀切很容易出現(xiàn)問題,人才進(jìn)出和晉升節(jié)奏嚴(yán)重割裂,內(nèi)部激勵(lì)機(jī)制不統(tǒng)一的情況下,阿里如何頂住國內(nèi)外大廠的“挖墻腳”攻勢,把最頂尖的AI人才留在內(nèi)部。另一方面,年輕高潛人才急速上位,表面上看似是“強(qiáng)激勵(lì)”,但也間接加劇了上下級代溝和溝通成本。
長久以來,阿里奉行大模型開源和閉源兩條腿走路。既要又要的心理,不可避免地令其陷入了拉鋸戰(zhàn)中,而集中的爆發(fā)點(diǎn)很可能在林俊旸身上。目前,林俊旸主導(dǎo)了Qwen系列模型的開源,Qwen3全系開源一周即沖到了Hugging Face的排名首位。
光子星球了解到,阿里目前對大模型的KPI考核主要集中在影響力上,開源聲量便是重要指標(biāo)之一。但大模型開源并不能帶來商業(yè)轉(zhuǎn)化,通義實(shí)驗(yàn)室直屬于阿里云,最后仍要以云收入計(jì)入考核。如此一來,林俊旸及其團(tuán)隊(duì)便與云銷售形成了對立,即開源聲勢越大,越容易稀釋付費(fèi)模型。模型研發(fā)團(tuán)隊(duì)追求影響力,云銷售則更愿意押注專有增值A(chǔ)PI上。
受雙重KPI考核制度影響,盡管云和大模型在同一部門,但矛盾正在逐漸加深。中間的調(diào)停者必然落在了周靖人身上,接下來,需要其給團(tuán)隊(duì)一個(gè)清晰的商業(yè)閉環(huán)。
世界模型
近期,通義千問實(shí)驗(yàn)室官方招聘網(wǎng)站陸續(xù)釋放崗位,新增了“世界模型算法工程師”和“多模態(tài)世界模型算法專家”的崗位,預(yù)示著接下來阿里的新方向。
圖注:通義千問實(shí)驗(yàn)室官方招聘網(wǎng)站
“世界模型算法工程師”職位描述清晰寫著,“Foundation Model要想真正實(shí)現(xiàn)AGI,需要實(shí)現(xiàn)理解生成一體化而打造出世界模型,達(dá)成‘交互’和‘創(chuàng)造’兩大目標(biāo)”。此前,就有媒體曝出周暢跳槽字節(jié)的研究方向是世界模型,基于周暢在通義的核心技術(shù)位置,推測或許是阿里籌備已久的項(xiàng)目。
據(jù)知情人士表示,通義內(nèi)部已經(jīng)達(dá)成共識(shí),即單純文本大模型迭代升級,已經(jīng)呈現(xiàn)出邊際收益遞減的趨勢。因此,必須邁進(jìn)“視頻-物理-行動(dòng)”為一體的世界模型才有機(jī)會(huì)繼續(xù)追趕OpenAI。
通義“世界模型”方向與字節(jié)Seed Edge“下一代感知”方向高度重合。字節(jié)也想找到統(tǒng)一生成和理解表示的方法,用于表示和壓縮真實(shí)世界,構(gòu)建“世界模型”,不過至今仍未公布具體實(shí)現(xiàn)路徑。
結(jié)合阿里自身優(yōu)勢,通義規(guī)劃下大致有三條路線:QVQ(視覺推理模型)-VL(視覺語言模型)-Omni(全模態(tài)融合),通過音頻token融合,打通大模型視覺鏈路;Agent-in-the-Loop(實(shí)時(shí)推理框架),把百煉工具調(diào)度框架植入千問模型,運(yùn)行類GPT-4o“實(shí)時(shí)多模態(tài)推理”功能;自監(jiān)督3D物理學(xué)習(xí),利用菜鳥物流、淘系3C影像和靈犀視頻數(shù)據(jù)訓(xùn)練物理一致性損失。
該方案若實(shí)現(xiàn),將使未來Qwen系列模型具備超高清視覺解析、實(shí)時(shí)多模態(tài)交互、物理常識(shí)推理三位一體能力,特別在智能客服、工業(yè)質(zhì)檢、XR交互等場景形成優(yōu)勢。
視覺、語音負(fù)責(zé)人剛走,通義便急不可耐地公布了世界模型新方向,該時(shí)間點(diǎn)頗為微妙。我們注意到,其官網(wǎng)近期還在招聘兩個(gè)方向的人員,一號(hào)補(bǔ)位尚不明確。
有相關(guān)人士對光子星球表示,“推進(jìn)世界模型就像阿里的戰(zhàn)略公告牌,先瞄定靶子穩(wěn)住士氣,而后再補(bǔ)槍”。一般而言,人才補(bǔ)位和算力排期會(huì)延后一到兩個(gè)季度,“如果GPU預(yù)算被公有大客戶繼續(xù)壓價(jià),世界模型的推理成本就會(huì)被推高”。
推進(jìn)開源、升級模型性能和擴(kuò)大模型影響力,三項(xiàng)重任讓通義實(shí)驗(yàn)室開進(jìn)了快車道,底下的年輕派也迎來了高光時(shí)刻。
但就像上路有新手保護(hù)期,達(dá)摩院的昨天隱隱中昭示著通義實(shí)驗(yàn)室的明天。AGI不保真,但能保命。未來,隨著技術(shù)收斂,大模型技術(shù)研究趨于穩(wěn)定,通義實(shí)驗(yàn)室也不得不走出真空地帶,重新思索“為阿里貢獻(xiàn)的價(jià)值”。
微信號(hào)|TMTweb
公眾號(hào)|光子星球
別忘了掃碼關(guān)注我們!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.