撰文| 郝 鑫
編輯| 吳先之
“510”阿里日上,“吳媽”發布內網帖,重申電商、AI+云計算、互聯網平臺產品三大核心戰役。
與此同時,針對組織機制調整和人才考核也被提上日程。此前,阿里打通內網權限,宣告張勇“1+6+N”時代破產,可被視為起點。在AI的大背景下,阿里后期的焦點可能在人才上,涉及跨部門流動、年輕高潛人才升遷、大模型搶人等。
AI的終極戰役是人才大戰,但這成為了現下阿里大模型上的“一道裂痕”。通義實驗室團隊作為阿里AI的主力軍,承擔了基礎研發任務,卻經歷了十個月之內,三位核心人物離職的動蕩。隨著周暢(原通義千問大模型技術負責人)、鄢志杰(原語音團隊負責人)和薄列峰(原多模態、視覺負責人)相繼離職,通義實驗室出現了“斷代”。
在“吳媽”扶持年輕人的號召下,老阿里人口中“查無此人”的林俊旸被提拔了上來。
有消息稱,年僅32歲的林俊旸現已升至P10。另有獵頭回復,“至少已經是P9級別”。截至目前,阿里官方沒有任何回應,但對其重視程度可見一斑。在“螞蟻527技術開放日”上,林俊旸對外最新的tittle為阿里通義千問(Qwen)技術負責人。
諷刺的是,上述被譽為“元老”或“領頭人”式的人物在離職前,也才堪堪P9、P10,其中包括當時的業界大牛楊紅霞。
就在不久前,通義實驗室招聘官網,悄悄更新了“世界模型”的相關崗位。在人才青黃不接的處境下,押注世界模型方向,是阿里通義的“遮羞布”還是技術迭代使然?
人事之變
阿里“1+6+N”變革奠定了動蕩的基調,從達摩院分拆出來的通義實驗室同樣如此(詳細始末見下篇)。通義實驗室的總負責人是周靖人,下屬有自然語言智能實驗室、應用視覺實驗室等,包含了通義千問、通義萬相、通義聽悟等產品。
通義團隊核心人物變動,要追溯到2022年楊紅霞的離職,其帶領研發的“多模態預訓練模型M6”,是現在通義千問底座模型的前身。而后,2024年通義千問大模型技術負責人周暢被字節挖走,徹底開啟了通義的“人事之變”。
鄢志杰,曾擔任達摩院機器智能語音實驗室負責人,彼時達摩院的十三位“掃地僧”之一。大模型之后,他曾擔任通義聽悟技術負責人,負責聚焦音視頻內容的工作學習AI助手“聽悟”。薄列峰,原多模態、視覺負責人,其主導研發的“全民舞王”玩法曾從外網火到了國內。受益于此,通義App也短暫地成為過“爆款”。
十個月,三位一線核心人物離職,直接導致了語音、視覺、模型三個方向的“真空”,而這恰恰是邁向世界模型的關鍵。在大模型競爭中,阿里的AI人才儲備算不上充沛,出走的三位人員兼具了技術研發和領導決策的特質,一時難以找到合適的“補位”。
截至目前,仍在崗的還有自然語言處理方向負責人黃非,通義千問負責人林俊旸,通義萬相負責人劉宇以及開源社區魔搭負責人周文猛。
據悉,周暢走后,林俊旸在通義實驗室的存在感逐漸增強。
通義千問系列模型研發構成了林俊旸的工作主線。據arXiv官網顯示,截至目前,其已經發布了將近二十篇學術論文和技術報告,內容涉及多模態模型、模型優化與訓練技術、代碼生成與推理、數學推理與邏輯評估等多個主題。這或許也是林俊旸被重用的主要原因,有阿里內部人士稱其為“AI技術明星”。
錯位與拉鋸
據達摩院官方披露信息,林俊旸曾參與過M6大模型研發,楊紅霞是當時團隊主要負責人。2021年,千億參數版本的M6剛發布,楊紅霞、林俊旸等人收到谷歌邀請,與Transformer第一作者探討訓練大模型經驗。當時,達摩院稱林俊旸為“團隊中的年輕人”。
2022年,M6團隊曾對外做過一次技術分享,楊紅霞、周暢和林俊旸同時出席。彼時,楊紅霞的tittle是“達摩院人工智能科學家”,周暢為“達摩院高級算法專家”,林俊旸為“達摩院智能計算實驗室算法專家”。
楊紅霞離職前職級停留在P9,周暢同樣P9,鄢志杰和薄列峰停留在P10。誰也沒想到,僅三年后,名不見經傳的林俊旸已經達到與“老江湖”并駕齊驅甚至超越的程度。在很多阿里老人記憶中,仿佛從來沒出現過這個人,提起林俊旸晉升,多數人表達了驚訝,“不知道從哪里冒出來的后輩”。
誠然,在大廠苦熬不如趕上風口,但林俊旸晉升背后,也折射出阿里激勵與晉升體系的問題。一如蹺蹺板的兩頭,一頭是沒有功勞也有苦勞的“老人”,一頭是渴望向上冒頭的“新人”。
有阿里內部人士告訴光子星球,“掃地僧”苦熬多年升不上去,一個新人踩著火箭直升P10,“難免讓一眾老阿里人寒了心”。這也解釋了近些年阿里高P頻繁跳槽對家大廠的原因,特別是字節連下猛料,職稱和薪酬待遇一步到位。
前輩給后輩讓位,提拔年輕人,少不了周靖人和吳泳銘的授意。但一刀切很容易出現問題,人才進出和晉升節奏嚴重割裂,內部激勵機制不統一的情況下,阿里如何頂住國內外大廠的“挖墻腳”攻勢,把最頂尖的AI人才留在內部。另一方面,年輕高潛人才急速上位,表面上看似是“強激勵”,但也間接加劇了上下級代溝和溝通成本。
長久以來,阿里奉行大模型開源和閉源兩條腿走路。既要又要的心理,不可避免地令其陷入了拉鋸戰中,而集中的爆發點很可能在林俊旸身上。目前,林俊旸主導了Qwen系列模型的開源,Qwen3全系開源一周即沖到了Hugging Face的排名首位。
光子星球了解到,阿里目前對大模型的KPI考核主要集中在影響力上,開源聲量便是重要指標之一。但大模型開源并不能帶來商業轉化,通義實驗室直屬于阿里云,最后仍要以云收入計入考核。如此一來,林俊旸及其團隊便與云銷售形成了對立,即開源聲勢越大,越容易稀釋付費模型。模型研發團隊追求影響力,云銷售則更愿意押注專有增值API上。
受雙重KPI考核制度影響,盡管云和大模型在同一部門,但矛盾正在逐漸加深。中間的調停者必然落在了周靖人身上,接下來,需要其給團隊一個清晰的商業閉環。
世界模型
近期,通義千問實驗室官方招聘網站陸續釋放崗位,新增了“世界模型算法工程師”和“多模態世界模型算法專家”的崗位,預示著接下來阿里的新方向。
圖注:通義千問實驗室官方招聘網站
“世界模型算法工程師”職位描述清晰寫著,“Foundation Model要想真正實現AGI,需要實現理解生成一體化而打造出世界模型,達成‘交互’和‘創造’兩大目標”。此前,就有媒體曝出周暢跳槽字節的研究方向是世界模型,基于周暢在通義的核心技術位置,推測或許是阿里籌備已久的項目。
據知情人士表示,通義內部已經達成共識,即單純文本大模型迭代升級,已經呈現出邊際收益遞減的趨勢。因此,必須邁進“視頻-物理-行動”為一體的世界模型才有機會繼續追趕OpenAI。
通義“世界模型”方向與字節Seed Edge“下一代感知”方向高度重合。字節也想找到統一生成和理解表示的方法,用于表示和壓縮真實世界,構建“世界模型”,不過至今仍未公布具體實現路徑。
結合阿里自身優勢,通義規劃下大致有三條路線:QVQ(視覺推理模型)-VL(視覺語言模型)-Omni(全模態融合),通過音頻token融合,打通大模型視覺鏈路;Agent-in-the-Loop(實時推理框架),把百煉工具調度框架植入千問模型,運行類GPT-4o“實時多模態推理”功能;自監督3D物理學習,利用菜鳥物流、淘系3C影像和靈犀視頻數據訓練物理一致性損失。
該方案若實現,將使未來Qwen系列模型具備超高清視覺解析、實時多模態交互、物理常識推理三位一體能力,特別在智能客服、工業質檢、XR交互等場景形成優勢。
視覺、語音負責人剛走,通義便急不可耐地公布了世界模型新方向,該時間點頗為微妙。我們注意到,其官網近期還在招聘兩個方向的人員,一號補位尚不明確。
有相關人士對光子星球表示,“推進世界模型就像阿里的戰略公告牌,先瞄定靶子穩住士氣,而后再補槍”。一般而言,人才補位和算力排期會延后一到兩個季度,“如果GPU預算被公有大客戶繼續壓價,世界模型的推理成本就會被推高”。
推進開源、升級模型性能和擴大模型影響力,三項重任讓通義實驗室開進了快車道,底下的年輕派也迎來了高光時刻。
但就像上路有新手保護期,達摩院的昨天隱隱中昭示著通義實驗室的明天。AGI不保真,但能保命。未來,隨著技術收斂,大模型技術研究趨于穩定,通義實驗室也不得不走出真空地帶,重新思索“為阿里貢獻的價值”。
微信號|TMTweb
公眾號|光子星球
別忘了掃碼關注我們!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.