5月27日下午16點多,接任螞蟻集團CEO僅87天的韓歆毅,穿著黃色短袖來到杭州螞蟻A空間正進行的“螞蟻黑客松”比賽,并坐在前排臺階上仔細聆聽。今年3月,獲清華大學經濟學碩士學位的韓歆毅升任螞蟻集團CEO。
支付寶雙飛輪、AI First和加速全球化是螞蟻集團的三大戰略。事實上,螞蟻和其他互聯網公司一樣,近兩年一直在 AI 領域進行投入。去年螞蟻20周年時候,螞蟻集團董事長井賢棟宣布,未來20年,螞蟻要做一家科技驅動、創新驅動的公司。
其中,在AI First戰略下,螞蟻推出了金融、醫療、生活服務三款AI應用,螞蟻內部業務也做了很多變革,支付寶、螞蟻國際等核心業務加速AI化,螞蟻內部也成立了通用人工智能(AGI)部門,開源2900億參數規模的百靈大模型,引發關注。
韓歆毅在27日下午的內部技術日活動上首次詳解螞蟻AI戰略。
他用時三十多分鐘,全面清晰談未來螞蟻的AI戰略布局。在韓歆毅看來,中國 AI 大模型賽道競爭激烈,螞蟻將聚焦AI應用側,利用AI基座大模型技術做更強的技術服務能力。
“今天,我們永遠是在AI技術突破的邊界上做一款PMF產品,如果技術路線不收斂,產品很難突破;技術路線收斂了,我們就敢于往里去投、去砸。大家說你聚焦AI應用,還要不要做基礎大模型,年初討論的時候我們答案非常堅決,一定要,因為如果基于AI做服務和應用,就像訓練一個人去做所有的事,追求智能上限,會讓這個人更加聰明,能夠做更多、更好的服務。我們很堅定去探索AGI、探索智能上限。”韓歆毅稱,未來,AI 時代將會重新定義一切。
螞蟻集團CEO韓歆毅
即將開源兩款:比肩DeepSeek-V3模型和百億多模態模型
對于AI大模型領域來說,螞蟻最重磅的消息無疑是今年3月百靈大模型團隊(Ling Team)發布的兩款MoE開源大模型論文。
今年3月,螞蟻百靈大模型團隊開源2個MoE架構的大語言模型Ling-lite(0220版本)和Ling-plus。
其中,Ling-lite參數規模168億(激活參數27.5億),Ling-plus基座模型參數規模高達2900億(激活參數288億),并且在多個算力平臺(包括非Hopper架構的國產算力)進行訓練,預訓練階段將計算成本降低約20%,每1萬億token成本達508萬元,最終實現行業頭部模型水平的性能表現,并驗證了300B尺寸的SOTA MoE大語言模型在非高端算力平臺上訓練的可行性。
同時,螞蟻強化學習AReaL團隊還開源了AReaL-boba,可用128張H800 GPU 在1天訓練完成SOTA 1.5B推理模型訓練,256張H800 GPU 2天內完成SOTA 7B推理模型訓練。
過去幾個月,螞蟻百靈大模型團隊進行了迭代,Ling-lite升級到了1.5版本,相比上一代新模型的推理能力有了顯著提升,同尺寸MoE SOTA,僅用2.75B激活計算可對標10B內SOTA dense模型。Ling-lite-1.5采用分層語料預訓練策略和需求驅動的執行優化體系,以更少的語料和更高的質量,性能超過同尺寸下SOTA模型,大幅提升數學、代碼等推理能力。
5月27日舉行的第十屆螞蟻技術日上,螞蟻百靈大模型團隊宣布,即將逐步開源百億參數規模的多模態模型Ming系列Ming-lite-omni。
具體來說,這是一款以統一架構集成多模態理解、生成和編輯能力的模型,支持將理解和生成模型合在一起調用,也可以單獨完成理解和生成任務,帶來原生全模態交互體驗。
Ming-lite-omni主要承襲了5月初開源的Ming-lite-omni-preview和Ming-lite-uni這2款模型的能力,在此基礎上做了更為系統的整合優化。
Ming-lite-omni基于Ling-lite-1.5,MoE模塊新增了模態特定路由以緩解模態沖突、增強模態間協同,使得音、視、圖、文等模態能夠有效統一在一個模型中。同時在圖像、語音生成與理解統一方面側重優化,突破理解與生成相互沖突的難題。至此,Ming-lite-omni實現了模態統一處理,以及多模態理解與生成在一個模型上的統一,可以處理音頻、視頻、圖像和文本模態的任意組合作為輸入,生成與音頻、圖像或文本輸出交織的多模態輸出,從而實現先進的實時的全模態交互體驗。
團隊表示,“我們的目標是逐步開源Ming系列多模態模型,這將營造一個協作環境,讓研究人員和開發者能夠在這些模型的基礎上進行構建和擴展,從而推動 AI 應用的創新。我們希望通過與社區的合作,逐步加速Ming系列模型開發,推進開發更先進、更實用的 AI 系統,以應對復雜的現實問題。”
螞蟻百靈大模型負責人周?。ɑ何魍ぃ┍硎?,新開源的Ming-lite-omni模型有幾個值得關注的創新點:一是真正把生成和理解模型放到一個模型;二是真正意義上的全模態輸入和輸出,都支持音視頻、圖文多種形態;三是真正是以MoE為架構的模型,中間沒有提供其他東西,交互性較強。
螞蟻百靈多模態大模型負責人陳景東(景東)向筆者進一步指出,目前更多開源的是必要的代碼,開源的更多作用是希望大家可以把Ming系列模型能夠用好。
目前來看,包括螞蟻、騰訊在內的多家AI大模型團隊認為,多模態模型正在走向MoE架構的“全模態”模型。包括Seed1.5-VL和Qwen2.5-Omni為代表的模型現已支持圖像、視頻、語音、文本及其任意組合的理解,而以Kimi-VL為代表支持MoE架構;但技術挑戰上,支持音、視、圖、文全模態交互的公開單模型非常少見,并且圖像和語音的理解與生成統一模型鮮有出現,且理解和生成效果難以平衡。
阿里集團副總裁許主洪認為,當下多模態大模型的一大演進趨勢,正是用統一的框架做理解和生成,這一領域發展尚處于初級階段,需要實踐驗證。而今日螞蟻開源的Ming-lite-omni,正是這一領域的代表性實踐。
同時,螞蟻團隊還宣布,百靈大模型即將開源一款Ling-max模型,模型規模和性能與DeepSeek-V3“滿血版”比肩,追尋跟V3差不多的版本進行開源,讓更多人基于百靈版本上面調用各式各樣的能力。
截至目前,螞蟻逐步形成兩類百靈基礎模型路線:MoE語言大模型Ling-Series/推理模型Ring-Series;原生全模態大模型Ming-Series。
除了模型更新,螞蟻三大AI管家應用方面也有新進展,旗下AI健康管家不久后將上線新版本。
據悉,今年初螞蟻集團宣布完成收購好大夫之后,3月首次對外公布了以螞蟻醫療大模型為核心的“一體三端(醫療機構、醫生、用戶)”的AI醫療布局,成為應用場景與行業共建最深的專業大模型之一。據悉,其面向用戶端的應用產品AI健康管家,從去年下半年發布以來,通過高質量數據資源、專業標注團隊等多方面優化模型,在AI就醫助理、AI健康咨詢等方面表現出色,充當用戶個人日常健康管理與就醫咨詢的助理角色,上線半年服務超4000萬用戶。而這一AI應用產品即將上線新版本,迎來新的產品功能迭代突破。
對于內部AI產品使用百靈大模型情況,西亭對筆者表示,站在基礎大模型角度看,之所以開源這么多基礎模型,主要是不想讓大模型成為某些公司的專屬,通過將螞蟻更多探索的AI技術公布到開源社區,成為推動大模型往前發展的重要起點。今天從業務和應用角度來說,百靈不會強行做一個非常綁定,因為當前模型還沒有達到AGI能力,也沒有成為社會必需品,所以行業和基礎模型兩方會持續推進,不會有那么強的耦合。
“另外,如果不談技術本身,我更加期待我們合作伙伴,純粹是因為百靈技術做得好而選用我們,而不是別的應用連接使用百靈模型,這是我們對內和對外的一個非常關鍵因素。我們希望做的東西能夠得到(開源)社區的認可,并且與社區推動AI技術進步。這是我們的觀點?!蔽魍しQ,AGI仍處于早前階段,團隊相信通過自己的努力、模型能力進步后,會在合適的時間通過內部、外部使用它。
國內AI競爭加劇,螞蟻發力應用
自2025年起,全球AI大模型市場“內卷”加劇。開源模型DeepSeek引發全球討論,基礎大模型并未如預期一樣放緩迭代,除了DeepSeek之外的AI行業Super App超級應用也未出現。
因此,國內外科技大廠都在“內卷”模型迭代:OpenAI發布GPT-4.5和o3;Gemini發布2.5 Pro版本;騰訊混元升級快思考模型混元TurboS、深度思考模型混元T1,并發布視覺深度推理模型T1-Vision和端到端語音通話模型混元Voice;字節跳動旗下火山引擎發布豆包·視頻生成模型Seedance 1.0 lite、豆包1.5·視覺深度思考模型,并升級豆包·音樂模型等。
去年第四季度國內有49個大模型更新發布,到今年一季度這一數字增長至55個,最多的時候一周有8個模型。大模型迭代速度越來越快,模型能力越來越強。正如李彥宏所說“大模型廠商卷生卷死?!?/p>
所以,對于AI這場戰役來說,企業如何利用這些強大模型,把AI應用做好,讓更多人體驗到AI技術能力,這似乎成為未來的關鍵點,而國內科技大廠擁有非常強的基本盤產品,并且擁有流量、資源投入以及人才資源,將是國內AI“下半場”競爭的核心參與者。
“跟很多創業公司相比,我們的優勢不是資源,而是人才,怎么把我們的人才聚集到一起,其實靠的是協作?!表n歆毅表示,AI這件事很難,當前螞蟻是在與全球最頂級的AI團隊競爭,而且坦白說,這上面人家不光是跑得比我們早,也跑得比我們快。因此,對于螞蟻來說,目標并不是做一家全球最領先的大模型公司,而是依然聚焦于應用上,仍希望智能上限的探索使得AI應用層面有突破,“至少在某幾個領域我們要領先?!?/strong>
展望未來,韓歆毅首次詳細闡述螞蟻新的AI First戰略:
- 三大AI應用服務——AI金融管家、AI健康管家、AI生活管家;
- 四大技術探索——百靈基礎大模型、AI世界的支付與基礎能力、科技產業化、開源與開放;
- 兩大行業探索領域——AI 與物理世界融合(具身智能)、區塊鏈。
談到基礎模型的探索,韓歆毅表示,過去幾個月螞蟻團隊投入的探索力量和更多突破,其實在某些方向已具備全球一定的領先地位,但這個領先還是偏單點。今天我們要全力以赴,追求智能上限,并且不斷開源開放。另一方面,未來所有應用隨著AI世界變得更加多樣化,螞蟻的機會在于支付,AI世界的支付可能與今天完全不一樣,因此,螞蟻需要提供AI世界的支付與基礎能力。
對于具身智能的探索,韓歆毅指出,這是一個面向未來的開放式探索。今年螞蟻成立了靈波科技,希望探索AI與物理世界的融合,未來還將與哈啰一起探索自動駕駛。
“人在相當長的時間內,不太可能回到我們的科幻電影中,有一個養生艙躺進去接上我們的虛擬世界、宇宙里面,這個短期內不太可能發生,但至少相當長的時間內,人還是活在現實世界中,現實世界和數字AI世界會同時并存,而我們希望幫助大家解決現實AI世界問題,這就是為什么我們去探索具身智能、智能駕駛等?!表n歆毅稱。
韓歆毅表示,如果往前看,螞蟻AI First戰略是一個“頂層框架型”的想法,還有一些非常具象的業務和策略依然在探索、摸索過程中,因此,整個過程中,無論是解決當下的業務的具體問題,還是螞蟻面向未來的探索,其實都需要技術人員的創新與突破?!耙驗榧夹g是我們產品、業務快速奔跑的核心能力和堅強后盾?!?/p>
韓歆毅強調,螞蟻希望真正給到用戶、合作伙伴一個革命性、代際差體驗、核心的競爭優勢,所以在面臨當下AI技術探索、AI應用的戰場上,我們要回到“黑客松”的精神,源于對技術的熱愛。
“我們源于熱愛,成于協同,最后我們終于創新,用創新的方式為螞蟻未來的10年、科技的10年打出一片新的天地。”韓歆毅在演講結尾稱。(本文首發于鈦媒體App,作者|林志佳)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.