智東西
作者 陳駿達
編輯 心緣
智東西5月23日報道,5月18日,中國人民大學高瓴人工智能學院向外界分享了該學院在AI研究方面取得的最新成果,以及學院本碩博在校生和畢業(yè)生的創(chuàng)新創(chuàng)業(yè)項目情況。高瓴人工智能學院成立剛滿6周年,已交出一份令人驚喜的答卷。
高瓴人工智能學院于2020年開啟了大模型研發(fā)工作,是國內(nèi)最早開始研發(fā)大模型的單位之一,現(xiàn)已布局了20多個研究方向。該學院曾發(fā)布我國第一個大規(guī)模預(yù)訓練模型文瀾、大語言模型玉蘭等AI科研成果,現(xiàn)已進入計算機學科國際權(quán)威排行榜CSRankings的前列,并在互聯(lián)網(wǎng)信息檢索領(lǐng)域連續(xù)3年排名世界第一。
去年,高瓴人工智能學院共發(fā)表160篇CCF A類(中國計算機學會推薦的A類國際學術(shù)會議)論文,其中有部分成果來自于與北京智源人工智能研究院、華為、聯(lián)通等國內(nèi)頭部研究機構(gòu)和企業(yè)的合作。
人才培養(yǎng)方面,高瓴人工智能學院現(xiàn)有本碩博學生532人,其中本科生與博士生占絕大多數(shù)。這批學生從大二開始便進入實驗室,已有11人次獲得百度獎學金、微軟學者、中國計算機學會優(yōu)博等獎項。
該學院還積極引導(dǎo)學生創(chuàng)業(yè),其中由2020級博士生高一釗創(chuàng)辦的多模態(tài)大模型企業(yè)智子引擎已完成3輪融資,總?cè)谫Y額達數(shù)千萬元。
文繼榮稱,在培養(yǎng)一流的AI科學家、工程師的同時,未來高瓴人工智能學院還將在創(chuàng)業(yè)創(chuàng)新、學科交叉這兩大方向發(fā)力,作為院長,他希望高瓴也能做出DeepSeek這樣的工作。
高瓴人工智能學院在中國人民大學首屆“全球校友大會”的人工智能自主創(chuàng)新發(fā)展論壇上分享了上述成果,這一論壇還見證了門頭溝區(qū)政府與中國人民大學共同建設(shè)的“京西智谷中國人民大學人工智能與智慧治理研發(fā)中心”的揭牌。
一、探索大模型架構(gòu)創(chuàng)新,AI+社科交叉研究成特色
中國人民大學高瓴人工智能學院的多位教師分享了該學院在大模型、交叉學科研究、科學智能、智慧治理方面的科研成果。
▲參與分享的7位高瓴人工智能學院教師(圖源:高瓴人工智能學院)
高瓴人工智能學院自2020年9月開始著手研發(fā)“文瀾”多模態(tài)大模型,成為全球最早開展大模型研究的學術(shù)機構(gòu)之一?;谖臑懩P偷募夹g(shù)積累,高瓴人工智能學院相繼研發(fā)出視頻生成大模型VDT和圖文大模型Awaker,探索了多模態(tài)大模型在三維場景生成、人物動作交互和機器人感知進化上實際落地應(yīng)用的技術(shù)。
在語言大模型領(lǐng)域,該學院成功構(gòu)建“玉蘭”系列開源大語言模型,包括百億級參數(shù)的YuLan、輕量化的YuLan-Mini及創(chuàng)新性的非自回歸模型LLaDA,系統(tǒng)掌握了預(yù)訓練全鏈條技術(shù),成為國內(nèi)少數(shù)具備從頭預(yù)訓練能力的高校團隊。該學院發(fā)表了首篇大模型綜述《A Survey of Large Language Model》及《大語言模型》教材,有力推動了大模型技術(shù)推廣。
依托中國人民大學的學科優(yōu)勢,高瓴人工智能重點推進“AI+”跨學科創(chuàng)新,形成了AI社會科學研究仿真模擬框架與涉外法治大模型等特色成果。
高瓴人工智能學院打造的玉蘭-萬象大模型社會模擬平臺,支持自動化場景構(gòu)建,用戶只需通過自然語言對模擬場景進行描述,系統(tǒng)將自動生成代碼,大幅降低編程門檻。平臺內(nèi)置50個模擬模擬場景,支持十萬級智能體大規(guī)模模擬。內(nèi)置的AI社會研究員可自動完成從研究問題分析、場景構(gòu)建、模擬執(zhí)行到報告生成的完整科研閉環(huán)。
該學院還聯(lián)合人大法學院、智源研究院共同研發(fā)了中國人民大學涉外法治大模型,并在研發(fā)過程中建立了高質(zhì)量的涉外法律知識庫、高精準的多語言法條檢索系統(tǒng)、高可信的法條增強生成框架、深度思考的法律推理功能。通過知識檢索和智能問答兩大系統(tǒng),用戶能夠精準獲取更優(yōu)質(zhì)、可信、合理的檢索結(jié)果和法律回答。
AI技術(shù)賦能智慧治理也是高瓴人工智能學院的重要研究方向。從基礎(chǔ)平臺到垂直場景,他們構(gòu)建了“數(shù)據(jù)感知-智能 認知-精準施策”的閉環(huán)體系,涵蓋城市治理中的數(shù)據(jù)智能基礎(chǔ)平臺、民生治理、公租房分配智能決策、產(chǎn)業(yè)賦能治理等領(lǐng)域。
高瓴人工智能學院還探索了大模型架構(gòu)的新范式。該學院于2025年2月發(fā)布全球首個80億參數(shù)擴散語言模型LLaDA。LLaDA 通過擴散采樣的方式而非從左到右的方式生成連貫對話,效果媲美同規(guī)模代表性自回歸模型并突破單向推理瓶頸。LLaDA在國內(nèi)外社交媒體被廣泛討論,單帖瀏覽量破40萬。開源模型單月全球下載量超過17萬次。
信息檢索領(lǐng)域是高瓴人工智能學院的強項。該學院曾開源模塊化工具包FlashRAG,在開源社區(qū)GitHub上獲得2300多星標,并適配了華為、百度的國產(chǎn)化開發(fā)框架。今年,高瓴人工智能學院開始關(guān)注AI深度搜索,并發(fā)布了深度搜索引擎WebThinker。
WebThinker以大規(guī)模推理模型為基座,能一邊推理一邊主動識別知識缺口,自主發(fā)起聯(lián)網(wǎng)搜索補充知識;還能深度瀏覽互聯(lián)網(wǎng),在搜索到的網(wǎng)頁上根據(jù)需要自主點擊其他鏈接來獲取更深層次相關(guān)信息。
它還能“邊思考-邊搜索-邊寫作”,通過并行處理實現(xiàn)實時研究報告生成,大幅縮短內(nèi)容整理和報告寫作周期,并基于在線強化學習策略,不斷從用戶交互歷史中優(yōu)化搜索策略和報告質(zhì)量。
在科學智能(AI for Science)領(lǐng)域,高瓴人工智能學院在基礎(chǔ)算法平臺、圖機器學習計算平臺取得重要成果,研發(fā)首個基于國產(chǎn)深度學習框架計圖的圖機器學習算法庫Jittor-Geometric,為科學計算提供了更高效的國產(chǎn)化解決方案。
在微觀和介觀尺度,該學院研發(fā)了一系列基于幾何學習的端到端預(yù)測與生成模型,為小分子藥物設(shè)計、抗體藥物設(shè)計、蛋白質(zhì)藥物設(shè)計、高分子藥物設(shè)計開拓了新方法路徑。
在宏觀和超宏觀尺度尺度,提出了數(shù)據(jù)與機理雙驅(qū)動新一代智能科學計算框架,解決了大規(guī)模湍流加速仿真、缺失觀測多物理場生成、無人機飛行氣動實時預(yù)測、精準臨近降水預(yù)報等挑戰(zhàn)難題。
二、博士生創(chuàng)業(yè)項目獲千萬融資,本科生打造多模態(tài)音樂生成模型
在科研的同時,中國人民大學高瓴人工智能學院也注重培養(yǎng)學生的創(chuàng)新、創(chuàng)業(yè)精神,學院學生已在多模態(tài)AI、AI+法律、AI+藝術(shù)等前沿領(lǐng)域打造了相關(guān)產(chǎn)品,從本科生階段到博士生階段,均有學生投身創(chuàng)業(yè)。
多模態(tài)大模型創(chuàng)企智子引擎的創(chuàng)始團隊主要來自中國人民大學高瓴人工智能學院,創(chuàng)始人高一釗是高瓴人工智能學院級2020級直博生。從參與國內(nèi)第一個多模態(tài)大模型項目悟道·文瀾開始,智子引擎團隊一直處在國產(chǎn)多模態(tài)技術(shù)的前沿。
智子引擎已完成圖生文、視頻生文、文生視頻、圖生視頻等多模態(tài)模型的發(fā)布,近兩年已連續(xù)完成多輪融資并將自主研發(fā)的多模態(tài)大模型在多行業(yè)落地,具體場景包含:城市治理、應(yīng)急消防、智能巡檢、影像內(nèi)容生成等。該公司希望探索在全新、可擴展架構(gòu)上打造多模態(tài)大模型的技術(shù)路徑。
▲智子引擎發(fā)展歷程
高瓴人工智能學院2021級博士生張陽稱,他的創(chuàng)業(yè)項目“妙手”是一款聚焦AI Agent for Research的自動化科研平臺,提供從選題挖掘、數(shù)據(jù)收集、模型構(gòu)建到報告生成的全流程自動化服務(wù)。
用戶僅需輸入研究方向或核心想法,平臺可在10分鐘內(nèi)輸出包含研究背景、方法設(shè)計、實證結(jié)果、圖表分析的完整實驗報告。
▲妙手產(chǎn)品架構(gòu)
高瓴人工智能學院2022級博士生孫忠祥的創(chuàng)業(yè)項目聚焦法律,打造了大模型驅(qū)動的可信模擬法庭“慧審”。項目聚焦法律AI的可落地性與可信性,融合法律三段論推理與“適應(yīng)-檢索修訂”框架,模擬真實審判流程,實現(xiàn)智能法官、原被告、證人等多角色協(xié)同。
系統(tǒng)特別強化了公平性和生成可信性,解決基層司法資源緊張、案件處理效率低等問題,助力構(gòu)建更高效、更公開、更可信的法律服務(wù)體系,推動智慧司法的創(chuàng)新發(fā)展。
▲模擬法庭智能體系統(tǒng)
高瓴人工智能學院2023級博士生涂權(quán)打造了AI鏡像社交應(yīng)用“回聲”。用戶可通過自建特質(zhì)遵循的擬人化社交分身,由AI主動篩選興趣和性格匹配的對象并代勞破冰,過濾無效社交。
“AI鏡像社交”并不替代真人連接,而是優(yōu)化社交漏斗,讓用戶從低效“滑屏”轉(zhuǎn)向高質(zhì)互動,最終回歸真實關(guān)系。
▲“回聲”團隊的技術(shù)積累
高瓴人工智能學院2023級本科生張景超和團隊一起打造了WeaveWave多模態(tài)人工智能音樂生成模型。目前,大部分音樂生成模型僅支持視覺、文本等單一模態(tài),而該模型可以同時使用視覺、文本、音頻等內(nèi)容作為“靈感”,生成音頻內(nèi)容,進一步提升了音樂生成的可控制性。
三、“在AGI時代,最大的風險就是不敢冒風險”
在以“AGI時代的創(chuàng)業(yè)創(chuàng)新”為主題的論壇上,來自研究機構(gòu)、企業(yè)界和學術(shù)界的多位嘉賓分享了他們對學生創(chuàng)業(yè)的建議。
中關(guān)村門頭溝園管委會主任譚李麗見證了許多創(chuàng)業(yè)項目的孵化,她肯定了高瓴人工智能學院的“導(dǎo)師帶領(lǐng)+產(chǎn)業(yè)鏈接”孵化模式,但也強調(diào)創(chuàng)業(yè)需緊密結(jié)合產(chǎn)業(yè)需求。譚李麗介紹,門頭溝區(qū)的京西智谷正在空間載體、人才安居、法律服務(wù)、科技金融等方向為創(chuàng)企提供支持。
國家級科研機構(gòu)北京中關(guān)村學院院長劉鐵巖建議,學生應(yīng)該充分利用在校期間的機會,在創(chuàng)業(yè)領(lǐng)域多試錯,在這一階段,試錯成本相對較低。他認為,創(chuàng)業(yè)者應(yīng)該“以最樂觀的心態(tài)面對挑戰(zhàn),但以最壞的打算接受結(jié)果?!?/p>
劉鐵巖是中關(guān)村學院的第一位全職員工,經(jīng)歷了該學院從0到1的“創(chuàng)業(yè)”過程。他告誡創(chuàng)業(yè)者,不能“以玩票的心態(tài)看待創(chuàng)業(yè)”。他在中關(guān)村學院鼓勵學生自主立項,從科研階段開始對自己負責,不把導(dǎo)師作為“最后一道防線”。
北京智源人工智能研究院院長王仲遠是中國人民大學校友,結(jié)合自身成長經(jīng)歷分享了對技術(shù)、理想與商業(yè)現(xiàn)實之間差距的認知。王仲遠鼓勵A(yù)GI時代的在校生們積極創(chuàng)業(yè),并強調(diào)“在AGI這個時代,最大的風險就是不敢冒風險”。
華為中央軟件院分布式與并行軟件實驗室主任譚焜觀察到,科技創(chuàng)業(yè)者的創(chuàng)業(yè)項目通常由技術(shù)出發(fā),但仍需看到商業(yè)需求是什么、客戶在哪里、客戶的需求是什么。此外,在公司達到一定規(guī)模后,如何構(gòu)建公司的組織架構(gòu)、股權(quán)架構(gòu),也是必須要注意的問題。
高瓴人工智能學院長聘副教授許洪騰從青年教師的角度分享了他對創(chuàng)業(yè)的看法。據(jù)他回憶,文繼榮曾說人大高瓴人工智能學院的發(fā)展方向應(yīng)該類似斯坦福大學,而非加州理工,前者更注重創(chuàng)業(yè)文化和多元發(fā)展路徑,后者更注重象牙塔內(nèi)的科研。
許洪騰建議,想投身創(chuàng)業(yè)的學生應(yīng)該認識到,投資人更看重“人靠譜”而非項目成敗。創(chuàng)業(yè)者應(yīng)該注重在創(chuàng)業(yè)過程中與投資人建立聯(lián)系,獲得投資人的信賴,這樣即便某一項目失敗了,還能持續(xù)獲得投資。
已經(jīng)擁有成功創(chuàng)業(yè)經(jīng)歷的高一釗分享說,創(chuàng)業(yè)幫助他迅速積累了在校園內(nèi)無法獲取的資源,對個人成長幫助較大。他鼓勵學生積極創(chuàng)業(yè),因為當以學生身份創(chuàng)業(yè)時,即便項目失敗,也不會面臨過大損失。
結(jié)語:產(chǎn)學研融合發(fā)展,高瓴打造特色人才培養(yǎng)模式
作為國內(nèi)頂尖的AI科研與教學機構(gòu),高瓴人工智能學院過去6年的發(fā)展速度和成果有目共睹。
在國內(nèi)AI產(chǎn)業(yè)飛速發(fā)展、國產(chǎn)化進程加速之際,高瓴人工智能學院正為產(chǎn)業(yè)界源源不斷地輸送高質(zhì)量AI人才,走出了一條科研、產(chǎn)業(yè)與教育融合的獨特路徑,對國內(nèi)的AI教育具有一定借鑒意義。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.