關于AI Agent在企業研發中的應用,先講一個真實的案例研究。根據研發部門的規模,大概可以判斷這是一家美國綜合性的工業與科技集團,市值在千億美元以上。
研究對1, 018 位科學家進行了隨機試驗,對照不同的分組使用AI給工作數量和質量帶來的變化。他們自己訓練了一個研發用的大模型,就是一個圖神經網絡系統,用來生成具有指定特性的化合物的配方。有點像文生圖一樣,科學家想要一個什么樣的化學結構,就輸入指令進系統,然后通過其中的擴散模型,生成各種各樣的化學結構,科學家再對這些生成的材料進行評估,篩選出候選的材料。在整個的研發管線里,研發部門判別出化合物產品的原型,下面就給交給產品部門了。
研究發現,使用AI工具,發現的新材料增加44%,申請的專利增加39%,創新增加了17%。這些化合物具有新穎性,質量更高,所以很多是可以申請專利。AI 可以提升研發效率大概在13%-15%。
(來源:Artificial Intelligence, Scientific Discovery and Product Innovation)
這項研究去年底公布,在 AI 、研發、行業圈子里引起了不小的轟動,它證明了AI 對于企業研發有顯著提升作用。AI 對企業中的應用效果,我之前也看過很多研究,比如說對企業的客服、呼叫中心之類的真實場景的研究,這是第一次看到比較高質量的對企業研發的研究。
引入AI對企業研發機制、協作方式和組織會帶來什么呢?創意生成階段花費的時間大幅度減少了,對生成的候選新材料進行判斷的時間增加了??梢钥闯?,引入AI,較資深的科學家是贏家,充分發揮了他們的能力和經驗,而底層的1/ 3 初級科學家是輸家,他們使用AI工具基本沒有任何提升。這家企業在引入AI工具之后,就對研發部門做了一次調整,裁掉了 3% 的人,主要是初級的研發人員,增加了一些比較資深和高級的科學家。當企業引入AI 的時候,企業的組織協作方式一定會帶來變化。
那么究竟誰在做研發Agent?首先是科技巨頭都在做,如微軟、谷歌等;其次是一些行業巨頭也在做,如生物醫藥、化學、電子、汽車、材料等,第三是大學和研究機構在做,往往跟行業或科技巨頭合作;第四是AI 大模型企業,就是像OpenAI、 Anthropic 這些公司,都會推出 deep research功能,而數據和代碼功能也可以被歸入泛研發領域,實際上是一種通用agent;第四,就是一些初創企業,它們直接進入垂直領域,或者聚焦在整個研發管線中的某一個片段上、某一個模塊上,它們也可以歸為原生的AI初創企業,在新材料和生物醫藥領域比較多,也是高專利密度領域。
再舉一個例子,約翰霍普金斯大學和AMD 聯合做了一個研發agent。我看完論文之后,覺得專業領域的人做本專業的agent,優于那些科技巨頭做上述專業的agent 。
(來源:Johns Hopkins University)
約翰霍普金斯在生物醫藥領域在全球是頂尖的,它主導了這項研究。這張圖上的每個小人都是一個agent,有醫學博士后、軟件工程師,醫學博士生,還有機器學習的工程師。實驗流程上,包括文獻檢索、規劃形成、數據準備、實施實驗、報告撰寫,然后到報告的評審,全部都是agent完成的,甚至最后的評審也是用AI來做的。
它得出的一些結論中,有些細節很有意思。如它試用了 OpenAI 的三個模型,今年初,最好的模型是OpenAI的推理模型o1-preview,還有 o1-mini,還有一個 GPT-4o。他發現確實是 o1 preview是最好用的,最不好用是 GPT-4o,每一代大模型的提升,最終需要在實用中驗證。這個實驗 agent可以用全自動模式,也可以用協同模式,最終證明協同模式出來的結果還是比全自動要好。協同模式就是在每一個節點都會有一個人類專家的反饋。
當實驗用agent完成時,它的成本就變成算力成本。這里要說明的一點,測試結果所說的節省了84% 的成本,主要是相對測試基準,與其他前沿研發agent相比的結果,主要是在實際運行實驗agent時的時間成本和推理的成本。
研究發現,使用研發agent也會帶來一些問題。第一個就是學術的嚴謹性。醫藥生物學領域的實驗報告、論文,都需要人類專家或者同行的審核。第二,實驗中所使用的底層數據集和算法中固有的偏見,可能帶入到整個的研究流程里面,agent可能全盤接收,導致系統性的偏差。最后,當 agent自主性越來越強,研究結果究竟是由人負責還是由agent負責,這就要求必須明確披露人工智能的參與程度。
上面兩個例子,一個是代表了企業內實際應用的,一個是代表了學術機構正在探討的。接下來分享一下最近很火的一篇論文。我看完之后,感覺它實際上就是談下一代研發agent的。
(來源:Welcome to the Era of Experience )
這篇由谷歌DeepMind負責強化學習的副總裁西爾弗(Daivd Silver)和今年圖靈獎獲得者、強化學習奠基人薩頓(Richard Sutton)共同撰寫的論文《歡迎來到經驗時代》,把大模型分成了三個階段,模擬的階段,人類數據階段,實驗數據的階段。它的一個核心的觀點,就是說我們現在研究大模型,不僅僅是在預訓練階段撞上了數據墻,而且整個AI的研究都撞上了數據墻。我們現在用的有質量的人類數據,已經基本上耗盡了,更多真正高質量的數據的來源,是在人類的邊界之外。AI在進入經驗時代,即agent不斷地從與環境互動的經驗中學習。
他們舉了三個例子,第一個是AlphaGo 戰勝李世石的第二番棋中出現的神之 37 手;第二個是 DeepSeek 在訓練R0模型時,直接用了無監督的強化學習,里面所謂的Aha時刻,就是模型涌現了新的智慧;第三個例子,是最近谷歌的AlphaProof,除了用人類所有的解法訓練之外,自己又去嘗試了很多新的解法,結果參加數學奧林匹克得了銀牌。
這三個例子,是在AI具備了先驗的知識之后,學習中主要不再使用人類投喂的數據,而是圍繞機器和自己所在環境里產生的數據來進行學習,這代表了大模型發展的未來。
論文面講得最多的其實就是研發agent。如持續學習,就是說agent能夠持續地跟自己的環境的互動,而不是說現在是一問一答就結束了。這樣agent就能自己持續地調整和適應?,F在大模型能提供越來越持久的記憶力,上下文已經過到了上千萬token,也有企業號稱將提供無限記憶力的。持續學習,才能稱得上是真正的的智能體。第二個就觀察和行動,agent可以通過數字接口和真實世界進行互動,包括物理世界。以后觀察世界的角度,agent仰望星空的感覺,可能跟人類不大一樣。第三個就是獎勵機制,以前是人給它設定的,那么它以后通過自己的算法,會為自己不斷地涌現出圍繞著自己的經驗而產生的獎勵機制。所以agent可能為自己構建一個世界模型。
上面講的這個三個例子,第一個是大型企業中的應用,而且是一個大型的企業,一千多位科學家在用,證明AI 在研發領域確實可以提升效率。第二個是在一個世界頂級大學的實驗agent,證明了它的有效性和局限性,但是大多數專業人士是愿意去試用。第三個例子,實際上說明的是agent的能力,最終還是取決于前沿的大模型取得的突破。我們期待agent在研發領域更快應用起來,一方面取決于垂直領域的know-how與AI更深入的結合,另外一方面,前沿大模型的創新和突破,包括產生算法新范式,依然是最基礎、最引領的。
最后小結幾點。首先,我們沿著現在的技術路線,幾乎可以看到agent在研發部門會實現單點-模塊-工作流-多智能體協作-業務-組織-生態這樣一個順序滲透,同時agent的自主性會越來越強,沿著工具-助手-代理-專家-創新者-組織者這樣一路成長,中間會看到從專業代理到專業人士,之間的界限會越來越模糊。研發agent更值得信任,還是取決于大模型新范式,如經驗性的學習,值得期待。最后,所有這些技術的突破,會不斷挑戰發明創造的倫理,agent與人類的權利和責任怎么去劃分;如何防止有人去濫用和惡意使用。最后,當agent 越來根據自己的經驗來終身學習,自己投喂自己數據,自己設立獎勵機制,它自主性越來越強,那人類如何能控制它。
本文來自智慧芽“AI重塑知識產權價值”大會上的演講,有調整。
參考:
Artificial Intelligence, Scientific Discovery and Product Innovation
Agent Laboratory: Using LLM Agents as Research Assistants
The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery
Welcome to the Era of Experience
下載演講PDF:Agent如何改變企業研發
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.