圖源·研討會官方
AI正在改變人類的科學研究方式。
2月19日下午,在世界互聯網大會人工智能專業委員會主辦的“人工智能賦能科學研究”研討會上,中央網信辦副主任、國家網信辦副主任王崧,王堅院士、龔克、溫迪·霍爾、孫茂松等專家教授,以及阿里巴巴集團副總裁葉杰平等企業家,就AI4S進行了公開的觀點分享。
諾貝爾獎進入AI時代
按照常規的理解,AI4S是AI for Science的縮寫,也就是“科學智能”,其利用AI技術解決復雜的科研問題,以推動科學發現和技術創新,被譽為科學研究的“第四范式”。這種范式通過結合機器學習、數據分析、高性能計算等技術,幫助科學家在各個領域進行更深入的探索和發現。
雖然與會嘉賓對AI4S的定義、范式等還存在一些不同的看法,但都形成了一個共識:AI正在改變人類科學研究方式。
研討會過程中,他們不約而同的提到,2024年諾貝爾物理學獎和化學獎均頒給了AI相關領域。其背景是,2024年10月8日,諾貝爾物理學獎表彰獲獎者“基于人工神經網絡實現機器學習的基礎性發現和發明”。2024年諾貝爾化學獎則頒發給“在計算蛋白質設計方面的貢獻”。
以后者為例,2024諾貝爾化學獎之所以獲獎,在于其開發了AlphaFold人工智能模型,這種模型解決了一個已有50年歷史的難題,能夠預測大約兩億種已知蛋白質的復雜結構,直接推動生物醫藥領域的研發進程,并且已經被全球200多萬人使用。
這兩項獲獎名單與AI關聯度之高,讓AI4S理念受到更大的關注,也在人工智能領域掀起巨大的浪潮。很多觀點認為,諾貝爾獎進入AI時代。這個論斷恰體現的是,科學家正在對AI提出源源不斷的需求,AI正成為科學探索的核心工具。
中科院院士鄂維南曾經指出,科學研究總體上可分成:基于數據驅動的開普勒范式和基于原理驅動的牛頓范式,這兩種范式在現代遇到了各自的挑戰。但這些挑戰也都有一個共同的解決方案: “缺乏有效手段解決高維數學問題,是阻礙科學研究與技術發展取得進一步突破的主因之一。而深度學習,或者說人工智能,可以幫助解決這個問題 ”。
這是因為傳統AI模式下,AI4S主要是“算法驅動”,依靠算法創新助力科研創新。大模型時代,AI4S對計算、網絡、存儲等基礎設施要求極高,特別是面向數據密集型的科研領域,AI4S也從“算法驅動”轉變為“計算驅動”。
圖源·研討會官方
王堅院士在分享中也特別提到這一點。他還表示,在開放科學領域,互聯網發揮著重要作用。他認為AI4S將幫助更多人加入創新陣列。開放科學不是簡單地把科學開放出來,而是要考慮怎么做科學研究,怎么做交流。
在開放科學領域,互聯網發揮著重要作用,也影響著人工智能的發展。如今,數據、計算和人工智能都無法脫離互聯網?;ヂ摼W作為基礎設施,將所有問題向前推進。人工智能簡單來說是數據、模型和計算的結合,與互聯網一樣具有規模效應。
此外,王堅就開放和范式的新變化發表自己的看法。談及DeepSeek對于開源概念的拓展,和開放資源對于科學技術領域的巨大價值。DeepSeek基于MIT許可協議開源,當DeepSeek出來的時候,《自然》雜志在一個星期以內發表了五篇文章講這件事情。
事實上,人工智能以其驚人的潛力,逐漸成為提升科研創新效率的“標配”。谷歌學術數據表明,近3年使用AI的論文數量增長率超3倍。特別是大模型的出現和突破發展,正加速AI4S成為科研創新和科技進步的核心驅動力,并在芯片設計、生物醫藥、材料能源、天文氣象、自動駕駛等一系列領域,取得重大創新突破。
阿里AI4S正加速應用
就目前大模型發展路線看,DeepSeek的火爆,將開源大模型技術體系再一次成功展示。Meta 首席科學家YannLeCun表示:“DeepSeek提出了新的想法,并在前人的工作基礎上加以實現。由于他們的工作成果已發表并開源,因此每個人都可以從中受益,這就是開放研究和開源的力量”。
也就是說,開源大模型“開源開放”特性,決定了其一旦性能優異、文檔與指引完善、工具鏈完備且模型持續迭代,就會以滾雪球的方式吸引開發者進入其生態體系,并由廣大開發者二次開發出數量龐大的“衍生模型”家族,量變到質變,大幅提高模型的性能和質量,呈現出與閉源模型分庭抗禮之勢。
不可忽視的是,開源模式還把大模型的“價格打下來”,有效解決制約大模型規?;瘧玫耐评沓杀具^高等問題。其中一個關鍵要素在于,開源大模型“公有云+API”的部署方式,全面加速了從MVP(最小可行產品)驗證、客戶觸達、交付、運營迭代等多個環節的應用創新。
從行業實踐看,AI大模型私有化部署的資本和時間投入成本,是“公有云+API”部署方式的10倍。
從構建MVP看,公共云提供的大規模、高彈性、低成本算力,以及成熟完善的工具鏈,能夠大幅降低創新成本和門檻。例如,依托谷歌云的Discord平臺,助力Midjourney、Pika等初創企業快速推出新產品。
再從客戶觸達看:公共云上有龐大的數字化基礎好的客戶池,能夠助力企業快速、低成本地觸達客戶。Mistral 模型在Azure 云平臺上部署后,立刻獲得了約1000個優質客戶。
這帶來的直接行業影響即是,公共云+API將成為企業使用大模型的主流方式。目前,國內已有50多所院校機構使用阿里巴巴的“云和AI服務”開展科研創新,并在生物、農業、天文等領域取得了可喜的成果。
圖源·唐辰現場拍攝
在算力普惠、模型開源和數據共享的合力下,阿里AI4S已經摸索出多種合作模式:
1、基礎設施服務模式。比如,2022年,小鵬汽車攜手阿里云在烏蘭察布建成中國最大的自動駕駛智算中心,將自動駕駛模型訓練效率提升了超過600倍。過去兩年,阿里云擴張該智算中心的算力儲備超4倍至2.51Eflops,為小鵬汽車提供穩定高效的算力底座,支撐了大模型快速迭代,實現智駕“全國都好用”;
再如,2023年6月27日,國內高校最大的云上科研智算平臺在復旦大學正式上線。該平臺由復旦大學、阿里云等共同打造,名為CFFF(Computing for the Future at Fudan)。中國工程院院士、阿里云創始人王堅高度評價了CFFF平臺的公共云部署模式,認為這是中國也是全球第一次讓高校能擁有和科技巨頭一樣的研究計算平臺,讓研究真正進入了計算驅動的時代。
2、專業平臺模式,搭建智慧育種平臺。2021年6月8日,由中國農業科學院作物科學研究所與阿里巴巴公益基金會牽頭,會同阿里巴巴達摩院、中國農科院農業發展基金,宣布共同合作共建“智慧育種平臺”,建立生物技術(BT)、信息技術(IT)與智能技術(AT)深度融合的種業自主創新模式,為培育作物新品種提供重要技術支撐。目前,全球已有150多家農業高校、研究院所和農業企業使用該平臺。
3、聯合研究模式。比如葉杰平在分享中提到,阿里AI與中山大學合作推進“如何用人工智能挖掘RNA病毒”項目,通過先構建數據集,再打造獨特領域大模型LucaProt等舉措,發現超51萬條病毒基因組等成果,該成果也登上了《Cell》期刊封面;
達摩院還與浙江大學棉花精準育種團隊、中國農科院生物技術所組建聯合科研團隊,綜合運用遺傳學、生物大數據和AI技術,為棉花育種提供重要的候選基因列表。相關論文發表在國際頂級期刊《細胞研究》(Cell Research)上。
4、模型開源模式。比如國家天文臺“星語3.0”大模型。2024年4月14日,中國科學院國家天文臺人工智能工作組發布新一代天文大模型——“星語3.0”。“星語3.0”基于阿里云通義千問開源模型打造,目前已成功接入國家天文臺興隆觀測站望遠鏡陣列--Mini“司天”。這是大模型在科學領域落地的經典案例,也是大模型在天文觀測領域的首次應用。
此外,阿里云在ChatGPT出現之前就啟動了模型社區建設——魔搭社區,目前已有超過4萬家模型入駐,有超過1000萬用戶數。截至目前,阿里通義千問開源模型下載量為2億,基于阿里通義模型衍生模型數量超過9萬個。
得益于阿里巴巴堅持開源開放,持續提升“通義千問”大模型能力,全尺寸、全模態開源,并推動阿里云AI算力提升性能、降低成本。近日,全球最大AI開源社區Hugging Face發布了最新的開源大模型榜單(Open LLM Leaderboard),榜單顯示,其排名前十的開源大模型全部是基于阿里通義千問(Qwen)開源模型二次訓練的衍生模型。
2024年GTC大會(英偉達GPU技術大會)上,英偉達CEO黃仁勛堅定認為,AI4S是AI領域的三個關鍵方向之一。但AI4S也面臨交叉型人才短缺、技術方案難復用、垂類學科數據質量欠佳等問題逐漸暴露出來。
唐辰也注意到,本次研討會就AI4S提出的三點建議:實現包容普惠的發展;實現融合創新的發展;實現安全有序的發展。而這些,都是AI將科學研究推入一個新的階段,所必然面臨的問題和挑戰。
36氪頭條轉載:
虎嗅推薦:
36氪首頁推薦、鈦媒體精選:
鈦媒體主編精選:
36氪熱榜、鈦媒體熱榜:
澎湃、界面、36氪、鈦媒體熱榜:
人人都是產品經理主編推薦:
「唐辰同學」
鈦媒體、36氪、老虎財經熱榜
澎湃新聞2024年最澎湃創作者
老虎財經2024年度優秀專欄
河南日報·頂端新聞2024年度影響力作者
界面新聞優質榜單
老虎財經2024年度優秀專欄
騰訊新聞年度優質熱問答主
2023搜狐新聞年度優質創作者
人人都是產品經理2023年度優秀作者
2023網易新聞年度內容合伙人
界面、36氪、鈦媒體、澎湃、藍鯨、老虎財經等平臺專欄認證作者
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.