設置星標 關注,從此你的世界多點科學~
大家·科技前沿
MASTERS
樊春海
中國科學院院士
上海交通大學化學化工學院院長
轉化醫學研究院執行院長
20世紀末,很多人都在討論即將到來的21世紀到底是信息技術的世紀,還是生物技術的世紀。但是,現在我們已經越來越清晰地意識到,21世紀既是信息技術也是生物技術的時代,更是兩者的交叉融合,這種交融很有可能帶來更多、更新的機會。
交叉科學的重要性
科學,可以說是“分科之學問”。人類迄今獲得的知識已經浩如煙海,單憑個人的能力已不可能掌握全部的科學知識。而科學被劃分成數學、物理、化學、生物等學科。這種分科研究的方法便于人們聚焦特定行業或領域,有針對性地累積大量專業知識,從而取得更深入和系統化的認識,推動該學科的發展。
雖然傳統的分科研究推動了現代科學飛速發展,但是我們也已看到這種方法的一些固有缺陷。比如過度分割可能導致學科和學科間缺乏聯系,很多研究無法突破邊界等。這些缺陷的存在導致不同學科之間留下大量的空白地帶,這也使得科學界對交叉科學產生了極大關注。
交叉學科需要研究者具備跨越不同學科間壁壘的能力,而作為一種新的科研范式還可能超越傳統學科里先行者固有的先發優勢。
這種特質更為我國帶來了一種全新的可能性:傳統賽道上歐美是先行者,已經建立起幾百年的領先優勢,我國雖然在奮力追趕,但想要趕超還有待時日。而在傳統學科的邊緣和交叉地帶還存在全新的機會和無限的潛力,我們有望通過學科交叉搶先取得能夠影響全世界、全人類發展的重大突破。因此交叉科學受到了國家和社會的廣泛關注,學科的交叉融合已成為科學發展的重要時代特征。
信息技術(IT)與生物技術(BT)的交叉
谷歌,這家傳統的IT大企業,看似研究領域與生命科學毫無聯系,難以想象它能夠引發生物技術領域顛覆性的革命。但這種情況卻在過去的幾年內變成了現實——2018年谷歌首次發布AlphaFold,利用人工智能(AI)的力量對蛋白質結構實現了預測。到2024年5月,AlphaFold已經更新至第三版,將可預測的范圍從蛋白質結構擴展到大部分生命分子。這種技術對于生命科學領域產生了非常深遠的影響,因為蛋白質等生命分子的結構可以說是整個生物技術領域的基石之一。生物體內的酶、各種抗體等功能性大分子在生物體內發揮著重要的功能,因此這些分子的精準結構可以為新的結構改造或藥物分子設計提供指引,加速藥物的發現,尋找新的靶點和治療方法。
在AI被引入結構生物學之前,百年間無數生物學家進行了不懈的努力,仍然只有極少數蛋白質的結構被真正研究出來。因此當第一版AlphaFold推出并展示出其強大的實力之后,結構生物學家紛紛發出悲嘆,因為他們在做的事情似乎已經被AI代替了,但是很快他們又從悲觀中醒悟過來,因為這種顛覆性的突破實際上預示著更大的機會,現在生物技術領域的科學家都開始積極地擁抱AlphaFold,把它作為一種強大的工具加速自己的研究。除了AlphaFold之外,現在還有越來越多來自IT領域的技術與生命科學掛起鉤來,比如AI與醫學的結合等,這些都是典型的IT-BT跨界從而產生新機遇的例子。
上文描述的是IT向BT的跨界,那么反過來BT是否也能給IT賦能呢?DNA或許就能做到這一點。
DNA的發現及重要應用
DNA存在于我們每一個人的身體里,從本質上來講,DNA是一個化學分子,可以被看作一種高分子。生物界在進化的過程當中,選取了這種雙螺旋結構的高分子材料作為我們遺傳信息的載體。DNA雙螺旋是一個特別美妙的結構,我們可以將這種結構想象成一條拉鏈,向右手方向擰轉。很多藝術家都非常喜歡這樣一個來自生命的結構,因此我們在很多建筑物或者雕塑中都能發現這樣的元素。在DNA雙螺旋結構發現50周年的時候,有人把DNA的雙螺旋結構和蒙娜麗莎融合到了一起。在藝術中,永恒的形象是蒙娜麗莎;在科學里,永恒的形象是DNA雙螺旋結構。
蒙娜麗莎與DNA雙螺旋結構
雙螺旋結構的發現可以追溯到1953年,兩位偉大的科學家——沃森(Watson)和克里克(Crick)——在著名的《自然》雜志上發表了一篇論文“核酸的分子結構”。整篇論文只有一頁紙和一張圖,卻開啟了生命科學進入微觀世界的新征程——分子生物學,后續衍生出了分子微生物學、分子神經生物學、腦科學等全新的領域。更重要的是,雙螺旋的發現回答了一個困擾人類上萬年的天問:我們從哪里來?我們到哪里去?這篇簡短的論文告訴我們:DNA一共只包含四種單體,分別用A、T、C、G表示,其中A與T配對,C與G配對,“從DNA的配對的方式,我們馬上可以推測出遺傳物質的復制機制”。這樣一個簡單的結構讓我們明白我們如何從父母處獲得遺傳信息,又如何傳遞到下一代。有意思的是沃森是一位生物化學家,克里克是一位物理學家,所以DNA結構的發現本身也是跨界的產物。
沃森和克里克發現DNA雙螺旋結構
經過幾代科學家的共同努力,現在我們翻開任何一本分子生物學的教科書,都可以看到遺傳是如何進行的。我們體內有一種叫DNA聚合酶的蛋白質,它的尺寸是頭發絲的千分之一,它像一個納米尺度的復印機,把DNA雙螺旋從中間分開,然后“復印”出兩條跟原來一模一樣的雙螺旋鏈,這就是DNA的復制過程,在我們細胞里這種復制無時無刻不在進行。
DNA堿基作為信息編碼字節
核酸(包括DNA和RNA)相關研究可謂產出諾貝爾獎最多的一個領域。回顧歷史,我們可以在幾十個頒獎時刻見到上百位科學家的工作收獲最高褒獎。從最開始對核酸結構的認識,到對核酸功能的認識,再到前幾年對核酸信息的調控——也就是大家耳熟能詳的CRISPR基因編輯技術。通過對該技術,我們不僅可以了解基因的結構和功能,還可以對它內部儲存的遺傳信息進行非常精準的編輯和調控。
這樣一段非常美妙的科學發現歷程不僅滿足了人類的好奇心,也讓我們知道我們從哪里來、到哪里去,而且開啟了整個現代生物技術工業。例如核酸檢測技術,這是一個非常偉大的技術,也獲了諾貝爾獎,它利用自然進化過程中的聚合酶,像一臺天然復印機一樣不停地把采集到的DNA分子一變二、二變四,最終積累到很高的水平。因此即使一開始樣本里只有極少量的病毒DNA,通過DNA聚合酶的復制擴增也可以實現檢測。核酸檢測技術可以對病毒、細菌或者目標基因進行高靈敏度的檢測,在醫學、農牧學、生態學、刑偵等領域都有廣泛的應用。
另一個非常重要的技術就是核酸測序。它起源于20世紀末一個非常偉大的大科學項目,即人類基因組計劃。當時全世界幾十個國家聯合起來,投入幾十億美元,經歷整整十年時間,只測了一個人的基因。而今天,我們只需要花費幾個小時和不到1000元人民幣,就可以測一個人的全部基因序列。如果測序的價格能夠降到100元的話,或許我們的體檢都可以加上這一項目。
測序技術的發展還讓我們能夠測幾十萬年甚至百萬年前古生物的基因信息,幫助我們了解古人類、猛犸象等古生物。古生物DNA測序技術前幾年也獲得了諾貝爾獎。
DNA成為一種變革性的新材料
在微觀層面,利用高分辨顯微鏡我們可以看到DNA的真實結構,就像一條寬度只有2納米的毛線,我們不僅可以看到它,還可以操縱它排列出我們想要的字母。在宏觀層面,特殊的紡絲技術可以把DNA紡成細絲,而且它的強度比天然蛛絲的強度還要高,可以作為防彈衣和人工韌帶等的原材料。最早提出把DNA作為一種材料來使用的是紐約大學的西曼(Seeman)教授,他在1983年提出這個新穎的想法時還被認為是荒誕和不切實際的,但是現在這已經變成現實。
為什么DNA可以作為一種變革性材料?
我們都知道IT世界的底層邏輯是0和1,而我們生命的背后就是A、T、C、G四個字母。如果把0和1看作二進制,那么DNA就是一個四進制的編碼體系,大自然中花鳥蟲魚本質上都是A、T、C、G的排列組合。DNA作為一種億萬年進化選擇的高分子材料,擁有和其他材料不同的一個特征,即可編程性,因此它的本質是一種由A、T、C、G四個字母組成的、可編碼的分子信息材料。
有一種叫作“DNA折紙”的技術,就像織毛衣一樣,可以按照特定的程序把DNA編制成各種各樣不同的圖案。最早是加州理工學院羅斯蒙德(Rothemund)博士利用這樣的編程技術,用DNA編織了一個直徑為70納米的笑臉圖案。2006年我們團隊用DNA做了一幅中國地圖,這是一個不對稱的DNA納米結構,也可能是最小的中國地圖之一。后來我們又用地圖作為模塊單元,拼出了一個熊貓圖案。現在這個快速發展的領域我們稱為DNA納米技術或者核酸納米技術。簡單地理解,這種技術可以像織毛衣或3D打印一樣,能把DNA這種信息材料編碼成一維、二維、三維、多孔、曲面等各種各樣的納米尺度的結構。
這些非常規則和精確的材料有著廣泛的應用。宏觀世界里最有用的材料就是框架材料,例如房子就是由多種框架材料構成的。框架材料為什么重要?我國古代的哲學家老子給出了一個最精準的哲學描述,就是“利”和“用”的關系。道德經里有一句話叫作“有之以為利,無之以為用”,就是說必須有框架有空間才能發揮作用,就像空碗才能吃飯,空杯才能喝水,空屋才能住人,框架里面空心的部分“無”才是能夠發揮作用的部分。
本基于利用DNA來編織框架結構的能力,我們率先在國際上提出了“框架核酸”的概念,即一類人工設計的結構核酸,它的尺寸、形貌和力學特性可以程序性調控。這種微小的框架核酸可以“住”分子,為生物分子的識別提供更好的結構支撐,從而成為疾病診療、合成生物學等領域的重要工具。
在過去的十幾年里,我們團隊和國際上許多團隊一起在框架核酸的領域做了很多工作,并證明它確實是一個通用的技術平臺和工具箱,可以為生物檢測、疾病治療甚至微電子相關的領域提供非常精確的基本工具。
DNA與IT的結合
那么如何把DNA與IT結合起來的呢?
讓我們用宏觀世界中已經無處不在的機器人作為例子。機器人是一個典型的IT產物,那么微觀世界中是否也有類似的機器人呢?關于這個概念,我們最早可能只是在科幻小說里看到過,未來可能有一種納米機器人,它可以走到我們的細胞里,尋找到癌細胞并消滅它們,這樣不用手術就能治療疾病。科學就是不斷地把科幻變成現實的歷程,科學家圍繞這個看似科幻的想法奮斗了很多年,大家意識到要建造這種納米尺度的機器人必須要利用生物技術采用分子來搭建。
首先是要創造出可以運動的分子,我們稱之為 “分子機器”。1983年法國科學家索瓦日(Sauvage)發明了兩類可以自主運動的分子機器,通過有機合成的方式創造了分子的運動。隨后許多科學家都在分子機器領域不斷探索,例如荷蘭的費林加(Feringa)教授發明了可以運動的分子汽車。這兩位教授和美國的司徒塔特(Stoddart)教授一起獲得了2016年的諾貝爾獎,以表彰他們在分子機器領域的貢獻。
《 世界科學》專訪 諾貝爾獎獲得者司徒塔特教授
分子機器的產生使得分子突破了布朗運動的限制,產生了定向機械運動,可以像宏觀的機器人一樣走起來。
諾貝爾獎委員會高度評價了這種納米尺度的機器人:“分子機器在未來的應用可以說無可限量,甚至還能應用于醫療上,進入人體組織修復器官,除去癌變細胞,更換有缺陷的人體基因。”
但是諾獎的頒發并不意味著分子機器人的研發畫上了圓滿的句號,它代表的其實是大家對技術潛力的無限憧憬,也代表這還沒有成為現實。
這些通過有機合成人為創造的分子,在體外可能運行得很好,納米機器可以產生各種各樣的功能。可是它一旦進入細胞,情況就會完全不同。因為細胞對于這些小分子來說是一個太過于巨大和復雜的空間,有點類似人類進入了浩瀚的太空。
細胞內部有細胞質、細胞核和各種細胞器,要在這些位置之間穿梭就像人類要在不同的星球間穿梭一樣,是一個高難度的行為,需要克服高度復雜的生物環境帶來的各種問題。
要完成這樣復雜的動作,必須讓這些機器具有智能。這已經超越了有機合成的能力范疇,于是化學家將目光轉向了分子的組裝,希望借此突破分子智能的限制。因為在我們的細胞里面就有一些機器時時刻刻都在運行。比如說我們體內與肌肉運動相關的蛋白質就在不斷組裝和解組裝,這就是一個天然的分子機器。
于是我們前些年提出了一個理念:能不能不依靠有機小分子從頭合成,而是直接借助自然的力量,利用DNA或者框架核酸在細胞里的組裝和解組裝來構筑仿生的DNA機器,從而實現細胞里的物質和能量調控。
基于這個理念我們開啟了全新的合成生物學:我們創建了一系列由框架核酸組裝的元件,它們像3D打印一樣精確;我們證明了可以通過分子組裝產生智能,即用框架核酸創造智能分子機器人,雖然看上去比較粗糙,但卻可以像家里的掃地機器人一樣走迷宮;我們還從細胞外深入到了細胞內,仿造病毒這種天然納米機器人的構造和工作原理做出框架核酸納米機器人。
這些工作有望推動生物醫藥產業的進一步發展。
可以像掃地機器人一樣走迷宮的框架核酸智能分子機器人
DNA這種全新的材料與IT世界中機器人的結合是一個新興的領域,但已經呈現出非凡的價值,值得持續探索。
DNA存儲
DNA存儲簡單來說,就是用DNA來存儲計算機的信息。這個想法是不是聽起來很瘋狂?基于硅的計算機信息為什么能存到我們碳基的生命中去?但是一旦深入到兩者的本質層面上,這一切就能得到非常合理的解釋,因為計算機世界本質上是0和1組成的二進制世界,而DNA則是由A、T、C、G四種基元組成的四進制世界。這兩個進制之間完全可以進行相互轉換。
近些年DNA存儲獲得了各界的廣泛關注,例如:我國把DNA存儲列入《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》和《“十四五”國家信息化規劃》;美國的《科學》(Science)雜志提出了未來發展的125個科學問題,其中信息科學的四大問題之一就是能否用DNA做信息存儲的介質;美國成立了DNA數據存儲聯盟,微軟等企業已經參與其中;國內的一些IT公司也對這個領域非常感興趣,希望參與這個全新的變革性存儲研究。
數據或者信息的存儲實際與整個人類文明的發展密不可分,可以說整個人類社會的文明史就是一個信息存儲和傳播方式變革的歷史。從原始人的結繩記事,到紙張的發明,再到1980年代出現電子信息,如今又有了硬盤、U盤、云盤等新的存儲介質,數據存儲的問題是不是已經都解決了呢?
實際上并沒有,看一下全球數據的增長情況就能發現我們進入了一個信息爆炸時代。2020年全世界的數據是44澤字節,也就是440萬億億字節,這些數據的保存需要消耗整個三峽大壩全年的發電量,而且數據還在不斷增長,對能源的消耗將會難以為繼。但是我們再仔細分析就能發現這些數據里80%~90%都是冷數據,這些數據不像我們手機里的信息需要快速頻繁地調用,相反它們在一年甚至更長時間里都很少被使用。這些數據如果要保存需要持續地消耗能源或者金錢,但如果直接丟棄又可能意味著人類文明的一種損失,這就造成了一個困境。
另一個困境來自數據的傳輸。各種技術的發展使得現在人類活動產生的數據已遠超從前。例如前些年人類第一次拍攝黑洞的照片,數據量高達5拍字節,要存滿幾千個太字節級別的硬盤,總重量達到半噸。這樣的數據量已經無法用網絡進行傳輸,只能回到最原始的方法,用車輛或者飛機來運輸,運輸的難度和費用直線上升。
第三個困境是存儲壽命的困境。現在的硅基存儲方式十年左右基本都要進行一次數據的遷移,除了造成成本上升之外,隨之而來的還有數據安全性和可靠性的問題。
這些困境都對硅基存儲提出了嚴峻的挑戰,于是大家想到了DNA存儲。實際上,早在1960年代就有科學家提出DNA存儲的設想,1988年這個設想得到了首次證明。如上所述,二進制和四進制的轉換實際上并不難。對DNA存儲而言,數據的寫入就是DNA的合成,而數據的讀出就是基因測序。
微軟前幾年也進入DNA存儲領域并在2019年推出了全世界第一臺端到端的DNA存儲原型機,使DNA存儲從科學研究真正走向了產業化。國內的華為、聯想和華大基因也都非常關注DNA存儲。這種來自業界的高度關注與DNA的優勢是密不可分的。
經過推算,利用DNA這一來自生命的全新材料存儲數據,可以把信息存儲的物理極限提高7個數量級,相當于把1000萬塊硬盤的數據存到一個只有50克砝碼大小的DNA中,而全世界的數據用200千克DNA就可以存下。這樣再也不會擔心未來的數據量太大存不下了。
除了密度極高之外,DNA存儲的能耗極低,壽命極長。對于硅基來說存儲十年是壽命極限,DNA卻可以存儲千年甚至百萬年,理論上DNA中的信息可以永久保存。此外,DNA存儲還有高安全性和抗干擾性等優勢。
更重要的是DNA存儲的上下游已經獲得了突破。DNA合成早在20世紀就已經實現,到現在已經是一個成熟的產業,成本是按照摩爾定律下降的。而基因測序由于人類基因組計劃的推動,甚至出現了超摩爾定律的發展,已經從一個幾十億美元的天價科學項目變成一個不到1000元的成熟技術。DNA存儲很可能在不久的將來就可以實現。
雖然現在DNA存儲的存取和讀出速度還比較慢,只是應對部分冷數據的存儲,但相信在可預見的未來,包括醫療、航空航天等領域的各種大數據都有可能變成由DNA來存儲。
DNA存儲是利用來自生物的材料執行IT的功能,因此是一個典型的IT-BT交融領域,我們期待它能夠按照半導體科技爆發式、跨越式、非線性的規律來發展。
就如1946年全世界第一臺計算機埃尼阿克,整個計算機極其復雜,體積和一個房間一樣大;但是到1982年就已經出現與我們現在的計算機非常相似的個人電腦。所以我們期待這臺微軟開發的簡單粗糙的DNA存儲原型機能在不久的將來脫胎換骨,真正成為一臺商業化的設備。我們也在上海交通大學成立了DNA存儲研究中心,希望能引領和促進整個行業的發展。
未來IT和BT的交融,以及更多不同學科的交叉與融合,可能就是新一輪科技革命和產業變革的必由之路。
-本文刊載于《世界科學》雜志2025年第1期“大家·科技前沿”欄目;文章根據筆者在上海市科學技術普及志愿者協會主辦的“海上科普講壇”上的報告撰寫而成-
《世界科學》雜志版在售中 歡迎訂閱
月刊定價
15元/期
全年訂閱價
180元
點擊左側圖片或以下方訂閱方式選購
方式一:
掃描二維碼,“雜志鋪”訂閱有折扣~
方式二:
全國各地郵局訂閱 郵發代號:4-263
方式三:
機構訂閱,請撥打
021-53300839;
021-53300838
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.