來源:DeepTech深科技
運營/排版:何晨龍
近日,當代最著名數學家之一、菲爾茲獎得主陶哲軒(Terence Tao)做客了萊克斯·弗里德曼(Lex Fridman)的播客節目。在這場長達三個多小時的深度對話中,陶哲軒分享了他對數學、物理、人工智能乃至現實本質的諸多思考。這場訪談信息量巨大,不僅探討了諸如納維-斯托克斯方程(Navier-Stokes equations)、P/NP 問題和黎曼猜想(Riemann Hypothesis)等數學領域的“圣杯”,還將話題延伸至人工智能如何重塑數學研究的未來。
圖丨相關訪談(來源:Lex Fridman)
在訪談中,陶哲軒談到了解決復雜數學問題的一種實用策略,他稱之為“策略性作弊”。具體來說,就是面對一個包含多個難點的問題時,研究者會先暫時忽略大部分困難,集中精力攻克其中一個。通過這種方式逐一解決,最終再將各個部分的解法整合起來。
與此同時,陶哲軒詳細闡述了他對人工智能在數學領域潛力的看法。他分享了自己使用證明助手語言 Lean 的親身經歷,并坦言,盡管 AI 目前在數學領域的能力如同一個“有時不太可靠,但能力超群”的研究生,但它正推動著數學研究范式的轉變。他預言,在不遠的將來(甚至有可能是 2026 年),AI 將能夠與人類數學家合作發表研究級別的論文。這種合作模式將徹底改變數學的協作方式,使得大規模、分布式的數學實驗成為可能。
此外,陶哲軒也談到了他對一些著名猜想的看法。他認為孿生素數猜想(Twin Prime Conjecture)在未來十年內可能會有重大突破,但對于黎曼猜想,他則坦言目前尚無線索。他強調,這些難題的核心在于“結構”與“隨機”的對立,而數學的本質正是在這兩種看似矛盾的力量之間尋找深刻的聯系。
以下是經過整理編譯的對話全文
第一個難題
萊克斯:
你遇到的第一個真正意義上困難的研究級數學問題是什么?有沒有一個讓你真正停下來、卡住的時刻?
陶:
在本科學習中,我們會接觸到一些“公認很難”的問題,比如黎曼猜想、孿生素數猜想。這些問題可以人為地制造出極高的難度——因為我們甚至知道有些問題是不可解的。但真正有趣的是那些處在“邊界地帶”的問題:它們不是完全絕望,但也遠非輕松。現有技術可以解決其中的 90%,但最后那 10% 才是真正棘手的部分。
我想,在我讀博士期間,掛谷問題(Kakeya Problem)無疑吸引了我的注意。。這是我早期研究中投入了大量精力的一個問題。
圖丨證明掛谷集合猜想的王虹(來源:NYU)
這個問題最早源于日本數學家掛谷宗一(Sōichi Kakeya)1918 年左右提出的一個小謎題:設想在平面上有一根針(可以想象成一輛車),你想讓它掉頭——也就是做一個 U 形轉彎——并且你想用盡可能小的面積來完成這個轉向。你可以無限靈活地操控這根針,比如讓它原地旋轉。作為單位長度的針,如果你繞中心旋轉,所需的面積大約是 π/4。或者你可以做一個三點調頭,這個方式更高效些,所需面積大約是 π/8。
一開始,人們以為這是最節省空間的方法。但別西科維奇(Besicovitch)證明,其實可以構造一種復雜的、多次反向旋轉的軌跡,使得你能在任意小的面積內完成掉頭——比如 0.01 的面積。關鍵是,這根針在這個過程中還會經過所有方向。
這個構造是在二維平面里完成的,我們對二維的理解已經很充分了。那么下一個自然的問題是:在三維空間中會發生什么?
想象一下哈勃太空望遠鏡,它是一個懸浮在太空中的管狀物體。你想用它觀察宇宙中每一顆星星,就需要讓它轉向每一個可能的方向。假設空間資源非常緊張,那么你希望在盡可能小的體積內完成這個“方向遍歷”。這個體積最小能有多小?
你可以對別西科維奇的二維構造做一個簡單修改:如果你的望遠鏡是零厚度的,那么理論上你仍可以用任意小的體積完成任務。但問題在于——如果你的望遠鏡并非完全沒有厚度,而是有一個非常小的厚度 δ,那要實現對所有方向的遍歷,所需體積的最小值會是多少?
隨著 δ 越來越小,也就是望遠鏡變得越來越細,所需體積確實會變小。但這個體積減少的速度是怎樣的?猜想是,它會非常緩慢地下降,大致是對數級的。這個猜想后來在經歷大量工作之后被證明成立。
表面上看,這像是一個“幾何小謎題”。但它的有趣之處在于,它和偏微分方程、數論、幾何、組合等許多領域都有出人意料的聯系。
舉個例子,在波傳播問題中:你把水攪動一下,就會產生朝各個方向傳播的水波。但波動本身既有粒子特性,也有波動特性。你可以得到所謂的“波包”(wave packet):它在空間上高度局部化,并沿某個方向傳播。
在時空圖中,這種波包會占據一個類似細長管子的區域。某些情況下,一開始分散的波會在稍后的某個時間點聚焦到一個點上。比如你往池塘里扔一顆石子,水波會向外擴散。但你也可以設想時間反演的情景:水波從四面八方匯聚到一個點,在那里形成一個巨大“水花”——甚至可能形成奇點。
如果你把這種波看作是光波,可以把它看作是無數個光子疊加而成,這些光子都沿光線前進,并最終匯聚到某一點。因此,最初非常分散的波可以聚焦到某個極小區域,并在時空中達到極高濃度,然后再重新發散。
但如果掛谷猜想有一個否定的答案,也就是說,如果真的存在一種極其高效的方式,可以把朝各個方向的“管狀物”都塞進一個極小的體積中,那么我們就有可能制造出一種非常特殊的波動結構:它們一開始非常分散,但后來不僅會聚焦到一個點,還會在多個時空點集中出現能量聚焦現象。
這樣就可能造成所謂的“blowup”(爆破型奇異性):波的振幅會變得極大,以至于原本描述它們的線性波動方程不再成立,需要使用更復雜的非線性方程來描述這個系統。
納維-斯托克斯奇點
陶:
在數學物理中,我們非常關心某些波動方程是否穩定,是否會形成所謂的奇點。有一個著名的未解問題叫做納維-斯托克斯正則性問題。納維-斯托克斯方程是支配像水這樣的不可壓縮流體流動的方程。這個問題在問:如果你從一個平滑的初始速度場出發,是否可能在某個點速度變成無窮大?這就叫做“奇點”。我們在現實生活中并不會觀察到這種情況,比如你在浴缸里攪動水,它不會突然爆炸,或者以光速噴涌而出,但理論上這類現象是有可能發生的。
事實上,近年來學界的共識逐漸傾向于認為,對于某些非常特殊的初始狀態,可能確實會出現奇點。盡管如此,目前還沒有人真正證明這一點。克雷數學研究所設立了七個千禧年大獎難題,為解決其中任何一個問題提供 100 萬美元的獎金,這就是其中之一。在這七個問題中,只有一個被解決了,那就是龐加萊猜想(Poincaré Conjecture)。雖然掛谷猜想與納維-斯托克斯問題沒有直接關系,但理解它會幫助我們理解波動集中等現象,從而間接幫助我們更好地理解納維-斯托克斯問題。
萊克斯:
你能談談納維-斯托克斯問題本身嗎?就像你說的,它是一個關于平滑解是否存在的千禧年難題。你在 2016 年曾發表論文《三維納維-斯托克斯平均方程的有限時間爆破》,對該問題有不少進展。通常我們認為納維-斯托克斯方程不會爆破,但我們能否確定它永遠不會爆破呢?
圖丨相關論文(來源:
arXiv
陶:
沒錯。這確實是那個價值百萬美元的問題。數學家與其他人最大的不同在于:即使某件事 99.99% 成立,對大多數人來說就足夠了。但數學家在意的是,是否對 100% 的情形都成立。所以雖然絕大多數時候流體不會爆破,但是否存在一種特別的初始狀態能讓它爆破呢?
萊克斯:
我們或許應該說明一下,這是一組支配流體動力學領域的方程,試圖理解流體的行為。而流體是一種極其復雜、難以建模的對象。
陶:
是的,所以它具有實際重要性。這個克雷獎問題關注的是所謂的不可壓縮納維-斯托克斯方程,主要涉及像水這樣的流體。還有可壓縮納維-斯托克斯方程,例如描述空氣流動的,這在天氣預報中尤為關鍵。天氣模型大量依賴于對納維-斯托克斯方程的數值求解,同時也要收集大量數據來作為初始條件輸入。這是一個系統性工程。
萊克斯:
為什么證明關于這組方程的普適性質,比如它不會爆破,會如此困難?
陶:
簡單來說,是麥克斯韋妖(Maxwell's Demon)。這是熱力學中的一個思想實驗:設想你有一個裝有氧氣和氮氣的箱子,氧氣在一邊,氮氣在另一邊,中間沒有隔板。它們自然會混合,而且一旦混合,就不太可能重新分離。但在原則上,可能存在某種“麥克斯韋妖”的機制,使得每次氧分子與氮分子碰撞時,它們都會以某種方式反彈,從而使得氧氣重新聚集一側,氮氣聚集另一側——極其不可能,但數學上無法排除。
這種“極端但可能”的情形在數學中經常出現。比如圓周率 π 的數字 3.14159……這些數字看起來沒有規律,我們相信它們是無偏的,也就是說從長遠看,每個數字(0 到 9)出現的頻率應相等。但或許在某處存在一個“π 妖”,使得每次多算幾位時,某個數字被偏好。沒有理由發生這種事,但我們也沒法證明它絕對不會發生。
回到納維-斯托克斯問題:流體有能量,而運動中的流體會把能量傳遞到不同位置。而由于水具有粘性,當能量分布較均勻時,粘性就會將其耗散。我們實驗時也是如此:水的波動、渦旋會逐漸平息。但理論上也可能存在某種“妖”,它不斷將流體的能量向更小的尺度推進,使局部速度越來越快。而當速度變快時,粘性的影響相對變小。所以有一種可能性:形成所謂的“自相似能量團”情景(self-similar blob scenario)——能量原本分布在一個大尺度區域,然后被集中轉移到一個較小的區域,再以更快的速度進入更小的區域,如此反復。
每次轉移耗時可能只有前一次的一半,那么整個過程會在有限時間內完成,即能量最終在一個點無限集中,這就是所謂的“有限時間爆破”(finite time blowup)。
在實際中,這種現象沒有發生。水是“湍流”的,也就是說如果你有一個大的旋渦,它確實會破碎成幾個小旋渦,但能量不會全部集中到一個小旋渦中,而是會分散成三四個,然后再細分為更多小旋渦。能量的分散使得粘性得以發揮作用,從而穩定系統。但如果能量被集中得足夠快,使得粘性來不及起作用,那么就有可能發生爆破。
過去有很多論文聲稱,只要用能量守恒和粘性項就能控制住系統,不只是對納維-斯托克斯,對很多類似的方程都適用。人們試圖證明所謂的“全局正則性”(global regularity),也就是反過來否定“有限時間爆破”,即速度場始終保持光滑。但這些嘗試全都失敗了。總是會出現符號錯誤或一些微妙的問題,導致不可修補。
我感興趣的是:我們為何一直無法證偽“有限時間爆破”?我沒法直接在納維-斯托克斯方程上操作,因為它太復雜。但我可以對其運動方程進行“平均化處理”,也就是人為關閉某些類型的流體相互作用,只保留我想研究的部分。
我基本上是在“工程化”地制造一個爆破,通過改變物理規律來實現——這是數學家被允許做的事情,我們可以改寫方程。
這在數學中被稱為構造阻礙(obstruction)。我做的事情是:關閉方程中的某些部分。通常關閉某些非線性交互項會讓系統更“溫順”,更容易控制,更不容易爆破。但我發現,通過精心設計地關閉一組特定交互項,我反而可以強制讓能量在有限時間內爆破。這意味著:如果你想要對真實的納維-斯托克斯方程證明正則性(即不會爆破),那你必須使用那些我這個“人工方程”所不具備的特性。也就是說,我的構造排除了一部分可能的證明路徑。
數學的精髓就在于,你不僅要找到能行得通的方法,更重要的是知道哪些方法永遠行不通。對于那些真正難的問題,通常有幾十種看似合理的辦法,但只有在深入嘗試之后你才會意識到它們注定失敗。構造這些“相似但失敗”的反例可以節省大量時間和精力,因為你已經知道某些方法在邏輯上根本無法奏效。
萊克斯:
這是否只與你所研究的流體動力學問題有關,還是你在數學上發展出的一種更普遍的直覺?
陶:
是的,我的這種技術背后其實利用了一個關鍵現象,叫做超臨界性(supercriticality)。在偏微分方程中,很多問題其實是不同力之間的拔河比賽。比如在納維-斯托克斯方程中,一方面是粘性帶來的“耗散力”,它是線性的、可控的、會讓系統趨于穩定;另一方面是“輸運項”,能量從一個位置傳遞到另一個位置,它是非線性的,也正是產生所有問題的源頭。
納維-斯托克斯的兩個核心項就是:耗散項和輸運項。如果耗散占優勢,系統就會趨于平穩,就有希望證明正則性;但如果輸運項占優勢,系統就變得不可預測,非常非線性,進入湍流狀態。
在不同的空間尺度下,這種力量對比也會改變:可能在大尺度下還在平衡,在小尺度下就完全不平衡。納維-斯托克斯的問題在于它是一個超臨界方程:當你觀察得越來越細時,輸運項的影響變得遠大于粘性項。
這就是問題難以解決的根本原因。相比之下,在二維空間里,蘇聯數學家拉德任斯卡婭(Ladyzhenskaya)在 60 年代就證明了不存在爆破。
圖丨拉德任斯卡婭(來源:Wikipedia)
那是因為在二維中,這個方程是所謂的臨界(critical)系統:輸運與耗散在所有尺度下影響相當。而我們已經掌握了大量技術可以處理臨界或次臨界(subcritical)系統,進而證明正則性。
但對超臨界系統,就很難說清楚。我的研究和許多后續工作已經表明:一旦非線性效應在小尺度上主導線性效應,各種“糟糕的事”就可能發生。這也正是這套研究工作的關鍵洞察之一:超臨界 vs 臨界/次臨界,是決定一個方程“是否可控”的關鍵定性特征。
比如行星運動,它們的方程比較“溫順”、可預測,我們可以精確預測其數千年軌跡;但天氣預測為什么過不了兩周?就是因為大氣系統是超臨界的,它在極小尺度上會發生各種難以預料的奇異變化。
萊克斯:
所以說,只要存在巨大的非線性源頭,就會導致系統難以預測?
陶:
是的,尤其是當這種非線性在越小的尺度上越“活躍”時,問題就更嚴重。并非所有非線性方程都難以處理——在很多情況下我們可以通過看系統的“整體行為”來近似局部結構。
比如,如果你想研究月球或火星的軌道,你并不需要知道月球的地震波結構或質量分布細節。你幾乎可以把它們看作點質量,其運動主要由整體重力決定。
但如果你想模擬流體,比如天氣系統,你不能只是說“洛杉磯的氣溫是 X,風速是 Y”來近似整個系統。對于超臨界方程,微小尺度上的信息是極其關鍵的,你忽略不了。
萊克斯:
你曾提到過一種構想,也許可以請你詳細解釋一下:你設想通過構建一種“液體計算機”,從而將計算理論中的停機問題(halting problem)引入到流體動力學中。也就是說,通過這種方式展示計算復雜性對流體行為的影響。你能講講這個思路嗎?
陶:
這個想法源自我之前構造出一個平均方程會爆破的工作。為了做到這一點,一種天真的做法是:你每到一個尺度,就立即將能量推向下一個尺度,盡可能快地推進。這種做法在五維及以上的空間維度中確實有效。但在三維中,我發現了一個奇怪的現象:如果你不斷將能量往更小的尺度壓縮,結果是能量會在多個尺度之間分散。也就是說,當你將能量從一個尺度推向下一個時,雖然它剛進入下一個尺度,但上一層仍有殘留的能量——你試圖同時推進一切,這會導致能量過于分散。
而一旦能量分散過多,就會讓它更容易被粘性所抑制,從而失去爆破的可能性。所以這種“直接推進”的方法在三維中不奏效。后來有其他研究團隊專門寫了論文證明這一點。因此,我需要設計一種“延遲機制”,就像“氣閘”一樣:流體在一個尺度上活動時,只有等它將該尺度的全部能量完整傳遞到下一尺度之后,才開啟通道進入下一級。
通過這種方式,能量可以逐級向前推進,而始終保持在一個特定尺度內局部集中,從而避免被粘性效應削弱。為了實現這個目標,我不得不構造一個非常復雜的非線性結構,它幾乎就像是一個電子電路的設計。我也很感謝我的妻子,她是電子工程專業出身,曾和我聊過如何設計電路。
比如你想要一個燈能按一定頻率閃爍,那你就得用電容、電阻等基本元件組合成某種結構,畫成電路圖。這些電路圖可以通過“用眼睛追蹤電流”來理解其工作原理。于是我就模仿這些電路元件,構造出數學上的對應物,例如模擬“電容”或“電阻”等組件。然后將它們組合在一起,形成一個能夠定時打開或關閉“閘門”的結構。整個系統就像一個數學版的魯布·戈德堡機器(Rube Goldberg machine)——復雜但可控。而這個設計最終確實起作用了。
這讓我意識到:如果你能用在真實的流體方程上做出同樣的事情,比如納維-斯托克斯方程真的能夠“支持”某種計算機制,那我們就可以構建一種“液體朋克”風格的系統。我們現在的計算機是由電子在細小電路中流動實現的,而這里,我們設想的是讓水流脈沖充當信息載體。
你可以想象兩種水流配置,分別表示“比特 1”與“比特 0”。如果兩個水流“碰撞”后得到的輸出狀態是可預測的,那么這個碰撞就可以實現邏輯運算,比如“與門”“或門”等。將它們串聯起來,你就可以構建出圖靈機。這臺機器完全由水組成,是一種“流體計算機”。
再進一步,如果你能用水來控制機器的形態,就像液態機器人,你甚至可以制造一種馮·諾依曼機(von Neumann machine)。
圖丨馮·諾伊曼架構(來源:Wikipedia)
馮·諾依曼曾提出一種理論:如果你想殖民火星,運送人類和機器的成本太高,那不如送一臺可以自我復制的機器。只要它能采礦、制造、組裝,就可以在火星上不斷復制自己,完成擴張。
同理,我們也可以設想這樣一種流體機器人:它的使命就是復制出一個更小的自己。在某個“冷啟動狀態”下,小機器尚未運作;當準備就緒后,大機器人將自己的全部能量傳輸給小機器人,自己“關閉”,清空殘余能量。接著,小機器人啟動、重復這一過程,但更小、更快。
由于納維-斯托克斯方程具有尺度不變性(scaling symmetry),這一過程理論上可以無限進行,從而實現“爆破”現象。這正是我在“平均化的納維-斯托克斯”上所完成的構造——一種為理解原方程爆破機制提供路線圖的方法。
當然,這仍是一個夢想,要真正實現它還有很多障礙。例如,我現在還不能真正構建出那些“流體邏輯門”,我也沒有那些特定的水流配置(雖然像渦環之類的結構可能是候選)。此外,模擬計算比數字計算要脆弱得多,誤差傳播是一個巨大挑戰,需要復雜的糾錯機制。
我也還不清楚如何讓大機器完全“關機”,以免干擾小機器的運行。但從物理角度來說,這一構想并不違背任何自然法則,所以它是“理論可行的”。目前也有其他團隊在嘗試推動納維-斯托克斯爆破的證明,只不過他們使用的方法遠沒有我這種方案復雜。他們采用的是更直接的“自相似模型”(self-similar model),雖然仍未完全奏效,但思路可能更簡潔可行。
從納維-斯托克斯方程到圖靈機,這個跳躍真的很驚人。你最初設想的是“自相似團塊”,不斷生成更小、更精細的結構,現在則是液體圖靈機不斷縮小復制自身,并且從中得出關于爆破的洞見——這個轉化非常具有天才般的創造力。
萊克斯:
從納維-斯托克斯方程跳到這臺圖靈機,這中間真是一次天才的飛躍。從一開始設想的那個越來越小的自相似斑點,到后來構想出一個越來越小的液體圖靈機,并洞察到這可以用來解釋爆破。這真是一個巨大的跨越。
生命游戲
陶:
這在數學中其實是有先例的。數學的一個強項就在于,它善于揭示那些看似完全無關的問題之間的深層連接。只要數學形式相似,就可能存在可以轉化或類比的路徑。
例如,有一類研究叫做“元胞自動機”(cellular automata),最著名的就是康威提出的生命游戲。這是一個無限的離散網格,每個網格點要么被一個“細胞”占據,要么是空的。整個系統依靠一套非常簡單的規則演化,細胞會因鄰近環境而“生”或“死”。
我在學生時期,這種動畫非常流行,甚至被用作屏保。這些圖像看起來非常混亂,甚至某種程度上有點像流體的湍流行為。但隨著時間的推移,人們在“生命游戲”中發現了越來越多有趣的結構。
比如說,有一種叫做“滑翔子”(glider)的結構,只需要四五個細胞組成,演化過程中會穩定地朝某一方向“滑動”,就像渦環一樣。這類現象說明,雖然“生命游戲”是一個離散系統,而納維-斯托克斯是一個連續系統,但在數學特征上卻存在一定的相似性。
“生命游戲”本身非常簡單,只有三四條演化規則,但你卻可以在其中設計出非常復雜的結構。比如有一種叫“滑翔子槍”(glider gun)的結構,它能周期性地發射滑翔子。后來又有人構建出了用于滑翔子的“與門(AND gate)”“或門(OR gate)”等邏輯結構。
這聽起來很夸張,但這些結構是實實在在地被構造出來了。比如有一個巨大的系統:當兩個方向上都有滑翔子流進入時,才會輸出滑翔子流;若只有一邊輸入,則無輸出——這就是典型的“與門”邏輯。
而一旦你可以用滑翔子構建出這些基礎邏輯門,就可以像在軟件工程中一樣,逐層搭建出圖靈機。盡管這些構造在圖像上看起來像是“蒸汽朋克”風格的機械,但它們確實是可以自我復制的結構。有些系統耗費大量時間,通過滑翔子槍的組合,最終實現了一種可以復制自身的大型裝置,即圖靈意義上的自復制機。
很多這樣的成果,其實都是由業余數學愛好者以眾包的方式完成的。我早就關注這些研究,它們也成為我思考納維-斯托克斯類似構想的啟發來源之一。
當然,“生命游戲”是數字系統,而納維-斯托克斯是連續系統,不能簡單照搬它們的結構。但它至少表明:這種復雜結構的涌現在原則上是可能的。
萊克斯:
這種由“局部規則”所引發的“宏觀結構”的涌現非常神奇——像“生命游戲”中的局部規則,在大規模運行下可以生成極其復雜的動態系統。你覺得這些現象是否可能被數學嚴謹地刻畫?我們是否擁有工具能對這種復雜性說出深刻的見解?
陶:
問題在于,這些“復雜結構的涌現”往往需要精心設計的初始條件。像滑翔子槍、邏輯門、自復制系統這些結構,如果你只是隨便在網格上撒一些隨機細胞,它們是不會自然出現的。
這其實也與納維-斯托克斯方程的情形相似:在一般的初始條件下,我們并不會看到任何“計算”或者“圖靈機”的行為。但如果你用“工程方法”對初始條件精心設計,那么確實可以實現一些精妙的結構性演化。
萊克斯:
有沒有可能證明它的反面……也就是說,證明只有通過“工程設計”,你才能創造出有趣的東西。
陶:
這其實是數學中一個反復出現的難題,我稱之為“結構與隨機性”的二元張力。我們在數學中遇到的大多數對象,其實是“看起來隨機”的。比如圓周率的數字序列(π 的十進制展開),我們普遍相信它沒有任何模式。
如果一個結構確實有規律,那我們是可以證明它的,比如周期性重復、等間距結構等等,這就屬于“結構定理”的范疇。而我們也可以證明,在一個給定的統計框架下,“大多數”數字序列沒有規律。比如大數法則告訴我們,隨機序列中 1、2、3 這些數字應該在長遠來看出現得一樣多。
但困難在于:如果給你一個特定的序列,比如 π 的小數位,你該如何證明它沒有隱藏的復雜結構?
這方面我做了很多研究,涉及到所謂的“結構定理”與“逆定理”,其核心在于:如果一個函數表現出某種看似結構化的行為,那可能是因為它接近于某個真正具有明確結構的函數。
比如,有些函數是所謂的“加性”的。如果你有一個從自然數到自然數的函數,比如 2 映到 4,3 映到 6,如果它滿足“兩個輸入相加,等于兩個輸出相加”,那它就是加性的。最簡單的例子就是乘以一個常數。如果你把一個數乘以 10,那么(A+B)×10 就等于 A×10 + B×10。有些函數是嚴格加性的,還有一些則是幾乎加性的。
舉個例子,如果我取一個數,乘以根號 2,然后取整數部分。比如 10 乘以根號 2 約等于 14 點幾,所以 10 映到 14,20 映到 28。在這種情況下,10+10=20,14+14=28,加性是成立的。但由于取整操作,有時會產生誤差,可能你把 A 和 A 相加,得到的結果并不完全是兩個獨立輸出的和,而是差了那么一點點,比如加一或減一。所以,它是“近似加性”(almost additive),但又不完全是。
我研究的很多成果表明:若某個對象顯示出某種結構的跡象,那么它就近似某個真正有結構的對象。通過這樣的逆定理,我們能劃分出一個清晰的二分世界——一個對象要么是徹底無結構的,要么就可以追溯到某種隱藏的結構,從而我們就有了進一步分析的可能性。
一個很好的例子是數學中一個叫做塞邁雷迪定理(Szemerédi s Theorem)的古老定理,它是在 1970 年代被證明的。它討論的是在一組數字中尋找一種特定模式——等差數列,例如 3、5、7 或 10、15、20。
塞邁雷迪證明了:只要一個數字集合足夠大、具有所謂“正密度”(positive density),那么這個集合中一定包含任意長度的等差數列。
比如,奇數集合的密度是二分之一(因為它占據所有整數的一半),我們顯然可以在其中找到各種長度的等差數列。比如 11、13、15、17。因為奇數集合本身就很有結構,找出這種序列不難。
但塞邁雷迪定理的強大之處在于,它也適用于隨機集合。比如我們取所有奇數,然后對每個數拋硬幣,只保留拋出正面的那些。這樣我們得到的就是一個“完全隨機”的子集,表面上看似毫無規律。然而,即便在這樣一個隨機集合中,仍然會存在大量的等差數列。
萊克斯:
你能證明在一個隨機集合里存在任意長度的等差數列嗎?
陶:
是的。你聽說過“無限猴子定理”(infinite monkey theorem)嗎?通常數學定理的名字都很無聊,但這個還挺形象。
“無限猴子定理”的流行版本是說,如果你有無限只猴子,每只都在打一臺打字機,隨機敲字,那么幾乎可以肯定,其中至少有一只猴子最終會打出整部《哈姆雷特》的劇本,或者任何你想要的有限文字序列。
這說明:如果你有一條無限長的數字序列或字符串,任何你想要的有限模式終將出現。這當然需要時間,可能是很長很長的時間,但只要是“無限”,它就會發生。
具體到我們之前討論的等差數列:只要序列夠長,任意長度的等差數列就一定會在其中出現。當然,需要的是極其巨大的隨機序列。
我們可以把“無限”理解為一個沒有上限的有限值的抽象化。現實世界中沒有什么是真正“無限”的,但我們會思考:“如果我有無限多的錢會怎樣?”“如果我可以無限快會怎樣?”等等。
數學中有一套嚴格的形式系統來處理這些理想化的狀態,把“非常大”或“非常小”的概念,抽象為“無限”或“零”,從而讓問題變得更清晰、更易處理。
就像物理中我們經常開玩笑說“假設奶牛是球形的”,意思是我們故意忽略很多現實復雜性,用一種理想模型來近似分析。
萊克斯:
那你覺得,當我們引入“無限”這個理想化工具時,會不會有時偏離了物理現實?
陶:
確實有很多陷阱。所以我們在大學數學課程中會花很多時間教“數學分析”,它基本上就是在教人如何正確使用極限和無限。
舉個例子:有限個數相加時,交換順序不影響結果。但如果是無窮級數,事情就沒那么簡單了。你可以用不同順序排列這些項,竟然會得到不同的收斂值!這就容易出錯。
所以在處理無限的時候,你必須非常謹慎。我們引入了 ε 和 δ 這樣的參數,制定一套非常嚴密的邏輯和推理方式,來防止在“無限”問題上犯錯。
而近年來,數學家們開始把那些在“極限下成立”的結論轉化為有限版本。也就是說:雖然你知道某件事在某個無限條件下是對的,但你會問:“那我到底要多大、多久才行?”
比如說,如果我沒有無限只猴子,而只有一億只,那我要等多久才能等出《哈姆雷特》?這是一個定量問題,而我們可以用純粹的有限方法去分析它。結果是:所需時間是與目標文本長度呈指數增長的。
所以你永遠看不到猴子敲出《哈姆雷特》,最多可能敲出個四個字母的單詞罷了。我個人覺得,一旦你把一個“無限陳述”有限化,它就變得更容易理解,也不再那么玄乎了。
萊克斯:
所以即使你在處理無窮大的問題,最好也把它“有限化”,這樣能幫助你建立直覺?
陶:
是的,缺點是有限化的證明要復雜得多。無限的證明通常是先被發現的,早了幾十年,然后人們才將它們有限化。
數學 vs. 物理
萊克斯:
既然我們剛才提到了很多關于數學和物理的問題。那作為兩種不同的學科、理解世界的方式,數學與物理的根本差異是什么?
陶:
我認為科學總體上可以被看作是三個元素的互動:現實世界、我們對現實的觀察,以及我們關于現實運行機制的心智模型。
我們無法直接接觸真實本身,我們擁有的只是觀察結果——這些結果通常不完整、帶有誤差。很多時候我們想知道的事,比如明天天氣如何,我們尚未有觀察數據,但我們希望預測它。
在此基礎上,我們建立了一些簡化模型,有時會做出不太現實的假設(比如假設奶牛是球形的那類)。這些模型就是我們說的數學模型。
數學研究的,就是模型本身。科學則是收集觀察數據,并據此提出能夠解釋這些觀察的模型。而數學的做法是:我們從模型的前提出發,思考其邏輯結果,推導出這個模型可能帶來的預測或結論,并檢查這些結論是否符合已有數據或可能的數據。
所以二者之間確實是一種共生關系。我想數學與其他學科相比的特殊之處在于:數學從假設出發(比如模型的公理),然后推導出可能的結論。而其他大多數學科是從目標出發:我要造一座橋,我想賺錢,我要達成某個目標,然后再反推該怎么做。
在人類活動中,絕大多數事情都是結論導向的,包括物理與科學研究。例如他們會問:這個小行星的軌道將會如何?或明天天氣如何?而數學除了從結果出發外,還會從假設出發:假設這個成立,那么會有什么結果?
萊克斯:
物理學里常常有理論與實驗之間的張力。你覺得哪一種方式更能引導我們真正發現現實中的新思想?
陶:
你需要兩者兼備,自上而下和自下而上。理論、觀察與建模應該逐漸趨近現實。但一開始,它們總是相距甚遠。要靠彼此推進彼此。
如果你的模型預測出了實驗未曾觀測到的異常現象,這恰好能告訴實驗者去哪里找數據,以進一步校正模型。這個過程是不斷往返推進的。
在數學內部其實也存在“理論”與“實驗”的劃分。只不過直到最近,數學幾乎被理論方法完全主導。大約 99% 的數學是純理論的,實驗數學占比很小,但確實有人在做,比如研究素數分布,他們可能會生成大量數據。
早在計算機出現前,人們也進行過實驗數學的嘗試。比如高斯,他發現了一個著名的猜想,后來發展成了素數定理(prime number theorem),這個定理預測:小于某個數(比如一百萬、一萬億)之間有多少個素數。這不是一個顯然能答的問題。高斯基本上是靠自己(也雇了一些人肉計算員),計算了前十萬以內的素數,并制作出對照表,從中得出預測。
這是早期“實驗數學”的一個例子。但直到最近,實驗數學還不是主流。
理論數學成功率更高也是因為:過去復雜計算幾乎無法實現,即便今天計算機已很強大,也只有少部分數學問題可以通過數值方法探索。
有一個概念叫做“組合爆炸”(combinatorial explosion)。比如你想研究塞邁雷迪定理,設你考慮從 1 到 1000 的所有數字中選子集。表面看:一千個數,能有多難?但實際情況是,它的子集數有 2 的 1000 次方,這遠遠超出了目前任何計算機所能枚舉的范圍。
所以有些數學問題,一旦規模變大,就根本不可能靠窮舉法解決。國際象棋也是經典例子:所有可能的棋局狀態數量巨大,計算機也無法全部列出。
但現在我們有了 AI,能用另一種方式探索這種空間。它們不一定能給出“100% 有保障”的解法,但可以通過實驗性模擬給出答案。比如現在的國際象棋 AI 非常強大,它們不窮盡所有棋步,但卻能找到非常好的近似方案。現在很多人用這些 AI 引擎來做“實驗性國際象棋”:重新評估那些舊的棋局理論,比如某個開局到底好不好,有些結論甚至推翻了傳統的棋譜智慧。
我希望未來數學也能有更多的實驗成分,可能由 AI 推動。
現實的本質
萊克斯:
你提到了柏拉圖的“洞穴寓言”。從某種意義上說,這不就是數學家,甚至所有人類正在做的事情嗎?我們只是在觀察現實的影子。我們有可能真正地觸及現實本身嗎?
陶:
我們可以將世界分為三個本體層次:現實本身、我們的觀察,以及我們對世界運作方式的模型。從嚴格意義上說,它們彼此是區分開的,而且我認為它們永遠都會是分離的。但它們之間的距離可以隨著時間縮小。而要讓模型更接近現實,往往意味著必須舍棄你最初的直覺。
天文學就是個很好的例子。一開始我們對世界的模型是“地是平的”,因為它看起來就是平的,而且它非常大;而天空中的其他東西,比如太陽,看起來非常小。所以你最初的模型雖然離真實非常遙遠,但它能很好地解釋你當時的觀察現象,因此它“看起來沒問題”。
但隨著你觀察得越來越多,模型就會被拉近現實——我們逐步認識到地球是圓的,它會自轉,它圍繞太陽公轉,太陽系圍繞銀河系運動,宇宙在膨脹,而且這個膨脹還是加速的自我膨脹。甚至就在最近的一年,我們發現,這種加速度本身也不是恒定的。
我們現在有一個模型能夠解釋,能夠很好地擬合數據。但也有人批評說:“這不就是乏晰因子(fudge factors)嗎?只要參數足夠多,你什么都能解釋。”但數學的觀點是:你希望模型的參數盡量少于觀察數據點的數量。
如果你用 10 個參數來解釋 10 個觀測值,這模型毫無意義,過擬合。但如果你用兩個參數解釋了一萬億個觀測值——比如說“暗物質模型”,它大約有 14 個參數,卻解釋了天文學家所擁有的數百萬 TB 的數據,那這個模型就極具價值。
你可以這樣看:一個物理或數學理論,本質上是一種對宇宙的“壓縮”,就像數據壓縮。你手里有幾百萬 TB 的觀測數據,你希望用五頁紙的公式加上幾個參數把它們概括出來。如果這個模型能以合理精度擬合幾乎所有觀察結果,那么你壓縮得越徹底,理論就越好。
萊克斯:
而事實上,我們宇宙中最驚人的一點就是,它居然是可壓縮的。這正是數學“不合理的有效性”。
陶:
是的,愛因斯坦有過一句類似的話:“關于宇宙,最不可理解的事情就是,它居然是可以被理解的。”數學中有一個叫做“普適性(universality)”的現象。很多宏觀系統雖然來源于無數微觀相互作用,但宏觀規律本身并不復雜。本來你會以為,宏觀規律應該比微觀結構復雜得多、甚至是指數級復雜,如果你想完全精確建模,確實如此。
比如你要模擬一盒空氣里的所有原子,阿伏伽德羅常數非常大,跟蹤每一個粒子幾乎是不可能的。但在某些情況下,一些宏觀定律幾乎不依賴微觀細節,或僅僅依賴極少數參數。
所以你要模擬 1023 個粒子的氣體,只需知道溫度、壓強、體積,加上五六個參數,就足夠描述這個系統的行為了。我們在數學上對“普適性”的理解遠遠不夠充分,但在一些簡化模型中我們已經知道為什么這種現象出現。最經典的是中心極限定理:它解釋了為什么“鐘形曲線”(bell curve)無處不在,為什么那么多自然現象都符合高斯分布。
萊克斯:
而且這個梗本身也具有普適性。
陶:
對,甚至可以再“元”一點。確實存在很多過程,比如你取一堆獨立的隨機變量,用各種方式把它們平均起來,無論是簡單平均還是復雜加權平均,最終都會得到鐘形曲線,在很多情況下我們都可以證明這一點,非常令人滿意。
當然,有時候不會出現鐘形曲線。如果你有很多變量,但它們之間存在系統性相關性,你就可能得到遠非高斯分布的結果。這種情況也非常重要。比如 2008 年金融危機就是一個著名例子。人們當時假設,按揭違約率是呈高斯分布的:你有 10 萬個房貸用戶,推測有多少人會違約,如果每個人違約行為是相互獨立的,那就會呈鐘形分布,你可以據此做期權、衍生品的風險管理。這套理論非常優雅。
但現實中,如果存在系統性沖擊——經濟系統整體波動導致所有人同時違約,那就是高度非高斯行為,而 2008 年的模型沒能充分預見這種風險。
現在大家多少意識到了:系統性風險比我們之前以為的更嚴重。一個模型再優美,不代表它符合現實。所以理解數學模型的推理邏輯很重要,但理解模型與現實契合度的科學判斷也同樣重要。你需要二者兼顧。
數學可以幫助我們找出模型的薄弱之處。比如中心極限定理會告訴你:只要輸入變量互不相關,結果就會呈現高斯分布。它能幫你定位問題源頭。
假如你了解塞邁雷迪定理,有人想用高斯分布去建模違約風險,你作為數學家就可以質問:“你這些輸入變量之間的系統性相關性有多大?”然后你可以問經濟學家,這種風險是否被低估了,是否能找到證據。這就是科學與數學之間的協同。
萊克斯:
在普適性這個話題上,你因在數學領域涉獵之廣、之深而聞名并備受贊譽,讓人想起一個世紀前的希爾伯特(Hilbert)。事實上,偉大的菲爾茲獎得主、你的同事蒂姆·高爾斯(Tim Gowers)曾說過,你就是我們這個時代最接近希爾伯特的人。
圖丨希爾伯特(來源:Wikipedia)
那么,作為一個能在數學中兼顧深度與廣度的人,你是最合適回答這個問題的人:你認為所有數學領域之間存在某種深層的統一結構嗎?
陶:
其實數學的很多進步,都是兩個原本毫無關聯的領域,后來發現了深刻的聯系。比如一個古老的例子:幾何與數論。在古希臘時期,這兩個領域被視作完全不同的學科。當然,數學家可能同時研究它們,比如歐幾里得,他既寫了幾何,也研究數論。但那時這兩個領域并沒有真正融合。
直到笛卡爾發明了解析幾何——用兩個實數坐標來參數化平面,將幾何問題轉化為代數問題。今天我們覺得這再自然不過:平面當然就是 x 和 y,但當時這可是一項革命性突破。
這類融合在數學史上反復發生:代數與幾何曾分離,后來發展出代數幾何;概率論和數論也開始融合;每一次跨領域連接,都是數學的重要進展。我個人非常喜歡這種數學。
我認為數學家有不同的風格——刺猬型與狐貍型。刺猬知道一件事,但非常深入;狐貍則對很多事略懂皮毛。
我個人更多地認同自己是“狐貍”。我喜歡套利式的探索:學會一個領域的工具后,把這些技巧帶到另一個看似毫不相關的領域,而那里的人通常沒用過這些方法,我能做出些新貢獻。
還有一些數學家比我深刻得多,他們是典型的刺猬型,非常快、非常高效。但我可以為他們帶來一些額外的工具。
萊克斯:
你曾說過,你可以根據具體語境或合作關系的不同,在“刺猬”和“狐貍”這兩種思維方式之間切換。那么,如果可能的話,能否談談這兩種處理問題的方式有什么區別?比如說,當你面對一個新問題時,是選擇尋找跨領域的聯系,還是保持高度專注的單一視角?
陶:
我更習慣于“狐貍”的范式。我喜歡尋找類比和敘事。我經常會花很多時間——比如當我在某個領域看到一個有趣的結果時,我可能很喜歡這個結果本身,但它的證明方式卻用了一些我不太熟悉的數學工具。這種情況下,我會試著用我自己擅長的工具重新去證明它。
往往我自己的證明更差,但這個過程本身很有價值。因為在嘗試重建的過程中,我會逐漸明白:原來的那個證明其實是想達成這個目標。通過這樣“繞路”的方式,我反而能理解那個領域里使用的那些工具。這是一種非常探索性的過程,也意味著我經常會去一些陌生的領域、做些瘋狂的嘗試,甚至常常在“重復造輪子”。
相比之下,我覺得“刺猬式”的風格更學術化,知識體系也更穩固。這種風格依賴對某一領域的發展始終保持最新了解,熟悉所有歷史脈絡,并且對每種具體技術的優劣都有非常清晰的把握。我覺得這種風格更強調計算,而不是通過講述故事或建構類比來理解。
我也能做到那種方式,但我知道有些人在那方面真的非常擅長。
萊克斯:
讓我們退一步,來看一個稍微浪漫化一點的數學版本。你曾說過,在你年輕的時候,對你而言數學更像是一種解謎游戲。你是在什么時候第一次遇到一個問題或一個證明,讓你意識到數學可以擁有一種優雅和美感?
陶:
這是個好問題。我剛到普林斯頓讀研究生的時候,約翰·康威(John Conway)當時還在那里,他幾年前去世了。但我記得我去聽的第一場研究講座之一,就是康威的一個關于他稱之為“極端證明”(extreme proof)的講座。
康威有一種神奇的思考方式,他總能以一種你完全想不到的方式看待各種事物。他把證明本身看作是占據了某種空間。比如你要證明一個命題,比如“素數是無窮的”,那么就會有很多種證明方法。你可以根據不同的維度對這些證明進行排序:有些證明很優雅,有些很長,有些很基礎。于是這些證明在某種意義上構成了一個證明空間,而他感興趣的是這個空間的“極限點”——也就是那些在某一方面達到極致的證明,比如最短的、最基礎的、最不依賴其他定理的那一個。
他舉了一些著名定理的例子,然后給出了他認為在不同方面堪稱極端的證明。我發現那真的讓我大開眼界,原來不僅僅是為一個有趣的結論找到一個證明,一旦你有了那個證明,再去從不同角度優化它,證明本身這個行為就蘊含了某種匠心。
這無疑影響了我的寫作風格。比如,你做數學作業,作為本科生,你的作業之類的,你被鼓勵只要寫下任何一個能行的證明,交上去,只要能得到一個對勾,你就繼續往下走了。但如果你希望你的成果能真正產生影響,能被人閱讀,那它就不能僅僅是正確的。它還應該讀起來令人愉悅,有清晰的動機,能夠被推廣到其他問題上。這和很多其他學科很像,比如編程。數學和編程之間有很多類比。我喜歡類比,如果你還沒注意到的話。你可以寫出一段代碼,意大利面條式的代碼——它能完成任務,但非常混亂,結構很差。雖然能用,但別的人看不懂,也很難修改或擴展。所以我們有各種寫好代碼的原則——寫得更整潔、更易維護、更少 bug。數學也是一樣的:一個好的證明,不只是為了“能用”,還要能被別人理解、引用和延續。
萊克斯
那你心中最優美、最優雅的數學公式是什么?很多人評價“美”時強調的是“簡潔性”,比如說愛因斯坦的 E=mc2。而在數學領域,大家最常提的美麗公式是歐拉恒等式。你覺得這個公式美嗎?
正如我所說,我發現最吸引人的是不同事物之間的聯系……所以如果……eiπ=?1。是的,人們用上了所有基本常數。好吧,我是說,這很可愛,但對我來說……指數函數,由歐拉提出,是用來衡量指數增長的。比如復利或衰變,任何持續增長、持續減少、生長和衰變,或擴張或收縮的東西,都由指數函數建模,而 π 則來自圓和旋轉,對吧?如果你想旋轉一根針,比如說,180 度,你需要旋轉 π 弧度,而 i,復數,代表了交換虛軸的 90 度旋轉。所以是一個方向的改變。
所以,指數函數代表了在你當前方向上的增長和衰減。當你把一個 i 放入指數中,運動就不再是與你當前位置相同的方向,而是與你當前位置成直角的運動。所以是旋轉,然后,eiπ=?1 告訴你,如果你旋轉時間為 π,你最終會到達相反的方向。所以它通過這種復化的行為,即乘以 iπ 的旋轉,統一了通過擴張的幾何學和通過指數增長的動力學。所以它把所有這些數學領域聯系在一起,動力學、幾何學和復數。由于這個恒等式,它們在數學中都被認為是近鄰。
萊克斯:
你覺得這些符號的“偶然碰撞”只是巧合,還是說它其實揭示了更深的東西?比如不同領域的符號相遇,是否也有其內在的價值?
陶:
我覺得這證明了你擁有了正確的概念。當你第一次研究任何東西時,你必須去測量事物,給它們命名。一開始,有時候因為你的模型離現實太遠,你可能會給錯誤的東西起了最好的名字,你只有在后來才發現什么才是真正重要的。
萊克斯:
物理學家有時會這么做,但結果還不錯。
陶:
實際上,物理學也一樣,比如說愛因斯坦提出 E=mc2。回到更早的時候,亞里士多德、伽利略和牛頓提出了最初的運動定律。他們能測量的是質量、加速度和力,于是牛頓力學中最核心的就是 F = ma,這些可測量的量在理論中占據核心地位。
但隨著人們對這些方程的進一步分析,出現了一些“額外的量”,比如動量和能量。能量并不是一個你能像質量和速度那樣直接測量的東西,但人們逐漸意識到它在物理系統中極為關鍵。
到了 19 世紀,哈密頓重構了牛頓力學,提出了所謂的哈密頓力學。在這個體系中,“哈密頓量”(Hamiltonian)才是真正的核心對象。只要你能準確地測量出一個系統的哈密頓量,你就可以描述整個系統的演化。這種思維方式在后來面對量子力學時起到了關鍵作用。
早期的物理學家試圖用牛頓的粒子圖景去理解量子世界,發現完全不對勁,因為量子力學強調的是“波”。
你要問,“量子版的 F=ma 是什么?”根本沒人能說清楚。但幸運的是,哈密頓量這個概念依然適用,它只是以不同的形式出現,是一個算符(operator),而不是一個函數。
只要你能給出哈密頓量,就能通過薛定諤方程描述量子系統的演化過程。
所以,雖然經典力學與量子力學在表面上完全不同,一個是粒子,一個是波,但因為都基于哈密頓量,我們就能將很多經典力學中的直覺遷移到量子力學中。
比如說,經典力學中有諾特定理(Noether theorem):每一個對稱性都對應一個守恒定律。如果物理規律不隨空間平移而改變,那就有動量守恒;如果不隨角度旋轉而改變,那就有角動量守恒;如果不隨時間變化而改變,那就有能量守恒。
如果你等 10 分鐘,所經歷的物理定律仍然相同,這種時間平移不變性對應的就是能量守恒。也就是說,對稱性和守恒律之間存在著根本性的聯結。而這在量子力學中同樣成立,盡管方程形式完全不同。但因為兩者都以哈密頓量為核心,只要這個哈密頓量保持某種對稱性,那么對應的方程就會產生一個守恒量。
一旦你找到了“正確的語言”,很多事情就會變得清晰許多。
至于為什么我們還無法統一量子力學與廣義相對論,其中一個問題是我們還沒搞清楚“基本的對象”到底應該是什么。比如,我們很可能要放棄將時空看作類歐幾里得空間的想法。我們知道,在極小的尺度上存在量子漲落,存在所謂的“時空泡沫”,而此時再使用笛卡爾坐標系(x, y, z)顯然是走不通的。但問題是:我們還不知道該用什么來替代。我們甚至沒有找到類比于哈密頓量那樣的組織性概念,能夠像哈密頓量在經典和量子力學中那樣,統攝一切。
萬有理論
萊克斯:
你是否在直覺上相信,真的存在一套“萬有理論”?我們真的可能找到這樣一種語言,來統一廣義相對論與量子力學?
陶:
我相信是存在的。從歷史來看,物理學的發展就是不斷統一的過程,某種程度上和數學的發展也類似。比如說,早期電學和磁學是兩套完全不同的理論,后來被麥克斯韋統一了;牛頓則統一了天體的運動與地球上的物體運動。因此,這種統一是有前例可循的,它應當可以實現。
不過,回到理論與觀測的關系,我們現在遇到的問題之一是物理學反而成為了它自身成功的受害者。因為我們目前的兩大物理理論:廣義相對論與量子力學,實在太有效了。這兩者加起來,已經可以解釋我們能觀測到的 99.9% 的現象。
為了找到它們失效的邊界,我們必須進入極端的實驗條件,比如極高能量的粒子對撞機,或者宇宙早期的狀態——這些都是難以實現的。因此,真正看到這兩者之間差異、并據此找到融合路徑,非常困難。但我相信,這條路我們已經走了幾個世紀,一直都在進步,沒有理由會停下。
萊克斯:
你認為你會是那個發展出萬有理論的數學家嗎?
陶:
通常發生的情況是,當物理學家需要某種數學理論時,往往已經有數學家早先一步做出了某種雛形。比如,當愛因斯坦開始意識到空間是彎曲的,他去找了一位數學家問:“有沒有關于彎曲空間的理論,是數學家已經搞出來的,可能能用?”然后那位數學家說:“有的,黎曼搞出過一些類似的東西。”結果,黎曼發展出的黎曼幾何——一個關于空間如何以各種方式彎曲的理論——幾乎就是愛因斯坦的理論所需要的。這又回到了數學“不合理的有效性”上。我認為,那些能很好地解釋宇宙的理論,往往也涉及到那些能很好地解決數學問題的數學對象。歸根結底,它們都只是以有用的方式組織數據的不同方法。
萊克斯:
只是感覺你可能需要去到一個非常奇特、非常難以憑直覺把握的地方。比如弦理論。
陶:
是的,那在很長一段時間里都是一個主要的候選理論。但我想它正慢慢地失寵,因為它與實驗不太匹配。
萊克斯:
所以,一個巨大的挑戰當然在于,就像你說的,實驗非常困難,因為廣義相對論和量子力學本身就極其有效。但另一個挑戰在于,這不是簡單地“偏離”時空結構,而是走向一些非常極端的想象空間——比如多維空間、各種我們難以感知的構造。我們已經從平地走到了“彎曲空間”,你還得不斷往前跳躍,而我們作為類人猿后代的認知結構,很難真正直覺地理解那種現實。
陶:
這就是類比如此重要的原因。“地圓說”是不直觀的,因為我們被困在地球上。但是,我們對圓的物體本身是有直覺認知的,也理解光是如何傳播的。所以,實際上是可以通過一些簡單的實驗來驗證這一點的,比如日食、月相變化等現象,都可以通過圓形的地球和月亮模型輕松解釋。你只需要一個籃球、一顆高爾夫球和一個燈光源,就可以自己在家動手模擬。所以直覺是可以培養的,只要你肯把它“遷移”過來。
萊克斯:
對我們來說,從“地平”到“地圓”,在認知上確實是一個巨大的飛躍,因為我們的生活大部分是在平地上度過的。如今我們對這些事情習以為常,是因為科學已經提供了大量證據。但你想想,我們其實正處在一個圓形的巖石上,以極快的速度在宇宙中飛行。這本身就是一種巨大的跳躍。而且,在科學進步的過程中,你需要不斷地進行這類飛躍,一次又一次。
陶:
完全正確。現代科學或許又是“成功的受害者”——為了追求更高的準確性,它不得不與人類最初的直覺越來越遠。而對于沒有接受過完整科學教育的人來說,越是如此,就越容易顯得“難以置信”。所以我們需要提供更扎實的基礎。
當然,現在有很多科學家做著非常出色的公眾傳播工作。其實還有很多科學實驗是可以在家里完成的。有很多 YouTube 視頻,我最近也和一個叫 Grant Sanderson 的 YouTuber 合作了一個視頻,我們就討論了古希臘人是如何測量月亮和地球之間的距離的。他們所用的技術,其實今天我們每個人也可以自己動手試一試。根本不需要太空望遠鏡或復雜數學模型。
視角的轉換非常重要。常言道,旅行開闊視野,那么這是一種“智識上的旅行”。你試圖把自己放入古希臘人、或任何歷史時期的人的視角,提出一些假設,比如“球形地球”,然后進行推演與想象。這其實就是數學家的工作方式,某種意義上,也類似于藝術家的創造。
只要你設定一組公理,數學的推演就會展開。你沿著這些公理不斷推理,常常可以走得比最初的假設遠得多。
廣義相對論
萊克斯:
你提到了廣義相對論,你也曾在理解愛因斯坦場方程的數學方面做出過貢獻。你能否介紹一下這部分工作?從數學的角度來看,廣義相對論中哪些方面最吸引你?又有哪些挑戰?
陶:
我確實研究過一些相關方程。其中有一個叫“波映射方程”(wave maps equation),也稱為 σ 場模型(Sigma field model),它并不是直接描述時空引力本身的方程,而是關于存在于時空之上的某些場的模型。
愛因斯坦的廣義相對論方程描述的是“空間”與“時間”本身,但在這個基礎之上還存在其他的場,比如電磁場、楊-米爾斯場(Yang-Mills fields)等等。這些方程形成了一個層級體系,而愛因斯坦方程雖然是其中最非線性、最復雜的之一,但在整個層級中卻并不處于最高位置。
我研究的是其中相對低階的一個——波映射方程。它的物理圖景是這樣的:想象一個波動,它在每一點上都被限制在球面之上。可以把它想象成時空中有一大堆小箭頭,這些箭頭指向不同的方向,像波一樣傳播。你輕輕撥動一個箭頭,它的擾動就會擴散開來,讓周圍的箭頭也開始運動,就像麥田中隨風搖曳的麥穗一樣。
我關注的問題是所謂“全局正則性問題”(global regularity problem),也就是:這些能量是否有可能集中在某個點上?我研究的這個方程屬于“臨界方程”(critical equation)類別,其特征是它在所有尺度上的行為基本相似。
我最終證明了:你無法構造出一個讓所有能量集中在一點的情形——能量必須在某個時刻稍微地分散開來,即便只是一點點分散,也足以維持解的正則性。這項工作大約是在 2000 年完成的,也是我后來開始對納維-斯托克斯方程產生興趣的原因之一。
為了解決這個問題,我開發了一些新的技術。因為這個方程是高度非線性的,主要是因為球面本身的曲率帶來了某種“非微擾效應”(non-perturbative effect)。在常規視角下,這些非線性效應甚至比波動方程的線性部分還要強,使得問題很難控制,即便能量很小也不例外。
于是我引入了一種稱為“規范變換”(gauge transformation)的方法。你可以把這個系統想象成一大片麥穗在風中來回擺動,極其復雜。如果我們能讓這些運動“穩定”下來,比如在空間的各個點上掛上小攝像頭,這些攝像頭可以隨著主流動方向一起運動,從而捕捉到主要動態。
在這種穩定坐標系下,原本非線性的流動就變得更線性了。我正是通過這種方式找到了一個可以轉換方程的坐標系統,成功減少了非線性影響,并最終得以解決該方程。
而我是在澳大利亞探望姑媽時發現這個變換方法的。當時我試圖理解這些場的動態變化,但既沒有紙筆,也不熟悉用計算機做模擬,只好閉上眼睛,躺在地板上,想象自己變成了那個矢量場,在空間中滾動,試圖找到一個合適的坐標系統,使得在所有方向上,系統行為都更接近線性。
我姑媽正好走進來,看見我躺在地上翻滾,就問我:你這是在干嘛?我只能回答:這事說來話長。于是她說,好吧,你是個年輕人,我不問了。
解決難題
萊克斯:
你是如何著手解決難題的?當你在思考時,你是在腦海里想象那些數學對象、符號,還是別的什么?通常,你在思考時,腦子里看到的是什么?
陶:
我會大量使用紙和筆。作為一名數學家,你會逐漸學會我稱之為“策略性地作弊”的方法。
數學的魅力之一在于,你可以自由地更改問題的形式、甚至規則,這一點在別的領域幾乎做不到。
比如說你是個工程師,有人讓你建一座橋橫跨這條河,你不能說:“我想在這邊建橋”或者“我想用紙建,而不是鋼”。但作為一個數學家,你可以任意設定條件。
這就像在玩一款電腦游戲,而你擁有所有作弊碼:你可以把一個很高維度的問題降到一維,先解決一維的情況;或者當有主項和誤差項時,你可以假設誤差項為零,做個球面對稱假設,先解簡化后的問題。
所以,解決數學問題的最佳方式不是進入“鋼鐵俠模式”,把一切難點都維持在最難,而是——如果有 10 個讓你頭大的難點,那就設法先把其中 9 個放下,僅保留 1 個,集中解決那個。
當然,如果你把 10 個都放下了,那題目就無聊了。但放下 9 個、只留 1 個,是一個很有價值的練習。
你先解決這一個問題,掌握了應對這類難點的方法,然后把這個“作弊”關閉,重新打開另一個難點,再解決另一個。
等你學會了單獨應對這 10 種難點之后,就可以開始把它們兩兩組合,一點點整合成原始問題。
小時候我看了很多港片,特別是功夫動作片——每次打斗場面,主角都會被一群惡人圍攻,比如 100 個反派包圍他,但打斗總會被編排成一次只跟一個人打。他解決一個,再打下一個。正因為這樣,他才可以一個打百個。
但如果反派們頭腦更聰明,直接一起圍攻,那主角早就輸了。當然這樣一來電影就不好看了(笑)。
萊克斯:
你通常是用紙和筆嗎?還是會用電腦和 LaTeX?
陶:
主要是紙和筆。我的辦公室里有四塊巨大的黑板,有時候我需要把我知道的關于這個問題的一切都寫在那四塊黑板上,然后坐在我的沙發上,看著全局。
上面還有很多圖畫,很多只有我自己才看得懂的涂鴉。黑板的好處是可以隨時擦掉,整個思考過程很有機。當然,現在我開始越來越多地使用電腦,部分原因是 AI 的發展讓一些基礎編程變得更簡單了。
以前如果我想畫一個稍微復雜點的函數圖,比如有些迭代過程,我得自己寫 Python 代碼,想想 for loop 怎么寫,還得調試,可能花上兩小時。而現在只要十幾分鐘就能搞定。所以我現在開始用電腦做一些簡單的探索了。
AI 輔助證明
萊克斯:
我們來聊聊 AI 吧,也許可以從計算機輔助證明談起。你能介紹一下 Lean 形式化證明編程語言嗎?它作為證明助手是如何工作的?你是怎么開始使用它的?它在哪些方面幫到了你?
陶:
Lean 是一種編程語言,和 Python、C 這些傳統語言相似,但一般的編程語言主要是執行指令,比如翻轉比特、驅動機器人、傳輸信息等。而 Lean 除了也可以像傳統語言那樣執行代碼之外,更重要的是,它可以“生成證明”。
比如用 Python 計算 3 + 4,會告訴你答案是 7,但 Lean 不僅給出答案,還會生成“為什么等于 7”的形式化證明——包括每一個推理步驟。
所以 Lean 處理的是比單純語句更復雜的對象:帶有完整證明的陳述。而每一行代碼,實質上是把已有的數學語句拼接起來,從而導出新的結論。
這種思想其實并不新穎,這類系統被稱為“證明助手(proof assistant)”,它們為構建復雜數學證明提供了一個形式化語言。如果你信任 Lean 的編譯器,那么它輸出的每一個證明都可以被視為 100% 正確的“證明證書”。而且 Lean 的編譯器做得非常小巧可靠,目前也有多個版本可供選擇。
萊克斯:
那能不能幫大家建立一個直觀概念:用 Lean 和用紙筆寫證明的區別在哪里?把一個數學命題形式化到底有多難?
陶:
Lean 的設計吸收了很多數學家的意見,所以它的語法盡可能模擬“數學證明的語言”。比如你引入一個變量、使用反證法等等,都可以用標準的方式表達。
理想狀態下,它可以做到“證明語言與代碼之間的一一對應”,但實際上仍然存在差距。Lean 更像是你在向一個極度挑剔的同事解釋證明過程,他會不斷打斷你,“你確定這是你想說的嗎?如果這里是 0 會怎樣?這一步你怎么保證的?”
Lean 雖然內置了很多自動化能力,但它要求你對每個對象都明確指明其類型。比如變量 X,你需要指出它到底是實數、自然數、還是函數?在非正式寫作中,這通常靠上下文推斷,比如設 X 為 Y 與 Z 之和,而 Y 和 Z 是實數,所以 X 也是。
Lean 可以自動推斷其中很多信息,但有時還是會打斷你:你能不能明確告訴我這個對象是什么?這就要求你在形式化時,不光要關注計算本身,還要在哲學層面上思考這個對象到底是什么。
萊克斯:
它是用像大語言模型這樣的東西來做類型推斷,還是說它只是匹配“實數”這個詞?
陶:
它用的是更傳統的那種,我們稱之為“老派 AI”。所有數學結構都可以表達成“樹狀結構”,然后使用算法在不同的樹之間進行匹配。
Lean 中的每個對象都有“生成歷史”,你可以一路追溯它是怎么來的。它的目標是“可驗證性”,而不是依賴現代 AI。但現在也有很多人嘗試在 Lean 之上疊加 AI。
比如在使用 Lean 寫證明時,經常需要調用微積分基本定理。Lean 團隊開發了一個叫 Mathlib 的龐大庫,里面包含了數萬個數學事實。但要用的時候,你得找到它。所以現在的主要瓶頸之一是“引理檢索”——你知道這個工具在庫里,但要找到它。
這時候,大語言模型可以幫忙了。你可以直接說“我現在需要用微積分基本定理”,像我在寫代碼時裝了 GitHub Copilot,它會掃描我當前的代碼環境并智能推薦,比如你只寫“我現在需要基本定理”,它就可能自動補上“試試這個引理”。
大概 25% 的時候它能直接用,另外 10–15% 雖然不完全對,但改一改也能用,還有 50% 是完全廢話。但即便如此,這種 AI 在 Lean 上的應用已經像是一種高級自動補全了。
萊克斯:
但這不會扼殺掉作為一名數學家的那種“氛圍”(vibe)嗎?有一個學究氣的同事在你身邊。
陶:
確實是這樣。但也有一些時候,形式化反而更舒服。比如我曾經形式化一個定理,最后得出的常數是 12,這個“12”在整個證明中不斷被使用,每一步都要和它保持一致。我們把整個定理寫成論文后,過幾周有人說我們其實可以把這個 12 降到 11,通過重構一些步驟。
如果是在紙上寫的,每次改一個參數,你就得一行一行地檢查整篇證明有沒有崩掉。有些地方可能用了 12 的某些特性,但你根本沒意識到,一改就錯。但我們是用 Lean 形式化的,于是我們把定理的“12”改成“11”,重新編譯,發現成千上萬行代碼中,90% 還是能跑的,只有少數幾行報錯。它會立刻告訴你“這些步驟無法被證明”,所以你知道改哪兒就行了。
如果你用的是良好的編程結構,不寫死常數、用智能調用,那修改范圍就很小。我們用了一兩天就把整個定理從“12”更新成“11”了,遠比紙筆快得多。
同時證明會更長,但每一個獨立的部分都更容易讀懂。比如你打開一篇數學論文,第 27 頁,第 6 段,某一行看不懂,很常見。因為它用了某些定義,而這些定義可能在第 10 頁,整個證明散布在不同地方,你不得不“順著讀”。
不像小說可以從中間隨便翻開。但在 Lean 里,如果你把鼠標懸停在某一行上,每個對象都會告訴你它是什么、從哪兒來、怎么定義的——你可以輕松追溯整個結構,而不用翻來翻去。
Lean 還讓我們可以在“原子級別”合作,這在過去根本不可能。傳統上,要合作寫一篇數學論文,不是黑板上一起推,就是你寫第三節我寫第四節,很難真正實時協作。而在 Lean 中,比如我卡在第 67 行:“這步我證不出來,但大概思路是這樣”,其他人看了之后可能立馬說:“你可以用這個工具、那個引理”,于是就能快速推進。
現在我可以和全球幾十個從沒見過面的人一起寫證明,而且即使我不知道他們是誰,有多可靠,Lean 本身就是可信的證明證書,它讓我們可以做“無信任協作”的數學。
萊克斯:
你以善于合作著稱。那在數學研究中,解決一個困難問題的“正確協作方式”到底是怎樣的?你們是“分而治之”型的?還是說會集中在某一部分上進行頭腦風暴
陶:
最開始總會有一輪頭腦風暴。數學研究項目的特點就是:你一開始根本不知道該怎么做。它不像工程項目,理論早就成熟了,主要難點是落地實施。做數學,你得先弄清楚“哪條路是對的”。
這就像我說的“先作弊”:拿造橋打比方——第一步,你假設自己有無限預算、無限工人,那你能造出這座橋嗎?如果能,再假設只有無限預算但工人有限;再進一步,預算也有限了……
當然,現實中的工程師不能這么干,他們有剛性需求。但在數學里,我們可以這樣“幻想”,先搞出一個原始構想,看是否存在一條可能的路徑。一旦你發現了有可能的解法的大概框架,那就可以把問題拆解成多個子問題。雖然每個子問題也不容易,但你可以集中精力各個擊破。
而且,不同合作者對不同子問題的處理能力也不一樣。
我有一個我因此而出名的定理,是和本·格林(Ben Green)合作的,現在叫做格林-陶定理(Green-Tao theorem)。它陳述的是素數包含任意長度的數學級數(等差數列),是對塞邁雷迪定理的一個修改。
我們合作的方式是,本已經證明了:素數中存在大量長度為 3 的等差數列,甚至在某些素數子集中也能找到。但他的技巧只能處理長度為 3 的情況,對更長的不適用。
我這邊呢,正好有一些來自遍歷論的技巧,是我一直在研究和玩的領域,那時候我比本更熟悉這套工具。于是我就想,如果本能提供某種關于素數的隨機性假設,只要滿足某個技術條件,我這邊就能從這個出發,推出我們想要的結論。但我提的那個條件,本說:這是個數論中的超難問題,我們不可能證明它。
于是他回我一句:你能不能把你那部分的假設放松一點?用我這邊能證明的條件?然后他提出了一個他能證明的假設,但對我來說太弱了,我根本用不上。于是我們就你來我往,我想多作弊一點,他想少作弊一點,不斷妥協。最后我們終于找到一個 A)本能證明,B)我也能用的共同假設,這才合力完成了這個定理的證明。所以每一次合作都有一套獨特的故事,沒有哪兩次合作是一樣的。
Lean 編程語言
萊克斯:
反過來說,像你剛才提到 Lean 編程語言的情況,這其實是另一種故事了。你曾說它可以讓我們為某個問題創建“藍圖”,然后就可以真正地實現“分而治之”。在 Lean 的框架下,每個人處理不同部分,由計算機來驗證整個推理過程是否成立。
陶:
對,它能讓一切變得兼容且可靠。當然,現在只有一小部分數學項目能以這種方式被拆分。就目前的技術水平而言,Lean 大多數的應用仍是用于形式化人類已經完成的證明。
從某種意義上說,一篇數學論文本身就是一份“藍圖”。它把一個大命題拆解成上百個引理。但這些引理常常沒有寫得足夠詳細,無法直接拿來形式化。
而我們說的“藍圖”,是那種極其嚴謹寫成的版本,每一步都解釋得盡可能詳細,力圖讓每個環節都自成體系,或者只依賴前面非常有限的一些結果。這樣生成的“藍圖圖譜”中,每個節點就可以獨立處理——你甚至不需要知道整個定理長什么樣,就像現代供應鏈組裝 iPhone 一樣。
萊克斯:
這是一個非常令人興奮的可能性,如果你能找到那種可以被拆解成模塊的問題,那你就能吸納上千名協作者,徹底實現分布式數學協作。
陶:
是的。我之前說過“理論數學”與“實驗數學”的劃分。目前數學絕大多數還是理論主導,實驗的只占很小部分。
但我認為 Lean 以及像 GitHub 這樣的平臺,能讓實驗數學的規模擴大到我們從未有過的程度。現在你如果想探索某個數學模式,就得寫代碼來模擬。雖然也有一些計算機代數軟件包能幫忙,但多數時候還是數學家自己寫一堆 Python 代碼,
這本身就極容易出錯。而且因為代碼不穩定,也很難開放給別人協作,一旦某個模塊有 bug,整個系統就不可信。于是大家寫出的代碼都像“意大利面條”,混亂、笨重、不易共享。
這也導致了實驗性研究無法規模化。但有了 Lean,我已經開始一些項目,不只是用數據做實驗,而是對證明本身進行實驗。
我們有一個叫“等式理論項目”(Equational Theories Project)的研究,生成了大約 2200 萬個抽象代數中的小問題。也許我得先解釋一下這個項目。
抽象代數研究的是像加法、乘法這樣的運算以及它們滿足的抽象性質。比如,乘法是交換的(X×Y = Y×X),也是結合的(X×(Y×Z) = (X×Y)×Z),但并非所有性質都成立,比如 X×X = X 并不總是成立。
我們列出了大約 4000 條可能的代數法則,并想搞清楚:哪些法則會推出另一些法則。比如,交換律能推出結合律嗎?答案是否定的,因為可以構造一個例子,滿足交換律卻不滿足結合律。
也有些法則之間確實存在推導關系,可以寫出代數證明。于是我們就對這 4000 條法則,兩兩配對,總共形成了 2200 萬個組合。每個組合就是一個問題:法則 A 能否推出法則 B?若能,請給出證明;若不能,給出反例。
這些問題幾乎都可以給本科生練習,大多數都很基礎,只有大約 100 個左右相對更難。項目的目標就是畫出這整張“推理圖譜”——哪些法則可以推導出哪些其他法則。
這在以前是不可行的。文獻中能處理的極限是 15 條法則之間的關系,靠人類手工,已經到極限了。
你要想拓展,就必須眾包;但你也得確保每條推理都可信,而不可能靠一個人檢查完 2200 萬個命題。這在 Lean 出現前是不可能實現的。我們原本也希望加入 AI 輔助,目前整個項目基本完成了:2200 萬個命題,只剩下兩個還沒完全形式化。
其實那兩個我們也已經有手工證明了,現在正在形式化。今天早上我還在處理這個,馬上就完工了。為了這項工作,我們找了大概 50 個人,所以我們將會有一篇 50 個作者的論文,還有一個超長的附錄,說明誰貢獻了什么。
萊克斯:
你們這么多人協作,有沒有辦法按照貢獻者的專業水平來組織協作?我這問題聽起來有些天馬行空,但設想一下:未來如果也加入 AI 協作者,是否可以像 Elo 等級評分那樣,為每個協作者打分、游戲化?
陶:
其實 Lean 項目的一個好處是:它會自動生成全部數據。我們所有的代碼都上傳到 GitHub,GitHub 會記錄誰寫了什么。所以你可以隨時生成統計,比如誰寫了多少行代碼。這當然只是粗略指標。
我絕對不希望這些數據被用于職稱評審之類的正式用途。但企業里早已有類似的員工評估標準,我理解這趨勢對學術界是有點嚇人的。
萊克斯:
但學術界也用指標,他們只是用舊的,比如論文數量。我反而覺得(新的)這種指標雖然有缺陷,但方向更正確了。
陶:
我認為這值得研究。你可以做一些研究,看看這些是不是更好的預測指標。這里有一個叫做“古德哈特定律”(Goodhart s Law)的問題:如果一個統計數據真的被用來激勵績效,它就會被“玩壞”,失去原有的參考價值。
所以我們這次采用了“自我報告”的方式。科學界有一套標準分類,用來描述協作者的貢獻:構思、驗證、資源、編程等等,總共大概十二項。
我們就把所有作者列成一個矩陣,請每人勾選自己在哪些類別有貢獻。比如你寫了代碼、提供了算力,但沒有參與手工驗證,那就標清楚。
數學界的傳統是按照姓氏字母排序。我們并不像自然科學那樣按“第一作者”“第二作者”區分,我們對此很自豪——我們把所有作者視為平等。但在這種大規模項目下,這個傳統就很難維持了。
十年前,我參與過一些叫做博學者項目(...
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.