網易首頁 > 網易號 > 正文申請入駐

陶哲軒三小時超長訪談：我們如何解決難題？AI將如何重塑數學？

2025-06-24 17:56:15　來源: 人工智能學家

北京舉報

分享至

來源：DeepTech深科技

運營/排版：何晨龍

近日，當代最著名數學家之一、菲爾茲獎得主陶哲軒（Terence Tao）做客了萊克斯·弗里德曼（Lex Fridman）的播客節目。在這場長達三個多小時的深度對話中，陶哲軒分享了他對數學、物理、人工智能乃至現實本質的諸多思考。這場訪談信息量巨大，不僅探討了諸如納維-斯托克斯方程（Navier-Stokes equations）、P/NP 問題和黎曼猜想（Riemann Hypothesis）等數學領域的“圣杯”，還將話題延伸至人工智能如何重塑數學研究的未來。

圖丨相關訪談（來源：Lex Fridman）

在訪談中，陶哲軒談到了解決復雜數學問題的一種實用策略，他稱之為“策略性作弊”。具體來說，就是面對一個包含多個難點的問題時，研究者會先暫時忽略大部分困難，集中精力攻克其中一個。通過這種方式逐一解決，最終再將各個部分的解法整合起來。

與此同時，陶哲軒詳細闡述了他對人工智能在數學領域潛力的看法。他分享了自己使用證明助手語言 Lean 的親身經歷，并坦言，盡管 AI 目前在數學領域的能力如同一個“有時不太可靠，但能力超群”的研究生，但它正推動著數學研究范式的轉變。他預言，在不遠的將來（甚至有可能是 2026 年），AI 將能夠與人類數學家合作發表研究級別的論文。這種合作模式將徹底改變數學的協作方式，使得大規模、分布式的數學實驗成為可能。

此外，陶哲軒也談到了他對一些著名猜想的看法。他認為孿生素數猜想（Twin Prime Conjecture）在未來十年內可能會有重大突破，但對于黎曼猜想，他則坦言目前尚無線索。他強調，這些難題的核心在于“結構”與“隨機”的對立，而數學的本質正是在這兩種看似矛盾的力量之間尋找深刻的聯系。

以下是經過整理編譯的對話全文

第一個難題

萊克斯：

你遇到的第一個真正意義上困難的研究級數學問題是什么？有沒有一個讓你真正停下來、卡住的時刻？

陶：

在本科學習中，我們會接觸到一些“公認很難”的問題，比如黎曼猜想、孿生素數猜想。這些問題可以人為地制造出極高的難度——因為我們甚至知道有些問題是不可解的。但真正有趣的是那些處在“邊界地帶”的問題：它們不是完全絕望，但也遠非輕松。現有技術可以解決其中的 90%，但最后那 10% 才是真正棘手的部分。

我想，在我讀博士期間，掛谷問題（Kakeya Problem）無疑吸引了我的注意。。這是我早期研究中投入了大量精力的一個問題。

圖丨證明掛谷集合猜想的王虹（來源：NYU）

這個問題最早源于日本數學家掛谷宗一（Sōichi Kakeya）1918 年左右提出的一個小謎題：設想在平面上有一根針（可以想象成一輛車），你想讓它掉頭——也就是做一個 U 形轉彎——并且你想用盡可能小的面積來完成這個轉向。你可以無限靈活地操控這根針，比如讓它原地旋轉。作為單位長度的針，如果你繞中心旋轉，所需的面積大約是 π/4。或者你可以做一個三點調頭，這個方式更高效些，所需面積大約是 π/8。

一開始，人們以為這是最節省空間的方法。但別西科維奇（Besicovitch）證明，其實可以構造一種復雜的、多次反向旋轉的軌跡，使得你能在任意小的面積內完成掉頭——比如 0.01 的面積。關鍵是，這根針在這個過程中還會經過所有方向。

這個構造是在二維平面里完成的，我們對二維的理解已經很充分了。那么下一個自然的問題是：在三維空間中會發生什么？

想象一下哈勃太空望遠鏡，它是一個懸浮在太空中的管狀物體。你想用它觀察宇宙中每一顆星星，就需要讓它轉向每一個可能的方向。假設空間資源非常緊張，那么你希望在盡可能小的體積內完成這個“方向遍歷”。這個體積最小能有多小？

你可以對別西科維奇的二維構造做一個簡單修改：如果你的望遠鏡是零厚度的，那么理論上你仍可以用任意小的體積完成任務。但問題在于——如果你的望遠鏡并非完全沒有厚度，而是有一個非常小的厚度 δ，那要實現對所有方向的遍歷，所需體積的最小值會是多少？

隨著 δ 越來越小，也就是望遠鏡變得越來越細，所需體積確實會變小。但這個體積減少的速度是怎樣的？猜想是，它會非常緩慢地下降，大致是對數級的。這個猜想后來在經歷大量工作之后被證明成立。

表面上看，這像是一個“幾何小謎題”。但它的有趣之處在于，它和偏微分方程、數論、幾何、組合等許多領域都有出人意料的聯系。

舉個例子，在波傳播問題中：你把水攪動一下，就會產生朝各個方向傳播的水波。但波動本身既有粒子特性，也有波動特性。你可以得到所謂的“波包”（wave packet）：它在空間上高度局部化，并沿某個方向傳播。

在時空圖中，這種波包會占據一個類似細長管子的區域。某些情況下，一開始分散的波會在稍后的某個時間點聚焦到一個點上。比如你往池塘里扔一顆石子，水波會向外擴散。但你也可以設想時間反演的情景：水波從四面八方匯聚到一個點，在那里形成一個巨大“水花”——甚至可能形成奇點。

如果你把這種波看作是光波，可以把它看作是無數個光子疊加而成，這些光子都沿光線前進，并最終匯聚到某一點。因此，最初非常分散的波可以聚焦到某個極小區域，并在時空中達到極高濃度，然后再重新發散。

但如果掛谷猜想有一個否定的答案，也就是說，如果真的存在一種極其高效的方式，可以把朝各個方向的“管狀物”都塞進一個極小的體積中，那么我們就有可能制造出一種非常特殊的波動結構：它們一開始非常分散，但后來不僅會聚焦到一個點，還會在多個時空點集中出現能量聚焦現象。

這樣就可能造成所謂的“blowup”（爆破型奇異性）：波的振幅會變得極大，以至于原本描述它們的線性波動方程不再成立，需要使用更復雜的非線性方程來描述這個系統。

納維-斯托克斯奇點

陶：

在數學物理中，我們非常關心某些波動方程是否穩定，是否會形成所謂的奇點。有一個著名的未解問題叫做納維-斯托克斯正則性問題。納維-斯托克斯方程是支配像水這樣的不可壓縮流體流動的方程。這個問題在問：如果你從一個平滑的初始速度場出發，是否可能在某個點速度變成無窮大？這就叫做“奇點”。我們在現實生活中并不會觀察到這種情況，比如你在浴缸里攪動水，它不會突然爆炸，或者以光速噴涌而出，但理論上這類現象是有可能發生的。

事實上，近年來學界的共識逐漸傾向于認為，對于某些非常特殊的初始狀態，可能確實會出現奇點。盡管如此，目前還沒有人真正證明這一點。克雷數學研究所設立了七個千禧年大獎難題，為解決其中任何一個問題提供 100 萬美元的獎金，這就是其中之一。在這七個問題中，只有一個被解決了，那就是龐加萊猜想（Poincaré Conjecture）。雖然掛谷猜想與納維-斯托克斯問題沒有直接關系，但理解它會幫助我們理解波動集中等現象，從而間接幫助我們更好地理解納維-斯托克斯問題。

萊克斯：

你能談談納維-斯托克斯問題本身嗎？就像你說的，它是一個關于平滑解是否存在的千禧年難題。你在 2016 年曾發表論文《三維納維-斯托克斯平均方程的有限時間爆破》，對該問題有不少進展。通常我們認為納維-斯托克斯方程不會爆破，但我們能否確定它永遠不會爆破呢？

圖丨相關論文（來源：

arXiv

陶：

沒錯。這確實是那個價值百萬美元的問題。數學家與其他人最大的不同在于：即使某件事 99.99% 成立，對大多數人來說就足夠了。但數學家在意的是，是否對 100% 的情形都成立。所以雖然絕大多數時候流體不會爆破，但是否存在一種特別的初始狀態能讓它爆破呢？

萊克斯：

我們或許應該說明一下，這是一組支配流體動力學領域的方程，試圖理解流體的行為。而流體是一種極其復雜、難以建模的對象。

陶：

是的，所以它具有實際重要性。這個克雷獎問題關注的是所謂的不可壓縮納維-斯托克斯方程，主要涉及像水這樣的流體。還有可壓縮納維-斯托克斯方程，例如描述空氣流動的，這在天氣預報中尤為關鍵。天氣模型大量依賴于對納維-斯托克斯方程的數值求解，同時也要收集大量數據來作為初始條件輸入。這是一個系統性工程。

萊克斯：

為什么證明關于這組方程的普適性質，比如它不會爆破，會如此困難？

陶：

簡單來說，是麥克斯韋妖（Maxwell's Demon）。這是熱力學中的一個思想實驗：設想你有一個裝有氧氣和氮氣的箱子，氧氣在一邊，氮氣在另一邊，中間沒有隔板。它們自然會混合，而且一旦混合，就不太可能重新分離。但在原則上，可能存在某種“麥克斯韋妖”的機制，使得每次氧分子與氮分子碰撞時，它們都會以某種方式反彈，從而使得氧氣重新聚集一側，氮氣聚集另一側——極其不可能，但數學上無法排除。

這種“極端但可能”的情形在數學中經常出現。比如圓周率 π 的數字 3.14159……這些數字看起來沒有規律，我們相信它們是無偏的，也就是說從長遠看，每個數字（0 到 9）出現的頻率應相等。但或許在某處存在一個“π 妖”，使得每次多算幾位時，某個數字被偏好。沒有理由發生這種事，但我們也沒法證明它絕對不會發生。

回到納維-斯托克斯問題：流體有能量，而運動中的流體會把能量傳遞到不同位置。而由于水具有粘性，當能量分布較均勻時，粘性就會將其耗散。我們實驗時也是如此：水的波動、渦旋會逐漸平息。但理論上也可能存在某種“妖”，它不斷將流體的能量向更小的尺度推進，使局部速度越來越快。而當速度變快時，粘性的影響相對變小。所以有一種可能性：形成所謂的“自相似能量團”情景（self-similar blob scenario）——能量原本分布在一個大尺度區域，然后被集中轉移到一個較小的區域，再以更快的速度進入更小的區域，如此反復。

每次轉移耗時可能只有前一次的一半，那么整個過程會在有限時間內完成，即能量最終在一個點無限集中，這就是所謂的“有限時間爆破”（finite time blowup）。

在實際中，這種現象沒有發生。水是“湍流”的，也就是說如果你有一個大的旋渦，它確實會破碎成幾個小旋渦，但能量不會全部集中到一個小旋渦中，而是會分散成三四個，然后再細分為更多小旋渦。能量的分散使得粘性得以發揮作用，從而穩定系統。但如果能量被集中得足夠快，使得粘性來不及起作用，那么就有可能發生爆破。

過去有很多論文聲稱，只要用能量守恒和粘性項就能控制住系統，不只是對納維-斯托克斯，對很多類似的方程都適用。人們試圖證明所謂的“全局正則性”（global regularity），也就是反過來否定“有限時間爆破”，即速度場始終保持光滑。但這些嘗試全都失敗了。總是會出現符號錯誤或一些微妙的問題，導致不可修補。

我感興趣的是：我們為何一直無法證偽“有限時間爆破”？我沒法直接在納維-斯托克斯方程上操作，因為它太復雜。但我可以對其運動方程進行“平均化處理”，也就是人為關閉某些類型的流體相互作用，只保留我想研究的部分。

我基本上是在“工程化”地制造一個爆破，通過改變物理規律來實現——這是數學家被允許做的事情，我們可以改寫方程。

這在數學中被稱為構造阻礙（obstruction）。我做的事情是：關閉方程中的某些部分。通常關閉某些非線性交互項會讓系統更“溫順”，更容易控制，更不容易爆破。但我發現，通過精心設計地關閉一組特定交互項，我反而可以強制讓能量在有限時間內爆破。這意味著：如果你想要對真實的納維-斯托克斯方程證明正則性（即不會爆破），那你必須使用那些我這個“人工方程”所不具備的特性。也就是說，我的構造排除了一部分可能的證明路徑。

數學的精髓就在于，你不僅要找到能行得通的方法，更重要的是知道哪些方法永遠行不通。對于那些真正難的問題，通常有幾十種看似合理的辦法，但只有在深入嘗試之后你才會意識到它們注定失敗。構造這些“相似但失敗”的反例可以節省大量時間和精力，因為你已經知道某些方法在邏輯上根本無法奏效。

萊克斯：

這是否只與你所研究的流體動力學問題有關，還是你在數學上發展出的一種更普遍的直覺？

陶：

是的，我的這種技術背后其實利用了一個關鍵現象，叫做超臨界性（supercriticality）。在偏微分方程中，很多問題其實是不同力之間的拔河比賽。比如在納維-斯托克斯方程中，一方面是粘性帶來的“耗散力”，它是線性的、可控的、會讓系統趨于穩定；另一方面是“輸運項”，能量從一個位置傳遞到另一個位置，它是非線性的，也正是產生所有問題的源頭。

納維-斯托克斯的兩個核心項就是：耗散項和輸運項。如果耗散占優勢，系統就會趨于平穩，就有希望證明正則性；但如果輸運項占優勢，系統就變得不可預測，非常非線性，進入湍流狀態。

在不同的空間尺度下，這種力量對比也會改變：可能在大尺度下還在平衡，在小尺度下就完全不平衡。納維-斯托克斯的問題在于它是一個超臨界方程：當你觀察得越來越細時，輸運項的影響變得遠大于粘性項。

這就是問題難以解決的根本原因。相比之下，在二維空間里，蘇聯數學家拉德任斯卡婭（Ladyzhenskaya）在 60 年代就證明了不存在爆破。

圖丨拉德任斯卡婭（來源：Wikipedia）

那是因為在二維中，這個方程是所謂的臨界（critical）系統：輸運與耗散在所有尺度下影響相當。而我們已經掌握了大量技術可以處理臨界或次臨界（subcritical）系統，進而證明正則性。

但對超臨界系統，就很難說清楚。我的研究和許多后續工作已經表明：一旦非線性效應在小尺度上主導線性效應，各種“糟糕的事”就可能發生。這也正是這套研究工作的關鍵洞察之一：超臨界 vs 臨界/次臨界，是決定一個方程“是否可控”的關鍵定性特征。

比如行星運動，它們的方程比較“溫順”、可預測，我們可以精確預測其數千年軌跡；但天氣預測為什么過不了兩周？就是因為大氣系統是超臨界的，它在極小尺度上會發生各種難以預料的奇異變化。

萊克斯：

所以說，只要存在巨大的非線性源頭，就會導致系統難以預測？

陶：

是的，尤其是當這種非線性在越小的尺度上越“活躍”時，問題就更嚴重。并非所有非線性方程都難以處理——在很多情況下我們可以通過看系統的“整體行為”來近似局部結構。

比如，如果你想研究月球或火星的軌道，你并不需要知道月球的地震波結構或質量分布細節。你幾乎可以把它們看作點質量，其運動主要由整體重力決定。

但如果你想模擬流體，比如天氣系統，你不能只是說“洛杉磯的氣溫是 X，風速是 Y”來近似整個系統。對于超臨界方程，微小尺度上的信息是極其關鍵的，你忽略不了。

萊克斯：

你曾提到過一種構想，也許可以請你詳細解釋一下：你設想通過構建一種“液體計算機”，從而將計算理論中的停機問題（halting problem）引入到流體動力學中。也就是說，通過這種方式展示計算復雜性對流體行為的影響。你能講講這個思路嗎？

陶：

這個想法源自我之前構造出一個平均方程會爆破的工作。為了做到這一點，一種天真的做法是：你每到一個尺度，就立即將能量推向下一個尺度，盡可能快地推進。這種做法在五維及以上的空間維度中確實有效。但在三維中，我發現了一個奇怪的現象：如果你不斷將能量往更小的尺度壓縮，結果是能量會在多個尺度之間分散。也就是說，當你將能量從一個尺度推向下一個時，雖然它剛進入下一個尺度，但上一層仍有殘留的能量——你試圖同時推進一切，這會導致能量過于分散。

而一旦能量分散過多，就會讓它更容易被粘性所抑制，從而失去爆破的可能性。所以這種“直接推進”的方法在三維中不奏效。后來有其他研究團隊專門寫了論文證明這一點。因此，我需要設計一種“延遲機制”，就像“氣閘”一樣：流體在一個尺度上活動時，只有等它將該尺度的全部能量完整傳遞到下一尺度之后，才開啟通道進入下一級。

通過這種方式，能量可以逐級向前推進，而始終保持在一個特定尺度內局部集中，從而避免被粘性效應削弱。為了實現這個目標，我不得不構造一個非常復雜的非線性結構，它幾乎就像是一個電子電路的設計。我也很感謝我的妻子，她是電子工程專業出身，曾和我聊過如何設計電路。

比如你想要一個燈能按一定頻率閃爍，那你就得用電容、電阻等基本元件組合成某種結構，畫成電路圖。這些電路圖可以通過“用眼睛追蹤電流”來理解其工作原理。于是我就模仿這些電路元件，構造出數學上的對應物，例如模擬“電容”或“電阻”等組件。然后將它們組合在一起，形成一個能夠定時打開或關閉“閘門”的結構。整個系統就像一個數學版的魯布·戈德堡機器（Rube Goldberg machine）——復雜但可控。而這個設計最終確實起作用了。

這讓我意識到：如果你能用在真實的流體方程上做出同樣的事情，比如納維-斯托克斯方程真的能夠“支持”某種計算機制，那我們就可以構建一種“液體朋克”風格的系統。我們現在的計算機是由電子在細小電路中流動實現的，而這里，我們設想的是讓水流脈沖充當信息載體。

你可以想象兩種水流配置，分別表示“比特 1”與“比特 0”。如果兩個水流“碰撞”后得到的輸出狀態是可預測的，那么這個碰撞就可以實現邏輯運算，比如“與門”“或門”等。將它們串聯起來，你就可以構建出圖靈機。這臺機器完全由水組成，是一種“流體計算機”。

再進一步，如果你能用水來控制機器的形態，就像液態機器人，你甚至可以制造一種馮·諾依曼機（von Neumann machine）。

圖丨馮·諾伊曼架構（來源：Wikipedia）

馮·諾依曼曾提出一種理論：如果你想殖民火星，運送人類和機器的成本太高，那不如送一臺可以自我復制的機器。只要它能采礦、制造、組裝，就可以在火星上不斷復制自己，完成擴張。

同理，我們也可以設想這樣一種流體機器人：它的使命就是復制出一個更小的自己。在某個“冷啟動狀態”下，小機器尚未運作；當準備就緒后，大機器人將自己的全部能量傳輸給小機器人，自己“關閉”，清空殘余能量。接著，小機器人啟動、重復這一過程，但更小、更快。

由于納維-斯托克斯方程具有尺度不變性（scaling symmetry），這一過程理論上可以無限進行，從而實現“爆破”現象。這正是我在“平均化的納維-斯托克斯”上所完成的構造——一種為理解原方程爆破機制提供路線圖的方法。

當然，這仍是一個夢想，要真正實現它還有很多障礙。例如，我現在還不能真正構建出那些“流體邏輯門”，我也沒有那些特定的水流配置（雖然像渦環之類的結構可能是候選）。此外，模擬計算比數字計算要脆弱得多，誤差傳播是一個巨大挑戰，需要復雜的糾錯機制。

我也還不清楚如何讓大機器完全“關機”，以免干擾小機器的運行。但從物理角度來說，這一構想并不違背任何自然法則，所以它是“理論可行的”。目前也有其他團隊在嘗試推動納維-斯托克斯爆破的證明，只不過他們使用的方法遠沒有我這種方案復雜。他們采用的是更直接的“自相似模型”（self-similar model），雖然仍未完全奏效，但思路可能更簡潔可行。

從納維-斯托克斯方程到圖靈機，這個跳躍真的很驚人。你最初設想的是“自相似團塊”，不斷生成更小、更精細的結構，現在則是液體圖靈機不斷縮小復制自身，并且從中得出關于爆破的洞見——這個轉化非常具有天才般的創造力。

萊克斯：

從納維-斯托克斯方程跳到這臺圖靈機，這中間真是一次天才的飛躍。從一開始設想的那個越來越小的自相似斑點，到后來構想出一個越來越小的液體圖靈機，并洞察到這可以用來解釋爆破。這真是一個巨大的跨越。

生命游戲

陶：

這在數學中其實是有先例的。數學的一個強項就在于，它善于揭示那些看似完全無關的問題之間的深層連接。只要數學形式相似，就可能存在可以轉化或類比的路徑。

例如，有一類研究叫做“元胞自動機”（cellular automata），最著名的就是康威提出的生命游戲。這是一個無限的離散網格，每個網格點要么被一個“細胞”占據，要么是空的。整個系統依靠一套非常簡單的規則演化，細胞會因鄰近環境而“生”或“死”。

我在學生時期，這種動畫非常流行，甚至被用作屏保。這些圖像看起來非常混亂，甚至某種程度上有點像流體的湍流行為。但隨著時間的推移，人們在“生命游戲”中發現了越來越多有趣的結構。

比如說，有一種叫做“滑翔子”（glider）的結構，只需要四五個細胞組成，演化過程中會穩定地朝某一方向“滑動”，就像渦環一樣。這類現象說明，雖然“生命游戲”是一個離散系統，而納維-斯托克斯是一個連續系統，但在數學特征上卻存在一定的相似性。

“生命游戲”本身非常簡單，只有三四條演化規則，但你卻可以在其中設計出非常復雜的結構。比如有一種叫“滑翔子槍”（glider gun）的結構，它能周期性地發射滑翔子。后來又有人構建出了用于滑翔子的“與門（AND gate）”“或門（OR gate）”等邏輯結構。

這聽起來很夸張，但這些結構是實實在在地被構造出來了。比如有一個巨大的系統：當兩個方向上都有滑翔子流進入時，才會輸出滑翔子流；若只有一邊輸入，則無輸出——這就是典型的“與門”邏輯。

而一旦你可以用滑翔子構建出這些基礎邏輯門，就可以像在軟件工程中一樣，逐層搭建出圖靈機。盡管這些構造在圖像上看起來像是“蒸汽朋克”風格的機械，但它們確實是可以自我復制的結構。有些系統耗費大量時間，通過滑翔子槍的組合，最終實現了一種可以復制自身的大型裝置，即圖靈意義上的自復制機。

很多這樣的成果，其實都是由業余數學愛好者以眾包的方式完成的。我早就關注這些研究，它們也成為我思考納維-斯托克斯類似構想的啟發來源之一。

當然，“生命游戲”是數字系統，而納維-斯托克斯是連續系統，不能簡單照搬它們的結構。但它至少表明：這種復雜結構的涌現在原則上是可能的。

萊克斯：

這種由“局部規則”所引發的“宏觀結構”的涌現非常神奇——像“生命游戲”中的局部規則，在大規模運行下可以生成極其復雜的動態系統。你覺得這些現象是否可能被數學嚴謹地刻畫？我們是否擁有工具能對這種復雜性說出深刻的見解？

陶：

問題在于，這些“復雜結構的涌現”往往需要精心設計的初始條件。像滑翔子槍、邏輯門、自復制系統這些結構，如果你只是隨便在網格上撒一些隨機細胞，它們是不會自然出現的。

這其實也與納維-斯托克斯方程的情形相似：在一般的初始條件下，我們并不會看到任何“計算”或者“圖靈機”的行為。但如果你用“工程方法”對初始條件精心設計，那么確實可以實現一些精妙的結構性演化。

萊克斯：

有沒有可能證明它的反面……也就是說，證明只有通過“工程設計”，你才能創造出有趣的東西。

陶：

這其實是數學中一個反復出現的難題，我稱之為“結構與隨機性”的二元張力。我們在數學中遇到的大多數對象，其實是“看起來隨機”的。比如圓周率的數字序列（π 的十進制展開），我們普遍相信它沒有任何模式。

如果一個結構確實有規律，那我們是可以證明它的，比如周期性重復、等間距結構等等，這就屬于“結構定理”的范疇。而我們也可以證明，在一個給定的統計框架下，“大多數”數字序列沒有規律。比如大數法則告訴我們，隨機序列中 1、2、3 這些數字應該在長遠來看出現得一樣多。

但困難在于：如果給你一個特定的序列，比如 π 的小數位，你該如何證明它沒有隱藏的復雜結構？

這方面我做了很多研究，涉及到所謂的“結構定理”與“逆定理”，其核心在于：如果一個函數表現出某種看似結構化的行為，那可能是因為它接近于某個真正具有明確結構的函數。

比如，有些函數是所謂的“加性”的。如果你有一個從自然數到自然數的函數，比如 2 映到 4，3 映到 6，如果它滿足“兩個輸入相加，等于兩個輸出相加”，那它就是加性的。最簡單的例子就是乘以一個常數。如果你把一個數乘以 10，那么（A+B）×10 就等于 A×10 + B×10。有些函數是嚴格加性的，還有一些則是幾乎加性的。

舉個例子，如果我取一個數，乘以根號 2，然后取整數部分。比如 10 乘以根號 2 約等于 14 點幾，所以 10 映到 14，20 映到 28。在這種情況下，10+10=20，14+14=28，加性是成立的。但由于取整操作，有時會產生誤差，可能你把 A 和 A 相加，得到的結果并不完全是兩個獨立輸出的和，而是差了那么一點點，比如加一或減一。所以，它是“近似加性”（almost additive），但又不完全是。

我研究的很多成果表明：若某個對象顯示出某種結構的跡象，那么它就近似某個真正有結構的對象。通過這樣的逆定理，我們能劃分出一個清晰的二分世界——一個對象要么是徹底無結構的，要么就可以追溯到某種隱藏的結構，從而我們就有了進一步分析的可能性。

一個很好的例子是數學中一個叫做塞邁雷迪定理（Szemerédi s Theorem）的古老定理，它是在 1970 年代被證明的。它討論的是在一組數字中尋找一種特定模式——等差數列，例如 3、5、7 或 10、15、20。

塞邁雷迪證明了：只要一個數字集合足夠大、具有所謂“正密度”（positive density），那么這個集合中一定包含任意長度的等差數列。

比如，奇數集合的密度是二分之一（因為它占據所有整數的一半），我們顯然可以在其中找到各種長度的等差數列。比如 11、13、15、17。因為奇數集合本身就很有結構，找出這種序列不難。

但塞邁雷迪定理的強大之處在于，它也適用于隨機集合。比如我們取所有奇數，然后對每個數拋硬幣，只保留拋出正面的那些。這樣我們得到的就是一個“完全隨機”的子集，表面上看似毫無規律。然而，即便在這樣一個隨機集合中，仍然會存在大量的等差數列。

萊克斯：

你能證明在一個隨機集合里存在任意長度的等差數列嗎？

陶：

是的。你聽說過“無限猴子定理”（infinite monkey theorem）嗎？通常數學定理的名字都很無聊，但這個還挺形象。

“無限猴子定理”的流行版本是說，如果你有無限只猴子，每只都在打一臺打字機，隨機敲字，那么幾乎可以肯定，其中至少有一只猴子最終會打出整部《哈姆雷特》的劇本，或者任何你想要的有限文字序列。

這說明：如果你有一條無限長的數字序列或字符串，任何你想要的有限模式終將出現。這當然需要時間，可能是很長很長的時間，但只要是“無限”，它就會發生。

具體到我們之前討論的等差數列：只要序列夠長，任意長度的等差數列就一定會在其中出現。當然，需要的是極其巨大的隨機序列。

我們可以把“無限”理解為一個沒有上限的有限值的抽象化。現實世界中沒有什么是真正“無限”的，但我們會思考：“如果我有無限多的錢會怎樣？”“如果我可以無限快會怎樣？”等等。

數學中有一套嚴格的形式系統來處理這些理想化的狀態，把“非常大”或“非常小”的概念，抽象為“無限”或“零”，從而讓問題變得更清晰、更易處理。

就像物理中我們經常開玩笑說“假設奶牛是球形的”，意思是我們故意忽略很多現實復雜性，用一種理想模型來近似分析。

萊克斯：

那你覺得，當我們引入“無限”這個理想化工具時，會不會有時偏離了物理現實？

陶：

確實有很多陷阱。所以我們在大學數學課程中會花很多時間教“數學分析”，它基本上就是在教人如何正確使用極限和無限。

舉個例子：有限個數相加時，交換順序不影響結果。但如果是無窮級數，事情就沒那么簡單了。你可以用不同順序排列這些項，竟然會得到不同的收斂值！這就容易出錯。

所以在處理無限的時候，你必須非常謹慎。我們引入了 ε 和 δ 這樣的參數，制定一套非常嚴密的邏輯和推理方式，來防止在“無限”問題上犯錯。

而近年來，數學家們開始把那些在“極限下成立”的結論轉化為有限版本。也就是說：雖然你知道某件事在某個無限條件下是對的，但你會問：“那我到底要多大、多久才行？”

比如說，如果我沒有無限只猴子，而只有一億只，那我要等多久才能等出《哈姆雷特》？這是一個定量問題，而我們可以用純粹的有限方法去分析它。結果是：所需時間是與目標文本長度呈指數增長的。

所以你永遠看不到猴子敲出《哈姆雷特》，最多可能敲出個四個字母的單詞罷了。我個人覺得，一旦你把一個“無限陳述”有限化，它就變得更容易理解，也不再那么玄乎了。

萊克斯：

所以即使你在處理無窮大的問題，最好也把它“有限化”，這樣能幫助你建立直覺？

陶：

是的，缺點是有限化的證明要復雜得多。無限的證明通常是先被發現的，早了幾十年，然后人們才將它們有限化。

數學 vs. 物理

萊克斯：

既然我們剛才提到了很多關于數學和物理的問題。那作為兩種不同的學科、理解世界的方式，數學與物理的根本差異是什么？

陶：

我認為科學總體上可以被看作是三個元素的互動：現實世界、我們對現實的觀察，以及我們關于現實運行機制的心智模型。

我們無法直接接觸真實本身，我們擁有的只是觀察結果——這些結果通常不完整、帶有誤差。很多時候我們想知道的事，比如明天天氣如何，我們尚未有觀察數據，但我們希望預測它。

在此基礎上，我們建立了一些簡化模型，有時會做出不太現實的假設（比如假設奶牛是球形的那類）。這些模型就是我們說的數學模型。

數學研究的，就是模型本身。科學則是收集觀察數據，并據此提出能夠解釋這些觀察的模型。而數學的做法是：我們從模型的前提出發，思考其邏輯結果，推導出這個模型可能帶來的預測或結論，并檢查這些結論是否符合已有數據或可能的數據。

所以二者之間確實是一種共生關系。我想數學與其他學科相比的特殊之處在于：數學從假設出發（比如模型的公理），然后推導出可能的結論。而其他大多數學科是從目標出發：我要造一座橋，我想賺錢，我要達成某個目標，然后再反推該怎么做。

在人類活動中，絕大多數事情都是結論導向的，包括物理與科學研究。例如他們會問：這個小行星的軌道將會如何？或明天天氣如何？而數學除了從結果出發外，還會從假設出發：假設這個成立，那么會有什么結果？

萊克斯：

物理學里常常有理論與實驗之間的張力。你覺得哪一種方式更能引導我們真正發現現實中的新思想？

陶：

你需要兩者兼備，自上而下和自下而上。理論、觀察與建模應該逐漸趨近現實。但一開始，它們總是相距甚遠。要靠彼此推進彼此。

如果你的模型預測出了實驗未曾觀測到的異常現象，這恰好能告訴實驗者去哪里找數據，以進一步校正模型。這個過程是不斷往返推進的。

在數學內部其實也存在“理論”與“實驗”的劃分。只不過直到最近，數學幾乎被理論方法完全主導。大約 99% 的數學是純理論的，實驗數學占比很小，但確實有人在做，比如研究素數分布，他們可能會生成大量數據。

早在計算機出現前，人們也進行過實驗數學的嘗試。比如高斯，他發現了一個著名的猜想，后來發展成了素數定理（prime number theorem），這個定理預測：小于某個數（比如一百萬、一萬億）之間有多少個素數。這不是一個顯然能答的問題。高斯基本上是靠自己（也雇了一些人肉計算員），計算了前十萬以內的素數，并制作出對照表，從中得出預測。

這是早期“實驗數學”的一個例子。但直到最近，實驗數學還不是主流。

理論數學成功率更高也是因為：過去復雜計算幾乎無法實現，即便今天計算機已很強大，也只有少部分數學問題可以通過數值方法探索。

有一個概念叫做“組合爆炸”（combinatorial explosion）。比如你想研究塞邁雷迪定理，設你考慮從 1 到 1000 的所有數字中選子集。表面看：一千個數，能有多難？但實際情況是，它的子集數有 2 的 1000 次方，這遠遠超出了目前任何計算機所能枚舉的范圍。

所以有些數學問題，一旦規模變大，就根本不可能靠窮舉法解決。國際象棋也是經典例子：所有可能的棋局狀態數量巨大，計算機也無法全部列出。

但現在我們有了 AI，能用另一種方式探索這種空間。它們不一定能給出“100% 有保障”的解法，但可以通過實驗性模擬給出答案。比如現在的國際象棋 AI 非常強大，它們不窮盡所有棋步，但卻能找到非常好的近似方案。現在很多人用這些 AI 引擎來做“實驗性國際象棋”：重新評估那些舊的棋局理論，比如某個開局到底好不好，有些結論甚至推翻了傳統的棋譜智慧。

我希望未來數學也能有更多的實驗成分，可能由 AI 推動。

現實的本質

萊克斯：

你提到了柏拉圖的“洞穴寓言”。從某種意義上說，這不就是數學家，甚至所有人類正在做的事情嗎？我們只是在觀察現實的影子。我們有可能真正地觸及現實本身嗎？

陶：

我們可以將世界分為三個本體層次：現實本身、我們的觀察，以及我們對世界運作方式的模型。從嚴格意義上說，它們彼此是區分開的，而且我認為它們永遠都會是分離的。但它們之間的距離可以隨著時間縮小。而要讓模型更接近現實，往往意味著必須舍棄你最初的直覺。

天文學就是個很好的例子。一開始我們對世界的模型是“地是平的”，因為它看起來就是平的，而且它非常大；而天空中的其他東西，比如太陽，看起來非常小。所以你最初的模型雖然離真實非常遙遠，但它能很好地解釋你當時的觀察現象，因此它“看起來沒問題”。

但隨著你觀察得越來越多，模型就會被拉近現實——我們逐步認識到地球是圓的，它會自轉，它圍繞太陽公轉，太陽系圍繞銀河系運動，宇宙在膨脹，而且這個膨脹還是加速的自我膨脹。甚至就在最近的一年，我們發現，這種加速度本身也不是恒定的。

我們現在有一個模型能夠解釋，能夠很好地擬合數據。但也有人批評說：“這不就是乏晰因子（fudge factors）嗎？只要參數足夠多，你什么都能解釋。”但數學的觀點是：你希望模型的參數盡量少于觀察數據點的數量。

如果你用 10 個參數來解釋 10 個觀測值，這模型毫無意義，過擬合。但如果你用兩個參數解釋了一萬億個觀測值——比如說“暗物質模型”，它大約有 14 個參數，卻解釋了天文學家所擁有的數百萬 TB 的數據，那這個模型就極具價值。

你可以這樣看：一個物理或數學理論，本質上是一種對宇宙的“壓縮”，就像數據壓縮。你手里有幾百萬 TB 的觀測數據，你希望用五頁紙的公式加上幾個參數把它們概括出來。如果這個模型能以合理精度擬合幾乎所有觀察結果，那么你壓縮得越徹底，理論就越好。

萊克斯：

而事實上，我們宇宙中最驚人的一點就是，它居然是可壓縮的。這正是數學“不合理的有效性”。

陶：

是的，愛因斯坦有過一句類似的話：“關于宇宙，最不可理解的事情就是，它居然是可以被理解的。”數學中有一個叫做“普適性（universality）”的現象。很多宏觀系統雖然來源于無數微觀相互作用，但宏觀規律本身并不復雜。本來你會以為，宏觀規律應該比微觀結構復雜得多、甚至是指數級復雜，如果你想完全精確建模，確實如此。

比如你要模擬一盒空氣里的所有原子，阿伏伽德羅常數非常大，跟蹤每一個粒子幾乎是不可能的。但在某些情況下，一些宏觀定律幾乎不依賴微觀細節，或僅僅依賴極少數參數。

所以你要模擬 1023 個粒子的氣體，只需知道溫度、壓強、體積，加上五六個參數，就足夠描述這個系統的行為了。我們在數學上對“普適性”的理解遠遠不夠充分，但在一些簡化模型中我們已經知道為什么這種現象出現。最經典的是中心極限定理：它解釋了為什么“鐘形曲線”（bell curve）無處不在，為什么那么多自然現象都符合高斯分布。

萊克斯：

而且這個梗本身也具有普適性。

陶：

對，甚至可以再“元”一點。確實存在很多過程，比如你取一堆獨立的隨機變量，用各種方式把它們平均起來，無論是簡單平均還是復雜加權平均，最終都會得到鐘形曲線，在很多情況下我們都可以證明這一點，非常令人滿意。

當然，有時候不會出現鐘形曲線。如果你有很多變量，但它們之間存在系統性相關性，你就可能得到遠非高斯分布的結果。這種情況也非常重要。比如 2008 年金融危機就是一個著名例子。人們當時假設，按揭違約率是呈高斯分布的：你有 10 萬個房貸用戶，推測有多少人會違約，如果每個人違約行為是相互獨立的，那就會呈鐘形分布，你可以據此做期權、衍生品的風險管理。這套理論非常優雅。

但現實中，如果存在系統性沖擊——經濟系統整體波動導致所有人同時違約，那就是高度非高斯行為，而 2008 年的模型沒能充分預見這種風險。

現在大家多少意識到了：系統性風險比我們之前以為的更嚴重。一個模型再優美，不代表它符合現實。所以理解數學模型的推理邏輯很重要，但理解模型與現實契合度的科學判斷也同樣重要。你需要二者兼顧。

數學可以幫助我們找出模型的薄弱之處。比如中心極限定理會告訴你：只要輸入變量互不相關，結果就會呈現高斯分布。它能幫你定位問題源頭。

假如你了解塞邁雷迪定理，有人想用高斯分布去建模違約風險，你作為數學家就可以質問：“你這些輸入變量之間的系統性相關性有多大？”然后你可以問經濟學家，這種風險是否被低估了，是否能找到證據。這就是科學與數學之間的協同。

萊克斯：

在普適性這個話題上，你因在數學領域涉獵之廣、之深而聞名并備受贊譽，讓人想起一個世紀前的希爾伯特（Hilbert）。事實上，偉大的菲爾茲獎得主、你的同事蒂姆·高爾斯（Tim Gowers）曾說過，你就是我們這個時代最接近希爾伯特的人。

圖丨希爾伯特（來源：Wikipedia）

那么，作為一個能在數學中兼顧深度與廣度的人，你是最合適回答這個問題的人：你認為所有數學領域之間存在某種深層的統一結構嗎？

陶：

其實數學的很多進步，都是兩個原本毫無關聯的領域，后來發現了深刻的聯系。比如一個古老的例子：幾何與數論。在古希臘時期，這兩個領域被視作完全不同的學科。當然，數學家可能同時研究它們，比如歐幾里得，他既寫了幾何，也研究數論。但那時這兩個領域并沒有真正融合。

直到笛卡爾發明了解析幾何——用兩個實數坐標來參數化平面，將幾何問題轉化為代數問題。今天我們覺得這再自然不過：平面當然就是 x 和 y，但當時這可是一項革命性突破。

這類融合在數學史上反復發生：代數與幾何曾分離，后來發展出代數幾何；概率論和數論也開始融合；每一次跨領域連接，都是數學的重要進展。我個人非常喜歡這種數學。

我認為數學家有不同的風格——刺猬型與狐貍型。刺猬知道一件事，但非常深入；狐貍則對很多事略懂皮毛。

我個人更多地認同自己是“狐貍”。我喜歡套利式的探索：學會一個領域的工具后，把這些技巧帶到另一個看似毫不相關的領域，而那里的人通常沒用過這些方法，我能做出些新貢獻。

還有一些數學家比我深刻得多，他們是典型的刺猬型，非常快、非常高效。但我可以為他們帶來一些額外的工具。

萊克斯：

你曾說過，你可以根據具體語境或合作關系的不同，在“刺猬”和“狐貍”這兩種思維方式之間切換。那么，如果可能的話，能否談談這兩種處理問題的方式有什么區別？比如說，當你面對一個新問題時，是選擇尋找跨領域的聯系，還是保持高度專注的單一視角？

陶：

我更習慣于“狐貍”的范式。我喜歡尋找類比和敘事。我經常會花很多時間——比如當我在某個領域看到一個有趣的結果時，我可能很喜歡這個結果本身，但它的證明方式卻用了一些我不太熟悉的數學工具。這種情況下，我會試著用我自己擅長的工具重新去證明它。

往往我自己的證明更差，但這個過程本身很有價值。因為在嘗試重建的過程中，我會逐漸明白：原來的那個證明其實是想達成這個目標。通過這樣“繞路”的方式，我反而能理解那個領域里使用的那些工具。這是一種非常探索性的過程，也意味著我經常會去一些陌生的領域、做些瘋狂的嘗試，甚至常常在“重復造輪子”。

相比之下，我覺得“刺猬式”的風格更學術化，知識體系也更穩固。這種風格依賴對某一領域的發展始終保持最新了解，熟悉所有歷史脈絡，并且對每種具體技術的優劣都有非常清晰的把握。我覺得這種風格更強調計算，而不是通過講述故事或建構類比來理解。

我也能做到那種方式，但我知道有些人在那方面真的非常擅長。

萊克斯：

讓我們退一步，來看一個稍微浪漫化一點的數學版本。你曾說過，在你年輕的時候，對你而言數學更像是一種解謎游戲。你是在什么時候第一次遇到一個問題或一個證明，讓你意識到數學可以擁有一種優雅和美感？

陶：

這是個好問題。我剛到普林斯頓讀研究生的時候，約翰·康威（John Conway）當時還在那里，他幾年前去世了。但我記得我去聽的第一場研究講座之一，就是康威的一個關于他稱之為“極端證明”（extreme proof）的講座。

康威有一種神奇的思考方式，他總能以一種你完全想不到的方式看待各種事物。他把證明本身看作是占據了某種空間。比如你要證明一個命題，比如“素數是無窮的”，那么就會有很多種證明方法。你可以根據不同的維度對這些證明進行排序：有些證明很優雅，有些很長，有些很基礎。于是這些證明在某種意義上構成了一個證明空間，而他感興趣的是這個空間的“極限點”——也就是那些在某一方面達到極致的證明，比如最短的、最基礎的、最不依賴其他定理的那一個。

他舉了一些著名定理的例子，然后給出了他認為在不同方面堪稱極端的證明。我發現那真的讓我大開眼界，原來不僅僅是為一個有趣的結論找到一個證明，一旦你有了那個證明，再去從不同角度優化它，證明本身這個行為就蘊含了某種匠心。

這無疑影響了我的寫作風格。比如，你做數學作業，作為本科生，你的作業之類的，你被鼓勵只要寫下任何一個能行的證明，交上去，只要能得到一個對勾，你就繼續往下走了。但如果你希望你的成果能真正產生影響，能被人閱讀，那它就不能僅僅是正確的。它還應該讀起來令人愉悅，有清晰的動機，能夠被推廣到其他問題上。這和很多其他學科很像，比如編程。數學和編程之間有很多類比。我喜歡類比，如果你還沒注意到的話。你可以寫出一段代碼，意大利面條式的代碼——它能完成任務，但非常混亂，結構很差。雖然能用，但別的人看不懂，也很難修改或擴展。所以我們有各種寫好代碼的原則——寫得更整潔、更易維護、更少 bug。數學也是一樣的：一個好的證明，不只是為了“能用”，還要能被別人理解、引用和延續。

萊克斯

那你心中最優美、最優雅的數學公式是什么？很多人評價“美”時強調的是“簡潔性”，比如說愛因斯坦的 E=mc2。而在數學領域，大家最常提的美麗公式是歐拉恒等式。你覺得這個公式美嗎？

正如我所說，我發現最吸引人的是不同事物之間的聯系……所以如果……eiπ=?1。是的，人們用上了所有基本常數。好吧，我是說，這很可愛，但對我來說……指數函數，由歐拉提出，是用來衡量指數增長的。比如復利或衰變，任何持續增長、持續減少、生長和衰變，或擴張或收縮的東西，都由指數函數建模，而 π 則來自圓和旋轉，對吧？如果你想旋轉一根針，比如說，180 度，你需要旋轉 π 弧度，而 i，復數，代表了交換虛軸的 90 度旋轉。所以是一個方向的改變。

所以，指數函數代表了在你當前方向上的增長和衰減。當你把一個 i 放入指數中，運動就不再是與你當前位置相同的方向，而是與你當前位置成直角的運動。所以是旋轉，然后，eiπ=?1 告訴你，如果你旋轉時間為 π，你最終會到達相反的方向。所以它通過這種復化的行為，即乘以 iπ 的旋轉，統一了通過擴張的幾何學和通過指數增長的動力學。所以它把所有這些數學領域聯系在一起，動力學、幾何學和復數。由于這個恒等式，它們在數學中都被認為是近鄰。

萊克斯：

你覺得這些符號的“偶然碰撞”只是巧合，還是說它其實揭示了更深的東西？比如不同領域的符號相遇，是否也有其內在的價值？

陶：

我覺得這證明了你擁有了正確的概念。當你第一次研究任何東西時，你必須去測量事物，給它們命名。一開始，有時候因為你的模型離現實太遠，你可能會給錯誤的東西起了最好的名字，你只有在后來才發現什么才是真正重要的。

萊克斯：

物理學家有時會這么做，但結果還不錯。

陶：

實際上，物理學也一樣，比如說愛因斯坦提出 E=mc2。回到更早的時候，亞里士多德、伽利略和牛頓提出了最初的運動定律。他們能測量的是質量、加速度和力，于是牛頓力學中最核心的就是 F = ma，這些可測量的量在理論中占據核心地位。

但隨著人們對這些方程的進一步分析，出現了一些“額外的量”，比如動量和能量。能量并不是一個你能像質量和速度那樣直接測量的東西，但人們逐漸意識到它在物理系統中極為關鍵。

到了 19 世紀，哈密頓重構了牛頓力學，提出了所謂的哈密頓力學。在這個體系中，“哈密頓量”（Hamiltonian）才是真正的核心對象。只要你能準確地測量出一個系統的哈密頓量，你就可以描述整個系統的演化。這種思維方式在后來面對量子力學時起到了關鍵作用。

早期的物理學家試圖用牛頓的粒子圖景去理解量子世界，發現完全不對勁，因為量子力學強調的是“波”。

你要問，“量子版的 F=ma 是什么？”根本沒人能說清楚。但幸運的是，哈密頓量這個概念依然適用，它只是以不同的形式出現，是一個算符（operator），而不是一個函數。

只要你能給出哈密頓量，就能通過薛定諤方程描述量子系統的演化過程。

所以，雖然經典力學與量子力學在表面上完全不同，一個是粒子，一個是波，但因為都基于哈密頓量，我們就能將很多經典力學中的直覺遷移到量子力學中。

比如說，經典力學中有諾特定理（Noether theorem）：每一個對稱性都對應一個守恒定律。如果物理規律不隨空間平移而改變，那就有動量守恒；如果不隨角度旋轉而改變，那就有角動量守恒；如果不隨時間變化而改變，那就有能量守恒。

如果你等 10 分鐘，所經歷的物理定律仍然相同，這種時間平移不變性對應的就是能量守恒。也就是說，對稱性和守恒律之間存在著根本性的聯結。而這在量子力學中同樣成立，盡管方程形式完全不同。但因為兩者都以哈密頓量為核心，只要這個哈密頓量保持某種對稱性，那么對應的方程就會產生一個守恒量。

一旦你找到了“正確的語言”，很多事情就會變得清晰許多。

至于為什么我們還無法統一量子力學與廣義相對論，其中一個問題是我們還沒搞清楚“基本的對象”到底應該是什么。比如，我們很可能要放棄將時空看作類歐幾里得空間的想法。我們知道，在極小的尺度上存在量子漲落，存在所謂的“時空泡沫”，而此時再使用笛卡爾坐標系（x, y, z）顯然是走不通的。但問題是：我們還不知道該用什么來替代。我們甚至沒有找到類比于哈密頓量那樣的組織性概念，能夠像哈密頓量在經典和量子力學中那樣，統攝一切。

萬有理論

萊克斯：

你是否在直覺上相信，真的存在一套“萬有理論”？我們真的可能找到這樣一種語言，來統一廣義相對論與量子力學？

陶：

我相信是存在的。從歷史來看，物理學的發展就是不斷統一的過程，某種程度上和數學的發展也類似。比如說，早期電學和磁學是兩套完全不同的理論，后來被麥克斯韋統一了；牛頓則統一了天體的運動與地球上的物體運動。因此，這種統一是有前例可循的，它應當可以實現。

不過，回到理論與觀測的關系，我們現在遇到的問題之一是物理學反而成為了它自身成功的受害者。因為我們目前的兩大物理理論：廣義相對論與量子力學，實在太有效了。這兩者加起來，已經可以解釋我們能觀測到的 99.9% 的現象。

為了找到它們失效的邊界，我們必須進入極端的實驗條件，比如極高能量的粒子對撞機，或者宇宙早期的狀態——這些都是難以實現的。因此，真正看到這兩者之間差異、并據此找到融合路徑，非常困難。但我相信，這條路我們已經走了幾個世紀，一直都在進步，沒有理由會停下。

萊克斯：

你認為你會是那個發展出萬有理論的數學家嗎？

陶：

通常發生的情況是，當物理學家需要某種數學理論時，往往已經有數學家早先一步做出了某種雛形。比如，當愛因斯坦開始意識到空間是彎曲的，他去找了一位數學家問：“有沒有關于彎曲空間的理論，是數學家已經搞出來的，可能能用？”然后那位數學家說：“有的，黎曼搞出過一些類似的東西。”結果，黎曼發展出的黎曼幾何——一個關于空間如何以各種方式彎曲的理論——幾乎就是愛因斯坦的理論所需要的。這又回到了數學“不合理的有效性”上。我認為，那些能很好地解釋宇宙的理論，往往也涉及到那些能很好地解決數學問題的數學對象。歸根結底，它們都只是以有用的方式組織數據的不同方法。

萊克斯：

只是感覺你可能需要去到一個非常奇特、非常難以憑直覺把握的地方。比如弦理論。

陶：

是的，那在很長一段時間里都是一個主要的候選理論。但我想它正慢慢地失寵，因為它與實驗不太匹配。

萊克斯：

所以，一個巨大的挑戰當然在于，就像你說的，實驗非常困難，因為廣義相對論和量子力學本身就極其有效。但另一個挑戰在于，這不是簡單地“偏離”時空結構，而是走向一些非常極端的想象空間——比如多維空間、各種我們難以感知的構造。我們已經從平地走到了“彎曲空間”，你還得不斷往前跳躍，而我們作為類人猿后代的認知結構，很難真正直覺地理解那種現實。

陶：

這就是類比如此重要的原因。“地圓說”是不直觀的，因為我們被困在地球上。但是，我們對圓的物體本身是有直覺認知的，也理解光是如何傳播的。所以，實際上是可以通過一些簡單的實驗來驗證這一點的，比如日食、月相變化等現象，都可以通過圓形的地球和月亮模型輕松解釋。你只需要一個籃球、一顆高爾夫球和一個燈光源，就可以自己在家動手模擬。所以直覺是可以培養的，只要你肯把它“遷移”過來。

萊克斯：

對我們來說，從“地平”到“地圓”，在認知上確實是一個巨大的飛躍，因為我們的生活大部分是在平地上度過的。如今我們對這些事情習以為常，是因為科學已經提供了大量證據。但你想想，我們其實正處在一個圓形的巖石上，以極快的速度在宇宙中飛行。這本身就是一種巨大的跳躍。而且，在科學進步的過程中，你需要不斷地進行這類飛躍，一次又一次。

陶：

完全正確。現代科學或許又是“成功的受害者”——為了追求更高的準確性，它不得不與人類最初的直覺越來越遠。而對于沒有接受過完整科學教育的人來說，越是如此，就越容易顯得“難以置信”。所以我們需要提供更扎實的基礎。

當然，現在有很多科學家做著非常出色的公眾傳播工作。其實還有很多科學實驗是可以在家里完成的。有很多 YouTube 視頻，我最近也和一個叫 Grant Sanderson 的 YouTuber 合作了一個視頻，我們就討論了古希臘人是如何測量月亮和地球之間的距離的。他們所用的技術，其實今天我們每個人也可以自己動手試一試。根本不需要太空望遠鏡或復雜數學模型。

視角的轉換非常重要。常言道，旅行開闊視野，那么這是一種“智識上的旅行”。你試圖把自己放入古希臘人、或任何歷史時期的人的視角，提出一些假設，比如“球形地球”，然后進行推演與想象。這其實就是數學家的工作方式，某種意義上，也類似于藝術家的創造。

只要你設定一組公理，數學的推演就會展開。你沿著這些公理不斷推理，常常可以走得比最初的假設遠得多。

廣義相對論

萊克斯：

你提到了廣義相對論，你也曾在理解愛因斯坦場方程的數學方面做出過貢獻。你能否介紹一下這部分工作？從數學的角度來看，廣義相對論中哪些方面最吸引你？又有哪些挑戰？

陶：

我確實研究過一些相關方程。其中有一個叫“波映射方程”（wave maps equation），也稱為 σ 場模型（Sigma field model），它并不是直接描述時空引力本身的方程，而是關于存在于時空之上的某些場的模型。

愛因斯坦的廣義相對論方程描述的是“空間”與“時間”本身，但在這個基礎之上還存在其他的場，比如電磁場、楊-米爾斯場（Yang-Mills fields）等等。這些方程形成了一個層級體系，而愛因斯坦方程雖然是其中最非線性、最復雜的之一，但在整個層級中卻并不處于最高位置。

我研究的是其中相對低階的一個——波映射方程。它的物理圖景是這樣的：想象一個波動，它在每一點上都被限制在球面之上。可以把它想象成時空中有一大堆小箭頭，這些箭頭指向不同的方向，像波一樣傳播。你輕輕撥動一個箭頭，它的擾動就會擴散開來，讓周圍的箭頭也開始運動，就像麥田中隨風搖曳的麥穗一樣。

我關注的問題是所謂“全局正則性問題”（global regularity problem），也就是：這些能量是否有可能集中在某個點上？我研究的這個方程屬于“臨界方程”（critical equation）類別，其特征是它在所有尺度上的行為基本相似。

我最終證明了：你無法構造出一個讓所有能量集中在一點的情形——能量必須在某個時刻稍微地分散開來，即便只是一點點分散，也足以維持解的正則性。這項工作大約是在 2000 年完成的，也是我后來開始對納維-斯托克斯方程產生興趣的原因之一。

為了解決這個問題，我開發了一些新的技術。因為這個方程是高度非線性的，主要是因為球面本身的曲率帶來了某種“非微擾效應”（non-perturbative effect）。在常規視角下，這些非線性效應甚至比波動方程的線性部分還要強，使得問題很難控制，即便能量很小也不例外。

于是我引入了一種稱為“規范變換”（gauge transformation）的方法。你可以把這個系統想象成一大片麥穗在風中來回擺動，極其復雜。如果我們能讓這些運動“穩定”下來，比如在空間的各個點上掛上小攝像頭，這些攝像頭可以隨著主流動方向一起運動，從而捕捉到主要動態。

在這種穩定坐標系下，原本非線性的流動就變得更線性了。我正是通過這種方式找到了一個可以轉換方程的坐標系統，成功減少了非線性影響，并最終得以解決該方程。

而我是在澳大利亞探望姑媽時發現這個變換方法的。當時我試圖理解這些場的動態變化，但既沒有紙筆，也不熟悉用計算機做模擬，只好閉上眼睛，躺在地板上，想象自己變成了那個矢量場，在空間中滾動，試圖找到一個合適的坐標系統，使得在所有方向上，系統行為都更接近線性。

我姑媽正好走進來，看見我躺在地上翻滾，就問我：你這是在干嘛？我只能回答：這事說來話長。于是她說，好吧，你是個年輕人，我不問了。

解決難題

萊克斯：

你是如何著手解決難題的？當你在思考時，你是在腦海里想象那些數學對象、符號，還是別的什么？通常，你在思考時，腦子里看到的是什么？

陶：

我會大量使用紙和筆。作為一名數學家，你會逐漸學會我稱之為“策略性地作弊”的方法。

數學的魅力之一在于，你可以自由地更改問題的形式、甚至規則，這一點在別的領域幾乎做不到。

比如說你是個工程師，有人讓你建一座橋橫跨這條河，你不能說：“我想在這邊建橋”或者“我想用紙建，而不是鋼”。但作為一個數學家，你可以任意設定條件。

這就像在玩一款電腦游戲，而你擁有所有作弊碼：你可以把一個很高維度的問題降到一維，先解決一維的情況；或者當有主項和誤差項時，你可以假設誤差項為零，做個球面對稱假設，先解簡化后的問題。

所以，解決數學問題的最佳方式不是進入“鋼鐵俠模式”，把一切難點都維持在最難，而是——如果有 10 個讓你頭大的難點，那就設法先把其中 9 個放下，僅保留 1 個，集中解決那個。

當然，如果你把 10 個都放下了，那題目就無聊了。但放下 9 個、只留 1 個，是一個很有價值的練習。

你先解決這一個問題，掌握了應對這類難點的方法，然后把這個“作弊”關閉，重新打開另一個難點，再解決另一個。

等你學會了單獨應對這 10 種難點之后，就可以開始把它們兩兩組合，一點點整合成原始問題。

小時候我看了很多港片，特別是功夫動作片——每次打斗場面，主角都會被一群惡人圍攻，比如 100 個反派包圍他，但打斗總會被編排成一次只跟一個人打。他解決一個，再打下一個。正因為這樣，他才可以一個打百個。

但如果反派們頭腦更聰明，直接一起圍攻，那主角早就輸了。當然這樣一來電影就不好看了（笑）。

萊克斯：

你通常是用紙和筆嗎？還是會用電腦和 LaTeX？

陶：

主要是紙和筆。我的辦公室里有四塊巨大的黑板，有時候我需要把我知道的關于這個問題的一切都寫在那四塊黑板上，然后坐在我的沙發上，看著全局。

上面還有很多圖畫，很多只有我自己才看得懂的涂鴉。黑板的好處是可以隨時擦掉，整個思考過程很有機。當然，現在我開始越來越多地使用電腦，部分原因是 AI 的發展讓一些基礎編程變得更簡單了。

以前如果我想畫一個稍微復雜點的函數圖，比如有些迭代過程，我得自己寫 Python 代碼，想想 for loop 怎么寫，還得調試，可能花上兩小時。而現在只要十幾分鐘就能搞定。所以我現在開始用電腦做一些簡單的探索了。

AI 輔助證明

萊克斯：

我們來聊聊 AI 吧，也許可以從計算機輔助證明談起。你能介紹一下 Lean 形式化證明編程語言嗎？它作為證明助手是如何工作的？你是怎么開始使用它的？它在哪些方面幫到了你？

陶：

Lean 是一種編程語言，和 Python、C 這些傳統語言相似，但一般的編程語言主要是執行指令，比如翻轉比特、驅動機器人、傳輸信息等。而 Lean 除了也可以像傳統語言那樣執行代碼之外，更重要的是，它可以“生成證明”。

比如用 Python 計算 3 + 4，會告訴你答案是 7，但 Lean 不僅給出答案，還會生成“為什么等于 7”的形式化證明——包括每一個推理步驟。

所以 Lean 處理的是比單純語句更復雜的對象：帶有完整證明的陳述。而每一行代碼，實質上是把已有的數學語句拼接起來，從而導出新的結論。

這種思想其實并不新穎，這類系統被稱為“證明助手（proof assistant）”，它們為構建復雜數學證明提供了一個形式化語言。如果你信任 Lean 的編譯器，那么它輸出的每一個證明都可以被視為 100% 正確的“證明證書”。而且 Lean 的編譯器做得非常小巧可靠，目前也有多個版本可供選擇。

萊克斯：

那能不能幫大家建立一個直觀概念：用 Lean 和用紙筆寫證明的區別在哪里？把一個數學命題形式化到底有多難？

陶：

Lean 的設計吸收了很多數學家的意見，所以它的語法盡可能模擬“數學證明的語言”。比如你引入一個變量、使用反證法等等，都可以用標準的方式表達。

理想狀態下，它可以做到“證明語言與代碼之間的一一對應”，但實際上仍然存在差距。Lean 更像是你在向一個極度挑剔的同事解釋證明過程，他會不斷打斷你，“你確定這是你想說的嗎？如果這里是 0 會怎樣？這一步你怎么保證的？”

Lean 雖然內置了很多自動化能力，但它要求你對每個對象都明確指明其類型。比如變量 X，你需要指出它到底是實數、自然數、還是函數？在非正式寫作中，這通常靠上下文推斷，比如設 X 為 Y 與 Z 之和，而 Y 和 Z 是實數，所以 X 也是。

Lean 可以自動推斷其中很多信息，但有時還是會打斷你：你能不能明確告訴我這個對象是什么？這就要求你在形式化時，不光要關注計算本身，還要在哲學層面上思考這個對象到底是什么。

萊克斯：

它是用像大語言模型這樣的東西來做類型推斷，還是說它只是匹配“實數”這個詞？

陶：

它用的是更傳統的那種，我們稱之為“老派 AI”。所有數學結構都可以表達成“樹狀結構”，然后使用算法在不同的樹之間進行匹配。

Lean 中的每個對象都有“生成歷史”，你可以一路追溯它是怎么來的。它的目標是“可驗證性”，而不是依賴現代 AI。但現在也有很多人嘗試在 Lean 之上疊加 AI。

比如在使用 Lean 寫證明時，經常需要調用微積分基本定理。Lean 團隊開發了一個叫 Mathlib 的龐大庫，里面包含了數萬個數學事實。但要用的時候，你得找到它。所以現在的主要瓶頸之一是“引理檢索”——你知道這個工具在庫里，但要找到它。

這時候，大語言模型可以幫忙了。你可以直接說“我現在需要用微積分基本定理”，像我在寫代碼時裝了 GitHub Copilot，它會掃描我當前的代碼環境并智能推薦，比如你只寫“我現在需要基本定理”，它就可能自動補上“試試這個引理”。

大概 25% 的時候它能直接用，另外 10–15% 雖然不完全對，但改一改也能用，還有 50% 是完全廢話。但即便如此，這種 AI 在 Lean 上的應用已經像是一種高級自動補全了。

萊克斯：

但這不會扼殺掉作為一名數學家的那種“氛圍”（vibe）嗎？有一個學究氣的同事在你身邊。

陶：

確實是這樣。但也有一些時候，形式化反而更舒服。比如我曾經形式化一個定理，最后得出的常數是 12，這個“12”在整個證明中不斷被使用，每一步都要和它保持一致。我們把整個定理寫成論文后，過幾周有人說我們其實可以把這個 12 降到 11，通過重構一些步驟。

如果是在紙上寫的，每次改一個參數，你就得一行一行地檢查整篇證明有沒有崩掉。有些地方可能用了 12 的某些特性，但你根本沒意識到，一改就錯。但我們是用 Lean 形式化的，于是我們把定理的“12”改成“11”，重新編譯，發現成千上萬行代碼中，90% 還是能跑的，只有少數幾行報錯。它會立刻告訴你“這些步驟無法被證明”，所以你知道改哪兒就行了。

如果你用的是良好的編程結構，不寫死常數、用智能調用，那修改范圍就很小。我們用了一兩天就把整個定理從“12”更新成“11”了，遠比紙筆快得多。

同時證明會更長，但每一個獨立的部分都更容易讀懂。比如你打開一篇數學論文，第 27 頁，第 6 段，某一行看不懂，很常見。因為它用了某些定義，而這些定義可能在第 10 頁，整個證明散布在不同地方，你不得不“順著讀”。

不像小說可以從中間隨便翻開。但在 Lean 里，如果你把鼠標懸停在某一行上，每個對象都會告訴你它是什么、從哪兒來、怎么定義的——你可以輕松追溯整個結構，而不用翻來翻去。

Lean 還讓我們可以在“原子級別”合作，這在過去根本不可能。傳統上，要合作寫一篇數學論文，不是黑板上一起推，就是你寫第三節我寫第四節，很難真正實時協作。而在 Lean 中，比如我卡在第 67 行：“這步我證不出來，但大概思路是這樣”，其他人看了之后可能立馬說：“你可以用這個工具、那個引理”，于是就能快速推進。

現在我可以和全球幾十個從沒見過面的人一起寫證明，而且即使我不知道他們是誰，有多可靠，Lean 本身就是可信的證明證書，它讓我們可以做“無信任協作”的數學。

萊克斯：

你以善于合作著稱。那在數學研究中，解決一個困難問題的“正確協作方式”到底是怎樣的？你們是“分而治之”型的？還是說會集中在某一部分上進行頭腦風暴

陶：

最開始總會有一輪頭腦風暴。數學研究項目的特點就是：你一開始根本不知道該怎么做。它不像工程項目，理論早就成熟了，主要難點是落地實施。做數學，你得先弄清楚“哪條路是對的”。

這就像我說的“先作弊”：拿造橋打比方——第一步，你假設自己有無限預算、無限工人，那你能造出這座橋嗎？如果能，再假設只有無限預算但工人有限；再進一步，預算也有限了……

當然，現實中的工程師不能這么干，他們有剛性需求。但在數學里，我們可以這樣“幻想”，先搞出一個原始構想，看是否存在一條可能的路徑。一旦你發現了有可能的解法的大概框架，那就可以把問題拆解成多個子問題。雖然每個子問題也不容易，但你可以集中精力各個擊破。

而且，不同合作者對不同子問題的處理能力也不一樣。

我有一個我因此而出名的定理，是和本·格林（Ben Green）合作的，現在叫做格林-陶定理（Green-Tao theorem）。它陳述的是素數包含任意長度的數學級數（等差數列），是對塞邁雷迪定理的一個修改。

我們合作的方式是，本已經證明了：素數中存在大量長度為 3 的等差數列，甚至在某些素數子集中也能找到。但他的技巧只能處理長度為 3 的情況，對更長的不適用。

我這邊呢，正好有一些來自遍歷論的技巧，是我一直在研究和玩的領域，那時候我比本更熟悉這套工具。于是我就想，如果本能提供某種關于素數的隨機性假設，只要滿足某個技術條件，我這邊就能從這個出發，推出我們想要的結論。但我提的那個條件，本說：這是個數論中的超難問題，我們不可能證明它。

于是他回我一句：你能不能把你那部分的假設放松一點？用我這邊能證明的條件？然后他提出了一個他能證明的假設，但對我來說太弱了，我根本用不上。于是我們就你來我往，我想多作弊一點，他想少作弊一點，不斷妥協。最后我們終于找到一個 A）本能證明，B）我也能用的共同假設，這才合力完成了這個定理的證明。所以每一次合作都有一套獨特的故事，沒有哪兩次合作是一樣的。

Lean 編程語言

萊克斯：

反過來說，像你剛才提到 Lean 編程語言的情況，這其實是另一種故事了。你曾說它可以讓我們為某個問題創建“藍圖”，然后就可以真正地實現“分而治之”。在 Lean 的框架下，每個人處理不同部分，由計算機來驗證整個推理過程是否成立。

陶：

對，它能讓一切變得兼容且可靠。當然，現在只有一小部分數學項目能以這種方式被拆分。就目前的技術水平而言，Lean 大多數的應用仍是用于形式化人類已經完成的證明。

從某種意義上說，一篇數學論文本身就是一份“藍圖”。它把一個大命題拆解成上百個引理。但這些引理常常沒有寫得足夠詳細，無法直接拿來形式化。

而我們說的“藍圖”，是那種極其嚴謹寫成的版本，每一步都解釋得盡可能詳細，力圖讓每個環節都自成體系，或者只依賴前面非常有限的一些結果。這樣生成的“藍圖圖譜”中，每個節點就可以獨立處理——你甚至不需要知道整個定理長什么樣，就像現代供應鏈組裝 iPhone 一樣。

萊克斯：

這是一個非常令人興奮的可能性，如果你能找到那種可以被拆解成模塊的問題，那你就能吸納上千名協作者，徹底實現分布式數學協作。

陶：

是的。我之前說過“理論數學”與“實驗數學”的劃分。目前數學絕大多數還是理論主導，實驗的只占很小部分。

但我認為 Lean 以及像 GitHub 這樣的平臺，能讓實驗數學的規模擴大到我們從未有過的程度。現在你如果想探索某個數學模式，就得寫代碼來模擬。雖然也有一些計算機代數軟件包能幫忙，但多數時候還是數學家自己寫一堆 Python 代碼，

這本身就極容易出錯。而且因為代碼不穩定，也很難開放給別人協作，一旦某個模塊有 bug，整個系統就不可信。于是大家寫出的代碼都像“意大利面條”，混亂、笨重、不易共享。

這也導致了實驗性研究無法規模化。但有了 Lean，我已經開始一些項目，不只是用數據做實驗，而是對證明本身進行實驗。

我們有一個叫“等式理論項目”（Equational Theories Project）的研究，生成了大約 2200 萬個抽象代數中的小問題。也許我得先解釋一下這個項目。

抽象代數研究的是像加法、乘法這樣的運算以及它們滿足的抽象性質。比如，乘法是交換的（X×Y = Y×X），也是結合的（X×(Y×Z) = (X×Y)×Z），但并非所有性質都成立，比如 X×X = X 并不總是成立。

我們列出了大約 4000 條可能的代數法則，并想搞清楚：哪些法則會推出另一些法則。比如，交換律能推出結合律嗎？答案是否定的，因為可以構造一個例子，滿足交換律卻不滿足結合律。

也有些法則之間確實存在推導關系，可以寫出代數證明。于是我們就對這 4000 條法則，兩兩配對，總共形成了 2200 萬個組合。每個組合就是一個問題：法則 A 能否推出法則 B？若能，請給出證明；若不能，給出反例。

這些問題幾乎都可以給本科生練習，大多數都很基礎，只有大約 100 個左右相對更難。項目的目標就是畫出這整張“推理圖譜”——哪些法則可以推導出哪些其他法則。

這在以前是不可行的。文獻中能處理的極限是 15 條法則之間的關系，靠人類手工，已經到極限了。

你要想拓展，就必須眾包；但你也得確保每條推理都可信，而不可能靠一個人檢查完 2200 萬個命題。這在 Lean 出現前是不可能實現的。我們原本也希望加入 AI 輔助，目前整個項目基本完成了：2200 萬個命題，只剩下兩個還沒完全形式化。

其實那兩個我們也已經有手工證明了，現在正在形式化。今天早上我還在處理這個，馬上就完工了。為了這項工作，我們找了大概 50 個人，所以我們將會有一篇 50 個作者的論文，還有一個超長的附錄，說明誰貢獻了什么。

萊克斯：

你們這么多人協作，有沒有辦法按照貢獻者的專業水平來組織協作？我這問題聽起來有些天馬行空，但設想一下：未來如果也加入 AI 協作者，是否可以像 Elo 等級評分那樣，為每個協作者打分、游戲化？

陶：

其實 Lean 項目的一個好處是：它會自動生成全部數據。我們所有的代碼都上傳到 GitHub，GitHub 會記錄誰寫了什么。所以你可以隨時生成統計，比如誰寫了多少行代碼。這當然只是粗略指標。

我絕對不希望這些數據被用于職稱評審之類的正式用途。但企業里早已有類似的員工評估標準，我理解這趨勢對學術界是有點嚇人的。

萊克斯：

但學術界也用指標，他們只是用舊的，比如論文數量。我反而覺得（新的）這種指標雖然有缺陷，但方向更正確了。

陶：

我認為這值得研究。你可以做一些研究，看看這些是不是更好的預測指標。這里有一個叫做“古德哈特定律”（Goodhart s Law）的問題：如果一個統計數據真的被用來激勵績效，它就會被“玩壞”，失去原有的參考價值。

所以我們這次采用了“自我報告”的方式。科學界有一套標準分類，用來描述協作者的貢獻：構思、驗證、資源、編程等等，總共大概十二項。

我們就把所有作者列成一個矩陣，請每人勾選自己在哪些類別有貢獻。比如你寫了代碼、提供了算力，但沒有參與手工驗證，那就標清楚。

數學界的傳統是按照姓氏字母排序。我們并不像自然科學那樣按“第一作者”“第二作者”區分，我們對此很自豪——我們把所有作者視為平等。但在這種大規模項目下，這個傳統就很難維持了。

十年前，我參與過一些叫做博學者項目（...

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.