99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

陶哲軒聯手AI挑戰經典ε-δ極限!加法秒殺、乘法翻車

0
分享至

新智元報道

編輯:犀牛

【新智元導讀】數學大師陶哲軒的第三支Lean 4自動化數學證明視頻來了!他攜手GitHub Copilot挑戰分析學經典的「ε-δ」極限問題:加法定理Copilot揮灑自如,減法開始卡殼,乘法更是全面失控。Copilot究竟是神助攻還是添亂?

數學大師陶哲軒的AI新實驗來了!

這次是Lean 4自動化數學證明的第三支視頻。

主要看看GitHub Copilot在處理分析學經典的「ε-δ」問題(描述函數極限的經典方法)時,效果究竟如何。

之前,陶哲軒上傳了兩支這個系列的視頻。

加上此次的一共3支視頻,陶哲軒的油管頻道已經有1.7萬位訂閱者了。

看來,他作為菲爾茲獎得主、當代最杰出數學家之一的影響力的確毋庸置疑。

陶哲軒在此次定理形式化演示中發現,GitHub Copilot在幫助新手入門和處理基礎任務時表現得相當不錯。

它能幫助用戶快速上手Lean語言(一種交互式定理證明工具),提供語法提示,并智能補全基本定義和聲明。

在比較簡單的證明,比如函數極限的和定理中,Copilot還能準確預測證明結構和關鍵步驟,表現得就像個得力助手一樣。

但當證明變得復雜時,Copilot的短板就暴露出來了。

比如在處理函數極限的差和積定理時,它在復雜的代數推導、尋找合適的數學引理(比如與絕對值相關的引理)等方面顯得力不從心。

Copilot有時還會出現「幻覺」,生成壓根不存在的策略,或者犯一些低級錯誤,導致證明過程亂成一團。

這時,陶哲軒不得不親自出馬,修正錯誤,甚至完全接管證明。

「人機協作」的證明過程

形式化數學的目標是用計算機能完全看懂的精確語言,把數學概念和證明寫出來,再用定理證明工具(比如視頻里提到的Lean)來一步步檢查推理是否靠譜。

這就像把數學證明翻譯成一種特別嚴謹的編程語言。

第三彈的視頻里,陶哲軒從一個經典的分析學概念入手:函數的極限。

用Lean把這個定義寫出來,對新手來說真不是件容易事兒。不過,GitHub Copilot就像個貼心助手,派上了大用場。

陶哲軒剛敲下「定義一個謂詞limit f x? l」,Copilot就立刻get到他想表達的是「ε-δ」極限定義,秒秒鐘生成了對應的Lean代碼。

雖然陶哲軒根據自己的習慣稍作調整,但Copilot的智能補全明顯讓整個過程快了不少。

「和的極限」——小試牛刀

接下來,陶哲軒挑戰了一個更復雜的定理:如果函數f(x)的極限是L,g(x)的極限是M,那么f(x)+g(x)的極限就是L+M。

Copilot又秀了一把操作。它不僅幫陶哲軒寫出了定理的Lean聲明,還開始「猜」證明的步驟,建議引入假設,提取出ε和δ這些關鍵變量。

Copilot嘗試用Lean的calc塊整理不等式鏈,還試著用simp簡化表達式。

但這里它開始出小差錯,比如搞亂了絕對值的位置,或者在代數推導時顯得不夠「機智」。

陶哲軒不得不出手,比如他提醒Copilot用「ε/2」技巧。Copilot雖然一開始沒完全跟上,但調整后成功融入了這個思路。

最終,經過一番人機配合,這個「和的極限」定理在Lean里被順利證明通過。

陶哲軒覺得,Copilot干了大部分活,互動體驗也很不錯。

「差的極限」——AI有點懵

有了「和的極限」的經驗,陶哲軒以為「差的極限」會同樣順利。這個定理是說,如果f(x)的極限是L,g(x)的極限是M,那么f(x)-g(x)的極限是L-M。

Copilot似乎也信心滿滿,直接套用了「和的極限」的證明套路,甚至用上了上述的「ε/2」的技巧。

但過程中,Copilot還是卡殼了,甚至還「腦補」了一個Lean里根本不存在的策略(叫什么sub subanc)。

面對Copilot的「胡思亂想」,陶哲軒試圖給予提示,但Copilot還是搞不懂。

陶哲軒意識到,這些代數變換對人類來說簡單,但在Lean里需要調用特定的數學引理來支撐每一步。最終,陶哲軒只能親自動手完成這些代數推導。

這一關讓陶哲軒看到,Copilot雖然能模仿證明的大框架,但在需要特定引理或復雜代數操作時,容易掉鏈子。

他給Copilot這一關的表現打了個B+:幫了不少忙,但關鍵時刻還是得靠人類引導甚至接管。

「積的極限」——徹底亂套

最難的來了:如果f(x)的極限是L,g(x)的極限是M,那么f(x)·g(x)的極限是L·M。

這個證明比加減法復雜多了,尤其在控制誤差(ε)時,堪稱噩夢。

Copilot嘗試沿用標準套路,加中間項、三角不等式。

但問題來了,Lean里處理絕對值乘積或求和,需要非常具體的引理,比如把|ab|變成|a||b|得用abs_mul,|a+b|≤|a|+|b|得用abs_add。

Copilot在找這些引理時頻頻出錯,甚至想用一些通用的策略(比如線性算術),卻因為有乘法和絕對值而行不通。

更麻煩的是,為了讓誤差控制在ε內,一開始得精心設計f(x)和g(x)的誤差參數。這些參數選擇和邊界估計對Copilot來說有點太難了,它試了些參數,但證明中發現行不通,甚至還差點弄出除以零的錯誤。

陶哲軒在這階段花了大量時間「救火」,不斷調整Copilot的嘗試,尋找正確的引理,甚至回去改最初的誤差參數。

整個過程亂成一團,盡管Lean系統改參數相對方便(改了讓系統重查就行),但得對證明結構有清晰理解才知道怎么改。

最終,經過艱苦努力和大量人工干預,陶哲軒完成了「積的極限」證明。

他總結說,一旦證明復雜到一定程度,Copilot就變得「不怎么靠譜」了。

證明的完整代碼在GitHub中:

import Mathlib

/- In this file we are going to give some "epsilon-delta" proofs of facts about limits of functions on the real line. -/

/- First, we give the epsilon-delta definition of what it means for a function f : R -> R to converge to a limit L at a value x_0. -/

def limit (f : ? → ?) (L : ?) (x_0 : ?) : Prop :=
  ? ε > 0, ? δ > 0, ? x, |x - x_0| < δ → |f x - L| < ε

/-- First we show that if a function f converges to a limit L at x_0, and a function g converges to a limit M at x_0, then f+g converge to L+M at x_0. -/

lemma limit_add (f g : ? → ?) (L M : ?) (x_0 : ?) :
  limit f L x_0 → limit g M x_0 → limit (fun x => f x + g x) (L + M) x_0 := by
  intro h1 h2 ε hε
  -- Use ε/2 for each function
  have hε2 : 0 < ε / 2 := half_pos hε
  rcases h1 (ε / 2) hε2 with ?δ?, hδ?, h1'?
  rcases h2 (ε / 2) hε2 with ?δ?, hδ?, h2'?
  let δ := min δ? δ?
  use δ
  constructor
  · exact lt_min hδ? hδ?
  intro x hx
...

代碼地址:https://github.com/teorth/estimate_tools/blob/master/EstimateTools/test/limits.lean

有意思的是,大部分觀眾都覺得視頻做得很棒,不過不少網友都建議陶哲軒換個新麥克風,以消除回音。

AI只是副駕駛

在視頻的最后,陶哲軒總結道:當證明過程變得復雜時,不如回到最傳統的「人腦」方式——拿支筆在紙上把證明的思路和關鍵步驟理得清清楚楚,再去證明器里一步步形式化

Copilot更像是你的「得力助手」,適合在你已經大致知道證明方向時,幫你快速搞定那些重復的、格式化的工作。

它是個超強的輔助工具,但證明的策略、方向和最終驗證,還是得靠人類自己來把控。

參考資料:

https://www.youtube.com/watch?v=c1ixXMtmfS8

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
平野美宇因過度換氣癥狀暈倒并被送往醫院,將暫退日本隊集訓

平野美宇因過度換氣癥狀暈倒并被送往醫院,將暫退日本隊集訓

懂球帝
2025-05-23 19:35:12
空軍司令員于振武

空軍司令員于振武

汲古知新
2025-05-23 14:40:07
外交部:中國和荷蘭在半導體領域互補性強 雙方將通過現有渠道保持密切溝通

外交部:中國和荷蘭在半導體領域互補性強 雙方將通過現有渠道保持密切溝通

每日經濟新聞
2025-05-23 17:08:58
廣州機場航班大面積延誤 成都兩場已有20多個往返航班受影響

廣州機場航班大面積延誤 成都兩場已有20多個往返航班受影響

錦觀新聞
2025-05-23 16:17:05
破天荒!惠州一樓盤業主表決通過,降低物業費、取消公攤費等決議

破天荒!惠州一樓盤業主表決通過,降低物業費、取消公攤費等決議

火山詩話
2025-05-23 14:19:28
以色列踢到鐵板,向中國外交官鳴槍,我外交部給以色列立兩條規矩

以色列踢到鐵板,向中國外交官鳴槍,我外交部給以色列立兩條規矩

削桐作琴
2025-05-23 16:54:15
朱媛媛的爸爸媽媽念女心切,媛媛竟與媽媽如此相像!

朱媛媛的爸爸媽媽念女心切,媛媛竟與媽媽如此相像!

悠閑歷史
2025-05-23 17:55:44
郎朗和他老婆生圖曝光,吉娜好滄桑啊,這黑眼圈和法令紋太明顯了

郎朗和他老婆生圖曝光,吉娜好滄桑啊,這黑眼圈和法令紋太明顯了

陳意小可愛
2025-05-23 11:14:37
知名大學院士校長在“祖國母親在召喚”雕像內死亡,終年69歲

知名大學院士校長在“祖國母親在召喚”雕像內死亡,終年69歲

雙一流高校
2025-05-23 18:20:11
和訊投顧李永熙:尾盤大跳水的真兇!

和訊投顧李永熙:尾盤大跳水的真兇!

和訊網
2025-05-23 15:56:47
88年一女子花20萬買上海浦東一塊地皮,23年后,得知價格她懵了

88年一女子花20萬買上海浦東一塊地皮,23年后,得知價格她懵了

紅豆講堂
2025-05-21 14:50:06
國防部強勢發聲,藏南屬中國!兩天不到,順勢邁出了收復第一步

國防部強勢發聲,藏南屬中國!兩天不到,順勢邁出了收復第一步

一個有靈魂的作者
2025-05-23 10:00:39
當年舉報畢福劍的那位告密者張清:眾叛親離,過得好慘

當年舉報畢福劍的那位告密者張清:眾叛親離,過得好慘

新興網評
2024-12-11 21:02:46
中央要求“工作餐禁煙酒”,釋放了什么信號?

中央要求“工作餐禁煙酒”,釋放了什么信號?

中國新聞周刊
2025-05-23 11:19:18
吳彥祖談“收手吧阿祖”網絡爆火,回應“帥哥變老”:非常享受50歲的自己

吳彥祖談“收手吧阿祖”網絡爆火,回應“帥哥變老”:非常享受50歲的自己

魯中晨報
2025-05-22 18:48:21
今后再無布丁連線,哈蘭德連發17張合照致敬德布勞內

今后再無布丁連線,哈蘭德連發17張合照致敬德布勞內

懂球帝
2025-05-23 16:47:26
東莞一奔馳車司機別停前車后用高爾夫球桿狂砸擋風玻璃被刑拘?當地警方回應

東莞一奔馳車司機別停前車后用高爾夫球桿狂砸擋風玻璃被刑拘?當地警方回應

上游新聞
2025-05-23 13:43:02
南京夫妻生下黑人寶寶,7次鑒定都是親生,妻子無奈痛哭說出真相

南京夫妻生下黑人寶寶,7次鑒定都是親生,妻子無奈痛哭說出真相

蕭竹輕語
2025-05-20 16:58:49
貝索斯55歲準新娘“擠進”人魚裙,險遭尷尬,關注氣候卻被批虛偽

貝索斯55歲準新娘“擠進”人魚裙,險遭尷尬,關注氣候卻被批虛偽

譯言
2025-05-23 11:18:49
你是怎么知道朋友家超有錢的?網友:她說家里有一架300萬的鋼琴

你是怎么知道朋友家超有錢的?網友:她說家里有一架300萬的鋼琴

娛樂圈人物大賞
2025-05-16 00:15:07
2025-05-23 21:35:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
12752文章數 66041關注度
往期回顧 全部

科技要聞

特朗普:iPhone不在美國制造就收25%關稅

頭條要聞

媒體:軍艦在金正恩眼前出事 其雖盛怒但未必會下重手

頭條要聞

媒體:軍艦在金正恩眼前出事 其雖盛怒但未必會下重手

體育要聞

全國游泳冠軍賽進行7天 潘展樂收獲7金

娛樂要聞

趙麗穎否認戀情,與趙德胤沒在一起?

財經要聞

美債英債日債暴跌 全世界陷入債務反思?

汽車要聞

續航720km/充電10分鐘補能500公里 理想i8信息曝光

態度原創

本地
家居
藝術
親子
旅游

本地新聞

巴黎沒有倍兒甜,但天津巧克力腦袋倍兒多

家居要聞

輕奢品質 開闊的三口之家

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

親子要聞

人類幼崽第一次春游!

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 成都市| 盘山县| 景宁| 罗甸县| 大埔区| 潜山县| 水富县| 大城县| 娱乐| 杭锦旗| 汝州市| 永胜县| 永川市| 河南省| 婺源县| 阿拉尔市| 乌海市| 库伦旗| 镇雄县| 林州市| 迁安市| 东乡| 曲麻莱县| 巴青县| 巴南区| 余干县| 阿图什市| 怀化市| 洞头县| 三河市| 吴旗县| 三门峡市| 南陵县| 晋中市| 余庆县| 政和县| 大同县| 香格里拉县| 集贤县| 江华| 南通市|