5月17日,由搜狐主辦的2025搜狐科技年度論壇在北京盛大開幕。多位院士、科學(xué)家與產(chǎn)業(yè)界人士齊聚一堂,激發(fā)智慧的深度碰撞,奔赴科技的星辰大海。
本屆論壇線上線下結(jié)合,開啟全天的思想盛宴。在上午的線上直播中,杜克大學(xué)電氣與計(jì)算機(jī)工程系John Cocke 杰出教授陳怡然發(fā)表了題為《大模型對硅谷教育的影響》的演講。
在人工智能迅猛發(fā)展的當(dāng)下,大型語言模型(LLMs)正以前所未有的速度介入教育現(xiàn)場。杜克大學(xué)陳怡然教授在搜狐科技峰會(huì)的演講中,通過多個(gè)親身教學(xué)與科研實(shí)例,深入解析了大模型對教育結(jié)構(gòu)性變革的推動(dòng)力,特別是在計(jì)算機(jī)工程等技術(shù)學(xué)科中的應(yīng)用潛力。
他指出,自ChatGPT面世以來,短短不到三年,大模型從只能生成模糊的行為描述,到可以自動(dòng)完成Verilog硬件設(shè)計(jì)、理解狀態(tài)機(jī)圖乃至實(shí)現(xiàn)軟硬件一體化系統(tǒng),能力呈指數(shù)級增長。這種多模態(tài)(Multi-modality)的演進(jìn),不僅在工程教育中解放了基礎(chǔ)重復(fù)勞動(dòng),更挑戰(zhàn)了傳統(tǒng)的教學(xué)目標(biāo)與人才培養(yǎng)路徑。
陳怡然也同時(shí)提出問題:在大模型智力水平迅速逼近甚至超過人類工程師的當(dāng)下,初級工程崗位逐漸被模型取代,大學(xué)教育若仍以“培養(yǎng)初級工程師”為目標(biāo),恐將失去現(xiàn)實(shí)立足點(diǎn)。未來的教育應(yīng)如何轉(zhuǎn)型,是否要直接培養(yǎng)“能與AI協(xié)同工作”的高級人才?這成為高校必須面對的核心議題。
以下為演講全文:
大家好,我是杜克大學(xué)陳怡然,非常高興有這個(gè)機(jī)會(huì)接受搜狐科技峰會(huì)的邀請跟大家做分享。我今天分享的題目是“大模型對于教育的影響”。
大模型對于教育的影響一直是一個(gè)很有趣的問題。大家都知道,我們現(xiàn)在生活在一個(gè)大模型的時(shí)代。從2022年11月份開始,從Chat GPT 3.5發(fā)布到最近,也就大概兩年半左右的時(shí)間,我們經(jīng)歷了很多代大模型的迭代,也有很多開源的大模型被release出來。這里是一些大家比較熟悉的大模型,包括最近像Deep Seek、Mini Max,在國內(nèi)也都有比較大的影響力。
那么究竟大模型對于教育本身的影響是什么樣子呢?早在大模型一開始,實(shí)大家就對這個(gè)問題有過比較深入的討論。這是一篇2024年發(fā)表的文章,它探討了大模型對高等教育的影響,列舉了大概七個(gè)方向,比如說對創(chuàng)造力、解決問題能力的改進(jìn),對個(gè)性化學(xué)習(xí)的影響,包括效率的提高等等。有些方面效果很明顯,比如效率的提升幾乎是可以肯定的;但有些方面就比較有挑戰(zhàn)性,比如更好地去做設(shè)計(jì)、更好地去做練習(xí),現(xiàn)在的AI還可能不能完全達(dá)到大家預(yù)期的效果。
但無論如何,大模型對于科研或教育的討論一直是熱門話題,這當(dāng)然也是我們在杜克大學(xué)正在討論的一個(gè)重點(diǎn)。我這里給大家舉一個(gè)簡單的例子,實(shí)際上是我們課堂上的一個(gè)例子,用大模型來做硬件設(shè)計(jì)。
對于不熟悉的朋友,我簡單介紹一下這是什么意思。我們都知道,如果我們要設(shè)計(jì)一個(gè)芯片或一個(gè)硬件,不能真的用手來畫,因?yàn)橐?guī)模太大了,我們需要一些工具來幫助我們自動(dòng)化這個(gè)過程。
Verilog其實(shí)就是這樣一種編程語言,它可以描述硬件的行為,甚至是設(shè)計(jì)一些非常細(xì)節(jié)的東西,讓工具能夠提取信息,進(jìn)而實(shí)現(xiàn)自動(dòng)化設(shè)計(jì)。
下面這兩張圖是一個(gè)常見的操作——兩個(gè)矩陣相乘:A乘上B等于C。比如說,一個(gè)3×5的矩陣乘以一個(gè)3×3的矩陣,結(jié)果是一個(gè)4×5的矩陣。在這個(gè)過程中,你可以定義每一個(gè)點(diǎn),比如說它是一個(gè)浮點(diǎn)運(yùn)算、乘法、加法,例如A乘上B等于C,再加上一個(gè)D等等。這些操作我們通常用Verilog語言來描述并交給工具來設(shè)計(jì)。
2022年3月,我們就做了這樣的嘗試。那個(gè)時(shí)候雖然也是大模型,但現(xiàn)在看已經(jīng)不算很大了。我們嘗試用這個(gè)模型,訓(xùn)練它一些語言學(xué)、編程語言等相關(guān)知識,然后讓它去生成我們想要的設(shè)計(jì)代碼,比如說“A乘B等于C,再加上D”的這樣的設(shè)計(jì)。
當(dāng)時(shí)的結(jié)果就是,它基本只能給出行為描述,不能生成具體的設(shè)計(jì)代碼。它告訴你,先定義3個(gè)參數(shù),輸入是A和B,輸出是C,然后用浮點(diǎn)乘法來計(jì)算A乘以B,最后加上D等等,是一種很high-level的描述,不太可能直接用于真實(shí)的硬件設(shè)計(jì)。
大家記住這個(gè)時(shí)間點(diǎn):2022年3月。一年之后,我們又做了一個(gè)實(shí)驗(yàn),這時(shí)候已經(jīng)有了GPT-3.5。
這大家很熟悉了,這是一個(gè)劃時(shí)代的產(chǎn)品。我們再次讓它寫代碼,結(jié)果就好了很多。有注釋,有帶寬說明,比如32bit,浮點(diǎn)運(yùn)算定義也更清晰。它定義了兩個(gè)輸入A和B,也設(shè)定了輸出C的寬度,整個(gè)代碼看起來就已經(jīng)很像樣了。它描述了矩陣相乘的過程,把每一個(gè)元素拿出來做1×1的加法,最后得到結(jié)果。整個(gè)過程是比較詳細(xì)的。
但這還不能用于真實(shí)的硬件設(shè)計(jì),它只是一個(gè)詳細(xì)的操作層面上的語言描述。
同年,也就是2023年,我們又嘗試了一次,這時(shí)候GPT-4發(fā)布了。我們再讓它寫一次代碼,發(fā)現(xiàn)它變得更加詳細(xì)了。它加入了四個(gè)參數(shù),帶寬是32bit,還有時(shí)鐘信息,用于同步設(shè)計(jì);還有RESET信號,就是重置信號,如果算錯(cuò)了,可以歸零等等。它還有for loop的結(jié)構(gòu),針對每一個(gè)元素通過index做循環(huán)。設(shè)計(jì)語言的選擇也更合理了。
這些變化僅僅發(fā)生在一年零八個(gè)月的時(shí)間內(nèi)。現(xiàn)在它還能做什么呢?
如果你能把你想要做的事情畫成圖,我們稱之為“狀態(tài)機(jī)”(state machine),它可以讀懂這個(gè)圖,然后用硬件語言來描述它,實(shí)現(xiàn)出來。
比如左邊是一張狀態(tài)機(jī)圖,它就可以理解你這個(gè)時(shí)鐘是怎樣的、RESET信號如何觸發(fā),從一個(gè)信號到另一個(gè)信號的轉(zhuǎn)換,然后把整個(gè)過程寫出來。這就非常厲害了,因?yàn)樗梢栽谝粋€(gè)時(shí)鐘域、時(shí)間域上完成表達(dá),實(shí)現(xiàn)從一個(gè)狀態(tài)到另一個(gè)狀態(tài)的動(dòng)態(tài)設(shè)計(jì)。
這種能力的學(xué)名叫“Multi-modality”,也就是多模態(tài)理解。從前只有人能讀這些設(shè)計(jì)圖,現(xiàn)在大模型也能讀懂,這是一個(gè)非常厲害的創(chuàng)新。
最近有一篇文章,我引用的是港科大李墨(音)老師的文章,說可以用大模型設(shè)計(jì)整個(gè)硬件系統(tǒng)。什么意思呢?比如說你有一些醫(yī)療數(shù)據(jù)設(shè)備、傳感器,然后告訴模型你要讀哪種數(shù)據(jù)、怎么處理,再怎么把它寫入硬件平臺,最后得到結(jié)果,整套系統(tǒng)現(xiàn)在都可以嘗試用大模型去實(shí)現(xiàn)。
這就非常厲害了。也就是說,如果老板告訴你要干什么事,只要用普通語言把任務(wù)說清楚,模型就能分解成多個(gè)子任務(wù),再用通用大模型逐步實(shí)現(xiàn),最后產(chǎn)出一個(gè)完整的軟硬件結(jié)合系統(tǒng)。
那以后做項(xiàng)目就很容易了——老板描述清楚,模型自動(dòng)生成方案并實(shí)現(xiàn)它。
2024年4月19號,有人發(fā)表了一篇文章,在Maxim Choose上面講說,現(xiàn)在的大模型在智商測試中的表現(xiàn),2024年時(shí)平均智商還在90-100之間,到了2025年,很多大模型的智商已經(jīng)突破了130、140。這個(gè)水平在人群中大概是前5%、2%、甚至1%的人群。
這就很厲害了,這意味著我們?nèi)丝赡芏疾恍枰獏⑴c了,只要靠大模型就能把事情做得更好。而且它是多才多藝的,只要你能把任務(wù)說清楚,它什么都能做。
這是我最后一張Slide,我要講的是,大模型在計(jì)算機(jī)教育中扮演的角色越來越重要,而且發(fā)展速度非常快。
我們?nèi)祟愑昧舜蟾?00萬年才發(fā)展到現(xiàn)在的智力水平,現(xiàn)在的大模型幾個(gè)月就從IQ 80飆升到130了,未來還會(huì)繼續(xù)提升。這對教育意味著什么?我們現(xiàn)在還不知道。
現(xiàn)在初級計(jì)算機(jī)工程師的工作已經(jīng)變得非常容易,模型基本上都能做。也就是說,我們可能只需要非常資深的工程師與AI協(xié)作工作。
但問題是,如果我們不培養(yǎng)初級工程師,那將來哪來的資深工程師?大學(xué)原來培養(yǎng)的是初級工程師,通過工作再逐步成長為資深工程師。現(xiàn)在我們發(fā)現(xiàn),原來想做的事AI都能做,那我們是否應(yīng)該直接培養(yǎng)資深人才?還是改換思路?
這對高等教育是一個(gè)巨大的挑戰(zhàn)。我們?nèi)绾斡舆@個(gè)挑戰(zhàn),如何應(yīng)對變革,是未來5到10年教育界必須思考和解決的問題。
我今天就講這么多,謝謝大家,希望未來還有機(jī)會(huì)繼續(xù)交流。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.