摘要
近年來(lái),神經(jīng)形態(tài)計(jì)算(neuromorphic computing)逐漸成為研究熱點(diǎn),它利用尖峰神經(jīng)網(wǎng)絡(luò)(Spiking Neural Networks, SNNs)進(jìn)行高效節(jié)能的計(jì)算。然而,由于尖峰信號(hào)的離散特性,傳統(tǒng)的梯度下降法難以實(shí)現(xiàn)高效的學(xué)習(xí)。本文介紹了一種新的尖峰神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法,通過(guò)光滑精確的梯度下降來(lái)避免尖峰信號(hào)的突然變化。
關(guān)鍵詞:尖峰神經(jīng)網(wǎng)絡(luò),梯度下降,偽尖峰,神經(jīng)形態(tài)計(jì)算,二次積分-發(fā)放神經(jīng)元模型
論文題目:Smooth Exact Gradient Descent Learning in Spiking Neural Networks 論文 地址:https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.134.027301 期刊名稱:Physical Review Letters
非擾動(dòng)尖峰動(dòng)態(tài)
傳統(tǒng)的尖峰神經(jīng)網(wǎng)絡(luò)難以處理尖峰信號(hào)的出現(xiàn)和消失,因?yàn)檫@些變化往往是不可預(yù)測(cè)的。為了解決這一問(wèn)題,研究者提出使用二次積分-發(fā)放(Quadratic Integrate-and-Fire, QIF)神經(jīng)元模型。該模型通過(guò)將尖峰信號(hào)的出現(xiàn)和消失限制在實(shí)驗(yàn)結(jié)束時(shí),使得網(wǎng)絡(luò)的尖峰時(shí)間隨著參數(shù)變化而平滑變化。這種方法允許精確的梯度下降學(xué)習(xí),并能系統(tǒng)地增加或刪除尖峰信號(hào)。
圖 1. 擾動(dòng)和非擾動(dòng)尖峰形態(tài)。(a),(b),(d) 在試驗(yàn)過(guò)程中,LIF神經(jīng)元的峰值時(shí)間可能出現(xiàn)中斷。(a),(c),(d) QIF神經(jīng)元的峰值時(shí)間僅在試驗(yàn)結(jié)束時(shí)無(wú)擾動(dòng)地出現(xiàn),其他時(shí)間隨參數(shù)的變化而連續(xù)變化。左列:一個(gè)神經(jīng)元接收到一個(gè)單一的輸入,其權(quán)重增加(隨著飽和度的增加而增加)。右列:神經(jīng)元接受興奮性和抑制性輸入,其到達(dá)時(shí)間被移動(dòng)到更大的時(shí)間。
偽動(dòng)態(tài)與偽尖峰
為了實(shí)現(xiàn)尖峰信號(hào)的系統(tǒng)增加,研究者引入了偽動(dòng)態(tài)(pseudodynamics)和偽尖峰(pseudospikes)的概念。通過(guò)在普通尖峰之間加入偽尖峰,網(wǎng)絡(luò)可以在學(xué)習(xí)初期保持活躍,避免“死神經(jīng)元”現(xiàn)象。這些偽尖峰與網(wǎng)絡(luò)參數(shù)連續(xù)相關(guān),并在學(xué)習(xí)過(guò)程中平滑轉(zhuǎn)換為普通尖峰,確保梯度的連續(xù)性。
圖 2. QIF神經(jīng)元的平滑梯度下降學(xué)習(xí)。(a)學(xué)習(xí)兩個(gè)輸入的權(quán)重和時(shí)間來(lái)調(diào)整前兩個(gè)輸出尖峰時(shí)間。(b)左:學(xué)習(xí)前,神經(jīng)元沒(méi)有尖峰。右圖:學(xué)習(xí)后,神經(jīng)元在期望的時(shí)間出現(xiàn)尖峰。(c)在學(xué)習(xí)過(guò)程中,偽尖峰時(shí)間平滑變化。(d)損失函數(shù)L的梯度分量在學(xué)習(xí)過(guò)程中不斷變化。學(xué)習(xí)進(jìn)度顯示為自學(xué)習(xí)開始以來(lái)輸出尖峰時(shí)間軌跡弧長(zhǎng)的函數(shù)
圖 3. 在RNN中學(xué)習(xí)精確的尖峰。(a)網(wǎng)絡(luò)示意圖。神經(jīng)元在每次試驗(yàn)中都接收到來(lái)自外部輸入神經(jīng)元的相同尖峰信號(hào)。學(xué)習(xí)了前兩個(gè)網(wǎng)絡(luò)神經(jīng)元的峰值時(shí)間。(b)學(xué)習(xí)前后網(wǎng)絡(luò)神經(jīng)元的尖峰。(c)學(xué)習(xí)過(guò)程中第一個(gè)神經(jīng)元的峰值時(shí)間軌跡。期望的峰值向目標(biāo)時(shí)間移動(dòng)。(d)與(c)相同,但尖峰時(shí)間顯示為輸出尖峰時(shí)間軌跡弧長(zhǎng)的函數(shù)。
實(shí)驗(yàn)驗(yàn)證與應(yīng)用
研究者通過(guò)多種任務(wù)驗(yàn)證了該方法的有效性,包括單個(gè)神經(jīng)元學(xué)習(xí)、遞歸神經(jīng)網(wǎng)絡(luò) (Recurrent Neural Networks, RNNs) 的訓(xùn)練,以及手寫數(shù)字識(shí)別任務(wù) (MNIST數(shù)據(jù)集) 的分類。實(shí)驗(yàn)結(jié)果表明,該方法不僅能使網(wǎng)絡(luò)從靜默狀態(tài)激活,并且在標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)任務(wù)中表現(xiàn)出較高的準(zhǔn)確性。特別是在遞歸神經(jīng)網(wǎng)絡(luò)中,利用偽尖峰可以有效地傳播誤差,確保網(wǎng)絡(luò)各層的神經(jīng)元參與學(xué)習(xí)。
圖 4. MNIST任務(wù)。(a)三層網(wǎng)絡(luò)尖峰柵格圖。左:學(xué)習(xí)前的沉默神經(jīng)元。右:學(xué)習(xí)后的稀疏尖峰。(b)學(xué)習(xí)后輸出神經(jīng)元的電壓動(dòng)態(tài);(c)分類誤差動(dòng)態(tài)。在測(cè)試期間也使用偽峰值在早期訓(xùn)練中產(chǎn)生較小的測(cè)試錯(cuò)誤。
結(jié)論與展望
本文展示的研究證明了即便是具有離散尖峰特性的神經(jīng)網(wǎng)絡(luò),也可以通過(guò)精確的梯度下降實(shí)現(xiàn)平滑的學(xué)習(xí)。這種方法不僅為生物神經(jīng)網(wǎng)絡(luò)的研究提供了新工具,也為神經(jīng)形態(tài)計(jì)算開辟了新的應(yīng)用前景。未來(lái)的研究可以探索更多具有連續(xù)尖峰時(shí)間特性的神經(jīng)元模型,以進(jìn)一步提升學(xué)習(xí)算法的穩(wěn)定性和效率。
彭晨| 編譯
關(guān)于集智俱樂(lè)部
集智俱樂(lè)部成立于 2003 年,是一個(gè)從事學(xué)術(shù)研究、享受科學(xué)樂(lè)趣的探索者的團(tuán)體,也是國(guó)內(nèi)最早的研究人工智能、復(fù)雜系統(tǒng)的科學(xué)社區(qū)。它倡導(dǎo)以平等開放的態(tài)度、科學(xué)實(shí)證的精神,進(jìn)行跨學(xué)科的研究與交流,力圖搭建一個(gè)中國(guó)的 “ 沒(méi)有圍墻的研究所 ”。集智科學(xué)研究中心(民間企業(yè))是集智俱樂(lè)部的運(yùn)營(yíng)主體,長(zhǎng)期運(yùn)營(yíng)社區(qū)生態(tài),催化理論創(chuàng)新。使命:營(yíng)造跨學(xué)科探索小生境,催化復(fù)雜性科學(xué)新理論。
計(jì)算神經(jīng)科學(xué)讀書會(huì)
人類大腦是一個(gè)由數(shù)以百億計(jì)的神經(jīng)元相互連接所構(gòu)成的復(fù)雜系統(tǒng),被認(rèn)為是「已知宇宙中最復(fù)雜的物體」。本著促進(jìn)來(lái)自神經(jīng)科學(xué)、系統(tǒng)科學(xué)、信息科學(xué)、物理學(xué)、數(shù)學(xué)以及計(jì)算機(jī)科學(xué)等不同領(lǐng)域,對(duì)腦科學(xué)、類腦智能與計(jì)算、人工智能感興趣的學(xué)術(shù)工作者的交流與合作,集智俱樂(lè)部聯(lián)合國(guó)內(nèi)外多所知名高校的專家學(xué)者發(fā)起神經(jīng)、認(rèn)知、智能系列讀書會(huì)第三季——,涵蓋復(fù)雜神經(jīng)動(dòng)力學(xué)、神經(jīng)元建模與計(jì)算、跨尺度神經(jīng)動(dòng)力學(xué)、計(jì)算神經(jīng)科學(xué)與AI的融合四大模塊,并希望探討計(jì)算神經(jīng)科學(xué)對(duì)類腦智能和人工智能的啟發(fā)。讀書會(huì)已完結(jié),現(xiàn)在報(bào)名可加入社群并解鎖回放視頻權(quán)限。
詳情請(qǐng)見:
1.
2.
3.
4.
5.
6.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.