智東西
編譯 金碧輝
編輯 程茜
智東西6月16日消息,據(jù)外媒New Atlas 6月14日報道,美國加州大學(xué)戴維斯分校(UC Davis)研究團(tuán)隊(duì)開發(fā)世界首例新型腦機(jī)接口(BCI)系統(tǒng),首次讓一名ALS患者(肌萎縮側(cè)索硬化癥,俗稱漸凍癥)通過腦內(nèi)植入設(shè)備,不僅實(shí)現(xiàn)實(shí)時說話,還能“演唱”簡單旋律,從信號采集到語音生成的全流程僅需10毫秒。
這里的“演唱”是指患者并非通過傳統(tǒng)聲帶發(fā)聲,而是通過BCI系統(tǒng)將神經(jīng)信號轉(zhuǎn)化為電子合成音,輸出三個預(yù)設(shè)音高的旋律片段。這種“演唱”本質(zhì)是系統(tǒng)對患者神經(jīng)意圖的解析與語音合成,有別于自然歌唱行為。
新研發(fā)的BCI系統(tǒng)通過手術(shù)植入的四組微電極陣列,捕捉大腦負(fù)責(zé)語言輸出區(qū)域的神經(jīng)信號,結(jié)合低延遲處理與AI解碼模型,將患者試圖說話時的肌肉控制信號轉(zhuǎn)化為語音,并通過語音克隆算法還原其患病前的聲音特征。
從信號采集到語音生成的全流程僅需10毫秒,加州大學(xué)戴維斯分校研究團(tuán)隊(duì)開發(fā)的新型BCI系統(tǒng)使患者能自然參與對話,甚至打斷他人發(fā)言,這是傳統(tǒng)BCI系統(tǒng)難以實(shí)現(xiàn)的交互體驗(yàn)。
▲BCI設(shè)置和使用語音合成技術(shù)的研究參與者
相關(guān)研究成果6月11日發(fā)表于學(xué)術(shù)頂刊Nature上,美國加州大學(xué)戴維斯分校研究團(tuán)隊(duì)最新研發(fā)的BCI系統(tǒng)被學(xué)界稱為“Speech BCI領(lǐng)域的圣杯”。
▲美國加州大學(xué)戴維斯分校研究團(tuán)隊(duì)研發(fā)BCI系統(tǒng)的相關(guān)成果發(fā)表于學(xué)術(shù)頂刊Nature上
論文地址:
https://www.nature.com/articles/d41586-025-01818-1
一、神經(jīng)信號捕捉與低延遲處理雙突破,漸凍癥患者說話“零卡頓”
據(jù)外媒New Atlas 6月14日報道,戴維斯分校研究團(tuán)隊(duì)開發(fā)的新型BCI系統(tǒng)的核心在于通過植入大腦運(yùn)動皮層的微電極陣列,直接獲取患者試圖說話時的神經(jīng)活動信號。
不同于“讀心術(shù)”,新型BCI系統(tǒng)的原理是翻譯患者大腦控制發(fā)音肌肉的指令,而非讀取抽象思維。AI驅(qū)動的解碼模型經(jīng)過訓(xùn)練,能實(shí)時將神經(jīng)信號轉(zhuǎn)化為文本,再通過語音合成器輸出。
▲研究參與者閱讀屏幕文本的神經(jīng)信號有助于訓(xùn)練AI解碼器模型
二、從“屏幕選詞”到“自發(fā)插話”,新型BCI系統(tǒng)讓“說話”更像真人
據(jù)外媒New Atlas報道,今年4月,美國加州大學(xué)伯克利分校與舊金山分校曾公布類似BCI技術(shù),但美國加州大學(xué)戴維斯分校的研究團(tuán)隊(duì)研發(fā)的BCI系統(tǒng)在自然表達(dá)維度實(shí)現(xiàn)突破。
在前沿交互能力的展現(xiàn)上,加州大學(xué)戴維斯分校研發(fā)的BCI系統(tǒng)不僅能捕捉患者發(fā)音時的“啊”、“哦”、“嗯”等語氣詞,還可借助神經(jīng)信號解析陳述句與疑問句句調(diào)差異,甚至能對單詞重音位置進(jìn)行識別。
據(jù)外媒報道,從加州大學(xué)戴維斯分校研究團(tuán)隊(duì)的系統(tǒng)演示視頻透露,患者可通過設(shè)備輸出三個預(yù)設(shè)音高的旋律片段,其AI解碼器突破傳統(tǒng)訓(xùn)練數(shù)據(jù)限制,成功處理生造詞匯的語音合成。
相較于過往BCI系統(tǒng)僅能輸出預(yù)設(shè)文本,加州大學(xué)戴維斯分校研究團(tuán)隊(duì)技術(shù)在自然語言情感表達(dá)與語義靈活性上實(shí)現(xiàn)實(shí)質(zhì)提升。
三、腦機(jī)接口克隆患者原聲實(shí)現(xiàn)連續(xù)對話,漸凍癥患者率先受益
加州大學(xué)戴維斯分校研發(fā)的BCI系統(tǒng)的一大亮點(diǎn)是通過患者患病前的語音樣本訓(xùn)練克隆算法實(shí)現(xiàn)個性化語音合成。
該論文的作者、神經(jīng)科學(xué)家謝爾蓋·斯塔維斯基(Sergey Stavisky)在論文發(fā)表同期接受多家外媒采訪時透露:“即時語音合成技術(shù)能讓患者更自然地融入對話,減少因傳統(tǒng)BCI系統(tǒng)延遲導(dǎo)致的交流中斷。”
荷蘭馬斯特里赫特大學(xué)的計算神經(jīng)科學(xué)家克里斯蒂安·赫夫(Christian Herff)在學(xué)術(shù)頂刊Nature同期評論中評價道:“這是真正的自發(fā)連續(xù)語音,BCI終于從實(shí)驗(yàn)室走向現(xiàn)實(shí)溝通。”
目前加州大學(xué)戴維斯分校的研究雖僅涉及1名ALS患者,但團(tuán)隊(duì)已計劃招募更多因中風(fēng)、腦損傷等不同病因?qū)е率дZ的患者,以驗(yàn)證技術(shù)的普適性。
在外媒看來,這一成果標(biāo)志著BCI從“文字輸出”向“自然語音交互”的跨越,為全球千萬癱瘓患者帶來更具尊嚴(yán)的溝通方式。
結(jié)語:腦機(jī)接口技術(shù)突破背后,BCI設(shè)備成本與普及性成挑戰(zhàn)
加州大學(xué)戴維斯分校的研究突破可能為全球約30萬漸凍癥患者及其他神經(jīng)退行性疾病患者帶來希望。或許未來,漸凍癥患者能像常人一樣打斷對話、用語氣表達(dá)情緒,但技術(shù)落地仍需跨越多重關(guān)卡。單病例研究的局限性、不同患者大腦信號的個體差異、長期植入的安全性,以及AI模型對復(fù)雜語境的適應(yīng)性,均需后續(xù)研究驗(yàn)證。
此外,BCI設(shè)備的成本與普及性也是現(xiàn)實(shí)挑戰(zhàn)。當(dāng)這項(xiàng)技術(shù)從頂尖實(shí)驗(yàn)室走向臨床,或許還需要5到10年的迭代。然而,從伯克利分校的屏幕選詞到美國加州團(tuán)隊(duì)的實(shí)時歌唱,腦機(jī)接口正以肉眼可見的速度突破邊界。正如赫夫所言:“這不是概念,而是真實(shí)的、自發(fā)的語言重生。”
來源:Nature、New Atlas
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.