近年來,伴隨腦機(jī)接口(BCI)技術(shù)的不斷發(fā)展,“依靠大腦植入物將大腦信號直接轉(zhuǎn)化為語言”這樣科幻的場景早已成為現(xiàn)實。但此類技術(shù)通常都存在一項難以解決的制約因素——存在很高的延遲。
畢竟自然的口頭交流通常是瞬間發(fā)生的,超過幾秒鐘的語音延遲會大大擾亂這一對話流程。這種制約會使得依賴這類技術(shù)的失語患者難以參與有意義的對話,從而產(chǎn)生孤立感和挫敗感。然而,如今在 AI 的幫助下,我們有望突破“高延遲”這一制約因素,切實幫助失語患者恢復(fù)自然交流的能力。
新聞詳情
3 月 31 日,發(fā)表于知名學(xué)術(shù)期刊《自然-神經(jīng)科學(xué)(Nature Neuroscience)》的一篇文章向我們揭示了這一突破性的研究成果。
來自美國加州大學(xué)的研究團(tuán)隊設(shè)計并使用了一種全新的深度學(xué)習(xí)循環(huán)神經(jīng)網(wǎng)絡(luò)傳感器 AI模型,幫助參與者的腦機(jī)接口設(shè)備實現(xiàn)大詞匯量、可理解的流暢語音合成,從而生成更接近自然對話的語音。
此次研究中被測試的參與者安(Ann),于 2005 年因腦干中風(fēng)而失去了說話能力。在 2023 年接受手術(shù)后,她的大腦皮層表面被放置了一片包含 253 個電極的超薄植入物——它可以同時記錄數(shù)千個神經(jīng)元的綜合活動。同時,研究人員還利用安婚禮視頻中的錄音訓(xùn)練 AI 模型,使其合成出的語音能夠模仿她失語前的音色。
植入電極的底座圖
在其最新的研究視頻中,安在 AI 模型的幫助下“念”出了屏幕上出現(xiàn)的 100 個句子,通過這一技術(shù),每分鐘可以生成約 47 到 90 個單詞(自然對話每分鐘大約產(chǎn)生 160 個單詞)。
在自然(Nature)官網(wǎng)報道這一研究的新聞文章中,將其評價為“朝著實用化的腦機(jī)接口邁出了一大步”。
背后故事
從馬斯克的 Neuralink 到與蘋果合作的 Synchron,腦機(jī)接口技術(shù)的每一次成果與突破都能引來不小的關(guān)注。近年來,中國在這一領(lǐng)域也取得了顯著的進(jìn)展。
3 月 4 日,復(fù)旦官網(wǎng)報道了其全球首創(chuàng)的“三合一”腦脊接口技術(shù),并在復(fù)旦大學(xué)附屬華山醫(yī)院成功實施了全球首批第 4 例通過腦脊接口讓癱瘓者重新行走的臨床概念驗證手術(shù)。
3 月 24 日,新華網(wǎng)報道了由中國自主研發(fā)的智能腦機(jī)系統(tǒng)“北腦一號”的首批無線人體全植入。這是國際上首批柔性高通量半侵入式無線全植入腦機(jī)系統(tǒng)的人體植入案例?;颊咝g(shù)后恢復(fù)良好,設(shè)備有效通道數(shù)達(dá)到 98% 以上。
或許不久后,失語者真的能像普通人一樣流暢“交談”。科技的意義,就是讓“不可能”變成“等一下,馬上就好”~
參考材料
1.https://www.nature.com/articles/s41593-025-01905-6
2.https://www.youtube.com/watch?v=GIdIIjIICYU&t=4s
3.https://www.nature.com/articles/d41586-025-01001-6
4.https://news.fudan.edu.cn/2025/0304/c1268a144336/page.htm
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.