撰文丨王聰
編輯丨王多魚
排版丨水成文
腦機接口(Brain–computer interface,BCI)有可能為因神經系統疾病(例如漸凍癥)或損傷而喪失說話能力的人恢復交流能力。腦機接口已被用于將試圖說話時的大腦神經活動解碼并轉化為文字。然而,文字交流無法捕捉人類言語中的細微差別,比如語調以及即刻聽到自己聲音的感覺。
而最近,一項臨床試驗結果顯示,BrainGate 公司開發的腦機接口(BCI)首次真正實現了幫助癱瘓者“說話”——將大腦中的想法實時轉化為語言,有感情的說出來,甚至還能唱歌。
該研究于 2025 年 6 月 12 日發表于 國際頂尖學術期刊Nature,論文題為: An instantaneous voice-synthesis neuroprosthesis ,論文作者來自加州大學戴維斯分校。
該研究利用植入式腦機接口(BCI) ,結合 低延遲處理和 AI 驅動的解碼模型,將一位已癱瘓的漸凍癥(ALS) 患者大腦中的神經活動轉化為語言,并通過揚聲器實時合成并輸出(僅延遲 8.5 毫秒),從而幫助他實現流暢、且有感情地“說話甚至唱歌”。
研究團隊將腦機接口(BCI)植入到一名已經幾乎完全失去發音能力的漸凍癥(ALS)患者的大腦,通過 256 個微電極記錄負責語言運動功能的腹側中央前回的神經活動,并實時合成語音,通過閉環音頻反饋進行調整,克服了訓練神經解碼器時缺乏真實語音的難題,成功準確合成了他的聲音。除了語音內容,研究團隊還從大腦神經活動中解碼出了副語言特征,使患者能夠實時調節其腦機接口合成的聲音,從而改變語調并哼唱簡短的旋律。這項臨床研究表明,通過腦機接口讓癱瘓者清晰且富有感情地說話是可行的。
這名因漸凍癥而幾乎完全喪失了說話能力的男性參與了在加州大學戴維斯分校健康中心進行的名為 BrainGate2 的腦機接口臨床試驗。研究團隊給他植入了一個實驗性的腦機接口(BCI)。該腦機接口由四個微電極陣列組成,通過手術植入負責產生語言的大腦區域——腹側中央前回。這些微電極記錄大腦中神經元的活動,并將其發送到計算機,計算機對信號進行解碼以重建他的聲音(合成的音色跟他本人的聲音很像)。
要想將大腦中想法實時合成語音,其主要障礙在于,無法確切知曉失語者試圖說話的具體時間和方式。在這項研究中,研究團隊開發了基于人工智能(AI)的算法,能夠將神經活動映射到每個時刻的預期聲音。這使得合成語音的細微差別成為可能,并讓使用者能夠控制其腦機接口語音的節奏。
因此,該腦機接口能夠將使用者的神經活動信號迅速轉化為通過揚聲器播放的可聽語音,整個過程僅需幾十分之一秒。這種短暫的延遲與人們正常說話并聽到自己聲音時的延遲相當。此外,該技術還允許參使用說出新詞匯(系統之前未錄入的詞匯)以及發出預期感嘆詞,能夠調節生成的電腦語音的語調來發出疑問句,或在句子中強調特定的詞,使用者還能夠唱出簡單的旋律。測試結果顯示,使用者通過腦機接口合成的聲音通常能讓人聽懂,聽眾能夠正確理解約 60% 的詞,而沒使用腦機接口時,這一比例僅為 4%。
之所以能夠將使用者的大腦神經活動實時轉化為合成語音,得益于先進的人工智能(AI)算法,該算法是通過參與者在電腦屏幕上看到句子并嘗試說出這些句子時所收集的大腦神經信號數據進行訓練的。大腦中植入的電極測量了數百個神經元的放電模式,研究團隊將這些模式與使用者當時試圖發出的語音相對齊,從而讓算法從其大腦神經信號中準確地重建聲音。
研究團隊表示,聲音是我們身份的一部分,對于患有神經系統疾病的人來說,失去說話能力是一個毀滅性的打擊。而這項臨床研究為那些想說話卻失去能力的人帶來了希望,研究結果展示了如何讓一位癱瘓失語者借助合成的自己聲音來說話,這種技術可能會給他們的生活帶來變革。
論文鏈接:
https://www.nature.com/articles/s41586-025-09127-3
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.