99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

杭電腦機協同智能團隊:用于細粒度腦語義解碼的視覺引導雙空間交互網絡

0
分享至


近日,杭州電子科技大學腦機協同智能團隊最新研究成果“Visual guided Dual-spatial Interaction Network for Fine-grained Brain Semantic Decoding”論文發表在國際TOP學術期刊《IEEE Transactions on Instrumentation and Measurement》上。


文章鏈接:https://ieeexplore.ieee.org/document/10716707

大腦語義解碼在計算機視覺和神經科學領域備受關注,但現有粗粒度解碼工作往往忽視了大腦信號的稀疏性問題和深層次隱含語義解析挑戰,導致大腦解碼能力極大受限。為解決這一問題,本文提出了一種視覺引導的雙空間交互網絡(VDIN),通過多路徑視覺信息引導(包括文本和圖像),構建一種細粒度大腦語義解碼框架。具體而言,本文首先設計了局部雙空間交互模塊,借助包含豐富語義信息的文本感知空間,探索大腦與文本之間的顯式和隱式語義相關性。同時,該模塊利用更高分辨率的圖像感知空間,可以有效挖掘大腦與圖像之間的多層次語義相關性。在此基礎上,本文提出的全局雙空間交互模塊通過進一步整合并優化局部語義相關性,從而得到綜合且全面的全局綜合語義表征。這一方法增強了對視覺信息與大腦信號一致性及互補性的建模能力,從而為現有大腦語義解碼工作提供了一種可行和可借鑒的更加細粒度且具有更強表達力的大腦語義解碼新方案。

研究背景

在計算機視覺與神經科學領域,EEG(腦電圖)作為一種非侵入式測量方法,已廣泛應用于腦活動分析,特別是在視覺誘發腦活動的研究中。圖像作為視覺刺激材料能夠引發大腦的相應活動,這些活動通過EEG信號記錄下來,如圖1所示,EEG信號反映了大腦對視覺刺激的響應,進而可以被解碼模型用來提取語義信息。


圖1:視覺誘發大腦語義解碼任務

盡管腦電信號可以有效學習得到本征語義信息,對于人類的認知過程具有不可替代的價值,但是腦電感知空間的空間分辨率過低,只能通過隱式的方式學習得到較為抽象的語義信息,在極大程度上限制了對語義的深層次解析能力。相比于腦電信號,視覺信號的高分辨率感知空間則能夠從多個維度上解析得到豐富的顯式語義信息,但無法有效滿足現實場景中的復雜語義解析需求。因此,現有語義解碼工作的問題在于,如何結合腦電信號的本征語義解析優勢以及視覺信號的多維顯式語義解析優勢,利用視覺信號從多個維度充分引導和激發腦電信號的深層次、本征和綜合的語義解析能力,從而提升對于復雜任務的語義理解能力,同時使得未來基于AI的大腦語義解碼工作在一定程度上能夠擺脫采集設備和復雜框架設計的限制。

為了克服以上問題,本文提出了一種視覺引導的雙空間交互網絡(VDIN)。該方法通過結合文本和圖像的豐富多模態信息,在局部和全局兩個層次上和大腦信號進行綜合的細粒度語義交互。在局部交互層面上,本文聚焦于如何利用語義豐富的文本感知空間來高效探索大腦信號和文本模態之間的顯式和隱式耦合語義相關性,以及利用高分辨率圖像感知空間來探索大腦信號和圖像模態之間的多層次語義相關性。而全局交互模塊則將可以將局部語義信息進一步高效整合為更為綜合豐富的全局語義表征,從而得到一種細粒度的大腦和視覺聯合語義解碼方案。通過這種方法,即使EEG信號的通道較少,模型也能保持較高的魯棒性,突破了傳統方法的局限,為大腦語義解碼工作提供一種新的研究視角和解決方案。

研究方法

視覺引導的雙空間交互網絡(VDIN)通過視覺空間與大腦空間的緊密結合,實現了細粒度的大腦語義解碼。首先,對原始圖像采用文本描述方法得到對應的文本表示,并利用注意力機制提取顯式語義信息。接著,通過卷積神經網絡和位置嵌入構建得到高分辨率圖像表征空間。對于EEG信號,則采用深度可分離卷積提取時序和跨通道特征,獲得大腦空間的隱式語義信息。接著,通過視覺引導的局部語義耦合模塊,將高分辨率圖像表征空間和語義豐富文本表征空間與大腦感知空間進行多模態語義交互。最后,通過全局語義耦合模塊進一步整合局部語義相關性,從而增強大腦和視覺之間的語義一致性和互補性學習,從而突破大腦語義解碼的局限性以及提高大腦語義解碼的性能。


圖2:VDIN模型中的視覺空間與大腦空間雙空間交互操作

在訓練過程中同時進行視覺引導的局部雙空間交互過程和視覺引導的全局雙空間交互過程。整體模型訓練的損失函數由雙空間交互損失和分類損失組成。具體來說,視覺引導的局部交互損失和通過跨模態的語義耦合操作來學習視覺空間(圖像和文本)與大腦空間之間的語義相關性,從而優化大腦空間的表示。視覺引導的全局交互損失進一步整合視覺空間和文本空間中的顯性和多層次語義相關性,來優化大腦空間的語義表示。同時,分類損失基于模型預測和真實標簽之間的差異,使得模型進行更準確的分類。最終,模型的總損失對應于以下公式:

該訓練過程通過最小化整體損失來優化模型的學習,以實現更高效的跨模態語義解碼。

實驗分析

表1: EEGCVPR40數據集上的性能比較


本實驗采用了EEGCVPR40數據集來評估所提出的VDIN模型。該數據集包含六個參與者的EEG記錄(1000 Hz采樣頻率,128個EEG通道)和來自ImageNet的視覺刺激圖像(40類,每類50張圖像)。每個參與者在四個實驗中觀看500張圖像,每張圖像的展示時間為0.5秒,生成的EEG數據包含500個數據點(0.5秒 × 1000 Hz)。實驗結果表明,VDIN在所有頻帶(全頻帶、高伽馬、貝塔-伽馬)下均超過了EfficienNet-Network模型和EEGClip模型的實驗結果。VDIN在全頻帶對比實驗中相較于EfficienNet-Network模型提高了15.97%的性能。此外,為了進一步驗證模型的性能,我們通過5-fold、7-fold和10-fold交叉驗證對模型進行了評估。實驗結果表明,VDIN在10-fold交叉驗證下表現最佳。值得注意的是,在只包含69個或99個大腦信號通道數據的情況下,視覺引導下的大腦語義解碼結果仍顯著優于非視覺引導的大腦語義解碼。這表明視覺引導機制在低空間分辨率大腦信號數據(EEG數據)中的有效性。同時,VDIN在不同EEG頻帶和通道設置下均取得了優異的任務性能,進一步驗證了其在大腦和視覺的一致性和互補性分析方面的優勢。

結論

本文提出了一種新型的視覺引導雙空間交互網絡(VDIN),通過視覺語義空間的多層次和綜合引導,得到一種細粒度大腦語義解碼新方案。與現有方法相比,該方法利用文本空間中的豐富語義解析優勢,完成大腦和文本空間之間的顯式和隱性語義相關性提取;同時,借助了圖像空間的高分辨率優勢,高效完成大腦和圖像空間的多層次語義相關性挖掘。這種雙重引導機制顯著提升了大腦表征空間的深層次和本征語義的精準和高效解析能力。因此,所提出的視覺引導下的雙空間交互方法為AI驅動下的大腦精準語義解碼提供了新的解決方案,使得現有大腦語義解碼依賴于高效的視覺感知策略,而非復雜且冗余的架構設計。

作者:唐佳佳,楊宇濤,趙啟斌,丁彧,張建海,宋揚,孔萬增(通訊作者)

第一作者簡介:唐佳佳,博士,杭州電子科技大學講師,長期從事腦機交互,情感計算,多模態學習等方面的工作。

通訊作者簡介:孔萬增,博士,杭州電子科技大學二級教授,腦機協同智能技術(科技部)國際聯合研究中心副主任,浙江省腦機協同智能重點實驗室主任,校黨委委員、組織部部長,入選2023、2024年度全球前2%頂尖科學家榜單,谷歌學術引用超4500次,省萬人計劃科技創新領軍人才。長期從事人工智能與模式識別、嵌入式可穿戴計算、腦機交互與認知計算等方面的工作。

僅用于學術分享,若侵權請留言,即時刪侵!


歡迎加入腦機接口社區交流群,

探討腦機接口領域話題,實時跟蹤腦機接口前沿。

加微信群:

添加微信:RoseBCI【備注:姓名+行業/專業】。

歡迎來稿

1.歡迎來稿。投稿咨詢,請聯系微信:RoseBCI

點擊投稿:

2.加入社區成為兼職創作者,請聯系微信:RoseBCI

一鍵三連「分享」、「點贊」和「在看」

不錯過每一條腦機前沿進展

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
杰弗森:即使哈利伯頓拿了FMVP 步行者隊史最佳仍是雷吉-米勒

杰弗森:即使哈利伯頓拿了FMVP 步行者隊史最佳仍是雷吉-米勒

直播吧
2025-05-30 00:49:09
畢井泉被查,他被認為是中國藥審改革的關鍵人物

畢井泉被查,他被認為是中國藥審改革的關鍵人物

經濟觀察報
2025-05-29 23:29:04
小S慘遭孤立!吳宗憲拉攏臺娛圈卻對小S重拳出擊,灣灣網友發聲了

小S慘遭孤立!吳宗憲拉攏臺娛圈卻對小S重拳出擊,灣灣網友發聲了

鄭丁嘉話
2025-05-29 13:56:01
林加德:每周都會剪一次頭發,我會用發膠打理這樣看起來精神點

林加德:每周都會剪一次頭發,我會用發膠打理這樣看起來精神點

直播吧
2025-05-29 09:17:11
楊瀚森在列!拓記:選秀前首次大型試訓 都是潛在的首輪秀!

楊瀚森在列!拓記:選秀前首次大型試訓 都是潛在的首輪秀!

直播吧
2025-05-30 01:43:03
黃仁勛計劃出售至多600萬股英偉達股票

黃仁勛計劃出售至多600萬股英偉達股票

每日經濟新聞
2025-05-29 23:41:46
隨著森林狼連續2年止步西決,上一次交易唐斯,這次蘭德爾背鍋!

隨著森林狼連續2年止步西決,上一次交易唐斯,這次蘭德爾背鍋!

田先生籃球
2025-05-29 11:33:10
瑞典媒體:已形成“特魯斯”效應,乒乓球成為瑞典增長最快的運動

瑞典媒體:已形成“特魯斯”效應,乒乓球成為瑞典增長最快的運動

懂球帝
2025-05-29 20:57:11
51歲陳德容上節目首談離婚,嘆:愛情既沒意思也沒用,浪費時間

51歲陳德容上節目首談離婚,嘆:愛情既沒意思也沒用,浪費時間

葡萄說娛
2025-05-29 10:07:50
義烏市產投集團副總經理黃政,主動投案!

義烏市產投集團副總經理黃政,主動投案!

浙中在線
2025-05-29 22:00:16
美對中國誤判了!福建艦剛完成8次海試,004航母又傳好消息

美對中國誤判了!福建艦剛完成8次海試,004航母又傳好消息

阿芒娛樂說
2025-05-30 02:20:17
如果對等關稅被叫停,特朗普還能怎么加關稅?

如果對等關稅被叫停,特朗普還能怎么加關稅?

華爾街見聞官方
2025-05-29 16:08:11
斬首普京失敗,澤連斯基生命倒計時,特朗普警告:不許吞并烏克蘭

斬首普京失敗,澤連斯基生命倒計時,特朗普警告:不許吞并烏克蘭

戰旗紅
2025-05-30 00:10:40
大反轉!王楚欽戀情傳出2天后,三大名將連番表態,真相大白?

大反轉!王楚欽戀情傳出2天后,三大名將連番表態,真相大白?

大秦壁虎白話體育
2025-05-29 08:54:29
郭德綱真沒有說錯,穿旗袍還真有開叉到胳肢窩的!大家看看唄!

郭德綱真沒有說錯,穿旗袍還真有開叉到胳肢窩的!大家看看唄!

翻開歷史和現實
2025-05-15 23:36:41
二線汽車豪華品牌全員陣亡!BBA能賣的就是56E,M9的確遙遙領先…

二線汽車豪華品牌全員陣亡!BBA能賣的就是56E,M9的確遙遙領先…

火山詩話
2025-05-28 07:14:31
多哈世乒賽國乒最失意的主力隊員,不是林高遠和王藝迪,是這一人

多哈世乒賽國乒最失意的主力隊員,不是林高遠和王藝迪,是這一人

老高說體育
2025-05-29 10:01:16
陳芋汐被網暴,抖音回應→

陳芋汐被網暴,抖音回應→

新民晚報
2025-05-28 19:32:46
北京一男子掏空積蓄,湊500萬入股中國人壽,20年后分紅嚇人

北京一男子掏空積蓄,湊500萬入股中國人壽,20年后分紅嚇人

一刀故事
2025-05-14 13:32:29
戈貝爾兩億肥約今夏結束,下賽季將執行3年1.1億合同

戈貝爾兩億肥約今夏結束,下賽季將執行3年1.1億合同

雷速體育
2025-05-29 14:29:25
2025-05-30 07:15:00
腦機接口社區 incentive-icons
腦機接口社區
關注腦機前沿,分享腦機技術
158文章數 19關注度
往期回顧 全部

科技要聞

英偉達財報炸裂 黃仁勛卻嘆退出中國太可惜

頭條要聞

巴西檢方宣布正在起訴比亞迪 外交部回應

頭條要聞

巴西檢方宣布正在起訴比亞迪 外交部回應

體育要聞

納達爾,法網,漫長告別

娛樂要聞

辛柏青沉默8天后,這些事還是發生了

財經要聞

若對等關稅叫停,特朗普還能怎么加關稅

汽車要聞

首搭鴻蒙座艙5 嵐圖FREE+將于6月預售

態度原創

本地
游戲
家居
房產
公開課

本地新聞

云游中國 |來仰天湖大草原,一起策馬奔騰

死亡擱淺2暫無DLC計劃 小島:現在已經不流行了吧

家居要聞

暖色復古 溫馨小資情調

房產要聞

清盤倒計時!這個天河芯紅盤,贏的不止多一點!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 遵义县| 石嘴山市| 伽师县| 新兴县| 嵩明县| 章丘市| 祁阳县| 禹州市| 五指山市| 志丹县| 扬中市| 青州市| 淮北市| 青龙| 界首市| 利川市| 蓬溪县| 安龙县| 若尔盖县| 龙州县| 六安市| 正镶白旗| 固镇县| 合肥市| 南昌县| 连江县| 大名县| 玛纳斯县| 西宁市| 芒康县| 丽江市| 滦平县| 灵川县| 肥城市| 泊头市| 乐昌市| 全椒县| 威远县| 娱乐| 焦作市| 永寿县|