網易首頁 > 網易號 > 正文申請入駐

為何完成小目標后更有動力堅持？科學家揭示前額葉與海馬協同整合獎勵歷史信息驅動行為參與的神經機制

2025-04-20 12:11:22　來源: 腦聲常談

上海舉報

分享至

多功能小鼠固定器，專為復雜實驗流程優化，適配多部位針刺實驗、光纖植入、經鼻給藥、清醒小鼠頭部固定等高精度操作，預留標準化接口與卡槽，確保設備穩定性。針對眼眶取血等特殊需求，用戶可依托主體框架進行個性化DIY改造，拓展實驗邊界。

伏隔核是一個高度整合的腦區，負責控制動機行為，接收多種谷氨酸能輸入，但這些輸入的相對功能尚不明確。

基于此，2025年4月15日，麥吉爾大學Rosemary C. Bagot研究團隊在Nature communications雜志發表了“Reward integration in prefrontal-cortical and ventral-hippocampal nucleus accumbens inputs cooperatively modulates engagement”揭示了前額葉皮層和腹側海馬對伏隔核的輸入通過協同整合獎勵信息來調節參與行為。

通過在小鼠的操作性獎勵任務中使用光纖記錄技術，作者同時記錄了兩條通往伏隔核的谷氨酸能傳入通路以評估回路的特化特性。發現了一種共同的神經模體，即內側前額葉皮層和腹側海馬的輸入整合了獎勵歷史信息。通過系統地降低任務復雜性將獎勵與選擇和行動分離，揭示了在招募編碼過程中行為條件的回路特異性。光遺傳學刺激實驗表明，這兩條輸入協同調節任務參與行為。

圖一在概率性獎勵環境中，mPFC-NAc和 vHip-NAc通路以類似的方式編碼獎勵信息

為了評估在匹配條件下和試驗歷史中，兩條不同回路在結果編碼中的冗余性與特異性，作者向伏隔核（NAc）內側殼注射了逆行AAV-GCaMP7f病毒，并在內側前額葉皮層（mPFC）和腹側海馬（vHip）植入光纖記錄小鼠在獎勵引導選擇任務中的鈣信號。訓練小鼠完成一個兩杠桿概率獎勵學習任務（即雙臂賭博任務），其中按壓杠桿以概率方式獲得巧克力牛奶獎勵。每次按壓杠桿后，兩個不同的聽覺提示信號分別表示試驗結果（獎勵或未獎勵）以及試驗間隔期（ITI）的開始。為維持動態環境并確保獎勵和未獎勵結果的頻繁出現，杠桿按壓的概率獎勵設置為80%或20%，并在高概率杠桿連續按壓5次后切換概率。雌性和雄性小鼠經歷了相似數量的獎勵和未獎勵試驗，而遺漏試驗的數量較少。行為分析顯示，未獎勵結果后停留概率下降，獲得獎勵的數量增加，表明動物利用結果信息來指導行為。在mPFC-NAc通路中，杠桿按壓和結果傳遞后的峰值逐漸演變為ITI期間的獎勵相關抑制。在vHip-NAc通路中，初始峰值后出現杠桿按壓和結果傳遞后的抑制，獎勵后抑制持續存在，而未獎勵結果后活動逐漸增加。到ITI結束時，獎勵明顯抑制了雌性和雄性小鼠的mPFC-NAc活動，同時也抑制了vHip-NAc活動。這表明，結果編碼在ITI期間逐漸顯現，獎勵抑制了mPFC-NAc和vHip-NAc的活動。在觀察到mPFC-NAc和vHip-NAc均受到獎勵類似調節后，進一步研究了一條回路是否主導另一條回路。作者發現，在獎勵和未獎勵試驗中，mPFC-NAc和vHip-NAc之間的最大交叉相關時間滯后在兩種性別中均不顯著偏離零。這表明，任何一條回路都沒有驅動另一條回路的結果編碼。有趣的是，盡管vHip-NAc的抑制比mPFC-NAc更早出現，但這種抑制在區分獎勵和未獎勵結果中的效用在mPFC-NAc中比vHip-NAc更早顯現。這表明，盡管整體信息編碼相似，但兩條通路的潛在動力學可能有很大差異。

小鼠實驗專用踏桿/壓桿

圖二mPFC-NAc和vHip-NAc通路以類似的方式整合獎勵歷史信息

作者發現，mPFC-NAc和vHip-NAc通路以類似的方式編碼結果信息。通過更長的時間跨度可視化這種編碼后發現，獎勵介導的抑制可以在mPFC-NAc和vHip-NAc中持續數十秒。因此，推測這種持久的調節可能會整合連續試驗中的獎勵信息，這種整合可能在mPFC-NAc中比在vHip-NAc中更為明顯。為了驗證這一點，將試驗按先前結果和當前結果進行分類，識別出以下試驗序列：先獎勵再獎勵（R→R）、先獎勵再未獎勵（R→U）、先未獎勵再獎勵（U→R），以及先未獎勵再未獎勵（U→U）。然后，作者比較了最近一次試驗中ITI（試驗間間隔期）期間的神經活動，分別分析雄性和雌性小鼠時，發現其調節模式相似。先前結果和當前結果均對mPFC-NAc的活動產生調節作用。在某次試驗（t-1）后，獎勵會抑制mPFC-NAc的活動。在隨后的試驗（t0）中，無論先前結果如何，獎勵都會在ITI結束時同樣抑制mPFC-NAc的活動。然而，當小鼠在隨后的試驗（t0）中未獲得獎勵時，先前獎勵引起的mPFC-NAc抑制會在整個ITI期間持續存在。這表明，單次獎勵能夠最大程度且持久地抑制mPFC-NAc的活動，而在沒有后續獎勵的情況下，這種抑制會逐漸消退。接下來，作者研究了vHip-NAc是否同樣整合結果信息。在某次試驗（t-1）后，獎勵會抑制vHip-NAc的活動。與mPFC-NAc類似，這為下一次試驗（t0）重置了基線，在t0試驗中，無論先前結果如何獎勵都會抑制vHip-NAc的活動。然而，當隨后的試驗（t0）未獲得獎勵時，先前獎勵引起的vHip-NAc活動抑制會在整個ITI期間持續存在。綜合來看，這表明mPFC-NAc和vHip-NAc在跨試驗中以類似的方式整合結果信息。在這兩條通路中，獎勵都會最大程度地抑制神經活動，而在后續未獎勵結果出現后，活動逐漸增加。

圖三降低任務需求揭示了獎勵整合中特定神經回路的作用

在單杠桿任務中，僅保留一個杠桿以消除選擇需求，但仍要求動物按壓杠桿以獲得獎勵。mPFC-NAc繼續編碼當前和先前的獎勵結果，這表明其對獎勵歷史的編碼不依賴于選擇需求。vHip-NAc同樣表現出對獎勵結果的類似編碼，但信號更嘈雜且峰值減弱，可能反映了對任務結構的高度敏感性。完全移除杠桿，動物無需按壓即可被動接收獎勵。獎勵序列與其在雙杠桿任務中的表現掛鉤。mPFC-NAc不再編碼先前獎勵，僅編碼當前獎勵。這表明mPFC-NAc的獎勵整合僅發生在需要行為反應的情境中。即使在被動獎勵中，mPFC-NAc仍能編碼獎勵，但時間窗口縮短，僅保留最近一次的結果。vHip-NAc對獎勵歷史的編碼也發生退化，但方式不同。僅當上一次試驗未獎勵時，才編碼當前獎勵。這表明vHip-NAc傾向于忽略孤立的非獎勵事件，可能反映了延長的時間常數。

總結

研究明確了神經回路的特異性功能：mPFC - NAc神經通路呈現對行為結果的持續性追蹤編碼；而 vHip - NAc通路則在經歷無獎勵性結果后，表現出對結果信息的優先選擇性編碼。本研究強調了結合多樣化行為狀態背景解析神經編碼機制的必要性。在行為結果整合進程中，精準調控伏隔核谷氨酸能輸入的平衡抑制狀態是維持獎勵信號驅動行為響應的核心機制。

文章來源

https://doi.org/10.1038/s41467-025-58858-4

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.