█腦科學動態
16萬人研究實錘:鍛煉直接增大腦容量,與體重無關
為什么我們吃完還想吃,餓久了反而不餓?
從35天到4天,干細胞平臺高效生成人類小膠質細胞
大腦如何運用分層與反事實推理解決復雜任務
嗅出饑餓感:鼻子和大腦之間的聯系與食欲有關
ELAV蛋白揭示大腦環狀RNA生成之謎
社會經濟地位與白質變化有關,這可能會影響晚年大腦健康
精神病態診斷迎來革新:膽大特質被忽視數十年
█AI行業動態
OpenAI發布o3-pro模型:Sam Altman暢想溫和奇點時代
FDA批準革命性AI平臺,通過乳房X光預測未來五年乳腺癌風險
Neuralink腦機接口讓漸凍癥患者重獲聲音
Mistral AI正式推出其首個推理專用模型系列Magistral
█AI驅動科學
大模型自發形成人類思維地圖
光學神經引擎突破偏微分方程求解瓶頸
強化學習不再是"蛋糕上的櫻桃":微軟將其融入語言模型核心
多模態AI代理VideoMind模仿人類思維實現長視頻推理
人形機器人Pepper搭載大語言模型亮相,公眾反應兩極分化
大語言模型是否具備內省能力?科學家提出新評估框架
腦科學動態
16萬人研究實錘:鍛煉直接增大腦容量,與體重無關
體力活動能否獨立于體重保護大腦?莫納什大學公共衛生與預防醫學院的Alexandra La Hood、Chris Moran等團隊通過分析16,725名中老年人的數據發現,體育鍛煉與更大的腦容量相關,這種關聯部分通過改善代謝健康實現,但不受BMI直接影響。
研究利用英國生物銀行(UK Biobank)的加速度計數據客觀測量體力活動(PA),結合MRI掃描量化腦容量指標。統計分析顯示,每增加1單位PA,總腦體積增加3.67立方厘米,灰質增加3.12立方厘米,且白質高信號(反映腦小血管病變)減少。盡管BMI和心臟代謝因素(如血壓、血糖)中介了部分效應,但PA對白質和總腦體積的保護作用保持獨立。值得注意的是,PA對海馬體的保護完全通過代謝改善實現,提示肥胖人群仍需運動來間接維護記憶功能。研究為“運動即良藥”提供了神經影像證據,支持通過生活方式干預預防癡呆。研究發表在 Scientific Reports 上。
#疾病與健康 #疾病預防 #健康管理與壽命延長 #神經機制與腦功能解析 #認知科學
閱讀更多:
La Hood, Alexandra, et al. “Associations between Physical Activity and Brain Structure in a Large Community Cohort.” Scientific Reports, vol. 15, no. 1, May 2025, p. 18896. www.nature.com, https://doi.org/10.1038/s41598-025-04010-7
為什么我們吃完還想吃,餓久了反而不餓?
羅格斯大學羅伯特伍德約翰遜醫學院神經代謝中心的Zhiping Pang和Mark Rossi團隊發現,大腦通過兩套對立神經回路動態調控進食——下丘腦至腦干的"飽腹剎車"與終紋至下丘腦的"饑餓油門",這種平衡機制為改進GLP-1類藥物提供了新方向。
研究采用光遺傳學激活下丘腦室旁核(PVN)中表達GLP-1受體的神經元向腦干背側迷走復合體(DVC)的投射,發現該通路在禁食狀態下突觸強度減弱,但對外源GLP-1更敏感。實驗顯示,持續激活該通路會使飽食小鼠停止進食,而抑制通路則導致體重增加。平行研究發現,終紋床核(BNST)通過抑制性神經元連接下丘腦外側區(LHA),形成饑餓驅動回路——激活時小鼠瘋狂覓食,阻斷后即使禁食也無動于衷。激素實驗證實,饑餓素(ghrelin)增強該回路敏感性,而瘦素(leptin)抑制其活性。特別值得注意的是,兩套回路會隨能量狀態快速重構突觸連接,這種動態特性解釋了為何單一靶點藥物易失效。研究發表在 Nature Metabolism 上。
#疾病與健康 #神經調控 #個性化醫療 #肥胖治療 #神經機制與腦功能解析
閱讀更多:
Wang, Le, et al. “State-Dependent Central Synaptic Regulation by GLP-1 Is Essential for Energy Homeostasis.” Nature Metabolism, June 2025, pp. 1–16. www.nature.com, https://doi.org/10.1038/s42255-025-01305-x
從35天到4天,干細胞平臺高效生成人類小膠質細胞
哈佛大學Wyss研究所和哈佛醫學院的George Church、Jenny Tam、Soumya Raychaudhuri團隊開發出革命性平臺,僅需4天即可從干細胞生成功能成熟的小膠質細胞,效率較傳統方法提升近9倍。
?這幅圖展示了開啟小膠質細胞特異性六種 TF 混合物的人類 iPSC(下排)與關閉六種 TF 混合物的 iPSC(上排)如何放棄多能性階段(以 OCT4 蛋白為標志),并接受小膠質細胞的命運(以 CD11b、P2RY12 和 CX3CR1 蛋白為標志)。Credit: Wyss Institute at Harvard University
研究團隊利用其開發的TFomeTM技術平臺,通過兩輪迭代篩選確定了六種關鍵轉錄因子(SPI1、CEBPA、FLI1、MEF2C、CEBPB、IRF8)的最佳組合。單細胞RNA測序(scRNA-seq)分析顯示,誘導生成的小膠質細胞樣細胞(TFiMGLs)與原代細胞具有高度相似的基因表達譜。功能驗證表明,這些細胞能有效執行吞噬功能,并對神經炎癥刺激因子干擾素γ(IFNg)和ALS相關TDP-43蛋白產生特異性響應。與傳統需要35天的分化方案相比,新方法不僅大幅縮短時間,還避免了復雜培養基和小分子添加劑的使用。該技術已應用于腦類器官研究,并計劃通過初創公司GC Therapeutics推進商業化。研究為阿爾茨海默病、帕金森病等疾病的機制研究和藥物開發提供了重要工具。研究發表在 Nature Communications 上。
#疾病與健康 #神經機制與腦功能解析 #跨學科整合 #個性化醫療
閱讀更多:
Liu, Songlei, et al. “Iterative Transcription Factor Screening Enables Rapid Generation of Microglia-like Cells from Human iPSC.” Nature Communications, vol. 16, no. 1, June 2025, p. 5136. www.nature.com, https://doi.org/10.1038/s41467-025-59596-3
大腦如何運用分層與反事實推理解決復雜任務
人類如何通過靈活的策略應對復雜決策?麻省理工學院的Mahdi Ramadan, Cheng Tang, Nicholas Watters和Mehrdad Jazayeri團隊通過迷宮追蹤實驗發現,大腦會依據認知限制在分層推理和反事實推理間動態切換,這種策略選擇具有計算理性。
研究設計了一項H型迷宮任務,要求150名受試者根據聽覺線索預測隱藏球的路徑。通過比較四種計算模型(并行處理、純分層推理、純反事實推理及混合策略),發現人類主要采用將問題分解為子任務的分層推理(hierarchical reasoning),但當記憶可靠性高時,會轉向反事實推理(counterfactual reasoning,即假設初始選擇錯誤并重新評估)。
進一步實驗揭示三個關鍵約束:并行處理瓶頸迫使分層分析,補償性但容量有限的反事實過程,以及工作記憶噪聲降低反事實準確性。為驗證這些策略的合理性,團隊訓練了遞歸神經網絡(RNN),發現僅當模型同時具備所有人類認知約束時,其行為模式與實驗數據吻合。研究還表明,傳統認為獨立的認知算法(如最優推理、反事實推理等)實際構成連續譜,大腦根據任務需求動態調整策略。研究發表在 Nature Human Behaviour 上。
#認知科學 #計算模型與人工智能模擬 #意圖與決策 #神經機制與腦功能解析
閱讀更多:
Ramadan, Mahdi, et al. “Computational Basis of Hierarchical and Counterfactual Information Processing.” Nature Human Behaviour, June 2025, pp. 1–15. www.nature.com, https://doi.org/10.1038/s41562-025-02232-3
嗅出饑餓感:鼻子和大腦之間的聯系與食欲有關
馬克斯·普朗克代謝研究所的Janice Bulk、Sophie Steculorum團隊發現,小鼠大腦中存在一條從嗅覺到飽腹感的直接神經通路,該通路在肥胖個體中功能異常,揭示了體重差異導致食欲調控差異的神經機制。
研究通過全腦圖譜掃描技術,首次定位出小鼠內側隔膜(medial septum)中一組對食物氣味敏感的谷氨酸能神經元(MSVGLUT2)。這些神經元表現出獨特的雙相活動模式:嗅到食物氣味時迅速激活產生飽腹感,進食后則轉為持續抑制狀態。光遺傳學實驗證實,刺激嗅球至內側隔膜的神經投射可顯著減少瘦小鼠的進食量,但對飲食誘導的肥胖小鼠無效。進一步分析顯示,該通路能響應多種食物氣味但不反應于非食物氣味,其功能異常可能是高熱量飲食導致暴食的關鍵因素。研究為解釋"聞香止餓"現象提供了神經科學依據,并提示肥胖治療需考慮嗅覺干預的個體化差異。研究發表在 Nature Metabolism 上。
#神經科學 #神經機制與腦功能解析 #肥胖治療 #嗅覺調控 #代謝紊亂
閱讀更多:
Bulk, Janice, et al. “A Food-Sensitive Olfactory Circuit Drives Anticipatory Satiety.” Nature Metabolism, June 2025, pp. 1–20. www.nature.com, https://doi.org/10.1038/s42255-025-01301-1
ELAV蛋白揭示大腦環狀RNA生成之謎
神經系統為何富含環狀RNA(circRNA)?馬克斯普朗克免疫生物學和表觀遺傳學研究所的Carlos Alfonso-Gonzalez和Mengjin Shi團隊發現,RNA結合蛋白ELAV是調控神經元circRNA生成的主開關,該機制從果蠅到人類可能具有保守性。
?ELAV 蛋白與前體 RNA 的特定區域結合,即與“反向剪接連接點”(BSJ)兩側內含子中所謂的反向互補序列(RCM)結合,而 BSJ 對環狀 RNA 的形成至關重要。這種結合能夠形成 RNA 二級結構,使反向剪接的剪接位點在空間上緊密接近。整個機制特異性地促進了反向剪接連接點(BSJ)處環狀 RNA 的形成,同時抑制了同一基因組位點上常規的線性剪接。Credit: MPI of Immunobiology & Epigenetics, Hilgers
研究團隊通過分析果蠅胚胎發現,ELAV蛋白通過結合前體RNA內含子的反向互補序列(RCM),促進反向剪接(back-splicing,不同于常規RNA剪接的環化過程)而非線性剪接。實驗顯示,敲除ELAV導致神經元circRNA減少75%,而過表達則使本不產生circRNA的細胞開始環化。ELAV通過減慢線性剪接速率,使RNA兩端靠近形成閉環。這種機制解釋了為何神經元能持續積累circRNA——這些穩定分子適合長期調控突觸功能。研究發表在Genes & Development上。
#神經科學 #神經機制與腦功能解析 #RNA調控 #神經退行性疾病 #分子機制
閱讀更多:
Alfonso-Gonzalez, Carlos, et al. “ELAV Mediates Circular RNA Biogenesis in Neurons.” Genes & Development, June 2025. genesdev.cshlp.org, https://doi.org/10.1101/gad.352670.125
社會經濟地位與白質變化有關,這可能會影響晚年大腦健康
愛丁堡大學、布里斯托大學、倫敦大學學院、意大利摩德納大學、荷蘭自由大學和阿姆斯特丹大學醫學中心的Charley Xia、W. David Hill等研究人員發現,社會經濟地位與大腦白質變化存在因果關系,較高社會經濟地位可減少白質損傷風險。
?SES 指標與 MRI 測量結果之間的遺傳關系。Credit: Molecular Psychiatry (2025).
研究團隊首先對947,466人進行多變量全基因組關聯研究(GWAS),發現職業、收入、教育和社會剝奪四種社會經濟指標共享75%的遺傳效應,并鑒定出554個相關基因組區域。隨后,通過孟德爾隨機化(Mendelian randomization)分析約35,000人的腦部MRI數據,證實較高社會經濟地位顯著降低白質高強度信號(WMHicv,與認知衰退和癡呆相關的腦損傷標志)。值得注意的是,這種保護作用獨立于認知能力,且遺傳因素僅解釋9%的社會經濟差異,其余主要由環境和社會因素決定。研究為通過改善社會經濟條件促進腦健康提供了科學依據,并展示了遺傳數據在識別可改變環境風險因素中的價值。研究發表在 Molecular Psychiatry 上。
#疾病與健康 #神經機制與腦功能解析 #健康管理與壽命延長 #社會決定因素 #跨學科整合
閱讀更多:
Xia, Charley, et al. “Deciphering the Influence of Socioeconomic Status on Brain Structure: Insights from Mendelian Randomization.” Molecular Psychiatry, May 2025, pp. 1–14. www.nature.com, https://doi.org/10.1038/s41380-025-03047-4
精神病態診斷迎來革新:膽大特質被忽視數十年
精神病態診斷長期依賴過時的20項檢查表,導致高功能患者漏診。加州大學伯克利分校Keanan J. Joyner團隊發現,包含膽大特質的三元模型能更準確識別精神病態,相關成果將改變臨床評估方式。
研究團隊采用178題元素精神病態評估(EPA)替代傳統檢查表,基于五因素人格模型(five-factor model)量化脫抑制(impulsivity,通常稱之為沖動)、冷酷(lack of empathy,即刻薄和缺乏同理心)和膽大(fearlessness,無所畏懼)三維度。通過對比實驗發現,EPA能識別出15%被傳統方法遺漏的病例,這些患者因膽大特質(社交自信與低焦慮)更易規避早期行為問題檢測。腦掃描顯示,患者面部情緒處理(facial emotion processing)神經活動異常與冷酷維度強相關。研究還發現,膽大特質使部分精神病態者在銷售、領導崗位表現優異,如2012年總統研究中該特質與危機管理能力呈正相關。但現行診斷因依賴犯罪記錄存在系統性偏差——紐約攔截搜身數據顯示,黑人被檢出率是白人的2.3倍,而實際患病率無差異。研究發表在 Psychological Assessment 上。
#疾病與健康 #心理健康與精神疾病 #個性化醫療 #神經機制與腦功能解析
閱讀更多:
Joyner, Keanan J., et al. “Locating Triarchic Model Constructs in the Hierarchical Structure of a Comprehensive Trait-Based Psychopathy Measure: Implications for Research and Clinical Assessment.” Psychological Assessment, vol. 36, no. 8, 2024, pp. 472–87. APA PsycNet, https://doi.org/10.1037/pas0001321
AI 行業動態
OpenAI發布o3-pro模型:Sam Altman暢想溫和奇點時代
OpenAI于今日凌晨正式推出新一代推理模型o3-pro,所有Pro訂閱用戶可通過ChatGPT和API立即使用。與以往不同,此次發布僅通過推文簡單介紹,但OpenAI CEO Sam Altman難掩興奮,稱其聰明得難以置信,并罕見發布題為《溫和的奇點》的博客文章。o3-pro在專家評估中表現突出,尤其在科學、編程和寫作等領域,其清晰度、指令遵從性和準確性均優于前代o3。盡管在ARC-AGI基準測試中表現與o3相近,但成本更高,OpenAI強調其200k上下文窗口和100k輸出token的能力,并支持文本與圖像輸入。
早期用戶測試反饋兩極分化。部分用戶盛贊o3-pro的編程效率提升天壤之別,甚至能合作開發免疫系統2.0或設計極限空間模擬器;但也有用戶對性能提升幅度表示失望。價格方面,o3-pro的API定價為輸入token每百萬20美元、輸出token每百萬80美元,雖比o1-pro便宜87%,但仍屬高價。隨著o3-pro上線,o3價格降至其十分之一,OpenAI建議用戶利用后臺模式處理長任務以避免超時。
Sam Altman在博客中描繪了AI驅動的未來圖景:到2030年,人類生產力將因AI輔助而倍增,科學突破加速,甚至可能實現太空殖民或腦機接口。他提出溫和奇點概念,認為超級智能將廉價普及,但需解決協同安全問題。OpenAI定位為超級智能研究公司,強調技術需廣泛分布而非集中,并呼吁社會盡早討論倫理邊界。
#OpenAI #o3-pro #人工智能 #SamAltman #溫和奇點
閱讀更多:
https://blog.samaltman.com/the-gentle-singularity
FDA批準革命性AI平臺,通過乳房X光預測未來五年乳腺癌風險
美國食品藥品監督管理局(FDA)近日批準了首個基于人工智能(AI)的乳腺癌預測平臺CLAIRITY BREAST。該平臺通過分析常規乳房X光檢查(mammograms)中的細微影像特征,能夠預測女性未來五年內罹患乳腺癌的風險。Clairity公司首席執行官Jeff Luber表示,這項技術的突破性在于能在癌癥尚未形成時,通過乳腺組織形態提前預警風險,并強調該平臺可無縫整合到現有醫療系統中。
CLAIRITY BREAST的AI模型經過數百萬張圖像的訓練,并在來自五個不同地區篩查中心的77,000多張乳房X光數據中驗證了其準確性。這些數據涵蓋醫院和獨立篩查機構,確保了模型的廣泛適用性。美國癌癥協會早期癌癥檢測科學高級副總裁Robert A. Smith博士指出,這種個性化風險評估工具將幫助識別高風險人群,推動MRI等補充篩查的精準應用,從而提升早期發現和預防效果。
#乳腺癌預測 #人工智能 #FDA批準 #早期篩查 #醫療AI
閱讀更多:
https://www.healthday.com/healthpro-news/health-technology/fda-authorizes-first-ai-platform-for-breast-cancer-prediction
Neuralink腦機接口讓漸凍癥患者重獲聲音
近日,埃隆·馬斯克旗下腦機接口公司Neuralink與人工智能公司xAI合作取得重大突破,成功幫助漸凍癥(ALS)患者布拉德福德·史密斯重新"開口說話"。通過植入僅硬幣大小的腦機接口裝置,配合xAI的Grok人工智能系統,能夠捕捉患者神經信號并還原其原本聲音。
#OpenAI #ChatGPT #語音交互 #實時翻譯 #AI升級
閱讀更多:
https://alsnewstoday.com/news/neuralink-brain-implant-gives-new-voice-nonverbal-als-patient/
Mistral AI正式推出其首個推理專用模型系列Magistral
法國初創公司 Mistral AI 于 2025 年 6 月 10 日正式推出了其首個推理專用模型系列——Magistral 系列,包括開源的 Magistral Small 和面向企業用戶的閉源版本 Magistral Medium。該系列采用“鏈式思考”(chain?of?thought)機制,使模型在解決復雜的數學、物理與多步驟邏輯任務時更加可靠且具可解釋性;其中 Magistral Small 可多語言推理,支持英、法、西、阿及簡體中文,并已在 Hugging Face 平臺開放使用。Magistral 在用戶交互中展現了近 10 倍于競品的解答速度,突顯其響應效率的顯著提升。這些進展標志著歐洲在高性能、可解釋 AI 模型研發方面邁出了具有競爭力的重要步伐。
Magistral 系列采用訓練過程優化與鏈式思考推理策略以提升性能,具體包括微調自 Mistral Large 2 的模型權重與專門設計的問題解析路徑。值得注意的是,Magistral Small 擁有約 240 億參數,并且使用 Apache?2.0 開源許可,支持社區自部署;Magistral Medium 則以閉源方式提供,通過 Le?Chat 平臺、API 和合作云服務接入。模型特別針對多步驟計算與結構化邏輯問題進行了強化,旨在提升數學和物理推理一致性與可靠性。官方評測顯示,雖然在 GPQA、AIME 等基準測試中 Magistral 性能略低于 Gemini 2.5 Pro 和 Claude Opus?4,但其在多語種推理效率和響應速度方面卻實現了顯著超越,并與競品在推理透明度和鏈式思考可追溯性方面形成差異化。尤其在 Le?Chat 上的實際交互中,Magistral 的解答速度比多數競品快近十倍,這為支持實時交互型 AI 應用提供了堅實基礎。
#AI推理 #多語言模型 #鏈式思考 #開源與閉源
閱讀更多:
https://mistral.ai/news/magistral
AI 驅動科學
大模型自發形成人類思維地圖
中國科學院自動化研究所與腦科學與智能技術卓越創新中心的Changde Du, Kaicheng Fu, Bincheng Wen等聯合團隊通過470萬次行為實驗與神經影像分析,證實多模態大語言模型能自發形成與人類高度相似的物體概念表征系統。
研究采用認知心理學三選一異類識別任務(triplet odd-one-out),收集470萬次行為判斷數據構建選擇概率矩陣。通過首創的行為認知探針方法,使用稀疏正定相似度嵌入算法從大模型行為數據中提取出66個核心維度。結果顯示,純文本ChatGPT-3.5與多模態Gemini模型均展現出穩定低維結構,預測人類行為準確度達噪聲上限的87.1%和85.9%。模型自發形成18個高級物體概念類別(如動物、工具),分類準確率78.3%接近人類的87.1%。在梭狀回面孔區,模型預測神經活動的準確度達人類水平的85%,遠超純文本模型(60%)。研究還發現大模型決策更依賴語義標簽和抽象概念,而人類更具感知整合能力。研究發表在 Nature Machine Intelligence 上。
#認知科學 #大模型技術 #神經機制與腦功能解析 #跨學科整合 #計算模型與人工智能模擬
閱讀更多:
Du, Changde, et al. “Human-like Object Concept Representations Emerge Naturally in Multimodal Large Language Models.” Nature Machine Intelligence, June 2025, pp. 1–16. www.nature.com, https://doi.org/10.1038/s42256-025-01049-z
光學神經引擎突破偏微分方程求解瓶頸
偏微分方程(PDEs)求解是科學計算的重大挑戰,傳統方法耗時耗能。猶他大學Weilu Gao團隊開發的光學神經引擎(ONE)通過光子計算實現突破,發表的研究中展示了其高效求解多種PDE的能力。
研究團隊創新性地將衍射光學神經網絡(DONNs,利用光衍射實現并行計算)與光學交叉結構(XBAR,實現矩陣運算)結合,構建雙空間處理架構。通過將PDE變量編碼為光波的強度、相位等屬性,當光波穿過光學元件時即完成方程求解。實驗測試顯示,該系統求解達西流方程(描述多孔介質流體運動)僅需納秒級時間,比電子方法快100倍;在磁靜泊松方程求解中準確率達95.7%,優于傳統有限元法。特別值得注意的是,該系統能耗僅為電子計算的1/10,且具備實時硬件重構能力,可快速切換處理納維-斯托克斯方程(流體力學核心方程)等不同PDE類型。研究為需要大規模科學計算的領域如地質建模、芯片熱分析等提供了革命性工具。研究發表在 Nature Communications 上。
#AI驅動科學 #計算模型與人工智能模擬 #跨學科整合 #光學計算
閱讀更多:
Tang, Yingheng, et al. “Optical Neural Engine for Solving Scientific Partial Differential Equations.” Nature Communications, vol. 16, no. 1, May 2025, p. 4603. www.nature.com, https://doi.org/10.1038/s41467-025-59847-3
強化學習不再是"蛋糕上的櫻桃":微軟RPT方法將其融入語言模型核心
傳統大語言模型預訓練依賴自監督學習,強化學習(RL)僅用于微調階段。微軟研究院Qingxiu Dong、Li Dong團隊與清華大學、北京大學合作者提出強化預訓練(RPT)新范式,將next-token預測重構為推理任務,使RL直接參與預訓練過程,顯著提升了模型的語言建模能力和推理性能。
研究團隊將next-token預測任務重新定義為next-token推理過程,模型需要生成包含自我批評和修正的思維鏈(chain-of-thought)來預測下一個token。通過前綴匹配獎勵(prefix matching reward)機制驗證預測正確性,該方法無需外部標注即可將海量文本數據轉化為RL訓練資源。實驗使用OmniMATH數學數據集和Deepseek-R1-Distill-Qwen-14B模型,結果顯示RPT-14B在所有難度級別的next-token預測準確率上均優于基線模型,甚至達到更大32B模型的性能。訓練計算量與預測準確率呈現穩定正相關(R2>0.9),驗證了方法的可擴展性。此外,RPT預訓練模型在下游任務強化微調中展現出更強的性能上限,零樣本任務表現也顯著提升。研究為語言模型預訓練提供了新思路,可能改變現有訓練范式。
#大模型技術 #預測模型構建 #語言模型 #強化學習 #AI驅動科學
閱讀更多:
Dong, Qingxiu, et al. Reinforcement Pre-Training. arXiv:2506.08007, arXiv, 9 June 2025. arXiv.org, https://doi.org/10.48550/arXiv.2506.08007
多模態AI代理VideoMind模仿人類思維實現長視頻推理
香港理工大學的Ye Liu、Kevin Qinghong Lin、Chang Wen Chen與新加坡國立大學的Mike Zheng Shou團隊開發出多模態代理VideoMind,通過模擬人類思維過程和創新技術架構,顯著提升了長視頻分析能力。
研究團隊設計了基于角色的工作流程,包含規劃器(Planner,協調任務)、定位器(Grounder,檢索相關時刻)、驗證器(Verifier,驗證信息準確性)和應答器(Answerer,生成答案)。提出Chain-of-LoRA策略,在統一模型中使用四個輕量級適配器(LoRA adapters)實現角色動態切換,避免部署多個模型的開銷。在14個基準測試(包括3個Grounded VideoQA、6個Video Temporal Grounding和5個General VideoQA)上的實驗顯示,VideoMind在平均時長27分鐘的視頻任務中,理解準確率超越GPT-4o和Gemini 1.5 Pro等先進模型。值得注意的是,其20億參數的小模型性能可媲美其他70億參數模型,計算效率顯著提升。該框架基于開源模型Qwen2-VL構建,已公開代碼和模型權重,為智能監控、視頻搜索等應用提供了高效解決方案。
#大模型技術 #預測模型構建 #多模態AI #視頻理解 #計算效率
閱讀更多:
Liu, Ye, et al. VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning. arXiv:2503.13444, arXiv, 1 Apr. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2503.13444
人形機器人Pepper搭載大語言模型亮相,公眾反應兩極分化
當具備自然語言能力的人形機器人進入公共空間,人們會如何反應?澳大利亞堪培拉大學協作機器人實驗室的Damith Herath團隊與澳大利亞國立大學的Janie Busby Grant等研究者合作,在節慶活動中部署了搭載ChatGPT的Pepper機器人,記錄了88名參與者的互動反饋,發現公眾反應呈現顯著差異。
?Pepper 機器人在公共活動中安裝。一位母親和一位幼兒在一個封閉的穹頂內與 Pepper 機器人互動。Credit: Scientific Reports (2025).
研究團隊將ChatGPT集成到商用Pepper機器人中,該機器人已具備自主移動和基礎互動能力,特色是能維持眼神接觸(eye contact)。在澳大利亞某創新節慶中,機器人被安置在限定區域內供公眾自由互動。研究人員通過視頻記錄互動過程,并收集參與者半結構化訪談數據。分析顯示,參與者反應可歸納為四大主題:對機器人改進的建議(如響應速度、表情識別)、情緒反應(從興奮到不安)、期望落差(語言能力與外形不匹配)以及對機器人形態的評論。值得注意的是,許多參與者對機器人能保持眼神接觸卻無法解讀人類表情感到不適,這種"半吊子"的擬人化特征反而強化了不安感。技術故障如響應延遲也顯著影響體驗。研究為大語言模型在實體機器人中的應用提供了重要用戶體驗數據,突顯了技術整合中的社會心理挑戰。研究發表在 Scientific Reports 上。
#大模型技術 #跨學科整合 #人機交互 #社會機器人學 #公眾認知
閱讀更多:
Herath, Damith, et al. “First Impressions of a Humanoid Social Robot with Natural Language Capabilities.” Scientific Reports, vol. 15, no. 1, June 2025, p. 19715. www.nature.com, https://doi.org/10.1038/s41598-025-04274-z
大語言模型是否具備內省能力?科學家提出新評估框架
大語言模型有時會產生描述自身特性的"自我報告",這種現象是否意味著它們具備內省能力?Google DeepMind的Iulia M. Com\cbsa和Murray Shanahan(同時任職于倫敦帝國理工學院)團隊對此展開研究,提出了適用于LLMs的內省概念定義,并分析了兩個典型案例。
研究團隊首先定義了適用于LLMs的輕量級內省概念,隨后分析了兩種LLM行為:第一種是LLM試圖描述自身"創造性"寫作過程,研究認為這不能視為有效內省;第二種是LLM正確推斷出自身溫度參數的值,研究認為這可以視為最小形式的內省,盡管這種內省不伴隨意識體驗。通過概念分析而非實證評估,研究建立了討論LLM內省可能性的框架,澄清了內省概念在AI系統中的適用邊界。這項工作為未來AI系統設計提供了理論參考,也有助于相關政策制定。
#大模型技術 #自動化科研 #代碼生成 #強化學習 #單元測試
閱讀更多:
Comsa, Iulia M., and Murray Shanahan. Does It Make Sense to Speak of Introspection in Large Language Models? arXiv:2506.05068, arXiv, 6 June 2025. arXiv.org, https://doi.org/10.48550/arXiv.2506.05068
整理|ChatGPT
編輯|丹雀、存源
關于追問nextquestion
天橋腦科學研究院旗下科學媒體,旨在以科學追問為紐帶,深入探究人工智能與人類智能相互融合與促進,不斷探索科學的邊界。如果您有進一步想要討論的內容,歡迎評論區留言,或后臺留言“社群”即可加入社群與我們互動。
關于天橋腦科學研究院
天橋腦科學研究院(Tianqiao and Chrissy Chen Institute)是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一,圍繞全球化、跨學科和青年科學家三大重點,支持腦科學研究,造福人類。
Chen Institute與華山醫院、上海市精神衛生中心設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室;與加州理工學院合作成立了加州理工天橋神經科學研究院。
Chen Institute建成了支持腦科學和人工智能領域研究的生態系統,項目遍布歐美、亞洲和大洋洲,包括、、、科研型臨床醫生獎勵計劃、、等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.