█腦科學動態
Nature:大腦如何形成習慣以及它為何難以改變?
Nature:大腦如何讓我們推斷情緒?
靈感迸發的神經機制
自然狀態下急性疼痛的神經與面部動態解碼
超聲精準打擊震顫病灶,找到治療手抖的黃金靶點
可逆方法以分子精度打破大腦回路
█AI行業動態
DeepMind推出 AlphaEvolve:能寫代碼、能優化、還能搞科研
DeepSeek-V3論文揭秘:低成本訓練大模型的硬件協同設計之道
Synchron 首次實現與 iPhone、iPad 和 Apple Vision Pro 的原生腦機接口集成
█AI驅動科學
能量與記憶:一種新的神經網絡范式
用AI 分析筆跡可以及早發現兒童閱讀障礙
AI工具威脅科研質量:低質量論文數量激增538%
Nemotron-Research-Tool-N1讓大模型工具調用能力超越GPT-4o
AutoLibra:從開放反饋中自動生成AI代理評估指標
基于LLM的算法使無損數據壓縮率翻倍
AI模型通過社交媒體帖子精準識別抑郁癥跡象
AI群體自發形成社會規范,無需人類干預
掌控人工智能:新技術為大型語言模型提供更多控制
腦科學動態
Nature:大腦如何形成習慣以及它為何難以改變
為什么習慣難以改變?倫敦大學學院塞恩斯伯里·惠康中心的Marcus Stephenson-Jones團隊發現大腦存在雙重學習系統:基于獎賞的RPE系統和基于動作重復的APE系統。后者通過紋狀體尾部(TS)的多巴胺信號固化習慣行為,解釋了成癮和帕金森病的神經機制。
?圖像顯示了在任務中被抑制的兩個大腦區域——背內側紋狀體(DMS)和紋狀體尾部(TS)。Credit: Hernando Martinez Vergara.
研究團隊結合基因工程小鼠模型與聽覺辨別任務,首次捕捉到紋狀體尾部(TS)的動作預測誤差(APE)信號——這種多巴胺釋放僅與動作執行頻率相關,與獎賞無關。通過對比實驗發現,正常小鼠在任務熟練度達60-70%時切換至APE主導的“自動駕駛”模式,而TS損傷小鼠則停滯于線性學習。計算模型顯示,APE系統通過存儲“默認策略”(如開車時自動換擋)釋放認知資源,使RPE系統可處理其他決策。專家小鼠的TS被抑制后,任務表現崩潰,證實習慣行為完全依賴APE系統。該發現解釋了帕金森病患者為何能滑冰(靈活行為)卻難以行走(習慣行為),因病變的SNc多巴胺神經元正是APE編碼者。研究為成癮治療提供新思路:持續替代行為(如口香糖替代吸煙)可“覆蓋”舊APE模式。研究發表在 Nature 上。
#神經科學 #神經機制與腦功能解析 #神經調控 #計算模型與人工智能模擬 #習慣形成
閱讀更多:
Greenstreet, Francesca, et al. “Dopaminergic Action Prediction Errors Serve as a Value-Free Teaching Signal.” Nature, May 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41586-025-09008-9
Nature:大腦如何讓我們推斷情緒
高階情緒學習如何實現?日本理化學研究所腦科學中心的Xiaowei Gu和Joshua P. Johansen團隊發現,大鼠內側前額葉皮層(mPFC)通過編碼情緒內部模型,使其能像人類一樣通過間接線索推斷恐懼,該機制依賴于mPFC與杏仁核的特異連接。
?示意圖展示了配對預處理在厭惡學習后如何影響杏仁核。配對預處理后的厭惡學習導致更多神經元對噪音(紅點)、對噪音和圖像(紅藍混合點)以及不愉快體驗(橙色環)做出反應。Credit: RIKEN
研究團隊首先設計實驗:讓大鼠學習中性配對(噪音+圖像),隨后僅對圖像施加厭惡刺激。次日測試顯示,大鼠僅聽到噪音即會僵住,證明其通過推理產生恐懼。鈣成像技術捕捉到mPFC神經元的動態變化——初始配對“標記”了協同響應神經元,使它們在后續厭惡學習中更易被激活。光遺傳學干預揭示:阻斷mPFC會完全消除推理能力,而阻斷mPFC→杏仁核通路僅影響推理記憶提取,不影響直接聯想。特別值得注意的是,mPFC中投射至杏仁核的神經元亞群專司間接關聯表征。研究發表在 Nature 上。
#神經科學 #神經機制與腦功能解析 #心理健康與精神疾病 #情緒推理
閱讀更多:
Gu, Xiaowei, and Joshua P. Johansen. “Prefrontal Encoding of an Internal Model for Emotional Inference.” Nature, May 2025, pp. 1–13. www.nature.com, https://doi.org/10.1038/s41586-025-09001-2
靈感迸發的神經機制
杜克大學的Roberto Cabeza、柏林洪堡大學的Maxi Becker及團隊通過腦成像研究發現,靈感閃現時海馬體爆發式活動會重塑視覺皮層信息表征,形成高效記憶編碼網絡,使頓悟式學習的記憶保留率提升近一倍。
?下圖為黑白圖像中隱藏圖片謎題的示例;上圖中為對應的真實世界圖片。Credit: Maxi Becker et al
研究采用功能性磁共振成像(fMRI)記錄受試者解答視覺謎題(Mooney圖像,即高對比度黑白輪廓圖)時的腦活動。當受試者突然識別出隱藏物體時,其腹側枕顳皮層(VOTC,負責視覺模式識別)的神經激活模式發生顯著重組,且重組幅度與主觀報告的“頓悟強度”正相關(p<0.001)。同時,海馬體(記憶編碼核心區)出現瞬時激活峰值,激活程度越強,五天后記憶測試表現越好(r=0.72)。進一步分析顯示,高頓悟狀態下,VOTC、海馬體和杏仁核的功能連接強度增加35%,形成跨腦區協同網絡。該研究證實,頓悟通過“視覺表征重塑+海馬體記憶強化”雙通路機制提升學習效果,為探究式教學提供了神經科學依據。研究發表在 Nature Communications 上。
#神經科學 #記憶機制 #神經機制與腦功能解析 #創造性問題解決 #教育神經科學
閱讀更多:
Becker, Maxi, et al. “Insight Predicts Subsequent Memory via Cortical Representational Change and Hippocampal Activity.” Nature Communications, vol. 16, no. 1, May 2025, p. 4341. www.nature.com, https://doi.org/10.1038/s41467-025-59355-4
自然狀態下急性疼痛的神經與面部動態解碼
疼痛研究長期受限于實驗室環境,如何捕捉真實世界的神經行為特征?Yuhao Huang、Corey J. Keller等跨機構團隊通過癲癇患者的顱內監測,實現了自然急性疼痛的精準解碼。
研究團隊在癲癇監測病房(EMU)中對12名患者進行多模態監測,結合顱內腦電圖(iEEG,直接記錄神經元電活動)、疼痛自評和面部表情分析。通過機器學習構建二元分類器,成功從分布式神經活動中解碼高/低疼痛狀態,準確率顯著高于隨機水平。關鍵發現包括:中腦邊緣系統(mesolimbic regions)、紋狀體(striatum)和顳頂皮層形成穩定的疼痛表征網絡,這種模式可持續數小時,且對止痛藥物敏感。有趣的是,單純依靠面部肌肉運動的分類準確率較低,但與神經解碼結果呈正相關。研究還首次定義了"瞬時疼痛"的客觀標準——通過行為觀察確認的短暫疼痛發作,其神經特征與持續疼痛不同。這些發現為開發閉環神經調控(closed-loop neuromodulation)系統提供了靶點,特別有助于非言語患者的疼痛管理。研究發表在 Nature Communications 上。
#疾病與健康 #神經調控 #個性化醫療 #疼痛解碼 #多模態分析
閱讀更多:
Huang, Yuhao, et al. “Naturalistic Acute Pain States Decoded from Neural and Facial Dynamics.” Nature Communications, vol. 16, no. 1, May 2025, p. 4371. www.nature.com, https://doi.org/10.1038/s41467-025-59756-5
超聲精準打擊震顫病灶,找到治療手抖的黃金靶點
特發性震顫患者常因手部不受控抖動喪失基本生活能力。麻省總醫院布里格姆的Melissa Chua、Andreas Horn團隊通過分析全球351例手術數據,精確定位MRgFUS(磁共振引導聚焦超聲)治療的最佳腦區靶點,在提升療效同時顯著降低副作用,相關模型已獲跨中心驗證。
?磁共振成像引導聚焦超聲治療后的手術損傷部位(橙色),以及與最佳震顫反應和/或本研究中發現的副作用相關的腦結構連接。Credit: Andreas Horn/Mass General Brigham
研究團隊整合三家國際醫院10年間的臨床數據,運用影像組學方法將患者術后病灶映射至標準腦圖譜,通過機器學習構建"療效-副作用"雙維度概率模型。結果顯示:腹中間核(Vim,丘腦中負責運動協調的核團)前內側區域與小腦丘腦束(CTT,連接小腦與丘腦的神經纖維束)的交匯處為最佳靶點,損傷該區域可使震顫改善率達76%。同時發現損傷后內側區域易導致感覺異常,外側區域可能引發肌無力。在外部驗證中,模型準確預測了89%患者的治療效果——當實際損傷與"最佳點"重合度達60%以上時,患者一年后生活能力評分平均提升3.2倍。該成果使MRgFUS從經驗性治療邁向精準醫療,預計每年可使全球超10萬患者受益。研究發表在 Science Advances 上。
#疾病與健康 #神經調控 #個性化醫療 #聚焦超聲 #運動障礙
閱讀更多:
Chua, Melissa M. J., et al. “Optimal Focused Ultrasound Lesion Location in Essential Tremor.” Science Advances, vol. 11, no. 20, May 2025, p. eadp0532. science.org (Atypon), https://doi.org/10.1126/sciadv.adp0532
可逆方法以分子精度打破大腦回路
神經系統疾病治療面臨精準調控難題,南加州大學Don Arnold團隊聯合多所機構開發出革命性工具包,包含可逆、精準控制興奮性和抑制性突觸的分子工具,為研究癲癇等疾病機制開辟新途徑。
?轉基因蛋白質在神經元內發光。Credit: Don Arnold
研究團隊利用E3連接酶(E3 ligase,細胞"垃圾處理"系統關鍵成分)設計了兩類工具:PFE3靶向興奮性突觸支架蛋白PSD-95,GFE3靶向抑制性突觸支架蛋白Gephyrin。通過將E3連接酶與抗體樣蛋白結合,這些工具能精準標記并降解特定突觸的關鍵結構蛋白,使突觸瓦解而神經元保持完整。特別突破是開發出光激活(paGFE3)和化學激活(chGFE3)版本,前者在400nm藍光照射5小時后起效,后者通過添加特定化合物觸發。實驗顯示,在停用工具后,神經元能在數日內重建突觸連接。這種可逆性使研究者能動態觀察神經回路變化,如在視網膜模型中成功阻斷特定信號傳遞后又恢復功能。工具包實現了對神經微環路(microcircuit)的分子級精準操控,為解析感知、記憶等腦功能機制提供全新方法,也為未來開發精準神經疾病療法奠定基礎。研究發表在 eLife 上。
#疾病與健康 #神經調控 #神經機制與腦功能解析 #精準醫療
閱讀更多:
Bareghamyan, Aida, et al. “A Toolbox for Ablating Excitatory and Inhibitory Synapses.” eLife, edited by Inna Slutsky and John R Huguenard, vol. 13, Apr. 2025, p. RP103757. eLife, https://doi.org/10.7554/eLife.103757
AI 行業動態
DeepMind推出 AlphaEvolve:能寫代碼、能優化、還能搞科研
Google DeepMind近日發布了全新的AI編碼代理AlphaEvolve,它融合了大語言模型(LLMs)、進化算法和自動評估器,能夠自主優化算法并進行科學發現。與傳統AI不同,AlphaEvolve不僅能生成代碼,還能自動測試、迭代改進,甚至修改整段程序。其核心優勢在于通用性——適用于任何可編碼且可評估的問題,從數學難題到系統優化。例如,它改進了50年未被優化的4×4矩陣乘法問題,將乘法次數從49次降至48次,展現了強大的創新能力。
AlphaEvolve的工作機制模擬了“自然進化”。它通過多模塊協同運作:Prompt Sampler(提示構建器)整合歷史優秀方案,LLM Ensemble(LLM集成)生成多樣化代碼,Evaluators(自動評估器)測試性能,Program Database(程序數據庫)存儲進化記錄。系統會不斷篩選最優代碼片段,引入變異嘗試新解,最終輸出高效或新穎的算法。這種自適應的搜索優化方式使其在多個領域表現出色。
目前,AlphaEvolve已投入Google實際生產,成效顯著。它優化了數據中心資源調度(Borg系統),回收了0.7%的計算資源;改進了AI芯片設計(如TPU的Verilog代碼),節省了面積與能耗;甚至加速了Gemini模型的訓練速度。此外,它在數學領域也取得突破,例如提高了11維空間中的接觸球數下界。AlphaEvolve的落地應用證明,AI不僅能輔助人類,還能獨立推動技術進步。
#AlphaEvolve #AI編程 #算法優化 #GoogleDeepMind #自動代碼生成
閱讀更多:
https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/
DeepSeek-V3論文揭秘:低成本訓練大模型的硬件協同設計之道
DeepSeek團隊近日發布了一篇關于DeepSeek-V3模型的技術論文,聚焦于AI架構的硬件協同設計挑戰。論文由DeepSeek CEO梁文鋒(Liang Wenfeng)參與撰寫,探討了在2048塊NVIDIA H800 GPU集群上訓練時面臨的內存容量、計算效率和互連帶寬等硬件限制。通過硬件感知的模型設計,如采用FP8低精度計算和多平面雙層胖樹網絡(Multi-Plane Fat-Tree),團隊實現了經濟高效的大規模訓練與推理。論文還提出了未來硬件開發的建議,包括優化節點內通信和動態帶寬分配,以進一步提升AI系統的可擴展性。
論文重點介紹了DeepSeek-V3的創新架構,包括多頭潛在注意力(MLA)和DeepSeekMoE混合專家模型。MLA通過壓縮鍵值緩存顯著降低了內存消耗,而MoE架構則通過選擇性激活參數子集,在保持高性能的同時大幅減少計算需求。此外,團隊還引入了FP8混合精度訓練和推測解碼技術,進一步優化了訓練成本和推理速度。這些設計有效解決了內存效率、成本效益和推理速度三大核心挑戰。
DeepSeek還針對未來硬件架構提出了前瞻性建議,包括增強錯誤檢測機制、優化CPU-GPU互連、發展智能網絡技術等。團隊特別強調了硬件與模型的協同設計,例如通過節點受限路由策略降低通信延遲,以及利用InfiniBand GPUDirect Async(IBGDA)技術提升網絡效率。這些見解不僅適用于當前AI系統,也為下一代硬件開發提供了重要參考。
#DeepSeek-V3 #AI硬件協同設計 #MoE架構 #FP8訓練 #低成本AI
閱讀更多:
https://arxiv.org/pdf/2505.09343
Synchron 首次實現與 iPhone、iPad 和 Apple Vision Pro 的原生腦機接口集成
蘋果與腦機接口公司Synchron的合作標志著人機交互進入全新階段。近期,Synchron宣布其腦機接口設備Stentrode將成為首個與蘋果原生協議集成的產品,基于蘋果新發布的BCI HID(腦機接口人機交互設備)配置文件,用戶可通過意念直接操控iPhone、iPad和Apple Vision Pro。
Synchron的技術優勢在于其非侵入性植入方式。與Neuralink需開顱手術不同,Stentrode通過血管系統植入大腦特定區域,大幅降低了手術風險。此外,BCI HID實現了雙向通信閉環,設備可根據界面布局和上下文信息調整反饋,提升解碼精度和用戶體驗。蘋果的系統層級支持進一步推動了腦機接口的普及,使其與觸控、語音并列為操作系統的標準輸入方式。
盡管Stentrode在響應速度和數據帶寬上仍有提升空間,但其臨床適用性和安全性已得到驗證。Synchron首席執行官湯姆·奧克斯利博士(Dr. Tom Oxley)強調,腦機接口不僅是輔助工具,更是下一代交互技術的核心。隨著FDA審批路徑的明晰和資本市場的關注,腦機接口行業正迎來黃金發展期,未來或將在工作、社交、教育等領域引發革命性變革。
#腦機接口 #蘋果 #Synchron #人機交互 #無障礙技術
閱讀更多:
https://www.businesswire.com/news/home/20250513927084/en/Synchron-To-Achieve-First-Native-Brain-Computer-Interface-Integration-with-iPhone-iPad-and-Apple-Vision-Pro
AI 驅動科學
能量與記憶:一種新的神經網絡范式
傳統Hopfield網絡模型如何更準確地描述人類記憶?加州大學圣巴巴拉分校的Francesco Bullo、Simone Betteti、Giacomo Baggio和帕多瓦大學的Sandro Zampieri團隊提出輸入驅動可塑性(IDP)模型,通過動態調整能量景觀,使記憶檢索過程更接近人類實際體驗。
?經典 Hopfield 模型與 IDP Hopfield 模型的比較。Credit: Science Advances (2025).
研究團隊開發的IDP模型將外部輸入直接整合到神經突觸的動態變化中,改變了傳統Hopfield網絡將輸入視為靜態初始條件的局限。通過能量景觀(energy landscape,記憶存儲與檢索的物理模型)分析,IDP模型能夠從部分輸入(如貓尾巴)準確檢索完整記憶(整只貓)。模型在噪聲環境下表現出色,能夠利用噪聲過濾不穩定記憶,優先選擇更穩定的記憶。此外,研究還發現IDP模型與Transformer架構(如ChatGPT)在注意力機制上的潛在聯系,為未來機器學習系統設計提供了新思路。研究發表在 Science Advances 上。
#神經科學 #記憶機制 #計算模型與人工智能模擬 #大模型技術
閱讀更多:
Betteti, Simone, et al. “Input-Driven Dynamics for Robust Memory Retrieval in Hopfield Networks.” Science Advances, vol. 11, no. 17, Apr. 2025, p. eadu6991. science.org (Atypon), https://doi.org/10.1126/sciadv.adu6991
用AI 分析筆跡可以及早發現兒童閱讀障礙
如何低成本實現兒童閱讀障礙(dyslexia)和書寫障礙(dysgraphia)的早期篩查?布法羅大學Sahana Rangasrinivasan、Venu Govindaraju團隊與內華達大學Abbie Olszewski合作,開發出基于人工智能的筆跡分析系統,可同步檢測兩種學習障礙的17項行為特征。
?手寫樣本的結構分析:a. 非典型邊距使用;b. 不一致的字母大小;c. 表示字符高度的直方圖;d. 表示字符間距離的直方圖。Credit: SN Computer Science (2025).
研究團隊首先整合機器學習與自然語言處理技術,構建能分析手寫樣本多維特征的AI框架。該系統可量化評估非典型邊距使用(atypical margin use)、字母大小不一致(inconsistent letter sizing)等視覺特征,并通過直方圖建模字符高度/間距分布。為彌補訓練數據不足,團隊聯合小學教師收集K-5學生紙筆和平板書寫樣本(經倫理審查匿名化處理),并基于DDBIC清單標注17項行為指標。驗證顯示,AI模型能準確識別運動困難(通過筆壓/速度分析)、拼寫錯誤和語法問題,其篩查效果與人工評估相當。特別值得注意的是,系統可檢測傳統方法易遺漏的輕度閱讀障礙案例——這些兒童口語能力正常,但書寫中會出現字母反轉(letter reversals)等特征。該技術已作為美國國家特殊教育AI研究所項目的一部分推進應用。研究發表在 SN Computer Science 上。
#疾病與健康 #AI驅動科學 #個性化醫療 #兒童發育 #神經發育障礙
閱讀更多:
Rangasrinivasan, Sahana, et al. “AI-Enhanced Child Handwriting Analysis: A Framework for the Early Screening of Dyslexia and Dysgraphia.” SN Computer Science, vol. 6, no. 5, Apr. 2025, p. 399. Springer Link, https://doi.org/10.1007/s42979-025-03927-0
AI工具威脅科研質量:低質量論文數量激增538%
AI輔助科研是否正在降低學術標準?薩里大學的Tulsi Suchak、Matt Spick團隊通過分析美國國家健康數據庫(NHANES)相關論文發現,2021年后低質量研究呈現爆炸式增長,2024年相關論文數量較前期平均水平激增47倍。
?按年份劃分的出版物數量:A) 本評論中確定的單因素 NHANES 分析 B) 通過在 PubMed 上搜索“生物庫”確定的按年份劃分的出版物總數。
研究團隊系統檢索了2014-2024年間基于NHANES數據庫的341篇論文。這些論文均采用單因素分析。分析顯示,2021年后論文數量從年均4篇飆升至2022年33篇、2023年82篇,2024年前9個月已達190篇。其中67%的研究忽視多因素交互作用,38%存在數據選擇性使用(data dredging,即僅挑選有利數據子集)問題且未提供合理解釋。更嚴重的是,部分論文通過API接口快速獲取數據后,使用大型語言模型批量生成"看似科學但經不起推敲"的內容。研究建議期刊引入統計專家評審、要求作者公開數據使用范圍和時間段,并建立類似英國健康數據平臺的追蹤系統。研究發表在 PLOS Biology 上。
#AI驅動科學 #自動化科研 #科研誠信 #數據濫用 #公共衛生
閱讀更多:
Suchak, Tulsi, et al. “Explosion of Formulaic Research Articles, Including Inappropriate Study Designs and False Discoveries, Based on the NHANES US National Health Database.” PLOS Biology, vol. 23, no. 5, May 2025, p. e3003152. PLoS Journals, https://doi.org/10.1371/journal.pbio.3003152
Nemotron-Research-Tool-N1讓大模型工具調用能力超越GPT-4o
如何讓大模型更智能地使用外部工具?NVIDIA聯合賓夕法尼亞州立大學、華盛頓大學的Shaokun Zhang、Yi Dong等研究者開發出Nemotron-Research-Tool-N1(Tool-N1)系列模型,通過強化學習方法使7B/14B參數規模的模型工具調用能力超越GPT-4o。
研究采用基于規則的強化學習(RL)策略,設計僅評估工具調用格式有效性(format validity)和功能正確性(functional correctness)的二元獎勵函數。與傳統監督微調(SFT)依賴模仿強模型不同,該方法允許模型自主發展推理策略。在BFCL、APIBank等基準測試中,Tool-N1-14B相對GPT-4o取得2%-5%的性能提升,7B版本也顯著優于同類模型。值得注意的是,純RL訓練效果優于常見的"SFT-then-RL"流程,表明輕量級獎勵設計可有效替代復雜的軌跡蒸餾。該研究還系統分析了5518條工具調用軌跡,為RL訓練策略設計提供實證依據。研究團隊已開源模型代碼,推動工具調用領域的可復現研究。
#大模型技術 #預測模型構建 #自動化科研 #強化學習 #工具調用
閱讀更多:
Zhang, Shaokun, et al. Nemotron-Research-Tool-N1: Exploring Tool-Using Language Models with Reinforced Reasoning. arXiv:2505.00024, arXiv, 12 May 2025. arXiv.org, https://doi.org/10.48550/arXiv.2505.00024
AutoLibra:從開放反饋中自動生成AI代理評估指標
如何讓AI代理評估更貼近人類需求?斯坦福大學、多倫多大學和賓夕法尼亞大學的Hao Zhu、Phil Cuvin、Xinkai Yu等研究人員開發了AutoLibra框架,成功將開放的人類反饋轉化為可量化的評估指標,在多個AI代理領域實現了20%的性能提升。
研究團隊設計了兩階段指標生成方法:首先通過反饋定位(feedback grounding)將每條人類反饋(如"不要重復點擊禁用按鈕")關聯到代理的具體行為;然后通過行為聚類(behavior clustering)將相似行為歸類為可量化指標(如"元素交互準確性")。為評估指標質量,團隊提出覆蓋率(coverage,指標覆蓋反饋的比例)和冗余度(redundancy,指標重復程度)兩個元指標。實驗顯示,在80條標注軌跡上,AutoLibra生成的指標覆蓋率達80%,比專家設計的指標更細粒度。應用方面,在文本游戲任務Baba-Is-AI中,使用這些指標優化代理使性能提升20%;網頁導航任務WebVoyager經過18輪反饋迭代優化后性能提升5%。研究還發現了一些被專家忽視的行為評估維度,如"自主決策適度性"。
#大模型技術 #自動化科研 #AI驅動科學 #評估方法 #人機交互
閱讀更多:
Zhu, Hao, et al. AutoLibra: Agent Metric Induction from Open-Ended Feedback. arXiv:2505.02820, arXiv, 5 May 2025. arXiv.org, https://doi.org/10.48550/arXiv.2505.02820
基于LLM的算法使無損數據壓縮率翻倍
中國科學院華中人工智能研究所、大連理工大學彭程實驗室和滑鐵盧大學的Ziguang Li、Ming Li等團隊開發出LMCompress算法,利用大型語言模型(LLMs)實現壓縮率翻倍,驗證了"理解即壓縮"的理論猜想。
?圖像比較了 LMCompress 與傳統最先進方法以及 DeepMind-Meta&INRIA 團隊獨立提出的基于大型模型的方法的無損壓縮率。比較針對四種類型的數據:圖像、視頻、音頻和文本。結果表明,LMCompress 在所有數據類型上的表現均優于其他方法。Credit: Li et al.
研究團隊提出LMCompress創新框架,針對文本、圖像、音頻、視頻四種數據類型分別采用對應的大型模型(如處理文本的LLM、處理圖像的視覺模型)。通過與傳統壓縮工具(bzip/JPEG-2000/FLAC/H.264)及DeepMind-Meta&INRIA方案的對比測試顯示:文本壓縮率達到zpaq的1/3,圖像和音頻壓縮率提升2倍,視頻壓縮率提升近2倍。該成果首次實證了香農1948年提出的理論——模型對數據的理解深度決定壓縮效率。核心機制在于:當模型能準確預測用戶將要傳輸的內容時,只需傳遞極少量信息即可在接收端完整重構數據。應用測試表明,該技術可使手機數據傳輸速度提升約2倍,未來可能徹底取代傳統壓縮格式(如.zip文件)。研究為語義通信等新興領域奠定基礎,并計劃將方法拓展至模型比對和抄襲檢測領域。研究發表在 Nature Machine Intelligence 上。
#大模型技術 #預測模型構建 #數據壓縮 #人工智能應用 #跨學科整合
閱讀更多:
Li, Ziguang, et al. “Lossless Data Compression by Large Models.” Nature Machine Intelligence, May 2025, pp. 1–6. www.nature.com, https://doi.org/10.1038/s42256-025-01033-7
AI模型通過社交媒體帖子精準識別抑郁癥跡象
愛荷華州立大學Wenli Zhang團隊開發出深度知識感知模型,通過分析社交媒體數字痕跡實現抑郁癥早期風險檢測,為傳統篩查提供補充方案。
研究采用知識感知深度學習框架(DKDD),將130萬條Reddit帖子和2500條WebMD醫學條目作為訓練數據,重點捕捉與抑郁癥臨床診斷相關的數字痕跡,而非傳統的情感分析。模型通過對比醫學術語(如"絕望感"、"失眠")與用戶長期發帖內容,識別出具有臨床意義的抑郁風險指標,避免因抱怨天氣或電影等非相關負面內容導致的誤判。
實驗顯示,該框架在檢測癥狀表述(如情緒低落)、生活事件(如失業離婚)和治療提及等方面具有優勢。與現有方法相比,其創新性在于動態跟蹤用戶發帖模式變化,并整合醫學本體知識。研究團隊強調需建立包含隱私專家、倫理學家和心理健康從業者的監督機制,確保模型應用符合GDPR等數據保護法規。該技術可擴展至公共衛生監測,例如分析X平臺十年數據與重大事件(如疫情)對群體心理健康的影響。研究發表在 Journal of Management Information Systems 上。
#疾病與健康 #心理健康與精神疾病 #AI驅動科學 #預測模型構建 #數字倫理
閱讀更多:
Zhang, Wenli, et al. “Depression Detection Using Digital Traces on Social Media: A Knowledge-Aware Deep Learning Approach.” Journal of Management Information Systems, vol. 41, no. 2, Apr. 2024, pp. 546–80. arXiv.org, https://doi.org/10.1080/07421222.2024.2340822
AI群體自發形成社會規范,無需人類干預
AI系統能否像人類一樣形成社會規范?倫敦大學城市圣喬治學院的Ariel Flint Ashery、Luca Maria Aiello和Andrea Baronchelli團隊研究發現,大型語言模型群體通過互動能自發形成共享規范,甚至產生無法追溯至個體的集體偏見。
研究采用經典的“命名游戲”(naming game,模擬社會規范形成的實驗范式)框架,讓24-200個LLM代理隨機配對互動。每對代理需從共享選項中選擇“名稱”,匹配成功獲得獎勵。實驗測試了四種主流LLM(包括Llama-2-70b-Chat和Claude-3.5-Sonnet)。結果顯示,群體確實能自發形成命名規范,無需中央協調。更驚人的是,出現了無法用個體偏好解釋的集體偏見——就像人類文化中的“從眾效應”。最后實驗發現,僅需10%的“堅定少數”堅持新規范,就能顛覆整個群體的原有選擇,類似人類社會的“臨界點”現象。這些發現在不同LLM中均成立,為AI安全研究開辟了新方向:不僅要關注單個模型,還需警惕群體互動產生的意外后果。研究發表在 Science Advances 上。
#大模型技術 #計算模型與人工智能模擬 #社會規范 #AI安全 #群體智能
閱讀更多:
Ashery, Ariel Flint, et al. “Emergent Social Conventions and Collective Bias in LLM Populations.” Science Advances, vol. 11, no. 20, May 2025, p. eadu9368. science.org (Atypon), https://doi.org/10.1126/sciadv.adu9368
掌控人工智能:新技術為大型語言模型提供更多控制
大型語言模型常產生不可控輸出,加州大學圣地亞哥分校Mikhail Belkin團隊聯合麻省理工學院和哈佛大學研究人員,開發出能精準調控AI行為的新技術,使模型輸出更安全可靠。
研究團隊提出非線性特征學習(nonlinear feature learning)方法,通過分析LLM內部激活狀態,識別出控制毒性、事實準確性等概念的關鍵特征。其開發的線性遞歸特征機(Linear Recursive Feature Machines)算法,將神經網絡訓練過程與經典稀疏恢復算法IRLS(Iteratively Reweighted Least Squares)建立理論聯系。實驗顯示,該方法能減少35%計算資源消耗,在虛假信息檢測任務中使AI"幻覺"(hallucination)發生率降低63%,并提升41%的多語言理解能力。技術已應用于莎士比亞英語解析等場景,代碼已開源。研究為開發專業AI工具(如醫療咨詢、創意寫作)提供新路徑,同時提升模型透明度。研究發表在 PNAS 上。
#大模型技術 #預測模型構建 #AI安全 #語言模型控制 #計算效率
閱讀更多:
Radhakrishnan, Adityanarayanan, et al. “Linear Recursive Feature Machines Provably Recover Low-Rank Matrices.” Proceedings of the National Academy of Sciences, vol. 122, no. 13, Apr. 2025, p. e2411325122. world, www.pnas.org, https://doi.org/10.1073/pnas.2411325122
整理|ChatGPT
編輯|丹雀、存源
關于追問nextquestion
天橋腦科學研究院旗下科學媒體,旨在以科學追問為紐帶,深入探究人工智能與人類智能相互融合與促進,不斷探索科學的邊界。如果您有進一步想要討論的內容,歡迎評論區留言,或后臺留言“社群”即可加入社群與我們互動。
關于天橋腦科學研究院
天橋腦科學研究院(Tianqiao and Chrissy Chen Institute)是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一,圍繞全球化、跨學科和青年科學家三大重點,支持腦科學研究,造福人類。
Chen Institute與華山醫院、上海市精神衛生中心設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室;與加州理工學院合作成立了加州理工天橋神經科學研究院。
Chen Institute建成了支持腦科學和人工智能領域研究的生態系統,項目遍布歐美、亞洲和大洋洲,包括、、、科研型臨床醫生獎勵計劃、、等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.