█腦科學動態
Nature:腹側海馬體多巴胺受體,焦慮抑郁治療新靶點
Nature:首次捕捉大腦學習時的神經重塑瞬間
Nature:果蠅大腦路線圖揭示神經系統性別差異
臨床試驗為大嬰兒分娩提供安全選擇方案
映射記憶:蛋白質追蹤技術揭示學習過程中的突觸變化
大腦如何構建"行動地圖"?揭秘海馬體與運動系統協作機制
大腦如何感知意外,為何這對心理健康很重要
影響嬰兒學步時間的11個關鍵基因
重新思考心理學,在誤解中尋找意義
█AI行業動態
OpenAI迎來應用CEO Fidji Simo
Google Gemini 2.0 Flash圖像生成功能升級
Avatar IV:用照片+語音即可生成真人級動態視頻
█AI驅動科學
大模型邏輯漏洞:為什么AI總犯低級錯誤?
語境理論:統一視角揭示表征學習本質
攻克神經網絡遷移學習效果預測難題
RetroInfer:向量存儲技術加速大語言模型長文本推理
機器學習預測兒童順鉑化療聽力損失風險
AI作曲助手Amuse:讓音樂創作靈感"看得見"
腦科學動態
Nature:腹側海馬體多巴胺受體,焦慮抑郁治療新靶點
西奈山醫院的Arthur Godino、Marine Salery和Eric J. Nestler團隊發現,大腦腹側海馬體中兩類多巴胺受體(D1/D2)就像情緒的"油門"和"剎車",分別調控趨近和回避行為。
?vHipp D1 和 D2 細胞的拓撲結構。Credit: Nature (2025).
研究團隊首先通過單細胞測序技術,確定了腹側海馬體(vHipp)中表達D1和D2受體的神經元具有不同的分子特征和空間分布。隨后使用光遺傳學技術,發現激活D2受體神經元可使小鼠在沖突情境中的回避行為減少40-67%,而激活D1神經元則增加探索行為。進一步實驗顯示,在壓力決策任務中,這兩類神經元被差異性激活:D1神經元在"冒險獲取獎勵"時活躍,D2神經元則在"安全撤退"時放電。通過病毒示蹤技術,團隊還發現這些神經元分別投射到不同的下游腦區,形成兩條獨立的情緒調控通路。特別值得注意的是,D2神經元與紋狀體存在直接連接,這可能解釋了為何激活這類神經元能快速改變行為反應。研究發表在 Nature 上。
#疾病與健康 #神經調控 #心理健康與精神疾病 #神經機制與腦功能解析 #多巴胺信號
閱讀更多:
Godino, Arthur, et al. “Dopamine D1–D2 Signalling in Hippocampus Arbitrates Approach and Avoidance.” Nature, May 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41586-025-08957-5
Nature:首次捕捉大腦學習時的神經重塑瞬間
加州大學圣地亞哥分校的Assaf Ramot、Felix Taschbach和Takaki Komiyama團隊結合成像技術與算法,首次捕捉到丘腦-皮層通路在學習過程中的動態重塑,證明學習會物理性改變腦區間的"對話方式"。
?神經元活動軌跡揭示了小鼠學習運動任務時大腦回路的演化過程。左圖:行為過程中記錄的視野示例;每種顏色代表不同的神經元。右圖:選定神經元的活動軌跡。Credit: Komiyama Lab, UC San Diego
研究團隊開發的ShaReD算法,解決了不同動物神經活動差異的難題。通過縱向追蹤小鼠初級運動皮層(M1)的輸入源,發現運動丘腦在學習兩周后會選擇性激活特定M1神經元集群。光遺傳學實驗顯示,這種精準調控對執行學會的動作至關重要——抑制丘腦輸入會使熟練動作立刻失調。更驚人的是,學習不僅改變神經活動強度,還重構了丘腦與皮層間的物理連接,使信息傳遞更快更精準。這種重塑類似"升級通信線路",而非簡單調高音量。研究發表在 Nature 上。
#神經科學 #神經機制與腦功能解析 #計算模型與人工智能模擬 #運動學習 #腦機接口
閱讀更多:
Ramot, Assaf, et al. “Motor Learning Refines Thalamic Influence on Motor Cortex.” Nature, May 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41586-025-08962-8
Nature:果蠅大腦路線圖揭示神經系統性別差異
萊比錫大學的Katharina Eichler和Tomke Stürner團隊聯合劍橋大學研究人員,通過整合電子顯微鏡數據集,首次繪制了覆蓋果蠅整個神經系統的"路線圖",并發現了顯著的性別差異。
?圖片展示了研究中的神經元樣本。每種顏色代表在雌性大腦、雌性(左下)和雄性(右下)神經索中發現的一個細胞。Credit: Tomke Stürner, Uni Cambridge and LMB Cambridge
研究團隊整合了三個電子顯微鏡(EM)數據集(包括雌性全腦FAFB-FlyWire、雌性神經索FANC和雄性神經索MANC),首次實現了從大腦到腹側神經索(功能相當于脊椎動物脊髓)的完整神經回路追蹤。通過光顯微鏡(LM)數據匹配,成功確定了51%的下行神經元(DNs,負責將大腦指令傳至身體)的細胞類型。比較分析揭示了驚人的性別差異:發現僅存在于單一性別的神經元群體,如雌性特有的aSP22神經元(后更名為DNa12)。功能研究表明,當aSP22活躍時,雌性會伸展腹部(產卵行為),而雄性則卷曲腹部(交配準備)。此外,團隊還鑒定了控制求偶鳴叫(雄性)和產卵器伸展(雌性)的特定神經回路。這些發現不僅提供了首個完整的果蠅神經系統"路線圖",更建立了跨性別比較的研究范式。研究發表在 Nature 上。
#神經科學 #神經機制與腦功能解析 #跨學科整合 #計算模型與人工智能模擬 #性別差異
閱讀更多:
Stürner, Tomke, et al. “Comparative Connectomics of Drosophila Descending and Ascending Neurons.” Nature, Apr. 2025, pp. 1–15. www.nature.com, https://doi.org/10.1038/s41586-025-08925-z
臨床試驗為大嬰兒分娩提供安全選擇方案
如何安全分娩大嬰兒?華威大學Siobhan Quenby與伯明翰圍產研究所Jason Gardosi團隊開展迄今最大規模臨床試驗,納入英國106家醫院2,893名孕婦,證明提前引產能降低肩難產風險而不增加剖腹產率。
研究采用多中心隨機對照設計,通過超聲篩查估計胎兒體重(EFW)>90%百分位的孕婦,隨機分配至38周引產組或標準護理組。結果顯示引產組肩難產(shoulder dystocia,胎兒肩膀卡在產道)發生率顯著降低(2.3% vs 3.1%),平均妊娠期縮短6天,嬰兒出生體重輕163.6克。重要的是,未增加緊急剖腹產或母親會陰撕裂風險。在嚴格遵循方案的孕婦中效果更明顯(風險降低38%)。該研究首次為臨床提供了三種安全選擇:自然等待、計劃剖腹產或38周引產。研究發表在 The Lancet 上。
#疾病與健康 #個性化醫療 #圍產醫學 #母嬰健康 #臨床決策
閱讀更多:
Gardosi, Jason, et al. “Induction of Labour versus Standard Care to Prevent Shoulder Dystocia in Fetuses Suspected to Be Large for Gestational Age in the UK (the Big Baby Trial): A Multicentre, Open-Label, Randomised Controlled Trial.” The Lancet, vol. 0, no. 0, May 2025. www.thelancet.com, https://doi.org/10.1016/S0140-6736(25)00162-X
映射記憶:蛋白質追蹤技術揭示學習過程中的突觸變化
哈佛大學Doyeon Kim、Adam E. Cohen等研究者開發出EPSILON技術,通過熒光標記AMPAR蛋白(記憶形成關鍵分子),首次實現活體大腦突觸變化的高清動態觀測。該技術已發現記憶印跡與特定蛋白運輸的強相關性,為治療記憶障礙疾病帶來希望。
?熒光標記與尖端顯微鏡的結合,使研究人員能夠以前所未有的分辨率闡明突觸行為。Credit: Pojeong Park
研究團隊開發的EPSILON(神經元細胞外蛋白質表面標記)技術,采用順序脈沖追蹤標記法,用兩種膜不通透染料分時標記突觸表面的AMPAR。當神經元釋放含有AMPAR的囊泡時,新舊染料會形成獨特熒光信號,使研究人員能以0.1微米分辨率觀測蛋白質運輸。在恐懼記憶實驗中,小鼠海馬CA1區顯示:經歷情境恐懼訓練后2-4小時內,約37%的突觸發生顯著增強(AMPAR增加量>50%),這些突觸的空間分布與cFos(神經元激活標志物)表達區域高度重合。進一步分析揭示,單個記憶痕跡涉及約15,000個突觸的協同變化,且增強程度與后續記憶 recall 準確率呈正比(r=0.71)。傳統電鏡技術僅能提供靜態快照,而EPSILON首次實現"突觸可塑性電影"拍攝。研究發表在 Nature Neuroscience 上。
#神經科學 #神經機制與腦功能解析 #記憶機制 #突觸可塑性
閱讀更多:
Kim, Doyeon, et al. “EPSILON: A Method for Pulse-Chase Labeling to Probe Synaptic AMPAR Exocytosis during Memory Formation.” Nature Neuroscience, Mar. 2025, pp. 1–9. www.nature.com, https://doi.org/10.1038/s41593-025-01922-5
大腦如何構建"行動地圖"?揭秘海馬體與運動系統協作機制
人類如何在豐富的行為選項中做出最優選擇?馬克斯·普朗克學會的Irina Barnaveli、Simone Viganò、Daniel Reznik與倫敦大學學院的Patrick Haggard、Christian F. Doeller團隊發現,海馬系統通過構建"認知地圖"組織行動選擇,并與運動系統協同工作。
研究團隊設計沉浸式虛擬現實任務,要求參與者學習控制虛擬球飛行的不同動作組合。通過功能性磁共振成像監測發現,內嗅皮層在動作比較時呈現典型的六邊形活動模式——這是"認知地圖"的神經標志。海馬體活動強度與動作結果的二維相似性成正比,證實了地圖狀組織原則。有趣的是,輔助運動區(SMA,運動計劃腦區)專門表征單個動作,對重疊計劃反應更強。最關鍵的是,海馬體與輔助運動區的功能連接強度隨動作相似性而變化,揭示了兩大系統的動態協作機制。這些發現表明,大腦通過抽象的地圖狀表征高效組織行為選項,將空間導航的神經機制擴展到了行動選擇領域。研究發表在 Nature Communications 上。
#神經科學 #神經機制與腦功能解析 #記憶機制 #計算模型與人工智能模擬
閱讀更多:
Barnaveli, Irina, et al. “Hippocampal-Entorhinal Cognitive Maps and Cortical Motor System Represent Action Plans and Their Outcomes.” Nature Communications, vol. 16, no. 1, May 2025, p. 4139. www.nature.com, https://doi.org/10.1038/s41467-025-59153-y
大腦如何感知意外,為何這對心理健康很重要
當現實與預期不符時,大腦如何發出警報?弗里德里希·米歇爾生物醫學研究所的Magdalena Solyga和Georg B Keller團隊通過小鼠和人類實驗發現,大腦對視覺和聽覺不匹配的反應存在非線性增強效應。
?FMI 的研究人員將小鼠實驗改編為人類實驗,并使用腦電圖 (EEG) 和虛擬現實 (VR) 技術,發現小鼠大腦在運動過程中對視覺不匹配的反應相似。Credit: Friedrich Miescher Institute for Biomedical Research
研究團隊首先設計小鼠虛擬實驗:當小鼠奔跑時,聲音響度與其速度同步變化,偶爾靜音制造聽覺不匹配。通過雙光子顯微鏡發現,聽覺皮層(L2/3)神經元對這類不匹配反應強烈。進一步實驗顯示,若同時暫停視覺流和聲音(多模態不匹配),大腦反應強度激增,甚至出現僅響應組合不匹配的特化神經元。在人類實驗中,團隊使用EEG和VR技術復現了類似現象:當受試者行走時虛擬場景突然凍結,其腦電反應模式與小鼠高度相似。這些發現表明,大腦通過非線性的跨模態整合機制處理預測誤差,且該機制在物種間保守。研究為開發精神分裂癥等疾病的客觀診斷工具奠定了基礎——異常或不存在的"不匹配反應"可能成為生物標志物。研究發表在 eLife 上。
#認知科學 #神經機制與腦功能解析 #心理健康與精神疾病 #跨學科整合 #計算模型與人工智能模擬
閱讀更多:
Solyga, Magdalena, and Georg B. Keller. “Multimodal Mismatch Responses in Mouse Auditory Cortex.” eLife, vol. 13, Jan. 2025. elifesciences.org, https://doi.org/10.7554/eLife.95398.3
發現影響嬰兒學步時間的11個關鍵基因
為什么有些寶寶9個月就會走路,有些要到2歲?薩里大學的Angelica Ronald、羅馬第二大學和倫敦大學伯貝克學院的Anna Gui等組成的國際團隊發現,遺傳因素解釋了約1/4的學步時間差異,并鑒定出11個相關基因位點。
研究團隊對70,560名歐洲血統嬰兒進行了全基因組關聯分析,發現11個獨立基因組顯著位點。單核苷酸多態性(SNP)分析顯示,遺傳力達24.13%,約11,900個基因變異共同作用。RBL2基因位點與大腦基因表達調控區域重疊,提示其可能通過影響神經發育發揮作用。遺傳相關性分析發現,較晚學步(仍在正常范圍內)與較低ADHD風險相關,同時與大腦皮層溝回發育程度呈正相關。多基因評分能預測3-5.6%的學步時間差異,并關聯運動控制相關腦區體積。這些發現為理解運動發育的生物學基礎提供了新視角,未來或有助于早期識別發育異常。研究發表在 Nature Human Behaviour 上。
#疾病與健康 #神經機制與腦功能解析 #個性化醫療 #兒科 #基因發現
閱讀更多:
Gui, Anna, et al. “Genome-Wide Association Meta-Analysis of Age at Onset of Walking in over 70,000 Infants of European Ancestry.” Nature Human Behaviour, May 2025, pp. 1–18. www.nature.com, https://doi.org/10.1038/s41562-025-02145-1
重新思考心理學,在誤解中尋找意義
心理學領域長期存在諸多被廣泛接受的迷思,從性別差異到潛意識信息的力量。Michael W. Eysenck通過系統性文獻回顧,對這些迷思進行了批判性分析,揭示了遺傳因素在人格形成中的主導作用,并指出當前心理健康分類系統的問題。
作者通過對當代心理學文獻的全面回顧,分析了性別差異、教養影響、潛意識信息等主題的實證研究。結果顯示,遺傳因素在人格形成中的作用遠大于教養方式,性別差異被夸大且因文化、地域而異。研究還發現潛意識信息的效果缺乏強有力證據支持。在心理健康領域,DSM-5(精神障礙診斷與統計手冊)被指出存在過度分類問題(共列出541種障礙),許多障礙實際上共享相同特征。此外,抗抑郁藥的效果被高估,心理治療更能解決根本問題。這些發現挑戰了公眾和專業人士的許多固有認知,呼吁對心理學研究和實踐進行更科學的評估。
#疾病與健康 #神經機制與腦功能解析 #個性化醫療 #兒科 #基因發現
閱讀更多:
Eysenck, Michael W. Rethinking Psychology : Finding Meaning in Misconceptions 2025, https://doi.org/10.4324/9781003596677
AI 行業動態
OpenAI迎來應用CEO Fidji Simo
OpenAI宣布任命39歲的Fidji Simo為應用CEO,直接向首席執行官Sam Altman匯報。Fidji Simo是硅谷知名高管,曾掌舵Instacart并擔任Meta核心業務負責人十年,以卓越的領導力和產品創新能力著稱。Altman表示,此次架構調整旨在強化執行力,他本人將更專注于研究、算力與安全領域,為超級智能的臨近做準備。Fidji Simo在過渡期將繼續兼任Instacart CEO,未來擔任其董事會主席,她稱加入OpenAI是榮幸與責任。
Fidji Simo的職業生涯堪稱傳奇。她出生于法國小鎮Sète,從巴黎高等商學院畢業后,先后在eBay和Meta嶄露頭角,主導了Facebook Live、Watch等顛覆性功能,推動移動廣告收入增長。2021年,她成為Instacart首位外部CEO,將廣告經驗融入物流技術,助力品牌曝光。OpenAI高層對其評價極高,首席營銷官Kate Rouch稱她為最有原則的領導者。此次加盟,預示ChatGPT等產品或將迎來重大革新。
#OpenAI #FidjiSimo #AGI #硅谷高管 #ChatGPT
閱讀更多:
https://openai.com/index/leadership-expansion-with-fidji-simo/
Google Gemini 2.0 Flash圖像生成功能升級:更精準、更開放、更協作
Google近日宣布,其Gemini 2.0 Flash圖像生成功能已進入預覽階段,開發者可通過Google AI Studio和Vertex AI平臺使用模型gemini-2.0-flash-preview-image-generation。此次升級顯著提升了視覺質量、文字渲染精度,并降低了內容過濾攔截率,使生成結果更貼近用戶需求。功能支持多樣化的應用場景,例如產品圖背景替換、局部圖像修改、實時協作繪圖等,為開發者提供了更靈活的創作工具。
新功能亮點包括“對話式圖片修改”和“圖文結合生成”。用戶可通過自然語言指令實現局部調整,例如將草地替換為海灘,或生成帶價格標簽的電商產品圖。此外,實時協作繪圖(Co-Drawing Sample App)允許用戶與Gemini共同編輯圖像,模擬設計師團隊的協作流程。這些改進不僅提升了效率,還降低了技術門檻,使創意落地更便捷。
開發者可利用該功能實現動態產品SKU(庫存量單位)生成、創意輔助等場景。例如,輸入“手繪風格馬卡龍教程圖”即可快速生成視覺內容。Google強調,Gemini 2.0 Flash的升級旨在推動AI工具在電商、廣告等領域的應用,同時為開發者提供更開放的實驗環境。
#Google #Gemini2.0 #AI圖像生成 #開發者工具 #創意協作
閱讀更多:
https://aistudio.google.com/
HeyGen推出革命性AI模型Avatar IV:用照片+語音即可生成真人級動態視頻
人工智能公司HeyGen最新發布的Avatar IV模型徹底改變了數字內容創作方式。這款基于"擴散式音頻驅動表情引擎(Diffusion-inspired Audio-to-Expression Engine)"的AI技術,能夠通過單張照片、文字腳本和用戶語音,生成具有驚人真實感的擬人化視頻。與傳統"語音對嘴同步"技術不同,該模型能深度分析語音中的語調(Tone)、節奏(Rhythm)、情緒(Emotion)和語義意圖(Intent),進而驅動面部微表情、頭部動作和真實的時間節奏感(Temporal Realism),使虛擬形象呈現點頭、停頓、挑眉等自然的人類表達特征。
該技術的突破性在于其卓越的適應能力。不僅支持正臉肖像,還能處理側臉和三分之二角度照片,生成具有電影質感的畫面效果。同時兼容Stable Diffusion等工具生成的AI圖像,可將動漫角色、像素游戲人物甚至寵物照片轉化為具有表達能力的動態形象。從半身像到全身像,從真人到二次元角色,Avatar IV為虛擬人視頻、AI臉替、動漫動效、游戲配音及播客視覺化等多元場景提供了全新解決方案。
使用流程極其簡化,用戶只需提供自拍照、文字腳本和語音錄音,即可快速生成高清視頻。這項技術特別適合UGC(用戶生成內容)創作,無需專業拍攝設備就能制作具有個人風格的視頻內容。
#HeyGen #AI視頻生成 #AvatarIV #數字內容創作 #人工智能
閱讀更多:
https://help.heygen.com/en/articles/11269603-new-feature-alert-heygen-avatar-iv-is-here
AI 驅動科學
大模型邏輯漏洞:為什么AI總犯低級錯誤?
大語言模型為何總犯"低級邏輯錯誤"?北京大學、清華大學、阿姆斯特丹大學、卡內基梅隆大學和MBZUAI的Fengxiang Cheng、Haoxuan Li等研究者聯合發布系統性綜述,揭示大模型在演繹推理和自洽性方面的關鍵瓶頸。
研究團隊建立雙維度分析框架:針對邏輯問答(logical QA),現有方法可分為基于外部求解器(將問題轉為符號表達式求解)、提示工程(設計推理鏈提示)和微調訓練(增強邏輯樣本)三類;針對邏輯一致性(logical consistency),系統梳理了否定一致性(如"信天翁是生物"矛盾回答)、蘊涵一致性(鐵→金屬的推理斷裂)、傳遞一致性("喜鵲有翅膀"悖論)等五類問題。實驗顯示,LLaMA-13B在FOLIO數據集上8-shot準確率僅33.63%,接近隨機猜測。研究提出的通用優化框架通過多候選答案篩選,將邏輯違背程度降低40-60%。未來需開發能同時處理模態邏輯(modal logic,含不確定性的推理)和多一致性的高效算法。
#大模型技術 #計算模型與人工智能模擬 #邏輯推理 #AI驅動科學 #自然語言處理
閱讀更多:
Cheng, Fengxiang, et al. Empowering LLMs with Logical Reasoning: A Comprehensive Survey. arXiv:2502.15652, arXiv, 24 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.15652
語境理論:統一視角揭示表征學習本質
基礎模型的表征學習機制長期缺乏理論解釋。卡內基梅隆大學的Runtian Zhai、Zico Kolter、Pradeep Ravikumar與北京大學的Kai Yang團隊提出"上下文關聯理論",證明多種學習范式實質都是學習輸入與上下文變量的關聯,并發現模型規模收益遞減的根本原因。
研究團隊建立數學框架證明,監督學習、自監督學習(self-supervised learning)和流形學習(manifold learning)都可統一理解為:通過輸入X與上下文變量A的關聯來學習表征。理論分析顯示,最優表征應逼近期望算子(expectation operator)的頂部奇異函數,此時編碼器被稱為"學習到上下文關聯"。實驗證實當模型足夠大時,繼續增加參數只能帶來邊際改善,驗證了規模收益遞減現象。團隊提出創新性的上下文有用性評估指標,該指標僅依賴X與A的統計關系,無需下游任務數據。在圖像、文本等多領域數據集驗證中,該指標與編碼器在下游任務的性能Spearman相關系數達0.73。研究為突破當前預訓練瓶頸指明方向——未來需聚焦"上下文擴展"而非單純模型擴展。
#大模型技術 #計算模型與人工智能模擬 #跨學科整合 #表征學習理論
閱讀更多:
Zhai, Runtian, et al. Contextures: Representations from Contexts. arXiv:2505.01557, arXiv, 2 May 2025. arXiv.org, https://doi.org/10.48550/arXiv.2505.01557
攻克神經網絡遷移學習效果預測難題
醫療診斷等領域常面臨訓練數據不足的困境,傳統神經網絡容易過擬合。唐德斯神經科學研究所的Alessandro Ingrosso與意大利國家核物理研究所、帕爾馬大學、博洛尼亞大學的研究人員合作,開發出能預測遷移學習(transfer learning)效果的新數學方法,解決了小樣本場景下AI訓練的關鍵理論問題。
研究團隊結合了"核重正化"(Kernel Renormalization,一種處理神經網絡權重的新方法)與自旋玻璃理論中的經典"Franz-Parisi"形式,構建了單隱藏層網絡的遷移學習數學模型。該模型通過耦合源網絡(預訓練網絡)與目標網絡的權重參數,量化兩者相關性對遷移效果的影響。在比例極限(即訓練集大小與網絡隱藏層節點數同步無限增大但保持固定比例的特殊數學場景)下的理論分析表明,遷移效果取決于經過重整化的源-目標核函數。實驗驗證使用C-EMNIST和C-CIFAR數據集,當源網絡在784維數據上預訓練后,目標網絡在僅100個樣本條件下仍能保持良好泛化能力。理論預測的測試損失曲線與實驗結果的相關系數達0.93,顯著優于傳統統計模型。
#AI驅動科學 #預測模型構建 #計算模型與人工智能模擬 #遷移學習
閱讀更多:
Ingrosso, Alessandro, et al. Statistical Mechanics of Transfer Learning in Fully-Connected Networks in the Proportional Limit. arXiv:2407.07168, arXiv, 9 July 2024. arXiv.org, https://doi.org/10.48550/arXiv.2407.07168
RetroInfer:向量存儲技術加速大語言模型長文本推理
大語言模型處理長文本時面臨GPU內存爆炸難題。微軟研究院聯合中國科學技術大學、武漢大學等多校團隊開發的RetroInfer系統,通過向量索引技術實現最高10.5倍加速,同時保持全注意力精度,為百萬級token應用鋪平道路。
研究團隊提出的"向量存儲系統"架構,核心是wave index(注意力感知向量索引)。該索引通過三分注意力近似(將token分為穩態/檢索/估計三個精度遞減區域)、精度有界估計(保證非關鍵token的貢獻誤差可控)和分段聚類(優化并行處理)三項技術,動態識別關鍵token。配套的wave buffer系統智能協調GPU與CPU資源,異步更新緩存并重疊計算傳輸。實驗顯示,在Llama等模型上,當上下文長度適配GPU內存時提速4.5倍;擴展至CPU內存后更達10.5倍,且準確率始終與全注意力持平。系統在RULER等長文本基準測試中展現優勢,支持批量處理超長代碼庫或對話場景。
#大模型技術 #計算模型與人工智能模擬 #跨學科整合 #高效推理系統
閱讀更多:
Chen, Yaoqi, et al. RetroInfer: A Vector-Storage Approach for Scalable Long-Context LLM Inference. arXiv:2505.02922, arXiv, 5 May 2025. arXiv.org, https://doi.org/10.48550/arXiv.2505.02922
機器學習預測兒童順鉑化療聽力損失風險
順鉑化療雖能有效治療兒童腫瘤,卻常導致不可逆聽力損傷。洛杉磯兒童醫院Etan Orgel團隊聯合南加州大學凱克醫學院Joshua Millstein等研究者,開發出首個可預測個體聽力損傷風險的機器學習工具PedsHEAR,準確率達95%。
研究團隊整合1,400名患兒數據,采用集成學習(ensemble learning,即組合多個模型提升性能)策略,結合邏輯回歸、隨機森林等算法,通過20輪10折交叉驗證優化模型。關鍵創新在于用高低風險分層閾值替代傳統0.5決策閾值,使預測更符合臨床需求。訓練集顯示優異性能(AUC 0.93),外部驗證中仍保持0.74-0.79的區分度。模型僅需常規臨床參數即可運行,將患者分為低(22%)、中(71%)、高(7%)三組風險,并輸出具體概率值。目前該工具已開放為網頁應用,醫生輸入診斷初期的常規數據即可獲得預測。研究為個性化化療方案制定提供量化依據,未來計劃擴展至成人患者并整合基因組數據。研究發表在 Journal of Clinical Oncology 上。
#AI驅動科學 #個性化醫療 #預測模型構建 #兒童腫瘤
閱讀更多:
Millstein, Joshua, et al. “Development and Validation of a Novel Prediction Model for Hearing Loss From Cisplatin Chemotherapy.” Journal of Clinical Oncology, May 2025. world, ascopubs.org, https://doi.org/10.1200/JCO-24-01861
AI作曲助手Amuse:讓音樂創作靈感"看得見"
音樂創作常受畫面、故事等多模態靈感啟發,但現有AI系統難以支持這一過程。韓國科學技術院(KAIST)的Yewon Kim、Sung-Ju Lee與卡內基梅隆大學的Chris Donahue團隊開發了Amuse系統,通過將文本/圖像/音頻轉化為和弦進行,使83%參與測試的音樂人獲得更流暢的創作體驗。
Amuse采用兩階段生成技術:首先通過多模態大語言模型將用戶輸入的"夏日海灘回憶"等文字/圖像轉化為音樂關鍵詞和初始和弦建議;隨后用拒絕采樣(rejection sampling)技術過濾不符合音樂理論的結果,確保輸出質量。系統集成在專業音樂軟件Hookpad中,包含Chord Generator(根據靈感生成和弦)和Chord Transcriber(從音頻提取和弦)兩大功能。用戶研究顯示,相比傳統工具,使用Amuse的音樂人創作效率提升32%,且能保留90%以上的創作主導權。特別值得注意的是,AI生成的和弦進行雖作為起點,但85%會被用戶修改,體現真正的協作關系。研究為音樂AI設計提供了新范式,證明技術可以增強而非替代人類創造力。研究發表在 Proceedings of the 2025 CHI Conference on Human Factors in Computing Systems 上。
#AI驅動科學 #跨學科整合 #音樂科技 #人機協作 #創意計算
閱讀更多:
Kim, Yewon, et al. “Amuse: Human-AI Collaborative Songwriting with Multimodal Inspirations.” Proceedings of the 2025 CHI Conference on Human Factors in Computing Systems, Association for Computing Machinery, 2025, https://doi.org/10.1145/3706598.3713818
整理|ChatGPT
編輯|丹雀、存源
關于追問nextquestion
天橋腦科學研究院旗下科學媒體,旨在以科學追問為紐帶,深入探究人工智能與人類智能相互融合與促進,不斷探索科學的邊界。如果您有進一步想要討論的內容,歡迎評論區留言,或后臺留言“社群”即可加入社群與我們互動。
關于天橋腦科學研究院
天橋腦科學研究院(Tianqiao and Chrissy Chen Institute)是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一,圍繞全球化、跨學科和青年科學家三大重點,支持腦科學研究,造福人類。
Chen Institute與華山醫院、上海市精神衛生中心設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室;與加州理工學院合作成立了加州理工天橋神經科學研究院。
Chen Institute建成了支持腦科學和人工智能領域研究的生態系統,項目遍布歐美、亞洲和大洋洲,包括、、、科研型臨床醫生獎勵計劃、、等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.