█腦科學動態
Science:暴飲暴食的遺傳根源
Science:遠紅光多巴胺探針,觀測腦內神經遞質“多色共舞”
心盲癥可能與大腦連通性的改變有關
年齡相關大腦連接變化導致社交能力下降
為個性化顱內腫瘤治療開發的磁驅動創新解決方案
服從命令將削弱道德責任感
血液檢測在門診記憶診所實現95%準確率的阿爾茨海默病診斷
海馬體如何形成穩定的記憶表征而不覆蓋舊記憶?
█AI行業動態
運動抗癌獲最高等級醫學實證
Google Veo 3推出FAST/TURBO模式
ChatGPT語音交互全面升級
█AI驅動科學
crossNN突破腫瘤診斷:基于表觀遺傳指紋識別170種癌癥
AI框架量化CEO同理心
AI工具PandemicLLM革新傳染病預測,準確率超越現有方法
用筆記本電腦診斷癌癥,68例數據訓練8分鐘完成!
CURE框架實現代碼與測試協同進化
從工具到隊友:臨床醫生與AI協作診斷的工作流程
大語言模型自我挑戰框架:無需人工標注實現性能翻倍
腦科學動態
Science:腦纖毛中 Gpr45 基因活性的發現揭示了暴飲暴食的遺傳根源
德克薩斯大學西南醫學中心的Yu Xun、Yiao Jiang、Baijie Xu、Miao Tang等團隊利用正向遺傳學方法,發現Gpr45基因通過調控神經元纖毛內的信號通路控制食欲,這一發現可能帶來抗肥胖新策略。
?GPR45 將 Gαs 轉運至初級纖毛,以調節食物攝入。Credit: Science (2025).
研究采用自動減數分裂圖譜(AMM,結合AI的基因突變快速定位技術)篩選出導致小鼠肥胖的Gpr45基因突變。通過CRISPR基因編輯證實,缺失Gpr45的小鼠從6周齡開始暴飲暴食。進一步實驗揭示GPR45蛋白在下丘腦神經元初級纖毛(細胞表面的天線狀結構)中富集,負責將G蛋白亞基Gαs轉運至纖毛內部。在纖毛中,Gαs激活MC4R(控制食欲的關鍵受體)和ADCY3(腺苷酸環化酶3),產生抑制食欲的信號。兩種Gpr45突變均破壞該轉運功能,導致MC4R失活。現有MC4R靶向藥物因副作用受限,而針對GPR45的藥物可能更安全。研究發表在 Science 上。
#疾病與健康 #神經機制與腦功能解析 #肥胖治療 #初級纖毛 #G蛋白偶聯受體
閱讀更多:
Xun, Yu, et al. “GPR45 Modulates Gαs at Primary Cilia of the Paraventricular Hypothalamus to Control Food Intake.” Science, vol. 388, no. 6751, June 2025, p. eadp3989. science.org (Atypon), https://doi.org/10.1126/science.adp3989
Science:遠紅光多巴胺探針,觀測腦內神經遞質“多色共舞”
如何實時觀測大腦中多種神經遞質的動態交互?北京大學李毓龍團隊(Yu Zheng, Ruyi Cai, Kui Wang等)開發出首個遠紅光多巴胺探針HaloDA1.0,成功實現活體動物三色成像。
?同時監測多種神經化學物質的遠紅光多巴胺傳感器的開發及應用
研究團隊將cpHaloTag-化學染料法與GRAB(G protein-coupled receptor activation-based)策略結合,開發的HaloDA1.0探針工作波長超過650nm,填補了遠紅光譜區神經調質檢測的空白。該探針在急性腦切片中與綠/紅探針協同,首次實現對多巴胺(DA)、乙酰膽堿(ACh)和內源性大麻素(eCB)的三重同步記錄,時間分辨率達亞秒級。在斑馬魚模型中,研究捕捉到電擊誘發癲癇時DA、ATP和鈣離子(Ca2+)的協同波動模式。更突破性的應用是在活體小鼠中,通過硅-羅丹明染料標記,實現在光遺傳學刺激同時的雙色記錄,并首次揭示伏隔核區域DA、ACh和環磷酸腺苷(cAMP)信號在自發活動和行為任務中的差異化調控規律。研究發表在 Science 上。
#疾病與健康 #神經機制與腦功能解析 #跨學科整合 #神經調控
閱讀更多:
Zheng, Yu, et al. “In Vivo Multiplex Imaging of Dynamic Neurochemical Networks with Designed Far-Red Dopamine Sensors.” Science, vol. 388, no. 6751, June 2025, p. eadt7705. science.org (Atypon), https://doi.org/10.1126/science.adt7705
心盲癥可能與大腦連通性的改變有關
巴黎腦研究所的Jianghao Liu、Paolo Bartolomeo團隊與NeuroSpin的Stanislas Dehaene合作,通過7T超高場磁共振首次揭示:心盲癥(aphantasia)患者雖能準確記憶視覺信息,但其大腦額頂葉網絡與視覺皮層間的功能連接存在缺陷。
?心盲癥患者右半球區域激活程度更高。(A)所有想象任務中的組間差異。藍色表示心盲癥患者的激活程度高于典型想象者。Typ:典型想象者。Aph:心盲癥患者。(B)所有感知任務中的組間差異。藍色表示心盲癥患者的激活程度高于典型想象者。Credit: Cortex (2025).
研究采用7T功能磁共振成像,對比10名心盲癥患者和10名典型想象者執行五類視覺任務時的腦活動。結果顯示,兩組在左梭狀回(負責高級視覺處理)和腹側顳葉皮層(專司面孔/文字識別等)激活相似,但心盲癥患者的"梭狀回意象節點"(FIN)與額頂葉網絡(調控注意與工作記憶)的連接效率降低40%。特別發現右半球激活增強現象,暗示補償機制。即使無法主觀體驗意象,心盲癥患者仍能通過非意識路徑處理視覺信息,例如準確判斷"菠菜比生菜顏色更深"。這種感知-意象分離現象支持"意識體驗依賴神經整合"假說,未來或助力開發針對視覺記憶障礙的干預方案。研究發表在 Cortex 上。
#神經科學 #神經機制與腦功能解析 #意識模擬 #知覺康復
閱讀更多:
“Visual Mental Imagery in Typical Imagers and in Aphantasia: A Millimeter-Scale 7-T fMRI Study.” Cortex, vol. 185, Apr. 2025, pp. 113–32. www.sciencedirect.com, https://doi.org/10.1016/j.cortex.2025.01.013
年齡相關大腦連接變化導致社交能力下降
為什么老年人社交能力會下降?新加坡南洋理工大學的Yuet Ruh Dan、Savannah K. H. Siew和Junhong Yu團隊通過腦成像研究發現,特定功能連接網絡的變化完全解釋了這一現象。
?與年齡相關的大腦連接模式,分為(A)腦網絡圖譜區域和(B)Yeo 的 7 個網絡。為了說明區域和網絡層面的 rsFC 模式,NBS 閾值邊緣的回歸系數在各自的區域和網絡中取平均值。 Credit: Dan et al., 2025, PLOS One, CC-BY 4.0
研究團隊分析了196名20-77歲健康成年人的靜息態功能磁共振成像(rsfMRI)數據和社會能力測評結果。通過基于網絡的統計(NBS)方法,識別出兩個關鍵網絡:年齡正向網絡(APN)和年齡負向網絡(ANN)。APN隨年齡增長連接增強,主要由邊緣系統與島葉(身體感覺整合區),以及腹側注意網絡(環境監測)與軀體運動區的連接組成;ANN則隨年齡連接減弱,包含額頂葉與默認模式網絡,以及皮層下結構(基底節等)與頂葉的連接。中介分析顯示,這兩個網絡完全解釋了年齡對社交能力的影響——APN增強和ANN減弱各自獨立導致社交能力下降。這種“網絡去隔離”模式可能損害情緒調節、溝通能力和社交信心所需的神經基礎。研究支持社會腦假說,表明社交衰退是神經生物學層面的自然衰老過程。研究發表在 PLOS One 上。
#疾病與健康 #神經機制與腦功能解析 #心理健康與精神疾病 #老齡化 #社會認知
閱讀更多:
Dan, Yuet Ruh, et al. “Intrinsic Functional Connectivity Brain Networks Mediate Effect of Age on Sociability.” PLOS ONE, vol. 20, no. 5, May 2025, p. e0324277. PLoS Journals, https://doi.org/10.1371/journal.pone.0324277
為個性化顱內腫瘤治療開發的磁驅動創新解決方案
中國科學院深圳先進技術研究院徐天添教授、深圳大學王奔副教授、香港中文大學張立教授組成的科研團隊, 開發了一種受外界可編程磁場驅動的仿生血凝膠纖維機器人(BBHFs),能夠在蛛網膜下腔極端狹窄的腦脊液環境中多模態仿生運動,并結合X射線影像引導,精準無創到達腫瘤區域完成藥物靶向遞送。
?BBHF 在體外豬大腦皮層上移動。Credit: SIAT
研究受線蟲(nematode)運動啟發,將磁性顆粒與患者自體血液結合,通過原位凝膠化技術制成直徑可調的BBHFs。這種材料彈性模量約100 kPa(比腸道柔軟但比軟骨強韌),在可編程磁場控制下能完成搖擺、爬行、翻滾等仿生運動。實驗顯示,BBHFs可穿越豬腦皮層溝壑而不損傷組織,結合X射線熒光成像實現毫米級追蹤精度。裝載一線化療藥阿霉素(doxorubicin)后,通過高強度磁場觸發靶向釋放,豬模型實驗證實其能有效穿越腦脊液遞送藥物。毒性評估表明磁性顆粒不會在重要器官積聚,組織學分析顯示顯著腫瘤抑制效果且無免疫反應。整個系統從采血到制備僅需15分鐘,為臨床轉化奠定基礎。研究發表在 Nature Biomedical Engineering 上。
#疾病與健康 #個性化醫療 #神經調控 #靶向治療 #生物材料
閱讀更多:
Wang, Ben, et al. “Magnetically Driven Biohybrid Blood Hydrogel Fibres for Personalized Intracranial Tumour Therapy under Fluoroscopic Tracking.” Nature Biomedical Engineering, May 2025, pp. 1–15. www.nature.com, https://doi.org/10.1038/s41551-025-01382-z
服從命令將削弱道德責任感
比利時布魯塞爾自由大學認知和神經科學研究中心的Emilie A Caspar、Antonin Rovai、Salvatore Lo Bue和Axel Cleeremans團隊通過腦部掃描發現,無論軍人還是平民,服從命令都會削弱自主感(SoA),且相關腦區活動模式高度一致。
研究采用功能性磁共振成像(fMRI)技術,對比19名軍官學員和24名平民在兩種情境下的道德決策:自由選擇或服從命令對虛擬受害者施加電擊。通過測量時間綁定(行動與結果感知的時間扭曲程度)量化SoA強度。結果顯示,服從命令使所有參與者的SoA降低約23%,且軍人和平民的神經反應無顯著差異。關鍵發現包括:枕葉負責視覺信息整合,其活動變化反映責任感知的視覺表征;額葉回(frontal gyrus)參與意圖形成,激活減弱與決策自主性下降相關;楔前葉(precuneus)作為自我意識核心區域,其活動模式變化直接關聯責任感削弱。這些發現表明,道德決策的神經基礎具有跨人群一致性,日常環境對其影響有限。研究為軍事指揮責任認定和司法系統評估脅迫情境下的行為責任提供了科學依據。研究發表在 Cerebral Cortex 上。
#認知科學 #意圖與決策 #神經機制與腦功能解析 #道德心理學
閱讀更多:
Caspar, Emilie A., et al. Neural Correlates of the Sense of Agency in Free and Coerced Moral Decision-Making among Civilians and Military Personnel. academic.oup.com, https://dx.doi.org/10.1093/cercor/bhaf049. Accessed 9 June 2025
血液檢測在門診記憶診所實現95%準確率的阿爾茨海默病診斷
如何實現阿爾茨海默病的便捷精準診斷?梅奧診所的Gregg Day團隊開發了一種經FDA批準的血液檢測方法,在門診環境中實現了95%的敏感性和82%的特異性。
研究團隊對509名門診記憶障礙患者(年齡32-89歲)進行了血漿生物標志物檢測,重點分析p-tau217(磷酸化tau蛋白)和Aβ42/40(β淀粉樣蛋白比例)兩種蛋白質。結果顯示,p-tau217在阿爾茨海默病患者中濃度顯著升高,確診敏感性和特異性分別達到95%和82%,與侵入性的腦脊液檢測效果相當。研究同時發現腎功能會影響p-tau217濃度,建議檢測時需考慮這一因素。該血液檢測成本僅為PET掃描的1/5,已成功應用于臨床試驗患者篩選,并能評估治療反應。在246例最終確診為阿爾茨海默病的患者中,血液檢測準確識別出233例。研究為無癥狀早期患者的篩查奠定了基礎,并計劃在更廣泛人群中驗證其有效性。研究發表在 Alzheimer's and Dementia 上。
#疾病與健康 #個性化醫療 #阿爾茨海默病 #生物標志物 #血液檢測
閱讀更多:
Piura, Yoav D., et al. “Rapid Identification of Patients with Rapidly Progressive Dementia.” Alzheimer’s & Dementia, vol. 20, no. S3, 2024, p. e092437. Wiley Online Library, https://doi.org/10.1002/alz.092437
海馬體如何形成穩定的記憶表征而不覆蓋舊記憶?
大腦如何在不覆蓋舊記憶的情況下存儲新信息?Sachin P. Vaidya、Guanchun Li、Raymond A. Chitwood、Yiding Li和Jeffrey C. Magee團隊通過研究小鼠海馬體CA1區位置細胞的活動,揭示了記憶形成的動態過程:位置細胞的穩定性隨學習逐漸增加,最終形成長期穩定的記憶表征。
研究團隊追蹤了小鼠在7天學習任務中同一群海馬體CA1位置細胞(place cells, PCs)的活動變化。他們發現,隨著學習進行,保持穩定位置野的位置細胞數量及其穩定性逐漸增加,最終形成主要由長期穩定位置細胞組成的記憶表征。這些穩定的位置細胞更傾向于編碼與任務相關的學習信息,且在行為會話中更早被檢索,與行為表現呈強相關性。
進一步分析表明,位置細胞的形成和后續檢索均伴隨行為時間尺度的突觸可塑性,表明即使是穩定的位置細胞也通過突觸可塑性在每次會話中重新形成。研究還通過級聯型狀態模型(cascade-type state model)驗證了CA1位置細胞在每天活躍時穩定性逐漸增加的機制,最終形成高度穩定的細胞群體。研究發表在 Nature Neuroscience 上。
#神經科學 #記憶機制 #神經機制與腦功能解析 #計算模型與人工智能模擬
閱讀更多:
Vaidya, Sachin P., et al. “Formation of an Expanding Memory Representation in the Hippocampus.” Nature Neuroscience, June 2025, pp. 1–9. www.nature.com, https://doi.org/10.1038/s41593-025-01986-3
AI 行業動態
運動抗癌獲最高等級醫學實證!結腸癌患者生存率提升28%堪比靶向藥
加拿大女王大學和阿爾伯塔大學的研究團隊在《新英格蘭醫學雜志》(NEJM)發表了一項里程碑式研究,首次通過3期臨床試驗證實:結構化運動能顯著延長結腸癌術后患者的無病生存期(DFS)和總生存期(OS)。這項名為CHALLENGE的試驗追蹤了889名完成化療的Ⅲ期或高危Ⅱ期結腸癌患者,運動組通過3年教練監督下的有氧訓練(如快走),最終疾病復發或死亡風險降低28%,8年總生存率提升至90.3%,效果媲美部分靶向藥物。
研究設計分為三個階段,運動組需逐步增加代謝當量(MET,衡量運動強度的單位)至每周10單位以上。結果顯示,運動組患者的最大攝氧量和6分鐘步行距離顯著優于對照組,且肌肉骨骼不良反應多為輕度。研究人員指出,運動可能通過增強免疫細胞活性、降低胰島素水平及炎癥因子(如IL-6)來抑制腫瘤轉移,同時改善血流微環境。
這項研究為“運動輔助抗癌”提供了1級證據(最高醫學證據等級),證實其成本低、安全性高且能同步提升患者生活質量。未來或推動個體化運動處方成為癌癥標準治療的一部分,尤其適用于結直腸癌等復發風險較高的病種。
#結腸癌 #運動療法 #無病生存期 #代謝當量 #NEJM
閱讀更多:
https://www.nejm.org/doi/full/10.1056/NEJMoa2502760
Google Veo 3推出FAST/TURBO模式
Google近日為其旗艦AI視頻生成工具Veo 3推出了革命性的FAST/TURBO模式,標志著AI視頻創作進入全新階段。這一升級不僅大幅提升了生成速度,還將成本降低了80%,同時首次實現了原生音頻集成,使專業級AI視頻制作變得更加普及。內容創作者、營銷人員和教育工作者現在能以極低成本在幾秒內生成高質量視頻,徹底改變了傳統視頻制作的效率瓶頸。
FAST/TURBO模式的核心突破在于其驚人的成本效益。標準模式下每段視頻消耗150積分,而FAST模式僅需20積分,成本直降80%。對于Google AI Ultra訂閱用戶(每月249.99美元),這意味著每月可生成625段8秒視頻,是標準模式的5倍。此外,該模式還原生支持從文本提示生成對話、音效和背景音樂,省去了繁瑣的后期音頻編輯流程。盡管早期測試者反饋復雜場景中偶有音畫同步問題,但整體質量已接近專業水準。
Google DeepMind通過優化模型架構和資源分配算法實現了這一性能飛躍,部分720p視頻可在1分鐘內完成渲染,速度提升30%。這一進步不僅節省時間,更鼓勵創作者大膽實驗。從社交媒體短片到廣告原型測試,再到教育可視化內容,FAST/TURBO模式正在降低視頻創作門檻,推動AI視頻從專業領域走向大眾化。
#GoogleVeo3 #AI視頻生成 #成本降低 #原生音頻 #DeepMind
閱讀更多:
https://deepmind.google/models/veo/
ChatGPT語音交互全面升級:真人般對話體驗與實時翻譯功能上線
OpenAI近日宣布對其高級語音功能Advanced Voice進行重大升級,顯著提升了ChatGPT語音交互的自然度和流暢性。新版本通過改進語調、節奏和情緒表達,使AI語音不再機械單調,而是能夠模擬真人對話中的抑揚頓挫、自然停頓和情感變化。例如,AI現在能通過語氣傳達同理心(Empathy)或諷刺(Sarcasm),讓用戶感受到更真實的互動體驗。這一更新已面向所有付費用戶開放,支持Web、iOS、Android及桌面端平臺。
此次升級的另一亮點是強化了實時語音翻譯功能。ChatGPT現可充當“雙語翻譯官”,在用戶與對話方之間持續翻譯多輪對話,無需重復觸發指令。例如,用戶說英語時,AI會即時翻譯成葡萄牙語輸出,反之亦然。這一功能特別適用于國際旅行、遠程辦公或多語言協作場景,大幅降低了跨語言溝通的門檻。OpenAI強調,系統會自動調用最新語音引擎,用戶僅需點擊語音圖標即可啟動。
盡管功能強大,OpenAI也坦承當前版本存在部分限制。少數情況下可能出現音質下降、語調不穩定,甚至偶發非預期內容(如背景雜音)。團隊表示正在持續優化,以提升穩定性和用戶體驗。
#OpenAI #ChatGPT #語音交互 #實時翻譯 #AI升級
閱讀更多:
https://help.openai.com/en/articles/6825453-chatgpt-release-notes
AI 驅動科學
AI模型crossNN突破腫瘤診斷:基于表觀遺傳指紋識別170種癌癥
傳統腫瘤診斷依賴高風險組織活檢,且現有AI工具存在平臺限制。Charité - 柏林醫學大學的Dongsheng Yuan、Philipp Euskirchen等團隊開發了crossNN模型,通過表觀遺傳指紋實現跨平臺高精度診斷,腦腫瘤識別準確率達99.1%,全身腫瘤分類覆蓋170種類型。
?人工智能模型 crossNN 將未知腫瘤的表觀遺傳數據與 8,000 多個參考腫瘤的指紋圖譜進行比較。十字標記表示待檢測的腫瘤。可視化效果展示了該模型所基于的海量數據。每個點代表一個參考腫瘤的概況,其中包含數十萬條信息;每種顏色代表一種特定的腫瘤類型。Credit: Charité | Philipp Euskirchen
研究團隊構建了輕量級神經網絡crossNN,整合DNA甲基化(DNA methylation)數據作為腫瘤"指紋"。該模型突破性地兼容納米孔測序(nanopore sequencing)、微陣列等5種技術平臺,能處理覆蓋率差異達90%的稀疏數據。在8,000多個參考腫瘤訓練后,模型對5,000多個測試樣本顯示出卓越性能:腦腫瘤診斷準確率99.1%,全身腫瘤分類準確率97.8%。臨床應用中,通過分析腦脊液樣本即實現無創診斷,成功識別出傳統MRI難以檢測的中樞神經系統淋巴瘤。模型決策過程完全可解釋,其簡單架構(僅需15分鐘訓練)大幅降低計算成本。目前德國癌癥聯盟已在8個中心啟動臨床試驗,計劃拓展至術中實時診斷。研究發表在 Nature Cancer 上。
#疾病與健康 #個性化醫療 #AI驅動科學 #預測模型構建 #跨學科整合
閱讀更多:
Yuan, Dongsheng, et al. “crossNN Is an Explainable Framework for Cross-Platform DNA Methylation-Based Classification of Tumors.” Nature Cancer, June 2025, pp. 1–12. www.nature.com, https://doi.org/10.1038/s43018-025-00976-5
AI框架量化CEO同理心
如何客觀評估領導者的同理心?香港理工大學的Li Cui、Jingran Zhao、Ka Chung Ng和Zhoudao Lu團隊開發出首個基于視頻行為分析的AI框架,通過捕捉情緒模仿等微表情特征,成功將CEO同理心與企業政策、市值建立量化關聯。
研究團隊融合大型語言模型、計算機視覺和神經科學理論,構建了多模態分析框架。系統首先將CEO電視訪談視頻分割為問答單元,通過OpenFace等工具提取面部動作單元(AU)、頭部姿態和語音韻律等136維特征,重點捕捉受訪者對記者情緒的即時反應(即情緒模仿)。驗證實驗顯示,該指標與傳統問卷結果顯著相關(r=0.71)。應用分析發現,高同理心CEO所在企業展現出更親社會的政策傾向:工傷率比行業均值低23%,薪酬公平性指數高19%。在2008-2020年危機事件分析中,這些企業市值恢復速度比對照組快2.3周,表明同理心對危機管理的積極作用。框架的突出優勢在于實現了每分鐘處理20小時視頻的高通量分析,且避免了自我報告偏差。研究發表在 SSRN 上。
#AI驅動科學 #預測模型構建 #組織心理學 #情緒計算 #領導力評估
閱讀更多:
Cui, Li, et al. Feeling Over Thinking: A Video Analytics Framework for Measuring Empathy from Video Recordings. 5260163, Social Science Research Network, 19 May 2025. papers.ssrn.com, https://doi.org/10.2139/ssrn.5260163
AI工具PandemicLLM革新傳染病預測,準確率超越現有方法
傳統傳染病預測模型難以應對動態變化因素(如政策調整和新變種出現),約翰·霍普金斯大學的Lauren Gardner(COVID-19儀表板開發者)與杜克大學團隊開發了基于大語言模型的PandemicLLM。該工具通過整合多模態實時數據,在COVID-19回溯測試中展現出超越現有方法的預測精度。
研究團隊將疾病預測重構為文本推理(text-reasoning)問題,讓PandemicLLM像人類專家一樣綜合評估四類數據:包含醫療資源的州級空間數據、病例時間序列、政策文本嚴格性指標以及變異株基因組特征。通過時間序列表示學習技術,模型能自動捕捉政策變化與病毒傳播的關聯,例如準確預測某州取消口罩令后奧密克戎BA.5亞型的加速傳播。在測試中,模型對1-3周住院趨勢的預測誤差比CDC最佳模型低29%,且在新變種出現等突變場景下優勢更顯著(誤差降低37%)。此外,該框架首次實現政策文本與基因組數據的聯合分析,為猴痘等新發傳染病提供了通用預測方案。團隊正進一步開發個體行為模擬模塊,以幫助設計更精準的防控政策。研究發表在 Nature Computational Science 上。
#AI驅動科學 #疾病與健康 #預測模型構建 #大模型技術 #跨學科整合
閱讀更多:
Du, Hongru, et al. “Advancing Real-Time Infectious Disease Forecasting Using Large Language Models.” Nature Computational Science, June 2025, pp. 1–14. www.nature.com, https://doi.org/10.1038/s43588-025-00798-6
用筆記本電腦診斷癌癥,68例數據訓練8分鐘完成!
傳統癌癥診斷AI依賴昂貴硬件和大數據,東京科學研究所的Kenji Suzuki團隊開發出革命性輕量級模型,僅需標準筆記本電腦即可實現肺癌診斷,性能超越主流系統并獲國際大獎。
研究采用大規模訓練人工神經網絡(MTANN,一種直接從像素學習的特殊深度學習架構),僅需68例CT掃描數據。在MacBook Air(M1芯片)上完成全部訓練僅耗時8分20秒,單病例診斷速度達47毫秒。與傳統需要數千病例的Vision Transformer和3D ResNet相比,該模型AUC值達0.92(傳統模型僅0.53-0.59),參數數量減少90%。關鍵創新在于像素級學習策略,避免了完整影像集需求。鈴木指出,該技術特別適合罕見病診斷,且能緩解AI發展導致的全球電力緊張問題。研究團隊擁有25年MTANN技術研發經驗,相關專利已商業化。研究發表在 Radiological Society of North America Annual Meeting 上。
#AI驅動科學 #預測模型構建 #個性化醫療
閱讀更多:
https://www.rsna.org/annual-meeting
CURE框架實現代碼與測試協同進化
如何讓大語言模型不依賴人工標注數據自主提升編程能力?芝加哥大學Yinjie Wang、普林斯頓大學Ling Yang、北京大學Ye Tian等組成的跨機構團隊開發出CURE框架,通過強化學習使代碼生成器與單元測試生成器協同進化,在多項基準測試中取得顯著提升。
研究團隊提出CURE(Co-evolving Unit test Reinforcement lEarning)框架,采用獨特的獎勵設計讓代碼生成器(coder)和單元測試生成器(unit tester)通過交互結果相互監督。當代碼生成器產生錯誤時,測試生成器會學習識別這些錯誤模式;而通過測試的優質代碼則指導測試生成器優化標準。這種自博弈機制無需任何人工標注的真實代碼(ground-truth code)作為監督信號。實驗顯示,基于Qwen2.5-Instruct優化的ReasonFlux-Coder-7B和14B模型,代碼生成準確率提升5.3%,Best of N(BoN,從多個候選方案中選擇最優的策略)準確率提升9%,超越同類尺寸的Qwen-Coder等模型。特別設計的4B長思維鏈(long-CoT)模型在保持性能優勢的同時,單元測試生成效率提升64.8%。該方法僅需4.5K編程問題訓練數據,且生成的單元測試可直接作為強化學習的獎勵模型使用。
#大模型技術 #自動化科研 #代碼生成 #強化學習 #單元測試
閱讀更多:
Wang, Yinjie, et al. Co-Evolving LLM Coder and Unit Tester via Reinforcement Learning. arXiv:2506.03136, arXiv, 3 June 2025. arXiv.org, https://doi.org/10.48550/arXiv.2506.03136
從工具到隊友:臨床醫生與AI協作診斷的工作流程
如何實現臨床醫生與AI的高效協作診斷?由Selin S Everett、Bryan J Bunning、Priyank Jain等來自多機構的研究團隊開展隨機對照試驗,證明協作式AI工作流程能顯著提升診斷準確率,最高達85%,接近AI單獨工作的專家水平。
研究團隊開發了基于GPT-4的定制系統,設計了兩種協作流程:一種是AI先提供診斷意見(AI-first),另一種是醫生先評估后AI補充(AI-second)。在70名臨床醫生的對照試驗中,兩種協作流程的診斷準確率(85%和82%)均顯著高于傳統工具的75%(p<0.0004和p<0.00001)。AI系統會生成綜合報告,整合醫生和AI的獨立評估,突出共識與分歧點并提供評論。值得注意的是,兩種協作流程間無顯著差異,且都接近AI單獨工作的90%準確率。這一結果顛覆了先前"AI工具會降低醫生表現"的發現,證明當AI被設計為"隊友"而非"工具"時,能有效結合人類專業知識和機器推理優勢。研究還發現,協作設計促進了醫生對AI建議的批判性思考,而非盲目接受。
#大模型技術 #個性化醫療 #臨床決策支持 #人機協作
閱讀更多:
Everett, Selin S., et al. From Tool to Teammate: A Randomized Controlled Trial of Clinician-AI Collaborative Workflows for Diagnosis. medRxiv, 8 June 2025, p. 2025.06.07.25329176. medRxiv, https://doi.org/10.1101/2025.06.07.25329176
大語言模型自我挑戰框架:無需人工標注實現性能翻倍
如何讓語言模型自主生成高質量訓練數據?UC Berkeley的Yifei Zhou、Sergey Levine與Meta FAIR的Jason Weston、Xian Li、Sainbayar Sukhbaatar團隊開發出"自我挑戰"框架,使Llama-3.1-8B-Instruct模型在多項任務中實現超過兩倍的性能提升。
研究團隊提出的"自我挑戰"(Self-Challenging)框架,讓語言模型交替扮演兩個角色:作為"挑戰者"時,模型會與給定工具交互并生成包含指令、驗證函數、解決方案和失敗案例的"代碼即任務"(Code-as-Task);作為"執行者"時,模型則嘗試解決這些任務并通過強化學習(RL)獲得反饋。這種結構化設計確保了生成任務的可行性(通過解決方案驗證)、難度(通過失敗案例體現)和可驗證性(通過代碼化驗證標準)。在M3ToolEval和TauBench的四個工具使用環境測試中,僅使用自我生成數據進行訓練的模型展現出驚人提升:在模型蒸餾(distillation)場景下平均成功率提高20.2%;在純自我改進(self-improvement)場景下,成功率從12.0%躍升至23.5%,遠超現有方法。
#大模型技術 #自動化科研 #強化學習 #語言模型代理 #自我監督學習
閱讀更多:
Zhou, Yifei, et al. Self-Challenging Language Model Agents. arXiv:2506.01716, arXiv, 2 June 2025. arXiv.org, https://doi.org/10.48550/arXiv.2506.01716
整理|ChatGPT
編輯|丹雀、存源
關于追問nextquestion
天橋腦科學研究院旗下科學媒體,旨在以科學追問為紐帶,深入探究人工智能與人類智能相互融合與促進,不斷探索科學的邊界。如果您有進一步想要討論的內容,歡迎評論區留言,或后臺留言“社群”即可加入社群與我們互動。
關于天橋腦科學研究院
天橋腦科學研究院(Tianqiao and Chrissy Chen Institute)是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一,圍繞全球化、跨學科和青年科學家三大重點,支持腦科學研究,造福人類。
Chen Institute與華山醫院、上海市精神衛生中心設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室;與加州理工學院合作成立了加州理工天橋神經科學研究院。
Chen Institute建成了支持腦科學和人工智能領域研究的生態系統,項目遍布歐美、亞洲和大洋洲,包括、、、科研型臨床醫生獎勵計劃、、等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.