█腦科學動態
Nature:耗時7年,繪制小鼠視覺神經網絡圖譜
Nature:NEURD,10倍速完成大腦地圖校對工作
Nature:創建視覺皮層數字孿生,實驗效率提升百萬倍
Nature:在培養皿中重建神經通路,可加速疼痛治療
全身麻醉讓大腦"指紋"消失?
肥胖軌跡揭示大腦衰老密碼:長期肥胖加速認知衰退
單神經元投射組揭示小鼠軀體感覺上行通路組織規律
█AI行業動態
Google開放Veo視頻生成模型 API
xAI推出多版本Grok模型 API, 支持長文本與多模態混合輸入
AI狂潮引爆電力危機,2030年數據中心耗電量或將翻倍
微軟踩下AI基建"剎車鍵":10億美元數據中心項目暫停
Google推出"AI全棧開發神器":一句話生成可上線應用
AI"通用語言"協議:A2A讓不同AI代理像人類一樣協作
OpenAI發布評估基準BrowseComp,衡量AI在搜索復雜信息的能力
█AI驅動科學
Nature:16,000個光學元件協同作戰,計算延遲降至3納秒
Nature:大型語言模型助力精準醫療診斷
AI也有"文化盲區"?如何打破WEIRD偏見實現全球包容
AI寫作 vs 記者手筆:揭示新聞報道風格差異
98.2%準確率!這臺電腦看得懂你的手語
可水洗AI T恤精準追蹤運動姿勢
腦科學動態
Nature:耗時7年,繪制小鼠視覺神經網絡圖譜
哺乳動物如何通過神經連接"看見"世界?在最新一期《自然》及其子刊《自然-方法》上,來自全世界150多名科學家和研究人員組成的MICrONS聯盟,利用新開發的成像和人工智能工具,耗時7年,繪制出小鼠大腦皮質完整的功能線路圖。研究人員追蹤到了84000個神經元,它們相互之間構成了5億多個連接點(突觸),以及總長約5400米的神經連接。
研究采用"三步走"策略:貝勒醫學院先通過雙光子鈣成像記錄下小鼠觀看視頻時的腦活動;艾倫研究所隨后將1立方毫米腦組織切成25,000片電子顯微鏡切片(每片僅人類頭發1/400粗細);普林斯頓大學最終通過人工智能算法重建出包含四公里軸突的3D神經回路。
?數據采集工作流程中的主要實驗步驟。
人工校對確認后,圖譜精確顯示一立方毫米腦組織內20萬細胞和5億突觸的連接方式,包括初級視覺皮層(VISp)與三個高階視覺區的特異回路。研究發現抑制性神經元并非隨機作用,而是像精準制導武器般選擇性靶向特定興奮性神經元;某些抑制細胞會協同作戰,形成全腦協調網絡。
?MICRONS 項目中重建了 12 萬個腦細胞(神經元 + 神經膠質細胞),其中超過 1000 個是其中的一部分。每個重建的神經元都呈現出不同的隨機顏色。圖中發光的神經元帶有顏色。Credit: Forrest Collman/Allen Institute
該技術已用于創建小鼠腦數字孿生(digital twin)模型,可模擬視覺處理過程。數據集已開放,正加速果蠅、獼猴等多物種腦圖譜研究。研究發表在 Nature 上。
#神經科學 #神經機制與腦功能解析 #AI驅動科學 #計算模型與人工智能模擬 #連接組學
閱讀更多:
Bae, J. Alexander, et al. “Functional Connectomics Spanning Multiple Areas of Mouse Visual Cortex.” Nature, vol. 640, no. 8058, Apr. 2025, pp. 435–47. www.nature.com, https://doi.org/10.1038/s41586-025-08790-w
Nature:NEURD,10倍速完成大腦地圖校對工作
面對包含20萬細胞和5.23億突觸的小鼠大腦測繪數據,貝勒醫學院的Jacob Reimer與約翰·霍普金斯大學的Brendan Celii團隊開發了NEURD軟件,通過自動化校對和特征提取,將神經連接圖譜的解析效率提升10倍。
?這幅圖展示了 MICrONS 項目中重建的 12 萬個腦細胞(神經元+神經膠質細胞)中超過 1000 個腦細胞的子集。Credit: Allen Institute
研究團隊開發的NEURD軟件基于3D神經元網格(3D mesh)技術,通過分層處理策略自動識別細胞體、樹突棘等結構特征,并采用啟發式規則修正數據中的合并錯誤。在MICrONS項目的小鼠視覺皮層數據集(1立方毫米/12萬細胞)中,該系統僅需傳統方法1/10的時間即可完成校對,準確率達到人工校對的98%。軟件提取的156種形態特征成功揭示了皮層不同層神經元特有的連接模式,例如第4層神經元更傾向于與同類細胞形成突觸。研究發表在 Nature 上。
#AI驅動科學 #神經機制與腦功能解析 #自動化科研 #跨學科整合 #腦科學
閱讀更多:
Celii, Brendan, et al. “NEURD Offers Automated Proofreading and Feature Extraction for Connectomics.” Nature, vol. 640, no. 8058, Apr. 2025, pp. 487–96. www.nature.com, https://doi.org/10.1038/s41586-025-08660-5
Nature:創建視覺皮層數字孿生,實驗效率提升百萬倍
如何突破腦科學研究的實驗限制?斯坦福醫學院的Andreas Tolias與貝勒醫學院的Eric Y. Wang團隊開發出首個小鼠視覺皮層AI基礎模型,該數字孿生不僅能預測神經活動,還能揭示解剖特征。
研究團隊讓8只小鼠觀看《瘋狂的麥克斯》等動作電影,記錄其視覺皮層900分鐘神經活動數據。通過深度學習構建的基礎模型,僅需少量數據即可適配新個體。測試顯示,該模型對陌生視頻的神經響應預測準確率創紀錄,甚至能推斷未訓練過的解剖特征——在MICrONS項目驗證中,成功預測了神經元類型、樹突形態及70,000個突觸連接。特別值得注意的是,模型揭示了視覺皮層"按功能偏好擇友"的新規則:神經元更傾向與響應相同刺激(如特定顏色)的細胞連接,而非鄰近位置的神經元。這種數字孿生技術將實驗效率提升百萬倍,原本需數年的活體實驗現可數小時完成。研究發表在 Nature 上。
#AI驅動科學 #神經機制與腦功能解析 #計算模型與人工智能模擬 #數字孿生
閱讀更多:
Wang, Eric Y., et al. “Foundation Model of Neural Activity Predicts Response to New Stimulus Types.” Nature, vol. 640, no. 8058, Apr. 2025, pp. 470–77. www.nature.com, https://doi.org/10.1038/s41586-025-08829-y
Nature:在培養皿中重建神經通路,可加速疼痛治療
慢性疼痛治療為何難突破?斯坦福大學醫學中心的Sergiu Pasca、Ji-il Kim和Kent Imaizumi團隊用干細胞培育出微型"疼痛通路",首次完整呈現人類神經信號從皮膚到大腦的傳遞過程。
研究團隊將皮膚細胞重編程為誘導多能干細胞(iPSC),再分化為四種類器官——模擬背根神經節(皮膚痛覺感知區)、脊髓背部(信號中轉站)、丘腦(感覺樞紐)和軀體感覺皮層(最終處理區)。這些直徑2.5毫米的"迷你器官"串聯后,自發形成包含400萬細胞的"疼痛組裝體"。通過鈣成像技術,科學家首次捕捉到辣椒素刺激引發的神經信號波(從外周直達大腦皮層),整個過程類似多米諾骨牌效應。實驗顯示,致痛基因突變(如Nav1.7功能增強)會使信號波過度同步,而臨床常用阿片類藥物僅阻斷同步性卻不影響信號本身,這解釋了為何這類藥物止痛卻易成癮。該模型還能模擬自閉癥患者的痛覺過敏現象。研究發表在 Nature 上。
#疾病與健康 #知覺康復 #神經機制與腦功能解析 #類器官技術 #藥物開發
閱讀更多:
Kim, Ji-il, et al. “Human Assembloid Model of the Ascending Neural Sensory Pathway.” Nature, Apr. 2025, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41586-025-08808-3
全身麻醉讓大腦"指紋"消失?研究發現意識狀態決定腦活動獨特性
意識如何塑造大腦獨特性?麥吉爾大學Andrea I. Luppi、劍橋大學Daniel Golkowski等組成的國際團隊發現,全身麻醉會顯著降低人類大腦功能連接的獨特性,使個體間腦活動模式趨同,且在進化較新的腦區表現最為明顯。
?七氟烷誘導功能可識別性喪失的解剖學特征分析。Credit: Nature Human Behaviour (2025).
研究團隊采用功能性磁共振成像(fMRI)技術,對健康志愿者進行麻醉前、中、后的腦部掃描,量化功能連接(FC,反映腦區間協同活動的指標)的個體差異。結果顯示,麻醉狀態下個體識別準確率下降67%,且這種"去個性化"效應沿感覺-聯合軸梯度分布——人類特有高級認知腦區受影響最大。跨物種分析發現,麻醉使人腦功能連接模式向獼猴趨近41%,特別是在默認模式網絡等與意識相關的區域。研究還通過Neurosynth元分析證實,麻醉減弱了自發腦活動與認知模式的匹配度。研究發表在 Nature Human Behaviour 上。
#疾病與健康 #神經機制與腦功能解析 #意識與腦機接口 #跨學科整合
閱讀更多:
Luppi, Andrea I., et al. “General Anaesthesia Decreases the Uniqueness of Brain Functional Connectivity across Individuals and Species.” Nature Human Behaviour, Mar. 2025, pp. 1–18. www.nature.com, https://doi.org/10.1038/s41562-025-02121-9
肥胖軌跡揭示大腦衰老密碼:長期肥胖加速認知衰退
肥胖如何侵蝕大腦健康?香港理工大學Anqi Qiu團隊通過分析英國生物銀行50萬人數據,發現持續肥胖會導致進行性腦損傷:高穩定肥胖者腦萎縮范圍比低穩定組擴大3倍,而成功減重者腦部幾乎未受損害。
?縱向肥胖軌跡分析。Credit: Nature Mental Health (2025).
研究采用縱向肥胖軌跡分析(longitudinal obesity trajectory analysis),將參與者分為低穩定、中穩定、高穩定、上升和下降五組。通過MRI掃描發現,上升組最早在額葉-中腦邊緣系統出現異常;中穩定組損傷蔓延至頂葉(空間認知)和顳葉(記憶);高穩定組則出現全腦廣泛萎縮,白質完整性下降18%。認知測試顯示,高穩定組工作記憶衰退最顯著(較基線降低23%)。令人振奮的是,下降組(成功減重者)腦結構與低穩定組無統計學差異。這項發現為肥胖管理提供了神經科學依據,表明及時干預可保護大腦健康。研究發表在 Nature Mental Health 上。
#疾病與健康 #個性化醫療 #神經機制與腦功能解析 #健康管理與壽命延長 #認知衰退
閱讀更多:
Zhang, Die, et al. “Long-Term Obesity Impacts Brain Morphology, Functional Connectivity and Cognition in Adults.” Nature Mental Health, vol. 3, no. 4, Apr. 2025, pp. 466–78. www.nature.com, https://doi.org/10.1038/s44220-025-00396-5
單神經元投射組揭示小鼠軀體感覺上行通路組織規律
軀體感覺如何從脊髓精準傳遞至大腦?中國科學院腦科學與智能技術卓越創新中心孫衍剛團隊通過單神經元追蹤技術,繪制出迄今最完整的體感神經"高清地圖",揭示脊髓投射神經元存在19種特化亞型,每種都像定制化的"信息快遞員"分工傳遞不同感覺。
?小鼠脊髓投射神經元與腦內中繼神經元單神經元全腦投射規律的圖示總結。Credit:Neuron(2025)
研究團隊創新采用病毒示蹤(給神經元裝"GPS")結合三維成像技術,對1,185個小鼠神經元進行全腦掃描。結果發現脊髓就像精密分揀中心:15類樹突形態的神經元負責采集不同部位信息,19類軸突投射模式的神經元則通過并行、發散或匯聚三種"物流方案"上傳信息。更驚人的是,丘腦如同交通樞紐,將觸覺、痛覺分送至不同皮層區域;而上丘則像"警報中心",通過兩條獨立通路分別觸發轉頭和防御反應。團隊建立的開放數據庫已收錄所有神經元三維路徑,未來可助力疼痛治療靶點開發。研究發表在 Neuron 上。
#神經科學 #神經機制與腦功能解析 #疼痛 #跨學科整合 #計算模型與人工智能模擬
閱讀更多:
Ding, Wen-Qun, et al. “Single-Neuron Projectome Reveals Organization of Somatosensory Ascending Pathways in the Mouse Brain.” Neuron, vol. 0, no. 0, Apr. 2025. www.cell.com, https://doi.org/10.1016/j.neuron.2025.03.007
AI 行業動態
Google開放Veo視頻生成模型 API:文本/圖片一鍵轉電影級短片
Google旗下DeepMind團隊最新發布的Veo視頻生成模型,通過Gemini API向開發者開放了多模態視頻生成能力。該模型支持文本轉視頻、圖片轉視頻以及混合提示生成,用戶可通過描述主題、背景、動作等電影語言參數,生成5-8秒的高質量短視頻,每秒成本0.35美元。開發流程涵蓋Python、JavaScript等語言SDK調用,并提供異步任務輪詢機制,但生成內容僅保留2天需及時下載。
Veo的獨特之處在于其對專業影視術語的理解,例如支持指定相機運動、構圖和氛圍等參數。研究人員示例中,一段“霓虹燈下穿風衣男子打電話”的黑色電影風格提示,可生成具有淺景深特寫鏡頭的視頻。不過目前僅支持英文提示,且圖片轉視頻模式禁止生成人物內容。模型還提供否定提示功能,但需避免使用命令式語句。
盡管功能強大,Veo仍存在一定限制:單次調用最多生成2個視頻版本,處理時間受資源影響可能長達數分鐘。開發者需注意上傳圖片的質量會影響輸出效果,且16:9或9:16的寬高比選擇會直接影響畫面構圖風格。
#GoogleVeo #AI視頻生成 #多模態模型 #GeminiAPI #DeepMind
閱讀更多:
https://ai.google.dev/gemini-api/docs/video?hl=zh-cn
xAI推出多版本Grok模型 API, 支持長文本與多模態混合輸入
馬斯克旗下的人工智能公司xAI近日發布了多個版本的Grok模型,針對不同應用場景進行了優化。所有文本模型均支持131K tokens的超長上下文窗口,特別適合長文摘要和持續對話場景。多模態版本則支持圖像與文字的任意組合輸入,用戶可自由混合圖片和文字提示,輸出形式也根據模型不同而靈活變化。
在技術細節方面,Grok模型突破了傳統對話模型的順序限制,system/user/assistant三種角色提示可以任意排列組合。圖像處理方面支持最大10MB的JPG/PNG文件輸入,但值得注意的是,所有Grok模型都無法實時聯網,其知識截止日期為2024年11月17日。用戶需要將實時事件作為上下文手動輸入,調用時可直接使用模型別名如grok-3或grok-3-fast-latest。
關于使用成本,xAI官方未明確標注免費額度,建議開發者登錄API控制臺查看具體配額。部分開發者賬號可能獲得試用期體驗額度,但需要特別注意的是,不同模型的計費狀態可能有所差異,用戶需仔細核對API Key綁定的模型可用性。
#人工智能 #多模態模型 #API開發 #xAI #Grok
閱讀更多:
https://docs.x.ai/docs/models#models-and-pricing
AI狂潮引爆電力危機,2030年數據中心耗電量或將翻倍
國際能源署(IEA)最新報告指出,人工智能(AI)的迅猛發展將導致全球數據中心電力需求在2030年前翻倍,對能源安全和碳排放目標構成嚴峻挑戰。目前,數據中心已占全球電力消耗的1.5%,且過去五年年均增長12%。生成式AI的普及進一步推高能耗,因其需要龐大算力處理海量數據。美國、歐洲和cn占據全球數據中心耗電量的85%,科技巨頭如谷歌、微軟和亞馬遜正積極尋求核能等替代能源以滿足需求。
報告預測,到2030年,數據中心耗電量將達945太瓦時(TWH),超過日本當前總用電量。一個100兆瓦數據中心的能耗相當于10萬戶家庭,而新建數據中心可能高達200萬戶家庭的用電規模。盡管煤炭目前占數據中心能源供應的30%,但可再生能源和天然氣因成本優勢將逐步擴大份額。國際能源署強調,AI雖加劇電力需求,但也為優化能源生產、降低成本和減排提供了新機遇。
然而,數據中心的擴張將推高碳排放,預計到2035年,相關排放量將從1.8億噸增至3億噸。盡管這一數字僅占全球總排放的極小比例,但AI與能源的深度綁定已引發政策關注。例如,美國總統特朗普成立“能源主導委員會”,旨在提升電力產能以維持AI領域競爭力。國際能源署呼吁,需平衡技術創新與可持續發展,避免能源轉型進程受阻。
#人工智能 #數據中心 #能源危機 #碳排放 #核能
閱讀更多:
https://www.iea.org/news/ai-is-set-to-drive-surging-electricity-demand-from-data-centres-while-offering-the-potential-to-transform-how-the-energy-sector-works
微軟踩下AI基建"剎車鍵":10億美元數據中心項目暫停
微軟近期宣布放緩或暫停多個數據中心建設項目,其中包括俄亥俄州價值10億美元的早期規劃。微軟云計算業務總裁Noelle Walsh在LinkedIn發文解釋,這一調整源于公司需要根據實際需求重新評估基礎設施擴張節奏。盡管過去三年微軟數據中心容量已翻倍,且本財年仍計劃投入超800億美元用于AI基建,但部分項目因戰略優先級變化被擱置,包括威斯康星州項目后期階段和國際市場的部分租賃合約。
行業分析師指出,這一決策與微軟和OpenAI的合作關系演變密切相關。1月21日雙方修改協議后,OpenAI獲準自建算力設施,而微軟則面臨AI技術路線的不確定性。B. Riley Securities研究主管Craig Ellis認為,OpenAI專注于需要海量算力的前沿模型研發,而微軟可能轉向更務實的商業化路徑。與此同時,美國政府對AI基建的干預(如特朗普推動的5000億美元投資計劃)也重塑了行業競爭格局。
能源問題成為另一大制約因素。運行AI工具的高耗能特性迫使科技企業探索核能等替代方案,微軟甚至提議重啟賓夕法尼亞州的三哩島(Three Mile Island)核電站。俄亥俄州項目的暫停令當地官員失望,該地區此前已吸引谷歌、Meta和英特爾等科技巨頭的投資,但半導體工廠建設也已延期至2030年。微軟強調,此次調整是"戰略性節奏控制",未來仍將保持強勁增長。
#微軟數據中心 #AI基建放緩 #云計算戰略 #OpenAI合作 #能源轉型
閱讀更多:
https://apnews.com/article/microsoft-ai-data-center-pause-ohio-4d987fe8446fc9e6cda31d919f938911
Google推出"AI全棧開發神器":一句話生成可上線應用
Google近日發布了革命性的Firebase全棧AI開發環境,將人工智能與云端開發深度整合。這套系統融合了Project IDX、Genkit和Gemini等工具,允許開發者通過自然語言或圖片直接生成Next.js原型項目,并一鍵部署到Firebase App Hosting。其核心創新在于將傳統編碼過程轉化為"描述即開發"的AI驅動模式,例如只需輸入"創建旅行網站"的需求,系統就能自動完成從代碼生成到上線的全流程。
該平臺包含多項突破性功能:App Testing Agent可利用Gemini AI自動生成測試腳本并執行多設備并發測試;Genkit框架支持用開發者熟悉的語言快速集成AI功能;Data Connect服務能自動生成后端API和前端SDK。特別值得注意的是,Vertex AI現在支持Gemini 2.0多模態模型的實時API調用,開發者可以輕松將語音交互等AI能力嵌入React Native應用。這些創新顯著降低了AI應用開發門檻,使非專業工程師也能參與項目開發和質量保障。
Firebase的定位已從單純的后端服務升級為"AI時代的全棧操作系統"。新推出的App Hosting服務支持Nuxt、Astro等項目的一鍵部署,配合可視化儀表板和版本回滾功能,徹底簡化了發布流程。該平臺提供Spark免費計劃和Blaze按需付費兩種模式,既適合初創項目快速驗證想法,也能滿足企業級應用的擴展需求,標志著AI應用開發進入"描述即所得"的新階段。
#AI開發 #云端工具 #自然語言編程 #全棧開發 #Google創新
閱讀更多:
https://firebase.blog/posts/2025/04/cloud-next-announcements
Google推出AI"通用語言"協議:A2A讓不同AI代理像人類一樣協作
Google近日發布了名為A2A(Agent2Agent)的開放協議,這項技術旨在解決當前AI代理(AI Agent)之間無法互通協作的難題。A2A被設計為AI代理間的"通用語言",類似于HTTP之于網頁通信,它允許不同平臺、不同廠商構建的AI代理能夠互相通信、分工合作,形成一個智能協同體,打破現有的"信息孤島"現象。
該協議基于五大核心理念構建,支持多模態通信(文本、圖像、音頻、視頻)和異步任務處理。其核心結構包括Agent Card(能力描述卡)、Task(任務對象)、Artifact(任務產物)和Message Part(消息內容塊)。通過這套系統,AI代理可以像拼樂高一樣互相對接,企業能夠組建"AI團隊"協作處理復雜任務,如招聘流程中多個代理協同完成候選人檢索、面試安排和背景調查等工作。
目前A2A已獲得Google Cloud、LangChain、MongoDB等50多家技術公司支持,并得到Accenture、BCG等咨詢機構的合作。協議還內置了OAuth2、API Token和雙向TLS等安全認證機制,確保企業級應用的安全性。這項技術的推出標志著AI協作進入新階段,有望大幅降低系統整合復雜度和長期維護成本。
#AI協作 #Google技術 #企業自動化 #多模態通信 #智能協同
閱讀更多:
https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/
OpenAI發布評估基準BrowseComp,衡量AI搜索復雜信息的能力
OpenAI發布了全新的評估基準BrowseComp,旨在衡量人工智能代理在互聯網上搜索復雜信息的能力。該基準包含1,266個高難度問題,要求AI在瀏覽數十甚至數百個網頁后,整合多源信息,回答涉及歷史、文化、科學等領域的復雜問題。與現有的SimpleQA等基準相比,BrowseComp更注重對AI在處理模糊、交織信息方面的評估,推動了AI在真實世界任務中的應用能力。
BrowseComp設計了多樣化的問題類型,如要求AI識別具有特定背景的虛構角色,或查找特定時間段內的學術出版物等。例如,某問題要求AI識別一位偶爾打破第四面墻的虛構角色,該角色在1960至1980年代之間有一部少于50集的電視節目,答案為“Plastic Man”。在性能評估中,OpenAI的GPT-4o模型在BrowseComp上的表現優于其他模型,顯示出其在處理復雜搜索任務中的優勢。此外,研究還探討了計算資源對模型性能的影響,發現增加計算資源有助于提高模型的搜索和推理能力。
#認知科學 #人工智能 #信息檢索 #復雜推理 #模型評估
閱讀更多:
https://openai.com/index/browsecomp/
AI 驅動科學
Nature:16,000個光學元件協同作戰,計算延遲降至3納秒
人工智能爆發式增長讓傳統芯片不堪重負,光電子融合技術成為破局關鍵。最新研究顯示,由Shiyue Hua、Bo Peng等組成的跨國團隊成功開發出含16,000個元件的光子加速器PACE,其延遲低至3納秒。
?啟發式循環算法的延遲比較和原理。Credit: Nature (2025).
研究團隊采用創新性2.5D混合封裝技術,將光子芯片與硅電子芯片集成,構建64×64光子矩陣。測試表明,該系統執行矩陣乘積累加運算(MAC,人工智能核心操作)時頻率高達1 GHz,最小延遲較傳統電路降低500倍。在解決伊辛問題(Ising problems,模擬磁性材料相變的數學難題)時展現出獨特優勢,驗證了光子計算在復雜優化任務中的潛力。值得注意的是,光子信號傳輸幾乎無電阻損耗,能效比顯著提升。不過研究者指出,光學信號與電子控制器的協同仍需優化,才能真正替代現有計算架構。研究發表在 Nature 上。
#AI驅動科學 #計算模型與人工智能模擬 #光子計算 #高性能計算 #能源效率
閱讀更多:
Hua, Shiyue, et al. “An Integrated Large-Scale Photonic Accelerator with Ultralow Latency.” Nature, vol. 640, no. 8058, Apr. 2025, pp. 361–67. www.nature.com, https://doi.org/10.1038/s41586-025-08786-6
Nature:大型語言模型助力精準醫療診斷
如何提升疑難病例的診斷準確性?Google Health與多機構合作的Daniel McDuff、Mike Schaekermann、Tao Tu等團隊開發了專為臨床診斷優化的語言模型AMIE,在302例真實疑難病例測試中,該模型獨立診斷準確率顯著高于無輔助臨床醫生,同時能有效提升醫生的診斷質量。
研究團隊首先開發了針對臨床診斷優化的AMIE模型(Articulate Medical Intelligence Explorer)。在實驗中,20名臨床醫生評估了302例來自《新英格蘭醫學雜志》的疑難病例,隨機分為無輔助、傳統檢索工具輔助(如UpToDate、PubMed)和AMIE輔助三組。結果顯示,AMIE獨立診斷的top-10準確率達59.1%,顯著高于無輔助臨床醫生的33.6%。更重要的是,AMIE輔助的臨床醫生診斷質量評分(top-10準確率51.7%)顯著高于僅使用傳統檢索工具的醫生(44.4%)。AMIE平均生成237詞的詳細解釋,幫助醫生構建更全面的鑒別診斷列表(differential diagnosis)。研究證實AMIE可有效提升臨床診斷能力,為患者提供更精準的醫療服務。研究發表在 Nature 上。
#疾病與健康 #大模型技術 #個性化醫療 #預測模型構建 #醫療AI
閱讀更多:
McDuff, Daniel, et al. “Towards Accurate Differential Diagnosis with Large Language Models.” Nature, Apr. 2025, pp. 1–7. www.nature.com, https://doi.org/10.1038/s41586-025-08869-4
AI也有"文化盲區"?如何打破WEIRD偏見實現全球包容
當前AI系統存在嚴重的文化偏見,主要反映西方發達國家視角。密歇根大學的Rada Mihalcea和圣克拉拉大學的Oana Ignat聯合12國專家團隊,系統分析了AI開發中的文化偏見問題,提出構建全球包容AI的解決方案。
研究團隊來自中國、德國、印度等12個國家,通過案例分析法揭示AI開發全流程的文化偏見。在數據層面,標注過程忽視非主流文化視角,如羅馬尼亞歷史人物評價出現嚴重偏差;模型對齊過程中,開發者編碼的價值觀過度傾向西方標準;評估指標也未能涵蓋多元文化場景。實驗顯示,加拿大法語區教育工具因文化錯配導致性能下降40%,而添加少量本地化數據可提升30%以上效果。研究提出"厚文化視角"解決方案,包括多元化數據收集、全球開發者協作、文化敏感評估體系三方面改進。
#大模型技術 #跨學科整合 #文化多樣性 #AI倫理 #全球化
閱讀更多:
Mihalcea, Rada, et al. Why AI Is WEIRD and Should Not Be This Way: Towards AI For Everyone, With Everyone, By Everyone. arXiv:2410.16315, arXiv, 9 Oct. 2024. arXiv.org, https://doi.org/10.48550/arXiv.2410.16315
AI寫作 vs 記者手筆:揭示新聞報道風格差異
AI生成新聞是否具有人類記者的創造力?查爾斯達爾文大學的Van Hieu Tran、Yakub Sebastian等研究者通過對比分析發現,人類記者在句式多樣性(句子長度變化達35%)和動詞使用量(比AI高22%)上顯著占優,而AI內容雖可讀性相當但風格單調。
研究團隊從《紐約時報》等媒體選取150篇人類新聞,涵蓋政治、體育等多領域,通過主題建模工具BERTopic提取關鍵詞后,用Google的Gemini生成對應AI新聞。采用機器學習方法分析文本特征,發現人類記者更善用動詞(verb ratio高1.8倍)和復雜句式(sentence complex tags多47%),段落長度變異系數(coefficient of variation)達AI的2.3倍,體現更強的表達靈活性。隨機森林模型基于這些特征實現98.3%的區分準確率。值得注意的是,AI在名詞使用頻率上超出人類15%,呈現"事實堆砌"傾向。該研究開發的檢測模型已封裝為瀏覽器插件原型,可實時評估新聞的AI生成概率。研究發表在 Computers 上。
#AI驅動科學 #大模型技術 #自然語言處理 #新聞真實性 #機器學習
閱讀更多:
Tran, Van Hieu, et al. “Distinguishing Human Journalists from Artificial Storytellers Through Stylistic Fingerprints.” Computers, vol. 13, no. 12, 12, Dec. 2024, p. 328. www.mdpi.com, https://doi.org/10.3390/computers13120328
98.2%準確率!這臺電腦看得懂你的手語
全球1100萬聾人面臨溝通障礙,傳統手語翻譯依賴人力且成本高昂。佛羅里達大西洋大學的Bader Alsharif團隊開發出基于普通攝像頭的實時手語翻譯系統,準確識別美國手語字母并轉換為文字,準確率達98.2%。
?帶注釋的美國手語字母手勢,包含 21 個關鍵點,用于模型訓練。Credit: Florida Atlantic University
研究采用YOLOv11(新一代目標檢測算法)進行手勢檢測,結合MediaPipe(谷歌開源的手部關鍵點追蹤工具)提取21個手部特征點。系統通過13萬張包含不同膚色、光照和背景的手勢圖像訓練,采用關鍵點標注技術(精確標記指尖、關節等位置)提升模型魯棒性。測試顯示,系統在復雜環境下仍保持98.2%的識別準確率,延遲低于50毫秒,可實時拼寫專有名詞。特別解決了"A/T"、"M/N"等易混淆手勢的區分難題,錯誤率從行業平均15%降至1.8%。研究還開源了包含21點精細標注的大規模數據集,推動領域發展。研究發表在 Sensors 上。
#AI驅動科學 #人機交互 #輔助技術 #實時識別 #深度學習
閱讀更多:
Alsharif, Bader, et al. “Real-Time American Sign Language Interpretation Using Deep Learning and Keypoint Tracking.” Sensors, vol. 25, no. 7, 7, Jan. 2025, p. 2138. www.mdpi.com, https://doi.org/10.3390/s25072138
可水洗AI T恤精準追蹤運動姿勢
如何讓運動監測既精準又舒適?康奈爾大學Tianhong Catherine Yu和Cheng Zhang團隊突破性地將導電線縫入普通T恤接縫,開發出可水洗的SeamFit智能服裝,能自動識別14種運動動作并計數,準確率超93%。
?Tianhong Catherine Yu在科幻實驗室里,將導電線縫入普通 T 恤的接縫處,制作出智能服裝。Credit: Louis DiPietro
研究團隊創新性地利用服裝接縫嵌入導電線(conductive threads,可隨身體彎曲改變電特性的特殊纖維),通過測量電容變化捕捉全身運動。定制的機器學習算法無需個人校準即可識別弓步等14種動作,分類準確率達93.4%,重復計數誤差小于1次。三種尺碼設計適應不同體型,后領可拆卸電路板使整件T恤可直接機洗。在15人實驗中,系統甚至能追蹤未被布料覆蓋的肘關節活動,突破傳統智能手表局部監測局限。該技術已從實驗室手工制作轉向探索工業包縫機量產方案,未來或使所有成衣具備"隱形"智能。研究發表在 Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies 上。
#AI驅動科學 #健康管理與壽命延長 #可穿戴技術 #運動醫學 #智能紡織
閱讀更多:
Yu, Tianhong Catherine, et al. “SeamFit: Towards Practical Smart Clothing for Automatic Exercise Logging.” Proc. ACM Interact. Mob. Wearable Ubiquitous Technol., vol. 9, no. 1, Mar. 2025, p. 24:1-24:22. ACM Digital Library, https://doi.org/10.1145/3712287
整理|ChatGPT
編輯|丹雀、存源
關于追問nextquestion
天橋腦科學研究院旗下科學媒體,旨在以科學追問為紐帶,深入探究人工智能與人類智能相互融合與促進,不斷探索科學的邊界。如果您有進一步想要討論的內容,歡迎評論區留言,或后臺留言“社群”即可加入社群與我們互動。
關于天橋腦科學研究院
天橋腦科學研究院(Tianqiao and Chrissy Chen Institute)是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一,圍繞全球化、跨學科和青年科學家三大重點,支持腦科學研究,造福人類。
Chen Institute與華山醫院、上海市精神衛生中心設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室;與加州理工學院合作成立了加州理工天橋神經科學研究院。
Chen Institute建成了支持腦科學和人工智能領域研究的生態系統,項目遍布歐美、亞洲和大洋洲,包括、、、科研型臨床醫生獎勵計劃、、等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.