在熱電、隔熱、防熱涂層等多個功能材料領(lǐng)域,晶格熱導(dǎo)率是衡量材料性能的核心指標(biāo)之一。尤其是超低晶格熱導(dǎo)率的半導(dǎo)體材料,因其在廢熱回收與高效熱管理中的巨大潛力,一直是材料研究的熱點(diǎn)。此外,在當(dāng)前數(shù)據(jù)驅(qū)動的材料設(shè)計(jì)背景下,傳統(tǒng)材料的研發(fā)面臨著兩大挑戰(zhàn):復(fù)雜物性如晶格熱導(dǎo)率的精準(zhǔn)計(jì)算非常復(fù)雜,通常依賴昂貴的第一性原理方法(如求解聲子玻爾茲曼輸運(yùn)方程),而基于機(jī)器學(xué)習(xí)的材料性質(zhì)預(yù)測常常受限于稀缺的標(biāo)注數(shù)據(jù),如何在百萬級化學(xué)空間中高效尋找具有復(fù)雜目標(biāo)物性的材料成為一個難題。
針對這些挑戰(zhàn),同濟(jì)大學(xué)物理科學(xué)與工程學(xué)院/上海自主智能無人系統(tǒng)科學(xué)中心任捷教授團(tuán)隊(duì)提出了一種層級增強(qiáng)的漏斗學(xué)習(xí)(HiBoFL)新范式(如圖1),創(chuàng)新地整合了無監(jiān)督學(xué)習(xí)、高通量計(jì)算和可解釋監(jiān)督學(xué)習(xí),并成功應(yīng)用于篩選具有超低晶格熱導(dǎo)率的半導(dǎo)體。通過從數(shù)十萬種材料中結(jié)合無監(jiān)督學(xué)習(xí)篩選,僅對少量(數(shù)百個)目標(biāo)材料進(jìn)行訓(xùn)練,實(shí)現(xiàn)了對超低晶格熱導(dǎo)率材料的高效且可解釋的有監(jiān)督預(yù)測,從而避免了在缺乏明確目標(biāo)下進(jìn)行大規(guī)模的暴力從頭計(jì)算。最終,不僅篩選出一批具有潛在熱電應(yīng)用價(jià)值的超低晶格熱導(dǎo)率的候選材料,還發(fā)現(xiàn)了一個對晶格非簡諧性具有顯著影響的新物理因子。
Figure 1. Hierarchy-boosted funnel learning (HiBoFL) framework for accelerating the discovery of functional materials.
本文所提出的HiBoFL框架,主要有四個部分:
一、數(shù)據(jù)準(zhǔn)備:初步高通量篩選
從Materials Project獲取超過十萬種材料,通過多級篩選,考慮熱力學(xué)穩(wěn)定性(凸包能量)、半導(dǎo)體特性(帶隙)、計(jì)算可行性(原子數(shù))、排除無關(guān)元素等,獲得2675種三維結(jié)構(gòu)的穩(wěn)定半導(dǎo)體材料,構(gòu)成一級數(shù)據(jù)集(如圖2a)。
二、無監(jiān)督學(xué)習(xí):識別相似熱導(dǎo)率材料
針對一級數(shù)據(jù)集中的材料,產(chǎn)生基于化學(xué)組分描述符:元素電負(fù)性、熔點(diǎn)等,以及晶體結(jié)構(gòu)描述符:原子局部環(huán)境體積、配位數(shù)等,標(biāo)準(zhǔn)化后通過PCA降維,進(jìn)一步結(jié)合K-means算法,依據(jù)“肘部法則”和輪廓系數(shù)確定最佳聚類(如圖2b),將這些材料聚成七類(如圖3)。類C1和C2包含了已知低熱導(dǎo)率材料(如Tl?AsSe?的κL= 0.23 W/mK),而C7包含已知高熱導(dǎo)率材料(如SiC的κL= 490 W/mK)。因此,搜索空間從2675種材料縮小至704種材料(C1+C2),效率大大提升了73%。
Figure 2. Dataset preparation and unsupervised learning optimization.
Figure 3. Unsupervised learning result in the first-level dataset.
三、數(shù)據(jù)標(biāo)注:低成本高通量計(jì)算構(gòu)建本地?cái)?shù)據(jù)庫
基于彈性性質(zhì)與晶格熱導(dǎo)率的經(jīng)驗(yàn)公式,進(jìn)一步低成本高通量計(jì)算了704種材料的熱導(dǎo)率,建立了本地?cái)?shù)據(jù)庫。其中,將近70%材料的熱導(dǎo)率低于2 W/mK(如圖4),硫族化合物(S/Se/Te)占比最高。Cs?SnSe?與Cs?GeSe?被進(jìn)一步進(jìn)行聲子熱輸運(yùn)機(jī)制分析(如圖5),結(jié)果表明,聲子譜軟化、Cs原子的rattling效應(yīng)是導(dǎo)致超低熱導(dǎo)的原因,而Ge-Se鍵的強(qiáng)共價(jià)性(COHP顯示反鍵態(tài)更少)增強(qiáng)了非諧性,使Cs?GeSe?的κL比Cs?SnSe?具有更低的熱導(dǎo)率,這也在后續(xù)可解釋監(jiān)督學(xué)習(xí)中得到論證。
Figure 4. HTC-based data annotation for statistical analysis and material discovery in the second-level dataset.
Figure 5. Mechanisms of phonon thermal transport properties based on first principles calculations.
四、有監(jiān)督學(xué)習(xí):超低熱導(dǎo)的高效可解釋預(yù)測
為了進(jìn)一步修正無監(jiān)督學(xué)習(xí)結(jié)果,基于本地?cái)?shù)據(jù)庫構(gòu)建了直接預(yù)測超低熱導(dǎo)率材料的有監(jiān)督學(xué)習(xí)模型。對比了決策樹、隨機(jī)森林、XGBoost等幾種常用算法,其中CatBoost表現(xiàn)出最優(yōu)結(jié)果并被用于后續(xù)建模。進(jìn)一步結(jié)合SHAP值分析了影響超低熱導(dǎo)率的關(guān)鍵描述符,如最小原子質(zhì)量、結(jié)構(gòu)填充率、最小相對鍵長等。其中,最小相對鍵長被用于量化鍵長分布,作為關(guān)聯(lián)結(jié)構(gòu)非諧性的新物理因子。該因子揭示了其主導(dǎo)Cs?GeSe?的超低κL優(yōu)勢,即更小的最小相對鍵長,增強(qiáng)了結(jié)構(gòu)的非諧性,縮短了聲子壽命,從而降低晶格熱導(dǎo)率。
Figure 6. Supervised learning in the local database and interpretable analysis.
本研究所提出的HiBoFL框架為不僅創(chuàng)新了復(fù)雜熱輸運(yùn)材料發(fā)現(xiàn)的新方法,也也為材料科學(xué)中的小樣本挑戰(zhàn)提供了有潛力的解決方案。
https://www.nature.com/articles/s41524-025-01583-9
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.