導(dǎo)語
在當(dāng)今大數(shù)據(jù)時代,數(shù)據(jù)已成為推動決策的核心資源。然而,如何將海量數(shù)據(jù)轉(zhuǎn)化為最優(yōu)決策,仍是學(xué)術(shù)界和工業(yè)界面臨的重大挑戰(zhàn)。近日北京大學(xué)宋潔教授團(tuán)隊(duì)在Cell Press交叉學(xué)科期刊Nexus發(fā)表題為《Bridging Prediction and Decision: Advances and Challenges in Data-Driven Optimization》的觀點(diǎn)性綜述文章,系統(tǒng)探討了數(shù)據(jù)驅(qū)動的方法在預(yù)測和決策領(lǐng)域的應(yīng)用。文章系統(tǒng)總結(jié)了序貫優(yōu)化(SO)、端到端學(xué)習(xí)(E2E)和直接學(xué)習(xí)(DL)三種數(shù)據(jù)驅(qū)動型優(yōu)化方法的理論、優(yōu)勢和最新進(jìn)展,并結(jié)合能源調(diào)度、運(yùn)籌管理和智能控制等典型應(yīng)用場景進(jìn)行了分析,通過剖析數(shù)據(jù)質(zhì)量、優(yōu)化建模和決策應(yīng)用等關(guān)鍵問題,文章提出了對應(yīng)的解決方案,為面向復(fù)雜環(huán)境的智能決策提供了重要的理論支撐和方法指引。
關(guān)鍵詞:優(yōu)化,序貫優(yōu)化(Sequential Optimization,SO),端到端學(xué)習(xí)(End to End Learning, E2E),直接學(xué)習(xí)(Direct Learning, DL)
陸怡舟丨作者
曾利丨審校
論文題目:Bridging prediction and decision: Advances and challenges in data-driven optimization 論文地址:https://www.cell.com/nexus/fulltext/S2950-1601(25)00004-X 論文來源:Nexus
背景知識
從石器時代的生存選擇到數(shù)字時代的智能決策,人類文明的發(fā)展史也是一部決策能力的進(jìn)化史。隨著決策科學(xué)正經(jīng)歷從"經(jīng)驗(yàn)驅(qū)動"到"數(shù)據(jù)驅(qū)動"的范式革命,現(xiàn)代決策問題越來越依賴于系統(tǒng)化的解決方法——通過將復(fù)雜的決策需求轉(zhuǎn)化為可計(jì)算的優(yōu)化問題,我們得以在數(shù)據(jù)海洋中尋找最優(yōu)解,下面讓我們通過兩個典型決策問題來深入理解這一過程。
裝載問題(個人決策):假設(shè)有一輛載重量上限為B的貨車來到貨場,需要從n件貨品中選擇部分貨物進(jìn)行裝載。每件貨物i的重量為ai,價值為ci。車主的目標(biāo)是在不超過貨車最大載重量B的前提下,選擇若干件貨物,使得被選中的貨物的總價值最大。
如果定義這樣的一個輔助決策變量:,那么裝載問題可以寫為如下的優(yōu)化問題。
電網(wǎng)最優(yōu)潮流控制問題(企業(yè)決策):在電力系統(tǒng)運(yùn)行中,最優(yōu)潮流控制問題的核心目標(biāo)是通過調(diào)整發(fā)電機(jī)組的輸出功率等可控參數(shù),在滿足節(jié)點(diǎn)正常功率平衡及各種安全指標(biāo)的約束下,實(shí)現(xiàn)系統(tǒng)運(yùn)行的目標(biāo)函數(shù)最小化。假如某火電廠有n臺火電機(jī)組,每臺機(jī)組的輸出功率為zi,機(jī)組的成本函數(shù)是輸出功率的二次函數(shù),即。火電廠面臨兩個約束,一是每臺機(jī)組的輸出功率需要保持在最佳運(yùn)行功率區(qū)間之內(nèi),同時,所有機(jī)組的總輸出功率不能低于某個數(shù)值L。同樣地,火電廠的決策問題也可以寫為一個優(yōu)化問題。
從前述的兩個決策問題的例子出發(fā),可以將決策問題一般化為如下形式:
這里的z代表了決策變量,可以進(jìn)一步參數(shù)化為pθ(x),代表了從輸入變量(環(huán)境變量)x對某個相關(guān)變量(中間變量、內(nèi)部變量)y的預(yù)測值。并且注意到,這個預(yù)測值可能與真實(shí)值y相等,也可能與真實(shí)值y之間存在偏差。對裝載問題來說,不同貨物的重量和價值均事先已知,,預(yù)測值與真實(shí)值是相等的。對于電網(wǎng)控制問題來說,成本方程(3)的各項(xiàng)系數(shù)是未知的,預(yù)測值與真實(shí)值y={ai,bi,ci},i=1, …,n 很可能不相等。
在復(fù)雜的現(xiàn)實(shí)決策問題中,所需要預(yù)測的變量y的形式更加多樣,預(yù)測問題更加困難。例如,在能源市場的相關(guān)決策問題中,通常需要對電力價格、電力需求、風(fēng)光新能源發(fā)電量等進(jìn)行預(yù)測,往往會涉及復(fù)雜的經(jīng)濟(jì)社會系統(tǒng)、氣象系統(tǒng)的預(yù)測問題。
隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的飛速發(fā)展,“預(yù)測+決策”框架作為人工智能與系統(tǒng)科學(xué)相結(jié)合的重要手段,逐漸成為提升系統(tǒng)效能的核心挑戰(zhàn),也是最終實(shí)現(xiàn)大數(shù)據(jù)價值轉(zhuǎn)化的關(guān)鍵途徑。宋潔教授團(tuán)隊(duì)的綜述文章從理論、應(yīng)用、挑戰(zhàn)和解決方案四個維度深入分析數(shù)據(jù)驅(qū)動的優(yōu)化方法。
從預(yù)測到?jīng)Q策:數(shù)據(jù)驅(qū)動優(yōu)化的三大范式
圖1:序貫優(yōu)化方法(范式一)
序貫優(yōu)化方法(Sequential Optimization,SO):該方法采用“預(yù)測”-“優(yōu)化”兩階段流程來解決決策問題:首先利用預(yù)測模型對不確定因素進(jìn)行估計(jì),再將預(yù)測結(jié)果輸入優(yōu)化模塊生成決策。此方法直觀且模塊化,各環(huán)節(jié)可獨(dú)立優(yōu)化,實(shí)現(xiàn)人工智能與決策模型的直接耦合。常用的實(shí)現(xiàn)為第一步是通過數(shù)據(jù)驅(qū)動的方法,發(fā)現(xiàn)數(shù)據(jù)所代表的復(fù)雜系統(tǒng)的潛在運(yùn)行模式,從而得到預(yù)測值。第二步再借助Gurobi等優(yōu)化求解器,求解優(yōu)化(公式 6-7)。
但是,由于序貫優(yōu)化方法將決策問題解耦成兩個子問題,很可能產(chǎn)生優(yōu)化階段和決策階段之間的不一致情況。在優(yōu)化階段,由于預(yù)測的精度有限,預(yù)測值往往是對稱分布在真實(shí)值y的周圍。但是決策階段面對的備擇情景卻未必有類似的對稱性[1]。仍然以電力行業(yè)面臨的問題為例,如果預(yù)測值偏高,可能備擇方案會增加不必要的操作資源,導(dǎo)致無效的資源分配。而如果預(yù)測值偏低,備擇方案可能會觸發(fā)網(wǎng)絡(luò)之間的再平衡,帶來額外系統(tǒng)可靠性問題。
圖2:端到端學(xué)習(xí)方法(范式二)
端到端學(xué)習(xí)方法(End to End Learning,E2E):也稱為決策驅(qū)動學(xué)習(xí)。該方法將優(yōu)化結(jié)構(gòu)嵌入訓(xùn)練過程中,通過決策反饋直接調(diào)整預(yù)測模型,實(shí)現(xiàn)從預(yù)測到?jīng)Q策的閉環(huán)學(xué)習(xí),從而更好地對齊預(yù)測與決策目標(biāo),有助于減少序貫優(yōu)化方法中存在的偏差問題。具體來說,該方法將最優(yōu)決策目標(biāo)表示為預(yù)測值的函數(shù),從而將決策問題的目標(biāo)(公式6-公式7)轉(zhuǎn)化為最小化以下?lián)p失函數(shù)(也稱為決策問題的后悔函數(shù)):
于是可以進(jìn)一步通過計(jì)算(8)的梯度,利用梯度反向傳播等方法得到最優(yōu)決策解。
但是,(9)式往往難以顯式表達(dá),或者在實(shí)際問題中計(jì)算量巨大。一般可以通過三類E2E方法求解:隱函數(shù)方法(Implicit differentiation methods)、代理損失函數(shù)法(Surrogate loss methods)、近似求解法(Approximation methods)。隱函數(shù)方法通過優(yōu)化問題的KKT條件將(9)式表示成雅可比矩陣的相應(yīng)形式。代理損失函數(shù)法以SPO+損失函數(shù)為代表,將公式(9)轉(zhuǎn)化為更易求解的SPO+損失函數(shù)的梯度形式[2]。近似求解法通過對預(yù)測值疊加高斯噪聲?Z,并計(jì)算其期望值,即決策問題的擾動解。
即便如此,E2E方法仍然受到優(yōu)化問題(公式 6-7)這一框架的限制,在一些問題上的迭代計(jì)算任務(wù)仍然繁重。因此出現(xiàn)了通過在線深度強(qiáng)化學(xué)習(xí)[3,4]、網(wǎng)格搜索、隨機(jī)搜索、貝葉斯優(yōu)化[5]來減少計(jì)算量的方法。另外,E2E方法的泛化能力(Transferability)也是個問題。這主要由于E2E方法犧牲了預(yù)測性能,來保證決策問題的優(yōu)化性能,因此其預(yù)測值可能與真實(shí)值偏離較大(圖2-C、D),也導(dǎo)致其泛化能力不佳。
圖3:直接學(xué)習(xí)方法(范式三)
直接學(xué)習(xí)方法(Direct Learning,DL)則另辟蹊徑,不去求解優(yōu)化問題(公式 6-7),轉(zhuǎn)而尋找輸入變量x與決策變量z的直接關(guān)系,該方法主要適用于那些優(yōu)化問題結(jié)構(gòu)復(fù)雜或隱式表達(dá)的場景,在難以明確定義優(yōu)化過程時表現(xiàn)出卓越的適應(yīng)性和靈活性。例如,在強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)框架下,主要目標(biāo)是求解馬爾可夫決策過程(Markov Decision Process,MDP)的獎勵值最大化,,,γ是折現(xiàn)系數(shù),rt(xt,zt) 是獎勵函數(shù)。又如在模仿學(xué)習(xí)(Imitation Learning,IL)框架下,主要目標(biāo)是求解網(wǎng)絡(luò)參數(shù)Φ,使得模仿網(wǎng)絡(luò)的行為與專家示范數(shù)據(jù)盡可能一致,,這里的y表示專家示范數(shù)據(jù)。
圖4:三種數(shù)據(jù)驅(qū)動優(yōu)化范式之間的比較
三類方法均有不同的特點(diǎn)和適用范圍,簡單對比總結(jié)為:
1.序貫優(yōu)化方法的可解釋性強(qiáng)、計(jì)算有效性較好,適用于對預(yù)測要求較高,預(yù)測模型重訓(xùn)練難度較大的大型問題(如NLP、氣象問題),同時可以接受一定程度的次優(yōu)決策;
2.端到端學(xué)習(xí)方法的一致性強(qiáng)、可解釋性好,適用于決策精度要求高的情景;
3.直接學(xué)習(xí)方法的一致性強(qiáng)、計(jì)算有效性相對較好,適用于復(fù)雜、動態(tài)的決策環(huán)境,比如自動駕駛領(lǐng)域等。
雖然三類方法均為數(shù)據(jù)驅(qū)動的優(yōu)化方法,但是序貫優(yōu)化方法一般作為基線方法的角色出現(xiàn)。在目前大部分的數(shù)據(jù)驅(qū)動應(yīng)用場景里,比如電力網(wǎng)絡(luò)規(guī)劃、復(fù)雜系統(tǒng)優(yōu)化、能源系統(tǒng)節(jié)能、貨物快遞、港口管理、自動駕駛等,端到端學(xué)習(xí)方法和直接學(xué)習(xí)方法在效果上都要勝過序貫優(yōu)化方法。
從理論到應(yīng)用:
數(shù)據(jù)驅(qū)動優(yōu)化方法面臨的挑戰(zhàn)
相較于基于先驗(yàn)知識和模型的傳統(tǒng)決策方法,數(shù)據(jù)與預(yù)測技術(shù)的融合顯著提升了實(shí)際應(yīng)用效能。例如,通過整合大規(guī)模氣象數(shù)據(jù)與地理信息,可實(shí)現(xiàn)更精準(zhǔn)高效的可再生能源預(yù)測,進(jìn)而借助多尺度人工智能模型使微電網(wǎng)中的分布式發(fā)電更智能高效。此外,針對發(fā)電企業(yè)與電網(wǎng)運(yùn)營商普遍面臨的管理難題,IBM、Oracle等行業(yè)巨頭已開發(fā)出大數(shù)據(jù)驅(qū)動的智慧能源管理產(chǎn)品與服務(wù),廣泛應(yīng)用于資產(chǎn)密集型產(chǎn)業(yè)。總體而言,數(shù)據(jù)輸入與預(yù)測分析等技術(shù)的出現(xiàn)為決策應(yīng)用注入了新活力,推動行業(yè)實(shí)踐與標(biāo)準(zhǔn)實(shí)現(xiàn)質(zhì)的飛躍。
文章通過三個微型案例研究,分別展示數(shù)據(jù)驅(qū)動優(yōu)化方法在電網(wǎng)調(diào)度、市場運(yùn)營及無人自動控制等不同領(lǐng)域的多元化應(yīng)用。這些案例凸顯了各類技術(shù)在應(yīng)對復(fù)雜決策挑戰(zhàn)時具有的跨領(lǐng)域適用性與實(shí)效性。
電力調(diào)度:Wahdany等人[6]利用KKT條件 (Karush-Kuhn-Tucker conditions) 來解決高風(fēng)電電網(wǎng)的潮流控制問題,他們使用的端到端學(xué)習(xí)方法要比序貫優(yōu)化方法減少了8.5%的網(wǎng)絡(luò)擁堵和過載問題。Zhou等人[7]使用LSTM預(yù)測方法求解電網(wǎng)中的混合線性規(guī)劃(Mixed-Integer Linear Programming, MILP)問題,降低了0.4%的運(yùn)營成本。Sang等人[8]使用SPO+損失函數(shù),根據(jù)電價來優(yōu)化儲能系統(tǒng)行為,比序貫優(yōu)化方法提高了6.11%的經(jīng)濟(jì)效益。
市場運(yùn)營:Chu等人[9]利用SPO+方法解決末端送貨問題,與序貫優(yōu)化方法相比減少了5%的運(yùn)輸成本。Tian等人[10]在端到端學(xué)習(xí)框架下求解港口巡檢問題,比序貫優(yōu)化方法減少每艘船只1%的運(yùn)營成本。Qi等人[11]提出了不確定需求下的庫存管理的直接學(xué)習(xí)框架,比序貫優(yōu)化方法平均降低26.1%的持有成本[注:包括資金成本、倉儲成本、保險(xiǎn)成本和庫存貶值成本,反映了持有庫存所帶來的一系列費(fèi)用]和51.7%的缺貨成本[注:包括銷售損失、客戶流失成本、緊急采購成本和生產(chǎn)中斷成本,反映了因庫存不足而帶來的損失]。
無人自動控制:在自動駕駛、無人機(jī)控制、機(jī)器人領(lǐng)域,由于環(huán)境和控制任務(wù)的復(fù)雜,決策目標(biāo)的優(yōu)化問題的顯式表達(dá)幾無可能。這類問題廣泛使用直接學(xué)習(xí)方法求解。比如,Cao等人[12]引入動態(tài)置信感知強(qiáng)化學(xué)習(xí)算法,來處理自動駕駛車輛在極端條件下的不確定性問題。Kim等人[13]使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練無人機(jī),整合無人機(jī)的形變傳感數(shù)據(jù)、姿態(tài)數(shù)據(jù)、風(fēng)向風(fēng)速數(shù)據(jù),來實(shí)現(xiàn)最優(yōu)飛行。
針對數(shù)據(jù)驅(qū)動優(yōu)化理論在行業(yè)應(yīng)用情況,文章從“數(shù)據(jù)質(zhì)量–建模優(yōu)化–決策應(yīng)用”的全流程分析挑戰(zhàn)并提出相應(yīng)技術(shù)性解決方案。
圖5:數(shù)據(jù)驅(qū)動優(yōu)化方法在實(shí)際應(yīng)用中的挑戰(zhàn)
上圖顯示了數(shù)據(jù)驅(qū)動優(yōu)化在實(shí)際應(yīng)用場景中面臨的三大挑戰(zhàn),具體來說包括以下三個方面:
數(shù)據(jù)的質(zhì)量和數(shù)量決定了決策的效果和效率。從數(shù)據(jù)質(zhì)量來看,數(shù)據(jù)驅(qū)動方法要求對數(shù)據(jù)進(jìn)行良好的預(yù)處理。傳統(tǒng)的無監(jiān)督的數(shù)據(jù)預(yù)處理方法包括一致性分析[14]、香農(nóng)熵[15]、例外點(diǎn)監(jiān)測[16],但是由于決策問題的復(fù)雜性,數(shù)據(jù)的重要性很可能是與決策條件相關(guān)的。為此,需要引入如動態(tài)分布方法[17]之類的有監(jiān)督的數(shù)據(jù)預(yù)處理方法,來增加決策階段的數(shù)據(jù)質(zhì)量。這方面的研究仍然處于相對早期階段。從數(shù)據(jù)數(shù)量來看,數(shù)據(jù)量太少可能造成過擬合問題,太多則可能增加訓(xùn)練成本和計(jì)算時間。在數(shù)據(jù)數(shù)量和決策效果之間取得平衡,仍然是一個關(guān)鍵的研究課題。對大樣本而言,需要確定最優(yōu)采樣度[18],對小樣本而言,則需要引入數(shù)據(jù)增廣等技術(shù)[19,20],以及小樣本學(xué)習(xí)方法[21]。
不確定性建模和解的可行性決定了優(yōu)化方法的效能。在不確定性建模方面,方法的應(yīng)用先于理論指導(dǎo)。近十年來,涌現(xiàn)了基于期望的隱函數(shù)法[22]、隨機(jī)約束[23]、穩(wěn)健優(yōu)化[24,25]等方法,但是不確定性建模的理論分析仍然滯后。在解的可行性方面,最大的挑戰(zhàn)來自于如何在E2E等方法應(yīng)用過程中,仍然保持解的可行性。雖然如增加懲罰項(xiàng)[26]、引入風(fēng)險(xiǎn)項(xiàng)[27]、動態(tài)調(diào)整約束項(xiàng)[22]等方法能在一定程度上保證可行解,但是完整的理論分析框架仍然有待建立。
可解釋性和可拓展性決定了決策方法的應(yīng)用范圍。可解釋性一方面能夠增強(qiáng)決策者對決策方法的信心,另一方面還有助于增加決策者對決策問題的洞見。機(jī)器學(xué)習(xí)領(lǐng)域出現(xiàn)了一些有效的解釋性方法,包括LIME(Local Interpretable Model-agnostic Explanations),通過局部近似的方式,為復(fù)雜的“黑箱”模型提供可解釋性,幫助用戶理解模型在特定預(yù)測上的決策依據(jù)。以及 SHAP(SHapley Additive exPlanations),利用公平分配合作博弈收益的 Shapley Value,計(jì)算每個特征對模型預(yù)測的貢獻(xiàn),幫助用戶理解模型的決策過程。但是將解釋性方法從機(jī)器學(xué)習(xí)領(lǐng)域拓展到?jīng)Q策理論,仍存在較大挑戰(zhàn)。可拓展性指模型在動態(tài)環(huán)境、不穩(wěn)定分布條件下仍然能取得良好效果的能力,是模型能夠跨領(lǐng)域跨行業(yè)應(yīng)用的重要衡量。模型不可知的元學(xué)習(xí)方法[28]、在線學(xué)習(xí)方法[29]、小樣本學(xué)習(xí)方法[30]都是保證可拓展性的重要方法類型。
結(jié)論
大數(shù)據(jù)深刻的改變著人們的生活,數(shù)據(jù)科學(xué)同樣深刻的改變著人們的決策行為。在數(shù)據(jù)驅(qū)動的優(yōu)化方法推動下,決策問題的求解將變得越來越便捷、快速。從Nexus的這篇論文可以看到,數(shù)據(jù)優(yōu)化的驅(qū)動方法經(jīng)歷了三次更迭,從序貫優(yōu)化到端到端學(xué)習(xí)優(yōu)化再到直接學(xué)習(xí)方法,模型的內(nèi)在一致性更強(qiáng),計(jì)算效率更高。雖然,這些方法在數(shù)據(jù)方法論、不確定性、解的可行性、可解釋性和可拓展性方面都存在挑戰(zhàn),但隨著數(shù)據(jù)科學(xué)、優(yōu)化理論的發(fā)展,新的決策方法將在更廣闊的領(lǐng)域得到應(yīng)用。數(shù)據(jù)驅(qū)動的決策科學(xué)將是一個有生命力的、方興未艾的研究領(lǐng)域。
參考文獻(xiàn)
Zareipour, H., Canizares, C.A., and Bhattacharya, K. (2010). Economic impact of electricity market price forecasting errors: A demand-side analysis. IEEE Trans. Power Syst. 25, 254-262.
Elmachtoub, A. N., & Grigas, P. (2017). Smart “Predict, then Optimize”. arXiv preprint arXiv:1710.08005.
Bertsimas, D., and Stellato, B. (2022). Online mixed-integer optimization in milliseconds. Inf. J. Comput. 34, 2229-2248.
Tang, Y., Agrawal, S., and Faenza, Y. (2020). Reinforcement learning for integer programming: Learning to cut. In International Conference on Machine Learning (PMLR), pp. 9367-9376.
Feurer, M., and Hutter, F. (2019). Hyperparameter optimization. In Automated Machine Learning: Methods, Systems, Challenges (Springer International Publishing), pp. 3-33.
Wahdany, D., Schmitt, C., and Cremer, J.L. (2023). More than accuracy: end-to-end wind power forecasting that optimises the energy system. Elec. Power Syst. Res. 221, 109384.
Zhou, Y., Wen, Q., Song, J., et al. (2024). Load data valuation in multienergy systems: An end-to-end approach. IEEE Trans. Smart Grid.
Sang, L., Xu, Y., Long, H., et al. (2022). Electricity price prediction for energy storage system arbitrage: A decision-focused approach. IEEE Trans. Smart Grid 13, 2822-2832.
Chu, H., Zhang, W., Bai, P., et al. (2023). Data-driven optimization for last-mile delivery. Complex Intell. Systems 9, 2271-2284.
Tian, X., Yan, R., Liu, Y., et al. (2023). A smart predict-then-optimize method for targeted and cost-effective maritime transportation. Transp. Res. Part B Methodol. 172, 32-52.
Qi, M., Shi, Y., Qi, Y., et al. (2023). A practical end-to-end inventory management model with deep learning. Manag. Sci. 69, 759-773.
Cao, Z., Jiang, K., Zhou, W., et al. (2023). Continuous improvement of self driving cars using dynamic confidence-aware reinforcement learning. Nat. Mach. Intell. 5, 145-158.
Kim, T., Hong, I., Im, S., et al. (2024). Wing-strain-based flight control of flapping-wing drones through reinforce-ment learning. Nat. Mach. Intell. 6, 992-1005.
Cichy, C., and Rass, S. (2019). An overview of data quality frameworks. IEEE Access 7, 24634-24648.
Lin, J. (1991). Divergence measures based on the shannon entropy. IEEE Trans. Inf. Theor. 37, 145-151.
Blázquez-García, A., Conde, A., Mori, U., et al. (2021). A review on out-lier/anomaly detection in time series data. ACM Comput. Surv. 54, 1-33.
Ghorbani, A., Kim, M., and Zou, J. (2020). A distributional framework for data valuation. In International Conference on Machine Learning (PMLR), pp. 3535-3544.
Besbes, O., and Mouchtaki, O. (2023). How big should your data really be? data driven newsvendor: Learning one sample at a time. Manag. Sci. 69, 5848-5865.
Lata, K., Dave, M., and KN, N. (2019). Data augmentation using generative adversarial network. In Proceedings of 2nd International Conference on Advanced Computing and Software Engineering (ICACSE).
Mumuni, A., and Mumuni, F. (2022). Data augmentation: A comprehensive survey of modern approaches. Array 16, 100258.
Wang, Y., Yao, Q., Kwok, J.T., et al. (2020). Generalizing from a few examples: A survey on few-shot learning. ACM Comput. Surv. 53, 1-34.
Donti, P., Amos, B., and Kolter, J.Z. (2017). Task-based end-to-end model learning in stochastic optimization. Adv. Neural Inf. Process. Syst. 30.
Pr'ekopa, A. (2013). Stochastic Programming, 324 (Springer Science & Business Media).
Rahimian, H., and Mehrotra, S. (2019). Distributionally robust optimization: A review. Preprint at arXiv. https://doi.org/10.48550/arXiv.1908.05659.
Ben-Tal, A., El Ghaoui, L., and Nemirovski, A. (2009). Robust Optimization, 28 (Princeton university press).
Garcia, J.D., Street, A., Homem-de Mello, T., et al. (2021). Application-driven learning: A closed-loop prediction and optimization approach applied to dynamic reserves and demand forecasting. Preprint at arXiv. https://doi.org/10.48550/arXiv.2102.13273.
Zhang, H., Li, R., Chen, Y., et al. (2023). Risk-aware objective-based forecasting in inertia management. IEEE Trans. Power Syst.
Finn, C., Abbeel, P., and Levine, S. (2017). Model-agnostic meta-learning for fast adaptation of deep networks. In International Conference on Machine Learning (PMLR), pp. 1126-1135.
Hoi, S.C., Sahoo, D., Lu, J., et al. (2021). Online learning: A comprehensive survey. Neurocomputing 459, 249-289.
Parnami, A., and Lee, M. (2022). Learning from few examples: A summary of approaches to few-shot learning. Preprint at arXiv. https://doi.org/10.48550/arXiv.2203.04291.
參考文獻(xiàn)可上下滑動查看
復(fù)雜系統(tǒng)自動建模讀書會第二季
“復(fù)雜世界,簡單規(guī)則”。
集智俱樂部聯(lián)合復(fù)旦大學(xué)智能復(fù)雜體系實(shí)驗(yàn)室青年研究員朱群喜、浙江大學(xué)百人計(jì)劃研究員李樵風(fēng)、清華大學(xué)電子工程系數(shù)據(jù)科學(xué)與智能實(shí)驗(yàn)室博士后研究員丁璟韜、美國東北大學(xué)物理系A(chǔ)lbert-László Barabási指導(dǎo)的博士后高婷婷、北京大學(xué)博雅博士后曹文祺、復(fù)旦大學(xué)數(shù)學(xué)科學(xué)學(xué)院應(yīng)用數(shù)學(xué)方向博士研究生趙伯林、北京師范大學(xué)系統(tǒng)科學(xué)學(xué)院博士研究生牟牧云,共同發(fā)起。
讀書會將于9月5日起每周四晚上20:00-22:00進(jìn)行,探討四個核心模塊:數(shù)據(jù)驅(qū)動的復(fù)雜系統(tǒng)建模、復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)推斷、具有可解釋性的復(fù)雜系統(tǒng)推斷(動力學(xué)+網(wǎng)絡(luò)結(jié)構(gòu))、應(yīng)用-超材料設(shè)計(jì)和城市系統(tǒng),通過重點(diǎn)討論75篇經(jīng)典、前沿的重要文獻(xiàn),從黑盒(數(shù)據(jù)驅(qū)動)到白盒(可解釋性),逐步捕捉系統(tǒng)的“本質(zhì)”規(guī)律,幫助大家更好的認(rèn)識、理解、預(yù)測、控制、設(shè)計(jì)復(fù)雜系統(tǒng),為相關(guān)領(lǐng)域的研究和應(yīng)用提供洞見。歡迎感興趣的朋友報(bào)名參與!
詳情請見:
1.
2.
3.
4.
5.
6.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.