隨著大數據時代的來臨,機器學習技術突飛猛進,并且在人類社會中扮演越來越重要的角色。
例如,你可能已經習慣了每天使用各種搜索引擎查找信息,或者在電商網站和視頻網站的推薦系統 ,以及利用谷歌、百度等網站提供的機器翻譯學習外語,這些應用都離不開機器學習模型的支持。
但機器學習模型,尤其是當下流行的深度學習模型面臨著域外泛化、可解釋性、公平性等挑戰。
例如,利用深度學習模型做圖像分類時可能會根據圖片中的沙漠背景立刻判斷圖像中會出現駱駝,這是因為它不會意識到“沙漠背景”和“駱駝出現”之間只存在相關性。
也就是說,“沙漠背景”并不是“駱駝出現”的原因。
而認識到這一點對人類來說并不難。因此,為了實現通用人工智能,機器學習算法需要具備判斷特征和標簽間是否存在因果關系的能力。
另外,機器學習中對因果關系的研究也一直扮演著重要的角色。
例如,在流行病學中,孟德爾隨機化揭示了基因對患病概率的影響,其本質是一種基于工具變量的因果推斷方法。
在研究疫苗的有效率時,雙盲實驗扮演著不可替代的角色。這是因為雙盲實驗可以衡量疫苗對免疫力的因果效應。
而近幾年出現了眾多利用機器學習方法解決因果推斷問題的研究。這是因為機器學習模型不僅可以有效地處理復雜的輸入數據(如圖像、文字和網絡數據),還能夠學習到原因和結果間復雜的非線性關系。
如今,因果機器學習的研究在學術界可謂百花齊放,從利用機器學習模型解決因果推斷問題到將因果關系添加到機器學習模型中,都會涉及因果機器學習。
而在業界,無論是像FAANG 和BAT 這樣的大公司、Zalando(總部位于德國柏林的大型網絡電子商城,其主要產品是服裝和鞋類)這樣的中型公司,還是像Causalens(一家英國無代碼因果AI產品開發商)這樣的創業公司,因果機器學習都在解決業務問題中扮演著重要的角色。
這意味著業界對因果機器學習人才的需求也處于一個上升期。
例如,2022年春季的就業市場對這類人才的需求就是一個證明。
但是,目前高校開設的課程中很少有同時涉及因果推斷和機器學習的。
這是因為因果推斷被認為是統計學、經濟學、流行病學的課程。而機器學習主要出現在計算機科學和數據科學的教學大綱中。
因此,《因果推斷與機器學習》一書正好可以幫助到那些想要系統學習因果機器學習,并在將來從事相關工作的讀者。
內容簡介
為了幫助讀者建立連接因果推斷和機器學習這兩個重要領域所需要的知識體系,本書對內容做了精心規劃。
為了照顧到沒有因果推斷基礎的讀者,第1章解答了在學習因果推斷之初讀者可能面臨的問題。例如,潛結果框架和結構因果模型兩種基礎理論框架到底有什么區別?因果推斷的經典方法有哪些,它們分別適用于什么場景?
在此基礎上,第2章介紹了更前沿的、利用機器學習模型來解決因果推斷問題的具有代表性的方法,希望那些想要解決因果效應估測、政策評估、智能營銷增益模型(Uplift Modeling)這些因果推斷問題的讀者從中有所收獲。
第3、4章中討論的域外泛化、可解釋性和公平性問題都在近幾年受到學界和業界的大量關注。它們體現了基于相關性的機器學習模型的局限性。而基于因果性的因果機器學習方法對于克服這些局限性十分有效。這部分知識可以回答在機器學習領域工作的讀者的一個問題:為什么因果性對于機器學習的研究和實踐非常重要?
第5章介紹基于因果的推薦系統和學習排序方法,可以幫助對這些領域感興趣的讀者打下堅實的基礎,從而在相關的科研和實踐中做到游刃有余。
第6章是對全書主要內容的總結。
本書是基于作者在因果機器學習研究、教學和實踐中積累的知識和經驗而撰寫的,旨在探索如何構建一個容易被讀者接受的因果機器學習知識體系,為培養因果機器學習的跨學科人才做一份貢獻。
精彩書評
在機器學習算法在各領域取得重大成果的今天,人工智能仍然面臨著挑戰。如今,大規模的機器學習模型在有海量數據的條件下可以學習到復雜的相關性。但它們仍然很難像人類一樣,只用少量的數據就可以學習到數據中隱含的因果關系。
本書首先介紹因果推斷的基礎知識,然后介紹因果機器學習在域外泛化、可解釋性、算法公平性、自然語言處理和推薦搜索糾偏等熱門研究和應用領域中最具代表性的模型方法和應用場景,適合數據科學相關專業的高年級本科生、研究生閱讀。
——張愛東 美國弗吉尼亞大學教授,ACM/IEEE/AIMBE Fellow
讓機器學習模型像人類一樣,能夠區分因果性和相關性是邁向通用人工智能的一個關鍵步驟。本書講解了因果機器學習相關的基礎知識、重要的方法和典型的應用,包括自然語言處理、機器學習可解釋性、算法公平性、推薦搜索糾偏等。
本書對想要進入因果機器學習領域、數據科學相關專業的本科生、研究生和從業人員很有幫助。
——常毅 吉林大學人工智能學院院長、教授,BCS/IET Fellow,ACM 杰出會員
人工智能和機器學習模型正在各行各業發揮著舉足輕重的作用。傳統機器學習往往專注于提升某個任務的預測準確能力,從而忽視了模型背后所能夠揭示的更深層次的不同變量之間的因果聯系,以致得到缺乏解釋性的模型,更有可能做出不公平的決策,甚至在新的數據分布上表現不佳。讓機器學習模型能夠進行因果推斷是從提高預測精度到揭示事物變化規律這一重要躍遷的關鍵能力。
本書深入淺出地介紹了因果機器學習的理論及其在各細分領域的應用,對相關領域的科研人員和工程師了解和研究因果機器學習會有很大幫助。
——洪亮劼 美國領英公司工程總監,博士
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.