A NOTE ON P-VALUES INTERPRETED AS PLAUSIBILITIES
關于將P值解釋為似然值的說明
https://www3.stat.sinica.edu.tw/sstest/oldpdf/A24n411.pdf
摘要:
P值是統(tǒng)計學中的主要工具,但常常被誤解。我們提出了一種新的解釋,將P值視為一種有意義的似然值,并在推斷模型框架內(nèi)正式解釋這一概念。我們證明,對于大多數(shù)實際的假設檢驗問題,存在一個推斷模型,使得相應的似然函數(shù)在原假設下的取值恰好是P值。這種表示的優(yōu)勢在于,似然的概念與從業(yè)者使用和解釋P值的方式一致,并且似然計算避免了在原假設為真的條件下進行麻煩的條件化。這種與似然值的聯(lián)系還揭示了標準P值在具有非平凡參數(shù)約束問題中的不足。
關鍵詞:假設檢驗,推斷模型,嵌套,似然函數(shù),預測隨機集。
1. 引言
P值在應用統(tǒng)計學中無處不在,但常常被誤解為某種貝葉斯后驗概率(即原假設為真的概率)或頻率主義錯誤概率。事實上,2012年,媒體報道了難以捉摸的希格斯玻色子粒子的發(fā)現(xiàn)(Overbye (2012)),而統(tǒng)計學博客則指出一些記者和物理學家如何誤解了由此產(chǎn)生的P值。我們的目標是提供一種新的、更簡單的方式來理解P值,從而避免這些誤解。
P值經(jīng)常被誤解的一個主要原因是標準的教科書定義與人們的常識不一致。本文的目標是提供一種更用戶友好的解釋。我們證明,P值可以解釋為原假設為真的似然值。這種“似然值”在Martin和Liu(2013a)提出的推斷模型(IM)框架中被精確定義,該框架建立在Martin和Liu(2014a)提出的有效且高效統(tǒng)計推斷的兩個基本原則之上??紤]檢驗原假設與全局備擇假設的問題。我們證明,在溫和條件下,對于任何P值(取決于
和檢驗統(tǒng)計量的選擇),存在一個有效的IM,使得的似然值就是P值。從這個意義上說,P值可以理解為在給定觀測數(shù)據(jù)的情況下,為真的似然值。在希格斯玻色子的報告中,由于P值極小,可以得出結論:假設:“希格斯玻色子不存在”是高度不可信的,因此是一項發(fā)現(xiàn)。這種基于小P值的推理與Cournot原理(Shafer和Vovk (2006))一致。
“似然值”一詞符合從業(yè)者使用和解釋P值的方式:小的P值意味著在給定觀測數(shù)據(jù)的情況下,是不可信的。計算似然值涉及一個概率計算,該計算不需要假設為真,因此避免了通過假設為真的計算來證明為假的邏輯問題。使用IM為經(jīng)典非概率性總結提供概率解釋已被證明是有益的;例如,參見Martin(2014)。
本文的其余部分組織如下。第2節(jié)設置了我們的符號并給出了P值的正式定義,并簡要討論了其常見的正確和錯誤解釋。第3節(jié)介紹了IM的基礎知識,特別是預測隨機集和似然函數(shù)。在第4節(jié)中,我們證明,給定任何假設檢驗問題,存在一個有效的IM,使得在原假設下評估的相應似然函數(shù)就是P值。我們在那里強調(diào)了IM似然值與客觀貝葉斯后驗概率之間的類似聯(lián)系,以及P值在具有非平凡參數(shù)約束問題中的一個未被認識到的缺陷。第4.3-4.4節(jié)展示了涉及二項分布和正態(tài)分布數(shù)據(jù)的兩個示例,并在第5節(jié)中給出了一些結論性意見。
2. P值
2.1 設置與正式定義
2.2 標準解釋
3. 推斷模型回顧
3.1 總體概述
推斷模型(IM)框架為關于未知參數(shù)的任何斷言生成精確的無先驗概率證據(jù)度量;參見Martin和Liu(2013a)、Martin、Zhang和Liu(2010)以及Zhang和Liu(2011)。這是通過首先在可觀測數(shù)據(jù)X、未知參數(shù)\(\theta\)和不可觀測的輔助變量U之間建立顯式關聯(lián)來實現(xiàn)的。引入隨機集來預測不可觀測的U,并通過關于該隨機集分布的概率計算獲得對\(\theta\)的推斷。IM框架與現(xiàn)有方法有一些聯(lián)系,例如置信推斷(Hannig(2009, 2013);Hannig和Lee(2009))、置信分布(Xie、Singh和Strawderman(2011);Xie和Singh(2013))、Dempster-Shafer理論(Dempster(2008);Shafer(1976, 2011))、廣義P值和置信區(qū)間(Tsui和Weerahandi(1989);Weerahandi(1993);Chiang(2001)),以及使用默認、參考和/或數(shù)據(jù)依賴先驗的貝葉斯推斷(Berger(2006);Berger、Bernardo和Sun(2009);Fraser等人(2010);Fraser(2011);Ghosh(2011))。
IM、置信推斷和Dempster-Shafer理論都將輔助變量引入推斷問題中。置信推斷和Dempster-Shafer理論都以觀測到的(X = x)為條件,然后通過反轉(zhuǎn)數(shù)據(jù)-參數(shù)-輔助變量關系并假設在(X = x)被觀測后(U)保留其先驗分布,在參數(shù)空間上開發(fā)一種分布。IM方法的目標是(無法實現(xiàn)的)對應于(U)被觀測到的最佳推斷。在(X = x)被觀測后,關于的不確定性通過隨機集擊中真實(U)的不確定性傳播。除了實現(xiàn)Fisher的無先驗概率推斷目標外,IM生成的推斷輸出對任何感興趣的斷言都是有效的(第3.3節(jié));置信概率僅對特殊類型的斷言有效(Martin和Liu(2013a,第4.3.1節(jié)))。此外,關于推斷效率的IM最優(yōu)性的一般理論可能并非遙不可及。
3.2 構建
根據(jù)Martin和Liu(2013a),IM的構建分為三個步驟。
3.3 IM的有效性
IM的置信函數(shù)和似然函數(shù)在類似研究中具有意義是非常重要的。這種意義在Martin和Liu(2013a)中被稱為有效性。這里,如果滿足以下條件,則稱IM是有效的:
Martin和Liu(2013a)表明,存在多種預測隨機集可以滿足P1–P2條件,因此IM的有效性相對容易實現(xiàn)。然而,效率是一個問題,為此,他們提出了最優(yōu)IM的理論。
4. 作為IM似然值的P值
4.1 主要結果
這些集合是閉的、嵌套的,并且根據(jù)A2,可測性成立。因此,定理1中的P1成立。定義一個預測隨機集S,其支持集為,分布滿足:
4.2 備注
Dempster(2008,第375頁)指出了似然值與P值之間的類似聯(lián)系;具體來說,他通過數(shù)值展示了Fisher的P值如何分解為兩部分——一部分對應于對的置信,另一部分對應于“不知道”——這兩部分的總和就是我們的似然值。他的例子是基于單邊備擇假設的泊松均值標準檢驗,并且他聲稱這種對應關系在一般情況下并不成立。
在貝葉斯框架中,尋找“客觀”先驗通常集中在概率匹配上(例如,Ghosh(2011)),即選擇先驗,使得相應的后驗尾概率與P值漸近等價。鑒于P值與IM似然值之間的聯(lián)系,這些客觀貝葉斯后驗概率也可以解釋為似然值。考慮到客觀貝葉斯后驗分布可以被視為近似頻率主義P值的一種簡單而有吸引力的方式(Fraser(2011)),這或許并不令人驚訝。
4.3 二項分布示例
4.4 正態(tài)方差示例
5. 討論
我們?yōu)槭煜さ?jīng)常被誤解的P值開發(fā)了一種新的用戶友好解釋。具體來說,我們已經(jīng)證明,對于幾乎任何假設檢驗問題,在溫和條件下,存在一個有效的IM,使得其在原假設下評估的似然函數(shù)恰好是通常的P值。這種用IM似然值表示P值的方式揭示了P值在具有非平凡參數(shù)約束問題中可能存在的潛在缺陷。在這種情況下,如何修改P值尚不明確,而IM似然值的修改可以通過Ermini Leaf和Liu(2012)中描述的方法輕松實現(xiàn)。
在假設檢驗文獻中,有許多替代P值的方法,至少部分原因是由于解釋P值的困難。例如,Jim Berger(及其合著者)建議將P值轉(zhuǎn)換為貝葉斯因子或后驗概率進行解釋;例如,Sellke、Bayarri和Berger(2001)強烈推薦他們提出的“(-ep log p)”調(diào)整。然而,P值不太可能從教科書和應用工作中消失,因此與提供一種替代P值的方法相比,提供一種更用戶友好的解釋可能更有價值。借用Larry Wasserman在其博客中使用的類比:許多人駕駛技術不佳,但消除汽車并不是解決這個問題的方法。
似然值與P值之間的聯(lián)系揭示了IM輸出的本質(zhì)。IM的置信函數(shù)和似然函數(shù)在Martin和Liu(2013a)中被理解為給定數(shù)據(jù)的證據(jù)度量。在某些情況下,似然值與P值匹配的事實是有用的,這表明人們可以像使用P值一樣使用IM似然值進行推理。似然值、P值和一些客觀貝葉斯后驗概率之間的對應關系表明,IM框架實際上可能為穩(wěn)健、客觀、概率推斷提供了一個統(tǒng)一的視角。
https://www3.stat.sinica.edu.tw/sstest/oldpdf/A24n411.pdf
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.