網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

關于將P值解釋為似然值的說明

2025-01-12 10:32:01　來源: CreateAMind

上海舉報

分享至

A NOTE ON P-VALUES INTERPRETED AS PLAUSIBILITIES

關于將P值解釋為似然值的說明

https://www3.stat.sinica.edu.tw/sstest/oldpdf/A24n411.pdf

摘要：

P值是統(tǒng)計學中的主要工具，但常常被誤解。我們提出了一種新的解釋，將P值視為一種有意義的似然值，并在推斷模型框架內(nèi)正式解釋這一概念。我們證明，對于大多數(shù)實際的假設檢驗問題，存在一個推斷模型，使得相應的似然函數(shù)在原假設下的取值恰好是P值。這種表示的優(yōu)勢在于，似然的概念與從業(yè)者使用和解釋P值的方式一致，并且似然計算避免了在原假設為真的條件下進行麻煩的條件化。這種與似然值的聯(lián)系還揭示了標準P值在具有非平凡參數(shù)約束問題中的不足。

關鍵詞：假設檢驗，推斷模型，嵌套，似然函數(shù)，預測隨機集。

1. 引言

P值在應用統(tǒng)計學中無處不在，但常常被誤解為某種貝葉斯后驗概率（即原假設為真的概率）或頻率主義錯誤概率。事實上，2012年，媒體報道了難以捉摸的希格斯玻色子粒子的發(fā)現(xiàn)（Overbye (2012)），而統(tǒng)計學博客則指出一些記者和物理學家如何誤解了由此產(chǎn)生的P值。我們的目標是提供一種新的、更簡單的方式來理解P值，從而避免這些誤解。

P值經(jīng)常被誤解的一個主要原因是標準的教科書定義與人們的常識不一致。本文的目標是提供一種更用戶友好的解釋。我們證明，P值可以解釋為原假設為真的似然值。這種“似然值”在Martin和Liu（2013a）提出的推斷模型（IM）框架中被精確定義，該框架建立在Martin和Liu（2014a）提出的有效且高效統(tǒng)計推斷的兩個基本原則之上?？紤]檢驗原假設與全局備擇假設的問題。我們證明，在溫和條件下，對于任何P值（取決于

和檢驗統(tǒng)計量的選擇），存在一個有效的IM，使得的似然值就是P值。從這個意義上說，P值可以理解為在給定觀測數(shù)據(jù)的情況下，為真的似然值。在希格斯玻色子的報告中，由于P值極小，可以得出結論：假設：“希格斯玻色子不存在”是高度不可信的，因此是一項發(fā)現(xiàn)。這種基于小P值的推理與Cournot原理（Shafer和Vovk (2006)）一致。

“似然值”一詞符合從業(yè)者使用和解釋P值的方式：小的P值意味著在給定觀測數(shù)據(jù)的情況下，是不可信的。計算似然值涉及一個概率計算，該計算不需要假設為真，因此避免了通過假設為真的計算來證明為假的邏輯問題。使用IM為經(jīng)典非概率性總結提供概率解釋已被證明是有益的；例如，參見Martin（2014）。

本文的其余部分組織如下。第2節(jié)設置了我們的符號并給出了P值的正式定義，并簡要討論了其常見的正確和錯誤解釋。第3節(jié)介紹了IM的基礎知識，特別是預測隨機集和似然函數(shù)。在第4節(jié)中，我們證明，給定任何假設檢驗問題，存在一個有效的IM，使得在原假設下評估的相應似然函數(shù)就是P值。我們在那里強調(diào)了IM似然值與客觀貝葉斯后驗概率之間的類似聯(lián)系，以及P值在具有非平凡參數(shù)約束問題中的一個未被認識到的缺陷。第4.3-4.4節(jié)展示了涉及二項分布和正態(tài)分布數(shù)據(jù)的兩個示例，并在第5節(jié)中給出了一些結論性意見。

2. P值
2.1 設置與正式定義

2.2 標準解釋

3. 推斷模型回顧

3.1 總體概述

推斷模型（IM）框架為關于未知參數(shù)的任何斷言生成精確的無先驗概率證據(jù)度量；參見Martin和Liu（2013a）、Martin、Zhang和Liu（2010）以及Zhang和Liu（2011）。這是通過首先在可觀測數(shù)據(jù)X、未知參數(shù)\(\theta\)和不可觀測的輔助變量U之間建立顯式關聯(lián)來實現(xiàn)的。引入隨機集來預測不可觀測的U，并通過關于該隨機集分布的概率計算獲得對\(\theta\)的推斷。IM框架與現(xiàn)有方法有一些聯(lián)系，例如置信推斷（Hannig（2009, 2013）；Hannig和Lee（2009））、置信分布（Xie、Singh和Strawderman（2011）；Xie和Singh（2013））、Dempster-Shafer理論（Dempster（2008）；Shafer（1976, 2011））、廣義P值和置信區(qū)間（Tsui和Weerahandi（1989）；Weerahandi（1993）；Chiang（2001）），以及使用默認、參考和/或數(shù)據(jù)依賴先驗的貝葉斯推斷（Berger（2006）；Berger、Bernardo和Sun（2009）；Fraser等人（2010）；Fraser（2011）；Ghosh（2011））。

IM、置信推斷和Dempster-Shafer理論都將輔助變量引入推斷問題中。置信推斷和Dempster-Shafer理論都以觀測到的(X = x)為條件，然后通過反轉(zhuǎn)數(shù)據(jù)-參數(shù)-輔助變量關系并假設在(X = x)被觀測后(U)保留其先驗分布，在參數(shù)空間上開發(fā)一種分布。IM方法的目標是（無法實現(xiàn)的）對應于(U)被觀測到的最佳推斷。在(X = x)被觀測后，關于的不確定性通過隨機集擊中真實(U)的不確定性傳播。除了實現(xiàn)Fisher的無先驗概率推斷目標外，IM生成的推斷輸出對任何感興趣的斷言都是有效的（第3.3節(jié)）；置信概率僅對特殊類型的斷言有效（Martin和Liu（2013a，第4.3.1節(jié)））。此外，關于推斷效率的IM最優(yōu)性的一般理論可能并非遙不可及。

3.2 構建

根據(jù)Martin和Liu（2013a），IM的構建分為三個步驟。

3.3 IM的有效性

IM的置信函數(shù)和似然函數(shù)在類似研究中具有意義是非常重要的。這種意義在Martin和Liu（2013a）中被稱為有效性。這里，如果滿足以下條件，則稱IM是有效的：

Martin和Liu（2013a）表明，存在多種預測隨機集可以滿足P1–P2條件，因此IM的有效性相對容易實現(xiàn)。然而，效率是一個問題，為此，他們提出了最優(yōu)IM的理論。

4. 作為IM似然值的P值

4.1 主要結果

這些集合是閉的、嵌套的，并且根據(jù)A2，可測性成立。因此，定理1中的P1成立。定義一個預測隨機集S，其支持集為，分布滿足：

4.2 備注

Dempster（2008，第375頁）指出了似然值與P值之間的類似聯(lián)系；具體來說，他通過數(shù)值展示了Fisher的P值如何分解為兩部分——一部分對應于對的置信，另一部分對應于“不知道”——這兩部分的總和就是我們的似然值。他的例子是基于單邊備擇假設的泊松均值標準檢驗，并且他聲稱這種對應關系在一般情況下并不成立。

在貝葉斯框架中，尋找“客觀”先驗通常集中在概率匹配上（例如，Ghosh（2011）），即選擇先驗，使得相應的后驗尾概率與P值漸近等價。鑒于P值與IM似然值之間的聯(lián)系，這些客觀貝葉斯后驗概率也可以解釋為似然值。考慮到客觀貝葉斯后驗分布可以被視為近似頻率主義P值的一種簡單而有吸引力的方式（Fraser（2011）），這或許并不令人驚訝。

4.3 二項分布示例

4.4 正態(tài)方差示例

5. 討論

我們?yōu)槭煜さ?jīng)常被誤解的P值開發(fā)了一種新的用戶友好解釋。具體來說，我們已經(jīng)證明，對于幾乎任何假設檢驗問題，在溫和條件下，存在一個有效的IM，使得其在原假設下評估的似然函數(shù)恰好是通常的P值。這種用IM似然值表示P值的方式揭示了P值在具有非平凡參數(shù)約束問題中可能存在的潛在缺陷。在這種情況下，如何修改P值尚不明確，而IM似然值的修改可以通過Ermini Leaf和Liu（2012）中描述的方法輕松實現(xiàn)。

在假設檢驗文獻中，有許多替代P值的方法，至少部分原因是由于解釋P值的困難。例如，Jim Berger（及其合著者）建議將P值轉(zhuǎn)換為貝葉斯因子或后驗概率進行解釋；例如，Sellke、Bayarri和Berger（2001）強烈推薦他們提出的“(-ep log p)”調(diào)整。然而，P值不太可能從教科書和應用工作中消失，因此與提供一種替代P值的方法相比，提供一種更用戶友好的解釋可能更有價值。借用Larry Wasserman在其博客中使用的類比：許多人駕駛技術不佳，但消除汽車并不是解決這個問題的方法。

似然值與P值之間的聯(lián)系揭示了IM輸出的本質(zhì)。IM的置信函數(shù)和似然函數(shù)在Martin和Liu（2013a）中被理解為給定數(shù)據(jù)的證據(jù)度量。在某些情況下，似然值與P值匹配的事實是有用的，這表明人們可以像使用P值一樣使用IM似然值進行推理。似然值、P值和一些客觀貝葉斯后驗概率之間的對應關系表明，IM框架實際上可能為穩(wěn)健、客觀、概率推斷提供了一個統(tǒng)一的視角。

https://www3.stat.sinica.edu.tw/sstest/oldpdf/A24n411.pdf

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.