99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

關于將P值解釋為似然值的說明

0
分享至

A NOTE ON P-VALUES INTERPRETED AS PLAUSIBILITIES

關于將P值解釋為似然值的說明

https://www3.stat.sinica.edu.tw/sstest/oldpdf/A24n411.pdf



摘要

P值是統(tǒng)計學中的主要工具,但常常被誤解。我們提出了一種新的解釋,將P值視為一種有意義的似然值,并在推斷模型框架內(nèi)正式解釋這一概念。我們證明,對于大多數(shù)實際的假設檢驗問題,存在一個推斷模型,使得相應的似然函數(shù)在原假設下的取值恰好是P值。這種表示的優(yōu)勢在于,似然的概念與從業(yè)者使用和解釋P值的方式一致,并且似然計算避免了在原假設為真的條件下進行麻煩的條件化。這種與似然值的聯(lián)系還揭示了標準P值在具有非平凡參數(shù)約束問題中的不足。

關鍵詞:假設檢驗,推斷模型,嵌套,似然函數(shù),預測隨機集。

1. 引言

P值在應用統(tǒng)計學中無處不在,但常常被誤解為某種貝葉斯后驗概率(即原假設為真的概率)或頻率主義錯誤概率。事實上,2012年,媒體報道了難以捉摸的希格斯玻色子粒子的發(fā)現(xiàn)(Overbye (2012)),而統(tǒng)計學博客則指出一些記者和物理學家如何誤解了由此產(chǎn)生的P值。我們的目標是提供一種新的、更簡單的方式來理解P值,從而避免這些誤解。

P值經(jīng)常被誤解的一個主要原因是標準的教科書定義與人們的常識不一致。本文的目標是提供一種更用戶友好的解釋。我們證明,P值可以解釋為原假設為真的似然值。這種“似然值”在Martin和Liu(2013a)提出的推斷模型(IM)框架中被精確定義,該框架建立在Martin和Liu(2014a)提出的有效且高效統(tǒng)計推斷的兩個基本原則之上??紤]檢驗原假設與全局備擇假設的問題。我們證明,在溫和條件下,對于任何P值(取決于

和檢驗統(tǒng)計量的選擇),存在一個有效的IM,使得的似然值就是P值。從這個意義上說,P值可以理解為在給定觀測數(shù)據(jù)的情況下,為真的似然值。在希格斯玻色子的報告中,由于P值極小,可以得出結論:假設:“希格斯玻色子不存在”是高度不可信的,因此是一項發(fā)現(xiàn)。這種基于小P值的推理與Cournot原理(Shafer和Vovk (2006))一致。

“似然值”一詞符合從業(yè)者使用和解釋P值的方式:小的P值意味著在給定觀測數(shù)據(jù)的情況下,是不可信的。計算似然值涉及一個概率計算,該計算不需要假設為真,因此避免了通過假設為真的計算來證明為假的邏輯問題。使用IM為經(jīng)典非概率性總結提供概率解釋已被證明是有益的;例如,參見Martin(2014)。

本文的其余部分組織如下。第2節(jié)設置了我們的符號并給出了P值的正式定義,并簡要討論了其常見的正確和錯誤解釋。第3節(jié)介紹了IM的基礎知識,特別是預測隨機集和似然函數(shù)。在第4節(jié)中,我們證明,給定任何假設檢驗問題,存在一個有效的IM,使得在原假設下評估的相應似然函數(shù)就是P值。我們在那里強調(diào)了IM似然值與客觀貝葉斯后驗概率之間的類似聯(lián)系,以及P值在具有非平凡參數(shù)約束問題中的一個未被認識到的缺陷。第4.3-4.4節(jié)展示了涉及二項分布和正態(tài)分布數(shù)據(jù)的兩個示例,并在第5節(jié)中給出了一些結論性意見。


2. P值
2.1 設置與正式定義



2.2 標準解釋


3. 推斷模型回顧

3.1 總體概述

推斷模型(IM)框架為關于未知參數(shù)的任何斷言生成精確的無先驗概率證據(jù)度量;參見Martin和Liu(2013a)、Martin、Zhang和Liu(2010)以及Zhang和Liu(2011)。這是通過首先在可觀測數(shù)據(jù)X、未知參數(shù)\(\theta\)和不可觀測的輔助變量U之間建立顯式關聯(lián)來實現(xiàn)的。引入隨機集來預測不可觀測的U,并通過關于該隨機集分布的概率計算獲得對\(\theta\)的推斷。IM框架與現(xiàn)有方法有一些聯(lián)系,例如置信推斷(Hannig(2009, 2013);Hannig和Lee(2009))、置信分布(Xie、Singh和Strawderman(2011);Xie和Singh(2013))、Dempster-Shafer理論(Dempster(2008);Shafer(1976, 2011))、廣義P值和置信區(qū)間(Tsui和Weerahandi(1989);Weerahandi(1993);Chiang(2001)),以及使用默認、參考和/或數(shù)據(jù)依賴先驗的貝葉斯推斷(Berger(2006);Berger、Bernardo和Sun(2009);Fraser等人(2010);Fraser(2011);Ghosh(2011))。

IM、置信推斷和Dempster-Shafer理論都將輔助變量引入推斷問題中。置信推斷和Dempster-Shafer理論都以觀測到的(X = x)為條件,然后通過反轉(zhuǎn)數(shù)據(jù)-參數(shù)-輔助變量關系并假設在(X = x)被觀測后(U)保留其先驗分布,在參數(shù)空間上開發(fā)一種分布。IM方法的目標是(無法實現(xiàn)的)對應于(U)被觀測到的最佳推斷。在(X = x)被觀測后,關于的不確定性通過隨機集擊中真實(U)的不確定性傳播。除了實現(xiàn)Fisher的無先驗概率推斷目標外,IM生成的推斷輸出對任何感興趣的斷言都是有效的(第3.3節(jié));置信概率僅對特殊類型的斷言有效(Martin和Liu(2013a,第4.3.1節(jié)))。此外,關于推斷效率的IM最優(yōu)性的一般理論可能并非遙不可及。

3.2 構建

根據(jù)Martin和Liu(2013a),IM的構建分為三個步驟。




3.3 IM的有效性

IM的置信函數(shù)和似然函數(shù)在類似研究中具有意義是非常重要的。這種意義在Martin和Liu(2013a)中被稱為有效性。這里,如果滿足以下條件,則稱IM是有效的:



Martin和Liu(2013a)表明,存在多種預測隨機集可以滿足P1–P2條件,因此IM的有效性相對容易實現(xiàn)。然而,效率是一個問題,為此,他們提出了最優(yōu)IM的理論。

4. 作為IM似然值的P值

4.1 主要結果


這些集合是閉的、嵌套的,并且根據(jù)A2,可測性成立。因此,定理1中的P1成立。定義一個預測隨機集S,其支持集為,分布滿足:


4.2 備注

Dempster(2008,第375頁)指出了似然值與P值之間的類似聯(lián)系;具體來說,他通過數(shù)值展示了Fisher的P值如何分解為兩部分——一部分對應于對的置信,另一部分對應于“不知道”——這兩部分的總和就是我們的似然值。他的例子是基于單邊備擇假設的泊松均值標準檢驗,并且他聲稱這種對應關系在一般情況下并不成立。

在貝葉斯框架中,尋找“客觀”先驗通常集中在概率匹配上(例如,Ghosh(2011)),即選擇先驗,使得相應的后驗尾概率與P值漸近等價。鑒于P值與IM似然值之間的聯(lián)系,這些客觀貝葉斯后驗概率也可以解釋為似然值。考慮到客觀貝葉斯后驗分布可以被視為近似頻率主義P值的一種簡單而有吸引力的方式(Fraser(2011)),這或許并不令人驚訝。


4.3 二項分布示例




4.4 正態(tài)方差示例






5. 討論

我們?yōu)槭煜さ?jīng)常被誤解的P值開發(fā)了一種新的用戶友好解釋。具體來說,我們已經(jīng)證明,對于幾乎任何假設檢驗問題,在溫和條件下,存在一個有效的IM,使得其在原假設下評估的似然函數(shù)恰好是通常的P值。這種用IM似然值表示P值的方式揭示了P值在具有非平凡參數(shù)約束問題中可能存在的潛在缺陷。在這種情況下,如何修改P值尚不明確,而IM似然值的修改可以通過Ermini Leaf和Liu(2012)中描述的方法輕松實現(xiàn)。

在假設檢驗文獻中,有許多替代P值的方法,至少部分原因是由于解釋P值的困難。例如,Jim Berger(及其合著者)建議將P值轉(zhuǎn)換為貝葉斯因子或后驗概率進行解釋;例如,Sellke、Bayarri和Berger(2001)強烈推薦他們提出的“(-ep log p)”調(diào)整。然而,P值不太可能從教科書和應用工作中消失,因此與提供一種替代P值的方法相比,提供一種更用戶友好的解釋可能更有價值。借用Larry Wasserman在其博客中使用的類比:許多人駕駛技術不佳,但消除汽車并不是解決這個問題的方法。

似然值與P值之間的聯(lián)系揭示了IM輸出的本質(zhì)。IM的置信函數(shù)和似然函數(shù)在Martin和Liu(2013a)中被理解為給定數(shù)據(jù)的證據(jù)度量。在某些情況下,似然值與P值匹配的事實是有用的,這表明人們可以像使用P值一樣使用IM似然值進行推理。似然值、P值和一些客觀貝葉斯后驗概率之間的對應關系表明,IM框架實際上可能為穩(wěn)健、客觀、概率推斷提供了一個統(tǒng)一的視角。

https://www3.stat.sinica.edu.tw/sstest/oldpdf/A24n411.pdf

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
熬出頭了!跳水總教練定了,農(nóng)民出身的全紅嬋,不用再卑微求出路

熬出頭了!跳水總教練定了,農(nóng)民出身的全紅嬋,不用再卑微求出路

老吳教育課堂
2025-06-24 15:03:40
撒貝寧再見章子怡,章子怡說我覺得有點夢幻,撒貝寧說我很憂傷

撒貝寧再見章子怡,章子怡說我覺得有點夢幻,撒貝寧說我很憂傷

情感大頭說說
2025-06-25 12:38:00
上海這條高速早不擴晚不擴,偏要在上海松江站發(fā)展黃金期改擴建!

上海這條高速早不擴晚不擴,偏要在上海松江站發(fā)展黃金期改擴建!

西莫的藝術宮殿
2025-06-25 12:38:50
拉夫羅夫:西方國家試圖讓烏克蘭“無條件?;稹?>
    </a>
        <h3>
      <a href=參考消息
2025-06-25 14:51:23
代言人奇跡生還,五天沒露面的哈梅內(nèi)伊,卻開始安排自己的身后事

代言人奇跡生還,五天沒露面的哈梅內(nèi)伊,卻開始安排自己的身后事

成視Talk
2025-06-25 13:45:00
2025最新高考分數(shù)線出爐,黑龍江考生最幸福,江蘇成最卷省份

2025最新高考分數(shù)線出爐,黑龍江考生最幸福,江蘇成最卷省份

阿柒體訊
2025-06-25 12:53:55
裝逼一時爽,牢飯吃個飽!臨沂23人持械打砸一輛寶馬車和車主…

裝逼一時爽,牢飯吃個飽!臨沂23人持械打砸一輛寶馬車和車主…

火山詩話
2025-06-24 05:47:18
人到中年,家里達到四個以上條件,你已經(jīng)超越90%的家庭了

人到中年,家里達到四個以上條件,你已經(jīng)超越90%的家庭了

小嵩
2025-06-24 16:25:58
退休人員速看!國家直接打錢到個人賬戶,這些補貼你能領嗎?

退休人員速看!國家直接打錢到個人賬戶,這些補貼你能領嗎?

南南說娛
2025-06-19 09:20:27
瓜達爾港投資了多少,建設了多少年,建成后為什么幾乎沒有輪船????

瓜達爾港投資了多少,建設了多少年,建成后為什么幾乎沒有輪船停靠?

高博新視野
2025-06-23 16:19:10
小獵豹遭妻子套路又懷四胎,這是要組足球隊?

小獵豹遭妻子套路又懷四胎,這是要組足球隊?

毒舌八卦
2025-05-20 00:52:28
特朗普希望中國,能夠成為韓國一樣的國家

特朗普希望中國,能夠成為韓國一樣的國家

慢看世界
2025-06-24 10:29:38
江毅與湖北省委書記王忠林舉行會談

江毅與湖北省委書記王忠林舉行會談

人民產(chǎn)經(jīng)觀察
2025-06-25 10:55:51
國家體育總局是正部級單位,機關部門數(shù)量有限,但直屬單位卻很多

國家體育總局是正部級單位,機關部門數(shù)量有限,但直屬單位卻很多

小圣雜談原創(chuàng)
2025-06-24 21:17:00
震驚!湖南一個古鎮(zhèn)花費50億,卻淪為“空城”,幾乎沒有游客!

震驚!湖南一個古鎮(zhèn)花費50億,卻淪為“空城”,幾乎沒有游客!

青眼財經(jīng)
2025-06-07 10:32:14
肋骨紋身真的不疼嗎?以前沒發(fā)現(xiàn)周冬雨有紋身,而且面積還挺大

肋骨紋身真的不疼嗎?以前沒發(fā)現(xiàn)周冬雨有紋身,而且面積還挺大

小嵩
2025-06-07 08:51:34
北京今年計劃開通兩段地鐵,多座地鐵站將新增出入口

北京今年計劃開通兩段地鐵,多座地鐵站將新增出入口

新京報
2025-06-25 10:25:07
5億年前,有只三葉蟲被踩了一腳,科學家疑惑:人穿鞋去海底干啥

5億年前,有只三葉蟲被踩了一腳,科學家疑惑:人穿鞋去海底干啥

兔斯基聊科學
2023-07-17 20:28:58
事關醫(yī)護薪酬!官方出手:醫(yī)院回款大提速

事關醫(yī)護薪酬!官方出手:醫(yī)院回款大提速

醫(yī)學界
2025-06-25 09:30:20
特朗普騎虎難下,美債被大量拋售

特朗普騎虎難下,美債被大量拋售

傲骨真新
2025-06-25 13:20:41
2025-06-25 15:35:00
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
639文章數(shù) 11關注度
往期回顧 全部

科技要聞

小米YU7已下線500輛展車 26日前運往全國

頭條要聞

媒體:被洪森叔叔上了堂"現(xiàn)實的政治課" 佩通坦很受傷

頭條要聞

媒體:被洪森叔叔上了堂"現(xiàn)實的政治課" 佩通坦很受傷

體育要聞

山西太原大媽,在NBA闖出一片天

娛樂要聞

林志穎15歲兒子眉眼間神似易烊千璽!

財經(jīng)要聞

3000億的泡泡瑪特,漲不動了?

汽車要聞

樂高樂園x比亞迪官配曝光!兒童駕駛學校來了

態(tài)度原創(chuàng)

親子
教育
本地
公開課
軍事航空

親子要聞

湖南某幼兒園監(jiān)控下最觸目驚心的一幕:病態(tài)群體,早該曝光了

教育要聞

2025,多少分能上長沙師范學院??

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗總統(tǒng):12天戰(zhàn)爭結束 重建工作開啟

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 孙吴县| 中方县| 涿鹿县| 神木县| 吉水县| 林口县| 威海市| 阿尔山市| 南华县| 瑞丽市| 洪洞县| 通州区| 朔州市| 洮南市| 阜宁县| 满洲里市| 林周县| 中西区| 安泽县| 聊城市| 拜城县| 宜城市| 忻州市| 隆化县| 汉中市| 上杭县| 虞城县| 武定县| 邹平县| 楚雄市| 昌江| 大厂| 南开区| 台中县| 巴东县| 谷城县| 珠海市| 陈巴尔虎旗| 南部县| 德惠市| 漠河县|