kivantium活動日記

プログラムを使っていろいろやります

帰無仮説のもとでp値の分布が一様分布になることの証明

帰無仮説のもとでp値の分布が一様分布になるらしいのですが、納得できるちゃんとした証明が検索しても出てこなかったので書いておきます。

p値とは何かとか、帰無仮説とは何かみたいな解説は省略します。

f:id:kivantium:20161117192139p:plain:w400

証明

 \mu_tを観測値の帰無仮説の分布、 F_t \mu_tの累積分布関数
 \mu_pをp値の分布、 F_p \mu_pの累積分布関数とする。
 \mu_tは連続分布で、 F_t逆関数を持つものと仮定する。
(注: 分布 \muの累積分布関数は F(x) = \mu( (-\infty, x])を満たすような関数 F(x)

観測値が帰無仮説に従うとき、 \mu_p [0,1]上の一様分布であることを示す。

 [a, b]上の一様分布の累積分布関数 F_{U_{a, b}}(x) [a, b]上で \frac{x-a}{b-a}という値を取ることと、p値は [0,1]上の値しか取らないことから、 F_p(p) = pであることを示せば \mu_p [0,1]上の一様分布に従うことが分かる。

観測値が tのときのp値を yとするとp値の定義より
 {\displaystyle
\begin{align}
y &= \mu_t(\{x \mid x \geq t\}) \\
&= 1 - \mu_t(\{x \mid x < t\}) \\
&= 1 - F_t(t)
\end{align}
}
が成り立つ。
 \mu_tが連続分布と仮定しているので \mu_t(\{x \mid x < t\}) = \mu_t(\{x \mid x \leq t\})

また、 F_tが単調増加することから、
 
\begin{align}
y \leq p \\
&\Leftrightarrow 1-y \geq 1-p \\
&\Leftrightarrow F_t^{-1}(1-y) \geq F_t^{-1}(1-p)
\end{align}が成り立つ。

以上より、
 {\displaystyle
\begin{align}
F_p(p) &= \mu_p(\{y \mid y \leq p\}) \\
&= \mu_t(\{F_t^{-1}(1-y) \mid F_t^{-1}(1-y) \geq F_t^{-1}(1-p)\}) \\
&= 1 - \mu_t(\{x \mid x < F_t^{-1}(1-p)\}) \\
&= 1 - F_t(F_t^{-1}(1-p)) \\
&= 1- (1-p) \\
&= p
\end{align}
}

したがって、 F_p(p) = pであることが分かったのでp値が [0,1]上の一様分布であることが示された。

怪しいところがあったら指摘してください。