信頼区間の意味

(頻度主義)統計学では信頼区間の概念を理解するのがとても難しいです。それを少しでもわかりやすく説明できないかと知恵を絞ってみました。

母平均10・母分散25(母標準偏差5)の正規分布にしたがう確率変数 X を考えます。今 X から100個の要素をランダムサンプリングします。サンプリングする人は母平均(と母分散)を知りませんが、サンプリングされた100個の要素の標本平均と標本分散は計算でき、母平均の95%信頼区間を計算できます。このような状況下で、母平均の95%信頼区間を以下のように解釈することは 誤り です。

  1. 100個の要素のうち95個は母平均の95%信頼区間内に含まれる
  2. 母平均10が95%信頼区間に含まれる確率は95%である

解説します。1.は母平均の信頼区間ではなく将来観測される標本値の95%予測区間と呼ばれるものです。たとえばこのような状況です。今、上記のような100個のランダムサンプリングを終えました。次の101個目の要素を同じ確率分布からランダムサンプリングするとき、その101個目の要素が95%の確率で表れる区間を示しています。

2.もよくみられる誤りです。これは一見正しいように見えるのですが、確率という概念の違いによるものです。2.の文章で書かれている確率とは正確には主観確率 or 条件付き確率と呼ばれるもので、2.のようなことを知りたければベイズ統計学を使う必要があります。一方、通常の統計学で確率と呼ばれるものは事象が起こった相対頻度から求める客観確率 or 頻度確率と呼ばれるものです。よく2.の文章を読んでみると、ここでいう確率は相対頻度をもとにした確率ではないことがわかると思います。単純に母平均は確率的に変動しないので、母平均がある区間に含まれる確率を表現すること自体がナンセンスであるといえばナンセンスです。

では上記のような条件の場合、信頼区間の正しい解釈とは何でしょう?それはこれです。

上記と同様のランダムサンプリングを何度も(例えば100回)行い、そのつど母平均の95%信頼区間を計算した場合、全(100個の)信頼区間のうち95%(95個)の信頼区間は母平均を含んでいる。

さきほども書いた通り、(頻度主義)統計学における確率とは事象が起こった相対頻度です。したがって母平均の95%信頼区間とは何個もある95%信頼区間のうちの95%が母平均を含んでいることを意味しています。

具体例をRで計算してみましょう。母平均10・母分散25・要素数100のランダムサンプリングを100回行います。それぞれの試行で標本平均・標本標準偏差・母平均の95%信頼区間を計算していきます。

# 母平均10・母分散25・要素数100のランダムサンプリングを100回行う
ran <- lapply(1:100, function(i) rnorm(100, mean=10, sd=5))
# 標本平均(100個)
ran.mean <- sapply(ran, mean)
# 標本標準偏差(100個)
ran.sd <- sapply(ran, sd)
# 母平均の95%信頼区間(100区間)
ran.ci <- cbind(ran.mean - qt(0.975,99) * ran.sd / sqrt(100),
                ran.mean + qt(0.975,99) * ran.sd / sqrt(100))

図示してみましょう。青の破線は母平均を、丸マークは各標本平均を、そのエラーバーは母平均の95%信頼区間を表しています。黒いエラーバーは母平均10をその区間に含むもの、赤いエラーバーは母平均10をその区間に含んでいないものです。

plot(ran.mean, ylim=c(7.5, 12.5))
abline(h=10, lty="dashed", col="blue")
arrows(1:100, ran.ci[,1], 1:100, ran.ci[,2],
       code=3, angle=90, length=.05,
       col=ifelse(ran.ci[,1]<10 & ran.ci[,2]>10, "black", "red"))

母平均の95%信頼区間に実際に母平均を含んでいたのは96個でした。

> sum(ifelse(ran.ci[,1] < 10 & ran.ci[,2] > 10, 1, 0))
[1] 96

今回は100回の試行をくり返しましたが、これを1000回、10000回と増やしていけば95%に限りなく近づいていきます。

余談ですが、この頻度主義統計学における母平均の95%信頼区間ベイズ統計学で局所一様事前分布を用いた場合の母平均の周辺事後分布の95%最高密度区間と数学的に等値です。その意味では2.の文章は正しいと言えます。こういうベイズ統計学の基本的なことは ベイズ統計学入門 に詳しく書かれています。ベイズ統計学に興味のある方はぜひご一読ください。