目次
95%CI 信頼区間 Confidence Intervals
統計学における信頼区間(CI;Confidence Intervals)とは、ある一定の信頼度で母集団の値を含む可能性が高い値の範囲のことです。母平均が上限区間と下限区間の間に位置する割合として表されることが多いです。
つまり、95%信頼区間とは、100個の異なるサンプルを取り、それぞれのサンプルについて95%信頼区間を計算した場合、100個の信頼区間のうち約95個に真の平均値(μ)が含まれることを意味します。
95%信頼区間 95%CIとは?
95%信頼区間とは、母集団の真の平均を含むと95%の確信が持てる値の範囲です。自然なサンプリングのばらつきのため、サンプル平均(信頼区間の中心)はサンプルごとに異なります。
サンプルサイズが大きくなると、区間値の範囲が狭くなり、サンプル数が少ない場合に比べて、より正確に平均値を知ることができることになります。
これは、正規分布を使って視覚化することができます。
なぜ95信頼度でZが1.96なのか?
例えば、母平均値がサンプル平均値から標準偏差(Zスコア)-1.96から+1.96の間にある確率は95%です。
したがって、母平均が上下の信頼区間の外側にある確率は5%です(1.96のzスコアの両側に2.5%の外れ値があることで示されています)。
なぜ研究者は信頼区間を使うのか?
母集団のすべての人を調査することは多かれ少なかれ不可能であるため、研究者は母集団のサンプルまたはサブグループを選択します。
つまり、研究者は母集団のパラメータ(すなわち特性)を推定することしかできず、その推定範囲は与えられたサンプルデータのセットから計算されるのです。
対象となる母集団からのサンプリング
したがって、信頼区間とは、サンプルが研究対象の母集団をどれだけよく表しているかを測定するための方法に過ぎません。
信頼区間が母集団内の真の平均値を含む確率は、CIの信頼度と呼ばれます。
信頼度はどのようなレベルでも計算できますが、最もよく使われる値は95%です。95%信頼区間とは、母集団の真の平均値を含んでいると95%確信できる値の範囲(上限と下限)のことです。
信頼区間はどのように計算するのですか?
信頼区間を計算するには、まずサンプルの平均値と標準誤差を計算します。
選択した信頼水準のZスコアを使って、信頼区間の上限と下限のスコアを計算する必要があります。
信頼水準 Z-Score
0.80 1.28
0.90 1.645
0.95 1.96
0.99 2.58
上記は与えられた信頼水準に対するz*の値を示しています。これらの値は、標準的な正規分布(Z-)から取られていることに注意してください。各z*値とそのz*値の負の間の領域が信頼度の割合です。例えば、z*=1.28とz=-1.28の間の面積は約0.80です。
この場合、データが正規分布から来ているか、正規分布でない場合は、中心極限定理を適用するためにnが十分に大きい(少なくとも30程度)必要があり、式の中でz*値を使用することができます。
信頼区間の計算式は以下のようになります。
X は平均値
Z は選択されたZ値(95%の場合は1.96)
sは,標準誤差
nはサンプルサイズ
下限区間スコアは標準誤差をnの平方根で割り、この計算の合計にZスコア(95%では1.96)を掛けます。最後に、この計算の値を標本平均から差し引きます。
母平均(平均)のCIを計算するには、次のようにします。
- 1.信頼水準を決定し,適切なz*値を求める.
- 2.サンプルサイズ(n)に対するサンプル平均(x̄)を求める。
注:母集団の標準偏差は、既知の値σであると仮定する。 - 3.z*にσを掛けて、nの平方根で割る。
この計算により、誤差を求めることができます。 - 4.x̄に誤差の範囲を加減してCIを求めます。
CIの下限はx̄から誤差を引いた値、CIの上限はx̄に誤差を加えた値となります。
例題:漁業試験場の孵化場のA池にいるすべての稚魚の平均体長を、95パーセントの信頼度で推定したい。
まずは、95パーセントの信頼区間を求めているので、z*値は1.96となります。
100匹の子魚から無作為にサンプルを採取し、平均長さが7.5㎝、母集団の標準偏差は2.3㎝でした。
この場合、x̄=7.5、σ=2.3、n=100となります。
1.96×2.3÷100の平方根(10)をかけます。したがって,誤差は± 1.96(2.3/10) = 1.96*0.23 = 0.45 インチとなります.
この魚の孵化場の池Aにいる稚魚の平均体長の95パーセント信頼区間は、7.5±0.45㎝です。
母平均が標本平均に近いことを確信するには?
区間(上限値と下限値)が狭ければ狭いほど、より正確な推定値が得られます。
一般的なルールとして、サンプルサイズが大きくなると、信頼区間はより狭くなります。
したがって,大規模なサンプルでは,小規模なサンプルよりも高い精度で母平均を推定することができるので,大規模なサンプルから計算された場合,信頼区間はかなり狭くなります.
この記事の著者:仲田洋美医師
医籍登録番号 第371210号
日本内科学会 総合内科専門医 第7900号
日本臨床腫瘍学会 がん薬物療法専門医 第1000001号
臨床遺伝専門医制度委員会認定 臨床遺伝専門医 第755号