신뢰구간(Confidence Interval) — 의미·직관, 그리고 흔한 오해

2024.10.13 ·#통계 #신뢰구간 #구간추정 #베이지안 #p-value

글의 목표

신뢰구간의 정확한 의미 이해
신뢰구간을 어떻게 해석·접근해야 하는지
가설검정 관점에서의 신뢰구간
흔한 오해와 진실 ("신뢰구간 안에 있을 확률?")

서론 — 통계학의 추정

통계학의 주요 목표는 추정이다. 우리가 쓰는 통계는 대개 빈도주의의 하위인 모수 통계학으로, 모집단 분포를 가정하고 평균·분산 같은 모수가 특정 값으로 정해져 있다고 본다.

모수 추정은 한 값을 찍는 점추정과, 어떤 구간 안에 있을 것이라 보는 구간추정으로 나뉜다. 구간추정은 점추정보다 불확실성을 더 잘 반영한다(불확실성을 구간 길이로 표현).

본론

Q. 우리나라 성인 남성 평균 키를 어떻게 추정할까?

표본 30명 이상 뽑아 평균을 구한다 → 점추정
추정된 평균 ± 오차(범위) 로 불확실성을 반영한다 → 구간추정

2.1) 오차 범위를 어떻게 설정할까?

추정하려는 모수(모평균 $\mu$)에서 출발하자. 모평균의 분포를 정규분포로 가정(정규성 검정 통과)하고 그려본다.

그림 1. x축을 표본평균으로 하는 모분포

추정 목표는 $\mu$(모평균)다. 핵심 아이디어:

이 분포에서 발견될 수 있는 95%의 값들이 모평균을 포함하도록 하자. 즉 그림1의 Interval 1 안에서 표본평균이 발견되면 된다.

모집단을 포함하는 표본으로부터의 범위 그림 2. 모집단을 포함하고 있는 표본으로부터의 범위

표기법 — $\bar{X}_n$ 은 $n$번째 표본평균(예: $\bar{X}_1$, $\bar{X}_2$), $d_{\bar{X}_n}$(줄여서 $d_n$)은 평균에서 경계까지의 거리(예: $d_{\bar{X}_1} = d_1$).

2.2) 모집단을 포함하는 범위 설정

그림 1에서 모평균으로부터 거리 $2d$(95% 발견 확률)의 경계값을 잡고, 왼쪽을 $\bar{X}_1$, 오른쪽을 $\bar{X}_2$로 둔다. 모평균을 포함하려면 $d = d_1 = d_2$ 여야 한다. 그러면 $\bar{X}_1$·$\bar{X}_2$ 사이 어떤 값이어도 모평균이 포함된다.

그림 3. 경계 내외에서 발견된 표본의 의미

그림 3에서 경계 내(95% 이내)에서 발견된 $\bar{X}_3$은 모평균을 포함하지만, 5% 구간에서 발견된 $\bar{X}_4$는 모평균을 포함하지 않는다. (z분포 기준이며, 표본으로 하면 t분포로 구간추정한다.)

용어 정의

추정된 평균 ± $d$ 구간을 신뢰구간, $d$를 오차한계, 이때의 95% 확률을 신뢰수준이라 한다.

결론 요약

모분포에서 표본평균이 발견될 95% 값들이 모평균을 포함하도록 $d=d_1=d_2$로 설정한다. 이를 통해 표본을 100번 뽑아 각각 신뢰구간을 구하면 그중 약 95개가 실제 모평균을 포함한다는 결론이 나온다.

"95% 신뢰수준에서 모평균의 신뢰구간을 구한다" 또는 "95% 신뢰구간을 구한다"

가설검정 관점에서의 신뢰구간

유의수준 $\alpha=0.05$ 설정은 신뢰구간 95% 설정과 같은 맥락이다. 가설검정의 핵심:

표본의 검정통계량이 일반적인 95% 이내면 채택, 5% 극한 영역에서 발견되면 기각.

그림 3 기준, 표본 결과가 상위 5% 극단 영역이면 그 신뢰구간은 모집단 값을 포함하지 않고, 그래서 귀무가설을 기각한다. (95% 신뢰구간 밖 표본을 이상치로 보기도 한다.)

오해의 포인트 — "신뢰구간 안에 있을 확률 95%?" (중요)

95% 신뢰구간이 172~176cm로 나왔을 때, 많은 사람이 "평균 키가 172~176 사이에 있을 확률이 95%"라고 해석한다. 모수 통계학에서는 틀린 표현이다. 모평균은 이미 고정된 하나의 값이고, 표본도 이미 뽑혔다 → 더 이상 확률이 존재하지 않는다.

오해의 이유

표현의 애매함 — "95% 신뢰수준에서 신뢰구간을 구한다"가 마치 신뢰구간 자체의 신뢰도가 95%인 것처럼 느껴진다.
모수를 모르기 때문 — 모수라는 고정된 진리가 있지만 우리는 알 수 없어, 이미 뽑힌 표본의 신뢰구간이 모평균을 포함하는지 모른 채 마치 확률처럼 느낀다.

결론

표본 추출 전: 표본을 뽑아 신뢰구간을 구했을 때 모평균을 포함할 확률은 95% — 맞는 표현.
표본 추출 후: 이미 모수·신뢰구간 고정 → "95% 확률" 표현은 틀림.

이미 뽑힌 표본이 95%/5% 어디에 속하는지는 알 수 없지만, '100번 중 95번이 모집단을 포함하는' 분포에서 나온 신뢰구간 중 하나임을 인식하고, 그 안에 모수가 있기를 기대하는 것이다.

(번외) 베이지안 통계학

베이지안에서는 모수가 고정되지 않고 확률변수로 취급되므로, 표본을 뽑아도 "신뢰구간 안에 있을 확률 95%"가 성립한다. 사람들이 더 쉽게 받아들이는 건 믿음 기반의 베이지안인 듯하다. 우리는 모두 진리를 모른 채 믿음을 가지고 경험(표본)으로 수정해 나가니, 베이지안이 휴리스틱한 인간 사고를 잘 반영한다고 생각한다.

참고 문헌

통계학 기본(입문) — 자유아카데미 (전공서적)
전공서적 다독으로 이해한 직관

📦 이 글은 제가 운영하던 티스토리 블로그에서 옮겨온(migration) 글입니다. 원문: taehyuklee.tistory.com/19