1. 통계적 유의성 판단의 도구, t-검정(t-test)의 개요
정의: 두 집단 간의 평균 차이가 통계적으로 유의미한지 확인하기 위해 t-분포를 활용하여 가설을 검정하는 방법.
전제 조건: * 정규성: 데이터가 정규분포를 따라야 함 (미충족 시 비모수 검정 수행).
등분산성: 두 집단의 분산이 동일해야 함 (독립표본 t-검정의 경우).
독립성: 표본들이 서로 독립적으로 추출되어야 함.
2. 독립표본 t-검정과 대응표본 t-검정의 특징 비교
가. 두 기법의 상세 메커니즘 비교
| 구분 | 독립표본 t-검정 (Independent t-test) | 대응표본 t-검정 (Paired t-test) |
| 개념 | 서로 다른 두 집단의 평균을 비교 | 동일한 집단의 사전/사후 평균을 비교 |
| 표본의 관계 | 독립적 (예: A반과 B반의 성적) | 의존적/쌍(Pair) (예: 복용 전/후 몸무게) |
| 표본 크기 | 두 집단의 크기가 달라도 됨 | 두 시점의 표본 크기가 동일해야 함 |
| 주요 가설 | $H_0: \mu_1 = \mu_2$ (두 집단 평균은 같다) | $H_0: \mu_d = 0$ (차이의 평균은 0이다) |
| 검정 통계량 | 두 집단 간 분산 고려 (등분산 검정 선행) | 개별 관측치 간 차이(Difference)의 분산 고려 |
나. 수행 프로세스 비교
독립표본: 등분산 검정(Levene test 등) → 등분산 여부에 따른 t-검정 수행 → 유의수준($p$-value) 확인.
대응표본: 동일 대상의 전/후 데이터 매칭 → 차이값($d$) 산출 → 차이값에 대한 단일표본 t-검정 형태 수행.
3. 상황별 적용 사례 및 의사결정 기준
가. 실무 적용 사례
독립표본 t-검정: * A/B 테스트: 기존 UI(A)와 신규 UI(B)의 사용자 체류 시간 비교.
그룹 비교: 남성과 여성의 특정 서비스 만족도 차이 분석.
대응표본 t-검정:
효과 측정: 신약 복용 전과 후의 혈압 변화 측정.
교육 평가: 직무 교육 실시 전과 후의 업무 숙련도 차이 분석.
나. 분석 시 고려사항 (Decision Tree)
집단이 하나인가 둘인가? → 집단이 둘이라면, 두 집단이 서로 연결되어 있는가?
연결됨 → 대응표본, 독립적임 → 독립표본.
4. 통계적 검정의 한계 및 현대적 발전 방향
p-value의 한계: 표본 크기가 너무 크면 미세한 차이도 유의미하게 나올 수 있음. 따라서 **효과 크기(Effect Size, Cohen's d)**를 함께 제시하는 것이 권장됨.
비모수 검정으로의 확장: 정규성 가정이 깨질 경우, Wilcoxon rank-sum test(독립) 또는 Wilcoxon signed-rank test(대응)로 전환하여 분석의 신뢰성을 확보해야 함.
결언: 기술사는 데이터의 특성을 정확히 파악하여 적절한 통계 모델을 선택할 수 있어야 하며, 이는 DX 환경에서 데이터 기반 의사결정의 핵심 역량임.