연구에서 통계분석을 진행 할 때 기본적으로 진행하는 몇가지 분석들이 있다.
그 중 하나는 왜도, 첨도 분석이다.
1. 왜도(Skewness)란 무엇인가?
- 왜도(歪度)는 데이터 분포의 비대칭성(좌우로 치우친 정도)을 나타내는 지표입니다. 쉽게 말해 "정규분포(종 모양)에 비해 한쪽 꼬리가 얼마나 긴가?"를 보여준다.
* 왜도 = 0: 완벽한 좌우 대칭이다. (정규분포)
* 왜도 > 0 (양의 왜도 / 오른쪽으로 긴 꼬리): 데이터가 왼쪽에 몰려 있고, 오른쪽으로 길게 꼬리가 늘어진 형태이다. 평균이 중앙값보다 큰 경우가 많다. (예: 소득 분포, 대부분의 사람은 평범하지만 극소수의 고소득자가 오른쪽에 위치함)
* 왜도 < 0 (음의 왜도 / 왼쪽으로 긴 꼬리): 데이터가 오른쪽에 몰려 있고, 왼쪽으로 길게 꼬리가 늘어진 형태이다. (예: 난이도가 아주 쉬운 시험의 점수 분포, 대부분 고득점이지만 일부가 낮은 점수를 받음)

2. 첨도(Kurtosis)란 무엇인?
- 첨도(尖度)는 데이터 분포의 뾰족한 정도(중심에 얼마나 몰려 있는가)와 꼬리의 두께를 나타내는 지표이다.
* 첨도 = 0 (또는 기준에 따라 3): 기준이 되는 정규분포의 뾰족함이다.
(엑셀이나 SPSS 등 통계 프로그램에서는 정규분포를 0으로 맞추는 '초과 첨도'를 주로 사용한다.)
* 첨도 > 0 (정규분포보다 뾰족함): 중앙에 데이터가 아주 빽빽하게 모여 있어 정 정점 부위가 뾰족하고, 양쪽 꼬리가 두꺼운 형태이다. (극단적인 예외 값이 존재할 가능성이 높음)
* 첨도 < 0 (정규분포보다 완만함): 정점 부위가 뭉툭하고 평평한 형태를 띱니다. 데이터가 중심에 모이지 않고 넓게 퍼져 있음을 의미한다.

3. 왜도와 첨도는 왜 연구에서 필요할까?
통계 분석을 활용하는 연구(특히 석·박사 학위논문이나 학술지 투고 논문)에서 왜도와 첨도를 반드시 확인해야 하는 이유
① '정규성 가정' 검정 (가장 중요한 이유)대부분의 계량적 연구에서 사용하는 주요 통계 분석 방법(t-test, ANOVA, 회귀분석 등)은 "수집된 데이터가 정규분포를 따른다"는 정규성 가정(Normality Assumption)을 전제로 한다.
- 데이터가 정규성을 만족해야만 분석 결과의 신뢰성을 보장할 수 있다. 학계에서 통용되는 일반적인 기준에 따르면, 왜도의 절대값이 2 미만, 첨도의 절대값이 4~7 미만(학자나 문헌에 따라 조금씩 기준은 다름)이면 정규성을 크게 벗어나지 않는 것으로 보고 모수 통계 분석을 진행할 수 있다.
② 데이터의 이상치(Outlier) 확인첨도가 지나치게 높다면, 이는 데이터 중심부에만 사람이 몰려 있는 게 아니라 양쪽 끝(꼬리)에 아주 극단적인 값(이상치)들이 존재한다는 강력한 신호이다. 이러한 이상치는 연구 전체의 평균을 왜곡할 수 있으므로, 왜도와 첨도를 통해 데이터 정제(Cleaning)가 필요한지 판단할 수 있다.

'연구데이터분석' 카테고리의 다른 글
| 경로분석 결과에서 정(+)의 영향, 부(-)의 영향, 기각의 해석은 어떻게 할까? (0) | 2026.06.03 |
|---|---|
| 양적 연구와 질적 연구란 무엇일까? (0) | 2026.06.01 |
| 논문 통계분석, p-value와 t-value (0) | 2026.05.31 |



