연구데이터분석

성별·연령별 2그룹 비교분석 연구방법론: t-test 쉽게 이해하기

DoctorLee 2026. 6. 18. 09:00

 

연구를 하다 보면 두 집단을 비교해야 하는 경우가 많다.


예를 들어 다음과 같은 질문

“남성과 여성의 만족도 평균은 차이가 있을까?”
“20대와 30대의 스트레스 점수는 다를까?”
“교육 전과 교육 후의 점수는 실제로 향상되었을까?”
“실험군과 대조군의 평균 차이는 통계적으로 의미가 있을까?”

 

이처럼 두 그룹의 평균 차이를 비교할 때 사용하는 대표적인 통계분석 방법이 바로 t-test이다.

 

t-test는 초보 연구자들이 가장 많이 접하는 기본 분석 방법이지만, 막상 논문에 적용하려고 하면 헷갈리는 부분이 많다.

 

* 이미지 출처 : Google Gemini 요약 생성

 


1. t-test란 무엇인가?

t-test는 두 집단의 평균이 통계적으로 유의하게 다른지를 확인하는 분석 방법이다.

쉽게 말하면 다음과 같은 질문에 답하기 위한 방법이다.

“두 그룹의 평균 차이가 우연히 생긴 차이일까, 아니면 실제로 의미 있는 차이일까?”

 

예를 들어 연구자가 남성과 여성의 학습만족도 평균을 비교했다고 가정해 보자!

 

남성 평균 점수: 3.8점
여성 평균 점수: 4.2점

 

겉으로 보면 여성의 평균 점수가 더 높다.
하지만 이 차이가 단순한 우연인지, 실제로 통계적으로 의미 있는 차이인지는 별도로 확인해야 한다.

이때 사용하는 분석이 바로 t-test이다.


2. t-test는 언제 사용할까?

t-test는 기본적으로 다음 조건에서 사용한다.

 

첫째, 비교하려는 집단이 2개여야 한다.
둘째, 비교하려는 값이 평균이어야 한다.
셋째, 종속변수가 숫자로 측정된 연속형 자료여야 한다.

 

예를 들어 다음과 같은 연구 질문에 t-test를 사용할 수 있다.

 

< 연구 질문사용 가능 여부 >

남성과 여성의 만족도 평균 차이가 있는가? 가능
실험군과 대조군의 검사 점수 차이가 있는가? 가능
교육 전과 교육 후의 자신감 점수가 달라졌는가? 가능
20대와 30대의 스트레스 평균이 다른가? 가능
성별에 따라 찬성·반대 비율이 다른가? 부적절
세 연령대의 평균 차이가 있는가? 부적절

 

중요한 점은 t-test는 평균 차이를 보는 분석이라는 것이다.
비율 차이, 빈도 차이, 세 집단 이상의 평균 차이를 볼 때는 다른 분석 방법을 사용해야 한다.


3. 독립표본 t-test와 대응표본 t-test의 차이

t-test는 크게 두 가지로 나눌 수 있다.

3-1. 독립표본 t-test

독립표본 t-test는 서로 다른 두 집단의 평균을 비교할 때 사용한다.

 

예를 들면 다음과 같다.

 

남성 vs 여성
실험군 vs 대조군
20대 vs 30대
전공자 vs 비전공자
수도권 거주자 vs 비수도권 거주자

 

이 경우 두 집단은 서로 독립적이다.
즉, 남성 집단에 속한 사람이 여성 집단에 동시에 속하지 않는다.

 

예시 연구 질문은 다음과 같다.

성별에 따라 학습만족도 평균에 차이가 있는가?

 

이 경우 독립변수는 성별이고, 종속변수는 학습만족도 점수이다.
성별은 남성·여성이라는 두 집단으로 나뉘고, 학습만족도는 숫자로 측정된 평균값이므로 독립표본 t-test를 사용할 수 있다.


3-2. 대응표본 t-test

대응표본 t-test는 같은 대상에게서 두 번 측정한 평균을 비교할 때 사용한다.

 

예를 들면 다음과 같다.

 

교육 전 vs 교육 후
프로그램 참여 전 vs 참여 후
상담 전 vs 상담 후
운동 전 vs 운동 후
치료 전 vs 치료 후

 

이 경우 두 값은 서로 독립된 집단이 아니라, 같은 사람에게서 반복 측정된 값이다.

 

예시 연구 질문은 다음과 같다.

AI 글쓰기 교육 전후로 연구자의 논문 작성 자신감에 차이가 있는가?

 

이 경우 같은 연구자들에게 교육 전 자신감 점수와 교육 후 자신감 점수를 측정한다.
따라서 대응표본 t-test를 사용하는 것이 적절하다.


4. t-test 사용 전 확인해야 할 조건

t-test를 사용하기 전에는 몇 가지 조건을 확인해야 한다.

4-1. 비교 집단이 2개인가?

t-test는 기본적으로 두 집단을 비교할 때 사용한다.


만약, 연령대를 20대, 30대, 40대처럼 세 집단 이상으로 나눈다면 t-test가 아니라 ANOVA, 즉 분산분석을 고려해야 한다.

 

예를 들어 다음과 같다.

 

20대 vs 30대 → t-test 가능
20대 vs 30대 vs 40대 → ANOVA 고려


4-2. 종속변수가 연속형 자료인가?

t-test는 평균을 비교하는 분석이다.


따라서 종속변수는 숫자로 측정된 연속형 자료여야 한다.

 

예를 들면 다음과 같다.

 

만족도 점수
스트레스 점수
시험 점수
소득

몸무게
검사 수치
자신감 점수

 

반대로 성별, 직업, 찬성·반대, 이용 여부처럼 범주형 자료를 비교할 때는 t-test가 적절하지 않다.


4-3. 정규성을 확인했는가?

t-test는 기본적으로 각 집단의 자료가 정규분포에 가깝다는 가정을 바탕으로 한다.


표본 수가 충분히 크면 크게 문제 되지 않는 경우도 있지만, 표본 수가 작다면 정규성 검토가 중요하다.

 

정규성은 보통 다음 방법으로 확인한다.

 

Shapiro-Wilk 검정
Kolmogorov-Smirnov 검정
왜도와 첨도 확인
히스토그램 확인
Q-Q plot 확인

 

초보 연구자라면 통계 프로그램에서 제공하는 정규성 검정 결과를 먼저 확인하면 된다.


4-4. 등분산성을 확인했는가?

독립표본 t-test에서는 두 집단의 분산이 비슷한지도 확인해야 하는데, 이를 등분산성이라고 한다.

 

보통 SPSS에서는 Levene의 등분산 검정 결과를 함께 제공한다.

Levene 검정의 유의확률이 .05 이상이면 등분산을 가정한 결과를 본다.
Levene 검정의 유의확률이 .05 미만이면 등분산을 가정하지 않은 결과를 본다.

초보 연구자가 SPSS 결과표를 볼 때 가장 자주 헷갈리는 부분이 바로 이 지점이다.


5. t-test 결과는 어떻게 해석할까?

t-test 결과에서 가장 많이 보는 값은 p값이다.

p값은 보통 유의확률 또는 Sig.로 표시된다.

 

일반적으로 p값이 .05보다 작으면 두 집단의 평균 차이가 통계적으로 유의하다고 해석한다.

예를 들어 다음과 같은 결과가 있다고 가정해 보자!

 

남성 평균: 3.70
여성 평균: 4.10
t값: -2.45
p값: .016

 

이 경우 p값 .016은 .05보다 작다.
따라서 남성과 여성의 평균 차이는 통계적으로 유의하다고 볼 수 있다.

논문에서는 다음처럼 표현할 수 있다.

성별에 따른 학습만족도 차이를 분석한 결과, 여성의 평균 점수가 남성보다 높았으며, 이 차이는 통계적으로 유의하였다(t=-2.45, p<.05).

 

반대로 p값이 .05보다 크다면 통계적으로 유의한 차이가 없다고 해석한다.

예를 들어 p값이 .231이라면 다음처럼 작성할 수 있다.

성별에 따른 학습만족도 평균 차이는 통계적으로 유의하지 않았다(p>.05).


6. t-test에서 자주 하는 실수

초보 연구자들이 t-test를 사용할 때 자주 하는 실수는 다음과 같다.

6-1. 세 집단 이상인데 t-test를 사용하는 경우

t-test는 두 집단 비교를 위한 분석이다.


세 집단 이상을 비교하면서 t-test를 반복해서 사용하는 것은 적절하지 않을 수 있다.

예를 들어 20대, 30대, 40대의 평균을 비교하고 싶다면 t-test가 아니라 ANOVA를 사용하는 것이 일반적이다.


6-2. 평균이 아니라 비율을 비교하는 경우

t-test는 평균 차이를 보는 분석이다.


성별에 따른 찬성·반대 비율, 이용 여부 차이, 선택 비율 차이 등을 분석할 때는 카이제곱 검정이 더 적절할 수 있다.

예를 들어 “남성과 여성의 AI 도구 사용 여부에 차이가 있는가?”는 평균 비교가 아니라 범주형 자료 비교에 가깝다.


6-3. p값만 보고 결론을 내리는 경우

p값이 중요하긴 하지만, p값만 보고 결론을 내리면 부족하다.
논문에서는 평균, 표준편차, t값, p값을 함께 제시하는 것이 좋다.

또한 단순히 유의하다·유의하지 않다만 적는 것이 아니라, 어느 집단의 평균이 더 높은지도 함께 설명해야 한다.


6-4. 독립표본과 대응표본을 혼동하는 경우

서로 다른 두 집단이면 독립표본 t-test이다.
같은 대상의 전후 비교이면 대응표본 t-test이다.

이 차이를 헷갈리면 분석 자체가 잘못될 수 있다.

 

쉽게 기억하면 다음과 같다.

다른 사람끼리 비교하면 독립표본 t-test
같은 사람의 전후를 비교하면 대응표본 t-test


7. 연구 논문에서 t-test 결과 작성 예시

논문에서는 t-test 결과를 보통 다음과 같이 작성한다.

예시 1. 성별에 따른 만족도 차이

성별에 따른 학습만족도 차이를 확인하기 위해 독립표본 t-test를 실시하였다. 분석 결과, 남성의 평균은 3.72점, 여성의 평균은 4.15점으로 나타났으며, 두 집단 간 차이는 통계적으로 유의하였다(t=-2.31, p<.05). 따라서 여성 집단의 학습만족도가 남성 집단보다 유의하게 높은 것으로 해석할 수 있다.

예시 2. 교육 전후 자신감 차이

AI 활용 교육 전후의 논문 작성 자신감 차이를 확인하기 위해 대응표본 t-test를 실시하였다. 분석 결과, 교육 전 평균은 2.95점, 교육 후 평균은 4.10점으로 나타났으며, 이 차이는 통계적으로 유의하였다(t=-5.42, p<.001). 이는 AI 활용 교육이 연구자의 논문 작성 자신감 향상에 긍정적인 영향을 미쳤을 가능성을 보여준다.


8. t-test 선택 기준 정리

t-test를 선택할 때는 다음 기준을 기억하면 쉽다.

 

< 상황적절한 분석 >

남성과 여성의 평균 비교 독립표본 t-test
실험군과 대조군의 평균 비교 독립표본 t-test
20대와 30대의 평균 비교 독립표본 t-test
교육 전후 평균 비교 대응표본 t-test
프로그램 참여 전후 평균 비교 대응표본 t-test
세 집단 이상의 평균 비교 ANOVA
성별에 따른 이용 여부 차이 카이제곱 검정

t-test는 2그룹 평균 비교의 기본 분석이다.

t-test는 연구방법론에서 가장 기본적이면서도 자주 사용되는 분석 방법이다.
특히 성별, 연령별, 실험군·대조군처럼 두 그룹을 비교할 때 많이 활용된다.

 

핵심은 간단하다.

t-test는 두 집단의 평균 차이가 통계적으로 유의한지 확인하는 분석이다.

 

초보 연구자라면 다음 세 가지를 먼저 확인하면 된다.

 

첫째, 비교 집단이 2개인가?
둘째, 비교하려는 값이 평균인가?
셋째, 독립된 두 집단인가, 같은 대상의 전후 비교인가?

 

이 세 가지를 구분할 수 있다면 t-test를 훨씬 쉽게 이해할 수 있다.

논문 작성 시에는 p값만 보는 것이 아니라 평균, 표준편차, t값, 유의확률을 함께 제시하고, 분석 결과가 연구 질문에 어떤 의미를 갖는지 해석하는 것이 중요하다.

t-test는 어렵게 느껴질 수 있지만, “두 그룹의 평균 차이를 확인하는 방법”이라고 생각하면 훨씬 쉽게 접근할 수 있다.