기초통계
t-검정
일 표본 t-검정 (one sample t-test)
가설 검정의 일정으로 하나의 모집단의 평균(n)값을 특정값과 비교하는 경우 사용하는 통계적 분석 방법
일 표본 단측 t-검정 | less/greater(방향성O) ex) alternative = 'greater' |
일 표본 양측 t-검정(일반적) | ~이다(방향성X) ex) alternative = 'two.sided' |
일 표본 단측 t-검정
일 표본 양측 t-검정
이(독립)표본 t검정 (independent sample t-test)
서로 독립적인 두 개의 집단에 대하여 모수의 값이 같은 값을 갖는지 통계적으로 검정하는 방법
두 모집단의 분산이 같음을 의미하는 등분산성을 만족해야 함 -> F검정을 먼저 수행
이 표본 단측 t-검정 | less/greater(방향성O) ex) alternative = 'greater' |
이 표본 양측 t-검정 | ~이다(방향성X) ex) alternative = 'two.sided' |
이 표본 단측 t-검정
자유도(degrees of freedom, df)가 198이 아닌 이유는 **웰치 t-검정(Welch’s t-test)**을 사용했기 때문이다.
t.test() 함수에서 기본적으로 적용되는 웰치 t-검정은 두 집단의 분산이 동일하지 않을 수도 있음을 가정한다. 따라서 스튜던트 t-검정(Student’s t-test)과 달리 자유도를 단순히 n1+n2−2 로 계산하지 않고, 웰치-새터스웨이트(Welch-Satterthwaite) 공식을 사용한다.
이 표본 양측 t-검정
대응 표본 t검정
동일한 대상에 대한 두 가지 관측치가 있는 경우 이를 비교하여 차이가 있는지 검정할 때 사용 (실험 전 후)
ex) t.test(before, after, alternative = 'greater', paired = TRUE)
대응표본 t-검정(paired t-test)
분산분석(ANOVA)
세 개 이상 모집단이 있을 경우에 여러 집단 사이의 평균을 비교하는 검정 방법이다. |
귀무가설 : 모든 집단간 평균은 같다 |
가정 1) 정규성 : 각 집단의 표본들은 정규분포를 따라야 한다. 2) 등분산성 : 각 집단은 동일한 분산을 가져야 한다. 3) 독립성 : 각 집단은 서로에게 영향을 주지 않는다. |
단점 : 귀무가설을 기각할 경우 평균이 얼마나 다른지 알 수 없음 사후검정 : Scheffe, Tukey, Duncan, Fisher's LSD, Dunnett 등 |
독립변수 : 범주형 데이터 종속변수 : 연속형 |
F-value 사용 : (집단 간 분산)/(집단 내 분산) |
일원 분산 분석
셋 이상의 집단 간 평균을 비교하는 상황에서 하나의 집단에 속하는 독립변수와 종속변수가 모두 한 개일 때 사용한다.
일원분산분석(one-way Anova)
이원분산분석
일원분산분석 수행 시 독립변수의 수가 두개 이상일 때 사용
독립 변수간 교호작용 O : 반복이 있는 실험
독립 변수간 교호작용 X : 반복이 없는 실험
종속 변수가 2개 이상 : 다변량분산분석 = 다원분산분석
교차분석
범주형 자료(명목, 서열)간의 관계를 알아보고자 할 때 사용
카이제곱 검정통계량 이용
적합도 검정, 독립성 검정, 동질성 검정에 사용
교차 분석표 : 두 범주형 변수를 교차하여 데이터의 빈도를 표 형태로 나타낸 것
적합도 검정 | 실험 결과 얻어진 관측값이 예상값과 일치하는지 여부를 검정하는 방법 실험 데이터 : 관측도수 예측값 : 기대도수 가설 : 실제 분포와 예측 분포 간에는 차이가 없다. (일치) |
독립성 검정 | 모집단이 두 개의 변수에 의해 범주화됐을 때 그 변수들 사이의 관계가 독립적인지 아닌지 검정하는 것 카이제곱 검정으로는 상관관계의 여부만 알려주지 강도를 말해주지 않음 |
동질성 검정 | 관측값들이 정해진 범주 내에서 서로 비슷하게 나타나고 있는지를 검정 동일한 모집단에서 추출된 것인지 |
상관분석
두 변수 간의 선형적 관계가 존재하는지 알아보는 분석 방법
+1 : 강한 양의 상관관계
0 : 상관 X
-1 : 강한 음의 상관관계
반드시 인과관계가 있다는 말은 아님
산점도 행렬
귀무가설 : 두 변수는 아무 상관관계가 없다
피어슨 상관분석(선형적) | 모수적 방법의 하나로 두 변수가 모두 정규분포를 따른다는 가정이 필요 |
스피어만 상관분석(비선형적) | 두 변수들이 서열척도일 때 사용하는 상관계수 비모수적 방법으로 관측갑싀 순위에 대하여 상관계수를 계산 |
p-value < 0.05 : 귀무가설 기각 -> 서로 상관관계가 있다
'자격증 > ADsP' 카테고리의 다른 글
[ADsP 미어캣 온라인 스터디 11기] Day 9 3과목 2장 통계분석 (0) | 2025.02.08 |
---|---|
[ADsP 미어캣 온라인 스터디 11기] Day 8 3과목 데이터 마트 (0) | 2025.02.05 |
Q-Q (Quantile-Quantile) Plot을 사용하여 데이터의 정규성을 판단하는 방법 (0) | 2025.02.05 |
[ADsP 미어캣 온라인 스터디 11기] Day 7 R기초와 데이터 마트 (0) | 2025.02.03 |
[ADsP 미어캣 온라인 스터디 11기] Day 6 2과목 분석 거버넌스 체계 수립 (0) | 2025.02.03 |