R에서 aov()와 anova()의 차이
aov()와 anova()는 둘 다 분산 분석(ANOVA, Analysis of Variance) 을 수행하는 함수지만, 용도와 동작 방식에 차이가 있다.
1. aov() – 분산 분석 (ANOVA) 모델 생성
• aov()는 ANOVA 모델을 생성하는 함수로, 회귀 분석(lm())과 유사한 방식으로 동작합니다.
• 주로 일원 분산 분석(one-way ANOVA) 및 다원 분산 분석(two-way, multi-way ANOVA)에 사용됩니다.
• 모델을 생성한 후 summary()를 사용하여 결과를 확인합니다.
✅ 예제: aov() 사용법
# 예제 데이터: iris 데이터에서 품종(Species)에 따른 꽃받침 길이(Sepal.Length) 차이 분석
model <- aov(Sepal.Length ~ Species, data = iris)
summary(model)
✔ 결과 해석:
• summary(model)을 실행하면 F-검정(F-test)과 p-value를 통해 그룹 간 평균 차이가 유의미한지 확인할 수 있습니다.
2. anova() – 분산 분석 테이블 출력
• anova()는 모델 간 비교 또는 회귀 모델의 ANOVA 테이블을 출력하는 함수입니다.
• 주로 회귀 분석 결과(lm(), aov())에 대한 ANOVA 테이블을 확인할 때 사용됩니다.
• 두 개 이상의 모델을 비교하여 추가 변수가 모델 설명력을 얼마나 증가시키는지 확인할 수 있습니다.
✅ 예제: anova() 사용법
# 선형 회귀 모델 생성
model1 <- lm(Sepal.Length ~ Species, data = iris)
model2 <- lm(Sepal.Length ~ Species + Petal.Length, data = iris)
# 두 모델 비교
anova(model1, model2)
✔ 결과 해석:
• anova(model1, model2)는 두 모델 간의 추가된 변수(Petal.Length)가 유의미한지를 비교합니다.
• p-value가 작으면 추가 변수가 유의미한 영향을 미친다는 의미입니다.
3. aov() vs anova() 차이 정리
구분 aov() anova()
역할 ANOVA 모델 생성 ANOVA 테이블 출력 및 모델 비교
입력값 ANOVA 수식 (formula) lm(), aov() 모델 객체
출력값 aov 객체 (회귀 모델과 유사) 분산 분석 테이블
주요 목적 그룹 간 평균 차이 분석 회귀 모델의 분산 분석 및 모델 비교
추가 설명 lm()과 유사한 방식 anova(model1, model2)로 모델 비교 가능
4. aov()와 anova() 언제 사용할까?
✔ ANOVA 분석을 수행할 때 → aov()
✔ 회귀 분석 결과에 대한 분산 분석을 수행할 때 → anova()
✔ 두 개 이상의 모델을 비교할 때 → anova(model1, model2)
결론
• aov()는 ANOVA 모델을 생성하는 함수로, summary(aov())를 통해 결과를 해석합니다.
• anova()는 기존 모델(lm, aov)의 ANOVA 테이블을 출력하거나 모델을 비교하는 함수입니다.
1. F value (F 통계량)
- F 통계량은 집단 간 변동(설명된 변동)과 집단 내 변동(오차 변동)의 비율을 나타냅니다.
- 일반적으로 F 값이 클수록 집단 간 평균 차이가 유의미할 가능성이 높습니다.
- 계산식
2. Pr(>F) (유의확률, p-value)
- Pr(>F)는 귀무가설(H₀: 집단 간 평균이 동일하다)이 참일 때, 관측된 F 값보다 더 큰 값이 나올 확률을 의미합니다.
- 값이 작을수록 귀무가설을 기각할 근거가 강해집니다.
📌 Pr(>F)의 의미
- **Pr(>F)**는 "현재 데이터에서 계산된 F 값보다 더 극단적인 값이 우연히 나올 확률"을 의미합니다.
- 즉, **귀무가설(H₀: 집단 간 차이가 없다)**이 참일 때, 현재보다 더 큰 F 값이 나올 확률을 나타냅니다.
- p-value가 작을수록 "집단 간 차이가 우연히 발생할 가능성이 낮다"는 뜻이므로, 귀무가설을 기각할 가능성이 커집니다.
🔹 과학적 표기법에서 e
- e는 10의 거듭제곱을 의미하는 기호입니다.
- e-16은 10을 -16제곱한 값을 뜻합니다.
(예: e-3 = 10−310^{-3} = 0.001) - e+3 같은 경우는 10을 3제곱한 값을 의미합니다.
(예: e+3 = 10310^3 = 1000)
'자격증 > ADsP' 카테고리의 다른 글
[ADsP 미어캣 온라인 스터디 11기] Day 7 R기초와 데이터 마트 (0) | 2025.02.03 |
---|---|
[ADsP 미어캣 온라인 스터디 11기] Day 6 2과목 분석 거버넌스 체계 수립 (0) | 2025.02.03 |
[ADsP 미어캣 온라인 스터디 11기] Day 5 2과목 분석 마스터플랜 (107 ~ 115p) (0) | 2025.02.02 |
[ADsP 미어캣 온라인 스터디 11기] Day 4 분석 기획과 분석 방법론 (88 ~ 107p) (1) | 2025.01.30 |
[ADsP 미어캣 온라인 스터디 11기] Day 3 분석 기획과 분석 방법론 (71 ~ 89p) (0) | 2025.01.29 |