[ADsP] R에서 aov()와 anova()의 차이

2025. 2. 3. 10:06·자격증/ADsP
목차
  1.  
  2. 1. F value (F 통계량)
  3. 2. Pr(>F) (유의확률, p-value)
  4. 📌 Pr(>F)의 의미
  5. 🔹 과학적 표기법에서 e
반응형

R에서 aov()와 anova()의 차이

aov()와 anova()는 둘 다 분산 분석(ANOVA, Analysis of Variance) 을 수행하는 함수지만, 용도와 동작 방식에 차이가 있다.

1. aov() – 분산 분석 (ANOVA) 모델 생성
• aov()는 ANOVA 모델을 생성하는 함수로, 회귀 분석(lm())과 유사한 방식으로 동작합니다.
• 주로 일원 분산 분석(one-way ANOVA) 및 다원 분산 분석(two-way, multi-way ANOVA)에 사용됩니다.
• 모델을 생성한 후 summary()를 사용하여 결과를 확인합니다.

✅ 예제: aov() 사용법

# 예제 데이터: iris 데이터에서 품종(Species)에 따른 꽃받침 길이(Sepal.Length) 차이 분석
model <- aov(Sepal.Length ~ Species, data = iris)
summary(model)

✔ 결과 해석:
• summary(model)을 실행하면 F-검정(F-test)과 p-value를 통해 그룹 간 평균 차이가 유의미한지 확인할 수 있습니다.


2. anova() – 분산 분석 테이블 출력
• anova()는 모델 간 비교 또는 회귀 모델의 ANOVA 테이블을 출력하는 함수입니다.
• 주로 회귀 분석 결과(lm(), aov())에 대한 ANOVA 테이블을 확인할 때 사용됩니다.
• 두 개 이상의 모델을 비교하여 추가 변수가 모델 설명력을 얼마나 증가시키는지 확인할 수 있습니다.

✅ 예제: anova() 사용법

# 선형 회귀 모델 생성
model1 <- lm(Sepal.Length ~ Species, data = iris)
model2 <- lm(Sepal.Length ~ Species + Petal.Length, data = iris)

# 두 모델 비교
anova(model1, model2)

✔ 결과 해석:
• anova(model1, model2)는 두 모델 간의 추가된 변수(Petal.Length)가 유의미한지를 비교합니다.
• p-value가 작으면 추가 변수가 유의미한 영향을 미친다는 의미입니다.


3. aov() vs anova() 차이 정리

구분 aov() anova()
역할 ANOVA 모델 생성 ANOVA 테이블 출력 및 모델 비교
입력값 ANOVA 수식 (formula) lm(), aov() 모델 객체
출력값 aov 객체 (회귀 모델과 유사) 분산 분석 테이블
주요 목적 그룹 간 평균 차이 분석 회귀 모델의 분산 분석 및 모델 비교
추가 설명 lm()과 유사한 방식 anova(model1, model2)로 모델 비교 가능


4. aov()와 anova() 언제 사용할까?

✔ ANOVA 분석을 수행할 때 → aov()
✔ 회귀 분석 결과에 대한 분산 분석을 수행할 때 → anova()
✔ 두 개 이상의 모델을 비교할 때 → anova(model1, model2)


결론
• aov()는 ANOVA 모델을 생성하는 함수로, summary(aov())를 통해 결과를 해석합니다.
• anova()는 기존 모델(lm, aov)의 ANOVA 테이블을 출력하거나 모델을 비교하는 함수입니다.

 

 

1. F value (F 통계량)

  • F 통계량은 집단 간 변동(설명된 변동)과 집단 내 변동(오차 변동)의 비율을 나타냅니다.
  • 일반적으로 F 값이 클수록 집단 간 평균 차이가 유의미할 가능성이 높습니다.
  • 계산식

2. Pr(>F) (유의확률, p-value)

  • Pr(>F)는 귀무가설(H₀: 집단 간 평균이 동일하다)이 참일 때, 관측된 F 값보다 더 큰 값이 나올 확률을 의미합니다.
  • 값이 작을수록 귀무가설을 기각할 근거가 강해집니다.

📌 Pr(>F)의 의미

  • **Pr(>F)**는 "현재 데이터에서 계산된 F 값보다 더 극단적인 값이 우연히 나올 확률"을 의미합니다.
  • 즉, **귀무가설(H₀: 집단 간 차이가 없다)**이 참일 때, 현재보다 더 큰 F 값이 나올 확률을 나타냅니다.
  • p-value가 작을수록 "집단 간 차이가 우연히 발생할 가능성이 낮다"는 뜻이므로, 귀무가설을 기각할 가능성이 커집니다.

 

🔹 과학적 표기법에서 e

  • e는 10의 거듭제곱을 의미하는 기호입니다.
  • e-16은 10을 -16제곱한 값을 뜻합니다.
    (예: e-3 = 10−310^{-3}10−3 = 0.001)
  • e+3 같은 경우는 10을 3제곱한 값을 의미합니다.
    (예: e+3 = 10310^3103 = 1000)
반응형
저작자표시 비영리 동일조건 (새창열림)

'자격증 > ADsP' 카테고리의 다른 글

[ADsP 미어캣 온라인 스터디 11기] Day 7 R기초와 데이터 마트  (0) 2025.02.03
[ADsP 미어캣 온라인 스터디 11기] Day 6 2과목 분석 거버넌스 체계 수립  (0) 2025.02.03
[ADsP 미어캣 온라인 스터디 11기] Day 5 2과목 분석 마스터플랜 (107 ~ 115p)  (0) 2025.02.02
[ADsP 미어캣 온라인 스터디 11기] Day 4 분석 기획과 분석 방법론 (88 ~ 107p)  (1) 2025.01.30
[ADsP 미어캣 온라인 스터디 11기] Day 3 분석 기획과 분석 방법론 (71 ~ 89p)  (0) 2025.01.29
  1.  
  2. 1. F value (F 통계량)
  3. 2. Pr(>F) (유의확률, p-value)
  4. 📌 Pr(>F)의 의미
  5. 🔹 과학적 표기법에서 e
'자격증/ADsP' 카테고리의 다른 글
  • [ADsP 미어캣 온라인 스터디 11기] Day 7 R기초와 데이터 마트
  • [ADsP 미어캣 온라인 스터디 11기] Day 6 2과목 분석 거버넌스 체계 수립
  • [ADsP 미어캣 온라인 스터디 11기] Day 5 2과목 분석 마스터플랜 (107 ~ 115p)
  • [ADsP 미어캣 온라인 스터디 11기] Day 4 분석 기획과 분석 방법론 (88 ~ 107p)
사락연
사락연
직대딩의 각박한세상 홀로살기
  • 사락연
    VINTAGE MONDAY
    사락연
  • 전체
    오늘
    어제
    • 분류 전체보기 N
      • 잡설
      • 블로그수익화 N
      • 내집마련 N
        • 주택청약 N
        • 현금생활
      • 소소한일상
        • 잡동사니
        • review
        • cosmetics
        • travel
      • 한국방송통신대
      • study
        • 플라스틱사출
        • 생산관리
        • 시사상식
        • 디자인이론
        • 멀티미디어
        • 노트필기
      • 자격증
        • JLPT
        • ADsP
        • SQLD
        • ERP정보관리사
        • 전산세무회계필기
      • language
        • English
        • 日本語
      • 나른한오후
        • 코바늘
        • 대바늘
        • calligraphy
        • 미산가
        • macrame
        • 쿠미히모
        • bracelet TIP
        • 페이퍼커팅
        • 기타공예
  • 태그

    마크라메팔찌
    소원팔찌
    시사상식
    일본어실전대화
    미산가
    손글씨
    시사용어
    다이소
    손뜨개
    경제용어
    팔찌만들기
    기본매듭
    캘리그라피
    미산가팔찌
    대바늘
    코바늘
    대바늘도안
    DIY
    실팔찌
    미산가팁
    일본어
    우정팔찌
    코바늘도안
    시사경제용어
    핸드메이드
    뜨개질
    마크라메
    일본어표현
    미산가도안
    매듭팔찌
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
사락연
[ADsP] R에서 aov()와 anova()의 차이

개인정보

  • 티스토리 홈
  • 포럼
  • 로그인
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.