Q-Q (Quantile-Quantile) Plot을 사용하여 데이터의 정규성을 판단하는 방법

2025. 2. 5. 13:07·자격증/ADsP
목차
  1. Q-Q Plot이란?
  2. Q-Q Plot에서 정규성을 확인하는 방법
  3. 예제 코드 (Python, statsmodels)
  4. 결론
반응형

Q-Q Plot이란?

Q-Q Plot은 데이터의 분포가 특정한 이론적 분포(예: 정규분포)를 따르는지 시각적으로 확인하는 도구입니다.

  • X축: 이론적 분포(정규분포)의 분위수
  • Y축: 실제 데이터의 분위수
  • 데이터가 정규성을 만족하면 점들이 대각선(45도 직선)을 따라 배치됩니다.

 

 

Q-Q Plot에서 정규성을 확인하는 방법

  1. 점들이 45도 직선을 따를 때
    • 데이터가 정규성을 만족함.
    • 작은 편차는 허용되지만 전체적으로 직선에 근접해야 함.
  2. 잔차가 오른쪽으로 상승하는 경우 (비대칭성 존재)
    • 오류: 잔차가 오른쪽(상위 분위수)으로 상승하는 형태를 띠면 정규성을 만족한다고 볼 수 없음.
    • 해석: 데이터가 오른쪽 긴 꼬리를 가지는 분포(우측 비대칭, 오른쪽 왜도)일 가능성이 큼.
  3. 잔차가 아래쪽이나 위쪽으로 크게 벗어나는 경우
    • 아래쪽(왼쪽 꼬리)이나 위쪽(오른쪽 꼬리)이 정규분포보다 더 두껍거나 얇음.
    • 이상치(outlier) 존재 가능성 있음.

 

 

예제 코드 (Python, statsmodels)

아래는 정규성을 만족하는 데이터와 정규성을 따르지 않는 데이터의 Q-Q Plot을 그리는 예제입니다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt
import statsmodels.api as sm
 
# 정규성을 따르는 데이터
np.random.seed(42)
data_normal = np.random.normal(0, 1, 100)
 
# 정규성을 따르지 않는 데이터 (오른쪽 긴 꼬리)
data_skewed = np.random.exponential(1, 100)
 
fig, axs = plt.subplots(1, 2, figsize=(12, 5))
 
# 정규 데이터 Q-Q Plot
sm.qqplot(data_normal, stats.norm, line='45', ax=axs[0])
axs[0].set_title("정규성을 만족하는 Q-Q Plot")
 
# 오른쪽 꼬리가 긴 데이터 Q-Q Plot
sm.qqplot(data_skewed, stats.norm, line='45', ax=axs[1])
axs[1].set_title("정규성을 만족하지 않는 Q-Q Plot")
 
plt.show()
 
Colored by Color Scripter
cs

 

 

 

 

결론

Q-Q Plot에서 점들이 45도 직선을 따르지 않고 오른쪽으로 상승하는 경우, 정규성을 만족하지 않는다고 판단할 수 있습니다.
즉, "잔차가 오른쪽으로 상승하면 정규성을 만족한다"라는 설명은 잘못된 것이며, 오히려 정규성이 깨졌을 가능성이 높음을 의미합니다.

반응형
저작자표시 비영리 동일조건 (새창열림)

'자격증 > ADsP' 카테고리의 다른 글

[ADsP 미어캣 온라인 스터디 11기] Day 9 3과목 2장 통계분석  (0) 2025.02.08
[ADsP 미어캣 온라인 스터디 11기] Day 8 3과목 데이터 마트  (0) 2025.02.05
[ADsP 미어캣 온라인 스터디 11기] Day 7 R기초와 데이터 마트  (0) 2025.02.03
[ADsP 미어캣 온라인 스터디 11기] Day 6 2과목 분석 거버넌스 체계 수립  (0) 2025.02.03
[ADsP] R에서 aov()와 anova()의 차이  (0) 2025.02.03
  1. Q-Q Plot이란?
  2. Q-Q Plot에서 정규성을 확인하는 방법
  3. 예제 코드 (Python, statsmodels)
  4. 결론
'자격증/ADsP' 카테고리의 다른 글
  • [ADsP 미어캣 온라인 스터디 11기] Day 9 3과목 2장 통계분석
  • [ADsP 미어캣 온라인 스터디 11기] Day 8 3과목 데이터 마트
  • [ADsP 미어캣 온라인 스터디 11기] Day 7 R기초와 데이터 마트
  • [ADsP 미어캣 온라인 스터디 11기] Day 6 2과목 분석 거버넌스 체계 수립
사락연
사락연
직대딩의 각박한세상 홀로살기
  • 사락연
    VINTAGE MONDAY
    사락연
  • 전체
    오늘
    어제
    • 분류 전체보기
      • 잡설
      • 블로그수익화
      • 내집마련
        • 주택청약
      • 소소한일상
        • 잡동사니
        • review
        • cosmetics
        • travel
      • 한국방송통신대
      • study
        • 플라스틱사출
        • 시사상식
        • 디자인이론
        • 멀티미디어
        • 노트필기
      • 자격증
        • JLPT
        • ADsP
        • SQLD
        • ERP정보관리사
        • 전산세무회계필기
      • language
        • English
        • 日本語
      • 나른한오후
        • 코바늘
        • 대바늘
        • calligraphy
        • 미산가
        • macrame
        • 쿠미히모
        • bracelet TIP
        • 페이퍼커팅
        • 기타공예
  • 태그

    일본어
    미산가
    경제용어
    대바늘
    실팔찌
    코바늘
    시사상식
    일본어실전대화
    일본어표현
    캘리그라피
    코바늘도안
    기본매듭
    뜨개질
    미산가팁
    핸드메이드
    미산가팔찌
    손뜨개
    시사경제용어
    대바늘도안
    마크라메팔찌
    다이소
    우정팔찌
    손글씨
    마크라메
    DIY
    소원팔찌
    미산가도안
    팔찌만들기
    매듭팔찌
    시사용어
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
사락연
Q-Q (Quantile-Quantile) Plot을 사용하여 데이터의 정규성을 판단하는 방법

개인정보

  • 티스토리 홈
  • 포럼
  • 로그인
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.