[ADsP 미어캣 온라인 스터디 11기] Day 13 시계열 분석
·
자격증/ADsP
시계열 분석일정 시간 간격으로 기록된 자료들에 대하여 특성을 파악하고 미래를 예측하는 분석방법 자기상관성자기상관계수시간의 흐름, not 시점시차증가시 감소부분자기상관계수특정 요소 배제특정 시점 이후 급격히 감소서로 이웃하는 자료들끼리 일종의 상관관계를 가진다는 뜻배부분의 시계열 자료는 자기상관성을 가져서 공분산은 '0'이 아님상관성을 나타내는 것 : 공분산상관성 정도는 나타내는 것 : 상관계수 자료비정상성 시계열 자료(일반적)시계열 분석을 수행하려면 정상성 자료로 변환해야 함!정상성 시계열 자료 정상성 조건1) 일정한 평균모든 시점에 대하여 평균이 일정해야 함차분을 통해 정상화한 시점의 자료 값에서 전 시점의 자료 값을 빼는 것2) 일정한 분산모든 시점에 대하여 분산이 일정해야 함변환을 통해 정상화자료 ..
[ADsP 미어캣 온라인 스터디 11기] Day 12 3과목 다변량 분석
·
자격증/ADsP
다차원 척도법(Multidimensional Scaling, MDS)낮은 차원의 공간에 근접성을 시각화하는 통계기법데이터축소목적측도 : stress 척도 (0~1 : 낮을수록 적합도가 높다) 다차원 척도법의 종류계량적 MDS비계량적 MDS구간척도, 비율척도서열척도유클라디안 거리 행렬서열척도를 거리속성값으로 변환하여 사용R에서 'cmdscale' 함수 사용R에서 'isoMDS' 함수 사용   주성분분석(PCA)서로 상관성 높은 변수를 하나의 새로운 변수(주성분)를 만듦 주성분분석의 목적변수축소로 모형의 설명력을 높임다중공선성 문제 해결군집분석 시 모형의 성능을 높일 수 있음IoT센서 데이터를 주성분분석 후 스마트팩토리에 활용주성분분석 시 선형변환 필요 평균 고윳값 방법고윳값들의 평균을 구한 뒤 고윳값이 평..
[ADsP 미어캣 온라인 스터디 11기] Day 11 3과목 회귀분석
·
자격증/ADsP
회귀분석하나 이상의 독립변수들이 종속변수에 얼마나 영향을 미치는지 추정독립변수 1개 : 단순선형회귀분석독립변수 2개 이상 : 다중선형회귀분석기본적으로 연속형 변수일 때 사용범주형일 경우 로지스틱 회귀분석 사용 회귀분석의 종류종류모형단순회귀1개의 독립변수와 반응변수가 직선(선형) 관계다중회귀K개의 독립변수와 반응변수가 선형 관계다항회귀K개의 독립변수와 반응변수가 2차함수 이상의 관계비선형회귀회귀식이 미지의 모수들과 선형관계가 아닌 경우 회귀분석의 가정선형성독립변수와 종속변수가 선형적독립성단순회귀분석에서 잔차와 독립변수 값이 서로 독립다중회귀분석의 경우 독립변수들 간에 상관성이 없이 독립등분산성잔차의 중심에서 분산이 같아야 한다.정규성잔차항이 정규분포 형태를 띠는 것 단순선형회귀분석독립변수와 종속변수가 1개..
[ADsP 미어캣 온라인 스터디 11기] Day 10 3과목 기초통계
·
자격증/ADsP
기초통계 t-검정일 표본 t-검정 (one sample t-test)가설 검정의 일정으로 하나의 모집단의 평균(n)값을 특정값과 비교하는 경우 사용하는 통계적 분석 방법일 표본 단측 t-검정less/greater(방향성O)ex) alternative = 'greater'일 표본 양측 t-검정(일반적)~이다(방향성X)ex) alternative = 'two.sided' 일 표본 단측 t-검정 일 표본 양측 t-검정   이(독립)표본 t검정 (independent sample t-test)서로 독립적인 두 개의 집단에 대하여 모수의 값이 같은 값을 갖는지 통계적으로 검정하는 방법두 모집단의 분산이 같음을 의미하는 등분산성을 만족해야 함 -> F검정을 먼저 수행이 표본 단측 t-검정less/greater(방향..
[ADsP 미어캣 온라인 스터디 11기] Day 9 3과목 2장 통계분석
·
자격증/ADsP
통계의 이해통계 분석 : 특정 집단을 대상으로 자료를 수집하여 대상집단에 대한 정보를 구하고, 적절한 통계 분석 방법을 이용하여 의사결정(통계적 추론)을 하는 과정표본조사표본집단을 선별 모집단신뢰수준 : ex) 95% : 100번 조사시 동일한 결과가 95번오차범위 : 결과값에 대한 오차범위% : 100을 기준으로 할 때 차지하는 비율%포인트 : 퍼센트간 차이 표본추출방법단순랜덤추출법 : N개의 모집단에서 n개의 데이터를 무작위로 추출계통 추출법 : 모집단의 원소에 차례대로 번호를 부여한 뒤 일정한 간격을 두고 데이터를 추출하는 방법집락(군집:Cluster)추출법 : 여러 집락으로 구분한 뒤, 단순랜덤추출법에 의하여 선택된 집락의 데이터를 표본으로 사용, 각 집단은 동질적/집락 내 데이터는 이질적층화 ..
[ADsP 미어캣 온라인 스터디 11기] Day 8 3과목 데이터 마트
·
자격증/ADsP
데이터마트의 이해데이터마트데이터 웨어하우스로부터 특정 사용자가 관심을 갖는 데이터들을 주제별, 부서별로 추출하여 모은 비교적 작은 규모의 데이터 웨어하우스 데이터 전처리데이터 정제 : 결측값과 이상값을 처리분석 변수를 처리 : 변수 선택, 차원 축소, 파생변수 생성 등 데이터 마트 개발을 위한 R 패키지 활용reshape 패키지20개에 가까운 함수 보유melt() : 데이터를 특정 변수를 기준으로 녹여서 나머지 변수에 대한 세분화된 데이터를 만들 수 있다.cast() : melt에 의해 녹은 데이터를 요약을 위해 새롭게 가공할 수 있게 도와준다.cast(melt저장값, 열값, 계산)sqld 패키지표준 SQL문장을 활용하여 R에서 데이터프레임을 다루는 것을 가능하게 해주는 패키지plyr 패키지apply 함..
Q-Q (Quantile-Quantile) Plot을 사용하여 데이터의 정규성을 판단하는 방법
·
자격증/ADsP
Q-Q Plot이란?Q-Q Plot은 데이터의 분포가 특정한 이론적 분포(예: 정규분포)를 따르는지 시각적으로 확인하는 도구입니다.X축: 이론적 분포(정규분포)의 분위수Y축: 실제 데이터의 분위수데이터가 정규성을 만족하면 점들이 대각선(45도 직선)을 따라 배치됩니다.  Q-Q Plot에서 정규성을 확인하는 방법점들이 45도 직선을 따를 때데이터가 정규성을 만족함.작은 편차는 허용되지만 전체적으로 직선에 근접해야 함.잔차가 오른쪽으로 상승하는 경우 (비대칭성 존재)오류: 잔차가 오른쪽(상위 분위수)으로 상승하는 형태를 띠면 정규성을 만족한다고 볼 수 없음.해석: 데이터가 오른쪽 긴 꼬리를 가지는 분포(우측 비대칭, 오른쪽 왜도)일 가능성이 큼.잔차가 아래쪽이나 위쪽으로 크게 벗어나는 경우아래쪽(왼쪽 꼬리..
사출성형 생산 관리자가 알아야 할 실전 지식
·
study/플라스틱사출
사출성형 생산 관리자가 알아야 할 실전 지식 플라스틱(plastic)은 열 또는 압력을 가해 성형 가능한 유기물 기반 고분자 물질 및 그 혼합물을 의미합니다.이 용어는 그리스어 plastikos와 라틴어 plasticus에서 유래하였으며, '성형할 수 있는, 거푸집으로 조형 가능한'이라는 뜻을 담고 있습니다. 일반적으로 합성수지(resin)와 혼용하여 사용되며, 그 활용도는 매우 광범위합니다.플라스틱 성형은 사출성형, 압출성형, 압축성형, 블로우 성형 등 다양한 방식이 존재하며, 자동차, 휴대폰, 가전제품, 화장품, 생활용품 등 현대 사회의 거의 모든 산업에서 필수적으로 사용되고 있습니다.이 포스팅에서는 사출성형 관리자가 알아야 할 핵심 지식과 실전 팁을 정리했습니다. 이를 통해 생산 효율을 높이고 불량..
[ADsP 미어캣 온라인 스터디 11기] Day 7 R기초와 데이터 마트
·
자격증/ADsP
Chapter01 빅데이터와 R [혼공R이] 1주차_작업환경이 이뻐야 공부도 잘 되는 법자유를 꿈꾸는 직대딩의 일상기록sarakyeon.blogspot.comChapter02 데이터 분석을 위한 기본 다지기 [혼공R이] 2주차_게더타운으로 외로움을 달래며 손코딩자유를 꿈꾸는 직대딩의 일상기록sarakyeon.blogspot.comChapter03 R 프로그래밍 익히기 [혼공R이] 3주차_바쁘다 바빠 현대사회자유를 꿈꾸는 직대딩의 일상기록sarakyeon.blogspot.comChapter04 데이터 다루기 [혼공R이] 4주차_구정 연휴에 몰아서 다 끝내버릴 수 있을까?자유를 꿈꾸는 직대딩의 일상기록sarakyeon.blogspot.comChapter05 데이터 가공하기 [혼공R이] 5주차_연휴삭제의 시점..