[ADsP 미어캣 온라인 스터디 11기] Day 4 분석 기획과 분석 방법론 (88 ~ 107p)
·
자격증/ADsP
02 분석 과제 발굴분석과제 탐색 방법1. 하향식 접근법Top-Down, 체계적, 단계화 (분석대상 Known)하향식 접근법의 개념도문제 탐색 단계문제 정의 단계해결 방안 탐색 단계타당성 검토 단계2. 상향식 접근법Bottom-Up, 인사이트 (분석대상 Unknown)상향식 접근법의 개념도지도, 비지도 학습프로토타입 : 시행착오 해결법    분석과제 발굴 분석의 대상(What)KnownUn-Known분석의 방법(How)KnownOptimizationInsightUn-KnownSolutionDiscovery 디자인 씽킹DEO사상향식 접근법의 발산 단계 + 하향식 접근법의 수렴단계 (반복적, 상호보완적)수렴 발산을 반복하면서 혁신적 아이디어 도출스탠퍼드대학d.school비지니스, 기술, 인간 중심사고 -> ..
[ADsP 미어캣 온라인 스터디 11기] Day 3 분석 기획과 분석 방법론 (71 ~ 89p)
·
자격증/ADsP
01 분석 기획과 방법론분석대상과 그 방법에 따른 4가지 분석 주제 분석의 대상WhatKnownUnknown분석의 방법HowKnown최적화(Optimization)통찰력(Insight)Unknown해결책(Solution)발견(Discovery) 목표 시점별 분석 기획 당연한 분석 주제 해결(과제 단위)지속적 분석 문화 내재화(마스터플랜 단위)목적빠르게 해결하는 것이 목적지속적으로 해결하는 것이 목적1차 목표Speed & TestAccuracy & Deploy과제 유형Quick & WinLong Term View접근 방식Problem SolvingProblem Definition 분석기획시 고려사항1) 가용데이터 고려2) 적절한 활용 방안과 유스케이스의 탐색 : 유사 시나리오 및 솔루션 활용3) 장애요소에..
[ADsP 미어캣 온라인 스터디 11기] Day 2 데이터의 이해 (30 ~ 70p)
·
자격증/ADsP
02 데이터의 가치와 미래가치 산정의 어려움데이터 활용 방식누가, 언제, 어떻게, 어디서 활용하는지 알 수 없음가치 창출 방식기존에 없던 가치 창출분석 기술 발전오늘의 가치없는 데이터가 내일은 가치 있을 수 있음 빅데이터 활용 기본 테크닉연관 규칙 학습상관관계, 장바구니 분석유형분석범주, 어떤 집단에 속하는가?유전 알고리즘최적화가 필요한 문제기계학습 = 머신러닝규칙을 찾은 뒤 예측회귀분석독립변수 -> 종속변수감정분석 소셜 네트워크 분석오피니언 리더 위기 요인 통제 방안사생활 침해개인정보 사용자의 책임책임 원칙 훼손결과 기반 책임 원칙 고수데이터 오용알고리즘 접근 허용   03 데이터 사이언스와 전략 인사이트빅데이터 분석의 핵심은 'Big'이 아닌 '인사이트'걸림돌은 '비용'이 아닌 '분석적 방법과 성과에..
[ADsP 미어캣 온라인 스터디 11기] Day 1 데이터의 이해 (1 ~ 30p)
·
자격증/ADsP
01. 데이터와 정보1. 데이터의 정의 데이터의 특성존재적 특성있는 그대로의 객관적 사실당위적 특성추론, 예측, 전망, 추정을 위한 근거 데이터의 유형1) 정성적 데이터와 정량적 데이터정성적연어, 문자 등정량적수치, 도형, 기호 등 2) 정형 데이터와 비정형 데이터, 그리고 반정형 데이터정형정형화 된 틀 + 연산 가능비정형정형화 된 틀 X + 연산 불가능반정형형태 O + 연산 불가능 3) 암묵지와 형식지암묵지내면화개인이 보유한 경험과 지식을 요령이나 노하우로 고도화 시키는 과정공통화개인이 다른 개인이나 집단과의 공통적 지식을 생성하는 과정형식지표출화개인에 보유한 경험, 지식 등을 책이나 문서 등 외부로 표출하는 과정연결화개인이 보유한 경험과 외부의 지식을 연결하는 과정   2. 데이터와 정보DIKW피라미..
[SQLD] 유선배 SQL 개발자 1.2 오답노트 및 개념정리
·
자격증/SQLD
정규화(Normalization)데이터 정합성(데이터의 정확성과 일관성을 유지하고 보장)을 위해 엔터티를 작은 단위로 분리하는 과정.(1) 제1정규형 : 모든 속성은 반드시 하나의 값만 가져야 한다.원자값이 아닌 도메인을 분해한다.(2) 제2정규형 : 엔터티의 모든 일반속성은 반드시 모든 주식별자에 종속되어야 한다. 주식별자가 단일식별자가 아닌 복합식별자인 경우 일반속성이 주식별자의 일부에만 종속될 수 있는데 이런 경우 데이터 이상 현상 발생할 수 있다. (입력 이상 현상, 수정 이상 현상)부분 함수 종속성을 제거한다.(3) 제3정규형 : 주식별자가 아닌 모든 속성 간에는 서로 종속될 수 없다.이행 함수 종속성을 제거한다. 이행 함수 종속성이란 컬럼 A가 컬럼 B를 결정하고, 컬럼 B가 컬럼 C를 결정..
[ADsP] 3사분위수를 구하는 방법과 이해하기 쉬운 예제
·
자격증/ADsP
3사분위수란?3사분위수는 데이터를 오름차순으로 정렬했을 때, 75%의 데이터가 그 값 이하에 위치하는 점이다. 이는 데이터를 4등분했을 때 상위 25%를 제외한 값의 경계점이라고도 할 수 있다. 3사분위수 위치를 구하는 공식데이터의 위치를 구할 때는 다음 공식을 사용한다.(n−1) × p + 1n: 데이터의 개수p: 백분위수 (3사분위수에서는 p = 0.75)1을 더하는 이유는 데이터 위치를 1부터 세기 때문 예제로 이해하기오름차순으로 정렬된 데이터 2,3,3,3,5,8데이터 개수 n = 6, 백분위수 p = 0.75위치 계산위치 = (6−1) × 0.75+1 = 4.75위치4.75번째 위치는 4번째 값과 5번째 값 사이에 있다.선형 보간법으로 값 구하기4번째 값 = 3, 5번째 값 = 53 + (5−3..