반응형
01. 데이터와 정보
1. 데이터의 정의
데이터의 특성
존재적 특성 | 있는 그대로의 객관적 사실 |
당위적 특성 | 추론, 예측, 전망, 추정을 위한 근거 |
데이터의 유형
1) 정성적 데이터와 정량적 데이터
정성적 | 연어, 문자 등 |
정량적 | 수치, 도형, 기호 등 |
2) 정형 데이터와 비정형 데이터, 그리고 반정형 데이터
정형 | 정형화 된 틀 + 연산 가능 |
비정형 | 정형화 된 틀 X + 연산 불가능 |
반정형 | 형태 O + 연산 불가능 |
3) 암묵지와 형식지
암묵지 | 내면화 | 개인이 보유한 경험과 지식을 요령이나 노하우로 고도화 시키는 과정 |
공통화 | 개인이 다른 개인이나 집단과의 공통적 지식을 생성하는 과정 | |
형식지 | 표출화 | 개인에 보유한 경험, 지식 등을 책이나 문서 등 외부로 표출하는 과정 |
연결화 | 개인이 보유한 경험과 외부의 지식을 연결하는 과정 |
2. 데이터와 정보
DIKW피라미드
지혜 (Wisdom) | 창의적 산물 |
지식 (Knowledge) | 경험과 결합 |
정보 (Information) | 의미 도출 |
데이터 (Data) | 객관적 사실 |
데이터 단위
bit < byte < KB < GB < TB < PB < EB < ZB < YB
02. 데이터베이스
1. 데이터베이스 개요
데이터베이스 정의
DB | 정보의 집합체 |
DBMS | DB를 구축, 유지할 수 있게 하는 관리 소프트웨어 |
일반적인 특징
통합된 데이터 | 중복X |
저장된 데이터 | 컴퓨터가 접근가능한 저장 매체에 저장 |
공용 데이터 | 여러 사용자가 공유 |
변화하는 데이터 | 항상 최신의 데이터 |
다양한 측면에서의 특성
정보의 축적 및 전달 측면 | 기계 가독성, 검색 가능성, 원격 조작성 |
정보이용 측면 | |
정보관리 측면 | |
정보기술발전 측면 | |
경제 산업적 측면 | |
데이터 트랜젝션 특성 | 원자성, 일관성, 고립성, 지속성 |
2. 데이터베이스 활용
기업 내부의 데이터베이스
OLTP | Online Transaciton Processing 기업 영역별로 구축되던 단순 자동화 중심의 서비스 |
OLAP | Online Analytical Processing '분석'이 중심이 되는 시스템 구축 |
KMS | Knowledge Management System 지식 경영 시스템 |
CRM | Customer Relationship Management |
SCM | Supply Chain Managemont |
ERP | Enterprise Resource Planning 자원에 대한 통합 관리 |
BI | Business Inteligence 기업의 의사결정 프로세스 |
RTE | Real time Enterprise 신속 대응이 가능한 스피드 경영 |
사회기반구조 데이터 베이스
물류 | PORT-MIS : 항만운영정보시스템 KROIS : 철도운영정보시스템 |
지리 | GIS(Geographic Information System) : 지리정보시스템 |
교통 | |
의료 | |
교육 |
데이터베이스 종류
관계형 데이터베이스 RDB | Oracle, MySQL, MS-SQL, DB2 informix(IBM), MariaDB, Derby, SQLite(오픈소스) |
NoSQL |
데이터 웨어하우스 : 총제적 관점에서 공통의 형식으로 변환해 관리
데이터 마트 : 데이터 웨어하우스로부터 추출된 작은 데이터베이스로서 특정 목표를 달성하는데 필요한 데이터 제공
01. 빅데이터의 이해
빅데이터의 특징
더그 래니의 3V | 양 (Volume) |
유형 (Variety) | |
생성 및 속도 (Velosity) | |
새로운 특징 4V | Value(가치) or Veracity(정확성) |
빅데이터의 출현 배경
데이터의 양적 증가 | |
산업계의 변화 | 양질 전환의 법칙 (양적인 변화가 축적되면 질적인 변화도 이루어진다는 개념) |
학계의 변화 | |
관련 기술의 발전 | 클라우드 컴퓨팅 (빅데이터 처리비용을 획기적으로 낮춤) |
빅데이터의 기능
산업혁명의 석탄, 철 | |
21세기 원유 | |
렌즈 | 현미경처럼 산업 발전에 큰 영향을 줄 것 |
플랫폼 | 공동 활용의 목적으로 구축된 유무형 구조물 다양한 서드파티 비즈니스에 활용될 것 |
빅데이터가 만들어내는 변화
사전처리 → 사후처리 |
표본조사 → 전수조사 |
질 → 양 |
인과관계 → 상관관계 |
[오늘의 퀴즈]
고정된 틀이 존재하지 않고 연산이 불가능하며, 수집과 관리가 어려워 일반적으로 관계형 DB가 아닌 NoSQL DB에 저장되는 데이터는 무엇인가요?
비정형 데이터
반응형
'자격증 > ADsP' 카테고리의 다른 글
[ADsP 미어캣 온라인 스터디 11기] Day 4 분석 기획과 분석 방법론 (88 ~ 107p) (1) | 2025.01.30 |
---|---|
[ADsP 미어캣 온라인 스터디 11기] Day 3 분석 기획과 분석 방법론 (71 ~ 89p) (0) | 2025.01.29 |
[ADsP 미어캣 온라인 스터디 11기] Day 2 데이터의 이해 (30 ~ 70p) (0) | 2025.01.28 |
[ADsP] 3사분위수를 구하는 방법과 이해하기 쉬운 예제 (0) | 2025.01.24 |
[ADsP] 데이터분석 준전문가 시험일정 및 원서접수방법 (0) | 2025.01.20 |