01. 데이터와 정보
데이터(Data) 란 무엇일까요?
데이터(Data)는 현실 세계에서 관찰(Observation)하거나 측정(Measurement)해서 얻은 객관적인 사실(Fact)입니다.
아직 해석이나 판단이 들어가지 않은 원시 자료(Raw Data)라고 보시면 됩니다.
예시
- 오늘 기온이 25도이다
- 노트북 가격이 100만 원이다
- 시험 점수가 85점이다
TIP💡
이 단계에서는 “비싸다”, “싸다”, “좋다” 같은 판단은 없습니다.
단순한 사실 정보일 뿐입니다.
데이터의 특징
이미지에 나온 데이터의 특징은 다음과 같습니다.
- 객관성(Objectivity) : 개인의 의견이 아니라 사실 기반
- 가치성(Value) : 단독으로도 의미가 있음
- 상관성(Relationship) : 다른 데이터와 결합될 때 더 큰 의미 발생
- 의사결정의 근거(Basis for Decision-making)
TIP💡
즉, 데이터는 생각의 출발점이라고 보시면 됩니다.
정보(Information)란?
정보(Information)는 데이터를 가공(Processing)하거나 분석(Analysis)하여 의미를 부여한 결과입니다.
예시
예시
- 온라인 쇼핑몰 노트북 가격: 100만 원
- 오프라인 매장 노트북 가격: 150만 원
TIP💡
“온라인이 더 저렴하다”
→ 이 문장은 데이터가 아니라 정보입니다.
왜냐하면 비교 분석을 통해 의미가 만들어졌기 때문입니다.
02. 데이터의 구분
| 정량적 데이터 (Quantitative Data) | 정성적 데이터 (Qualitative Data) |
|
|
|
|
TIP💡
시험에서는 숫자냐 / 글자냐로 먼저 구분하시면 됩니다.
03. 데이터베이스(Database)
데이터베이스란?
데이터베이스(Database)는 데이터를 체계적으로 저장·관리하는 시스템화된 집합체입니다.
여러 사용자가 동시에 접근해도 안정적으로 사용할 수 있도록 설계됩니다.
예시
- 학교 성적 관리 시스템
- 쇼핑몰 회원 정보 시스템
데이터베이스의 특징
이미지에 나온 핵심 특징을 정리하면 다음과 같습니다.
- 통합성(Integrated Data)
→ 데이터 중복을 최소화합니다. - 저장성(Stored Data)
→ 컴퓨터 저장 장치에 보관됩니다. - 공유성(Shared Data)
→ 여러 사용자가 공동 이용합니다. - 변화성(Changed Data)
→ 최신 상태로 지속적으로 갱신(Update)됩니다.
TIP💡
시험에서는 이 4가지를 키워드 그대로 묻는 문제가 자주 나옵니다.
04. 데이터베이스의 활용
| OLTP (Online Transaction Processing) | OLAP (Online Analytical Processing) |
| OLTP는 온라인 트랜잭션 처리 시스템 현재 발생하는 거래(Transaction)를 실시간으로 처리 |
OLAP는 온라인 분석 처리 시스템 과거 데이터를 포함하여 다차원 분석(Multi-dimensional Analysis)을 수행 |
|
|
|
|
TIP💡
OLTP vs OLAP 한눈 정리
- OLTP → “ 실시간 처리”
- OLAP → “ 석 및 의사결정 ”
05. 빅데이터 개요
빅데이터(Big Data)란?
빅데이터는 기존의 데이터 처리 방식으로는 관리·분석이 어려운 대규모(Volume) 데이터 집합을 의미합니다.
특징
- 3V : Volume,Velocity,Variety
- Volume (규모) : 데이터의 양이 방대함
- Velocity (속도) : 데이터의 생성 및 처리 속도가 빠름
- Variety (다양성) : 데이터의 형태가 다양함
- 5V : 3V + Veracity, Value
- Veracity (신뢰성) : 데이터가 가지는 신뢰도 및 품질
- Value (가치) : 데이터를 통해 창출할 수 있는 가치
(정확성, 신뢰성과 관련됨)
- 7V : 5V + Validity, Volatility
- Validity (유효성) : 데이터가 가지는 유효성 및 정확성
- Volatility (휘발성) : 데이터가 의미를 가지는 기간
(장기적인 관점에서 유용한 가치를 창출해야 함)
Byte 크기비교(KMGTPEZY)
- KB<MB<GB< TB<PB<EB<ZB<YB
- 킬로<메가<기가<테라<페타<엑사<제타<요타\
- 테라바이트=10^12바이트
예시
- SNS 게시글
- 유튜브 영상과 댓글
- 스마트폰 위치 데이터
06. 데이터 웨어하우스 (DW)
데이터 웨어하우스란?
데이터 웨어하우스(Data Warehouse)는
기업의 의사결정을 지원하기 위해 데이터를 통합·저장한 분석 전용 데이터베이스입니다.
핵심 포인트
- 분석 목적
- 일정 기간 데이터 축적
- 의사결정 지원
데이터 웨어하우스의 특징
이미지에 나온 4가지는 꼭 기억하셔야 합니다.
- 주제지향성(Subject-oriented)
→ 고객, 상품 등 특정 주제 중심 구성 - 통합성(Integration)
→ 여러 시스템의 데이터를 통합 - 시계열성(Time-variant)
→ 시간 흐름을 반영 - 비휘발성(Non-volatility)
→ 저장 후 변경되지 않음
TIP💡
시험에서 가장 자주 나오는 부분입니다.
07. 데이터의 유형
정형 데이터 |
반정형 데이터 |
비정형 데이터 |
|
|
|
|
|
|
08. 데이터의 근원에 따른 분류
| 가역 데이터 | 불가역 데이터 |
|
|
09. 암묵지와 형식지
| 암묵지 | 형식지 |
|
|
10. 지식창조 메커니즘 (SECI)

TIP💡
공 → 표 → 연 → 내
- 공통화(Socialization)
- 표출화(Externalization)
- 연결화(Combination)
- 내면화(Internalization)
이 순서 그대로 외우시면 됩니다.
11. DIKW 피라미드
- Data(데이터) : 객관적 사실 / 순수한 수치나 기호
- Information(정보) : 데이터 가공및 처리 -> 연관관계&의미 도출 데이터
- Knowledge(지식) : 정보 구조화 -> 분류&일반화 -> 결과물, 규칠
- Wisdom(지혜) : 근본 원리에 댛란 깊은 이해를 바탕으로 도출되는 창의적 아이디어/ 상황, 맥락에 맞게 규칙을 적용하는 요소
}