ADsP(빅데이터분석기사)/필기

[ADsP] 빅데이터의 개요 및 활용 한눈 정리|데이터부터 빅데이터 조직까지 쉽게 이해하기

천재단미 2026. 2. 11. 09:42
728x90
반응형

 

 

 

 

01. 데이터와 정보

데이터(Data) 란 무엇일까요?

데이터(Data)는 현실 세계에서 관찰(Observation)하거나 측정(Measurement)해서 얻은 객관적인 사실(Fact)입니다.
아직 해석이나 판단이 들어가지 않은 원시 자료(Raw Data)라고 보시면 됩니다.

 

예시

  • 오늘 기온이 25도이다
  • 노트북 가격이 100만 원이다
  • 시험 점수가 85점이다

  TIP💡 

 

이 단계에서는 “비싸다”, “싸다”, “좋다” 같은 판단은 없습니다.
단순한 사실 정보일 뿐입니다.


 

데이터의 특징

이미지에 나온 데이터의 특징은 다음과 같습니다.

  • 객관성(Objectivity) : 개인의 의견이 아니라 사실 기반
  • 가치성(Value) : 단독으로도 의미가 있음
  • 상관성(Relationship) : 다른 데이터와 결합될 때 더 큰 의미 발생
  • 의사결정의 근거(Basis for Decision-making)

  TIP💡 

 

즉, 데이터는 생각의 출발점이라고 보시면 됩니다.


 

정보(Information)란?

정보(Information)는 데이터를 가공(Processing)하거나 분석(Analysis)하여 의미를 부여한 결과입니다.

 

예시

 

예시

  • 온라인 쇼핑몰 노트북 가격: 100만 원
  • 오프라인 매장 노트북 가격: 150만 원

  TIP💡 

 “온라인이 더 저렴하다”

                                 → 이 문장은 데이터가 아니라 정보입니다.
                                      왜냐하면 비교 분석을 통해 의미가 만들어졌기 때문입니다.


02. 데이터의 구분

정량적 데이터 (Quantitative Data) 정성적 데이터 (Qualitative Data)
  • 숫자(Number)로 표현
  • 객관적 측정 결과
  • 통계 분석 가능
  • 문자(Text)나 언어(Language)로 표현
  • 의미 해석이 필요
  • 주관적 요소 포함
  • 속도 100km/h
  • 매출액 3억 원
  • 시험 점수 90점
  • “시험이 어려웠다”
  • “이 상품은 만족스럽다”

 

 

 

  TIP💡 

 

시험에서는 숫자냐 / 글자냐로 먼저 구분하시면 됩니다.


03. 데이터베이스(Database)

 데이터베이스란?

데이터베이스(Database)는 데이터를 체계적으로 저장·관리하는 시스템화된 집합체입니다.
여러 사용자가 동시에 접근해도 안정적으로 사용할 수 있도록 설계됩니다.

 

예시

  • 학교 성적 관리 시스템
  • 쇼핑몰 회원 정보 시스템

 데이터베이스의 특징

이미지에 나온 핵심 특징을 정리하면 다음과 같습니다.

  1. 통합성(Integrated Data)
    → 데이터 중복을 최소화합니다.
  2. 저장성(Stored Data)
    → 컴퓨터 저장 장치에 보관됩니다.
  3. 공유성(Shared Data)
    → 여러 사용자가 공동 이용합니다.
  4. 변화성(Changed Data)
    → 최신 상태로 지속적으로 갱신(Update)됩니다.

 

  TIP💡 

 

시험에서는 이 4가지를 키워드 그대로 묻는 문제가 자주 나옵니다.


04. 데이터베이스의 활용

 OLTP (Online Transaction Processing)  OLAP (Online Analytical Processing)
OLTP는 온라인 트랜잭션 처리 시스템
현재 발생하는 거래(Transaction)를 실시간으로 처리
OLAP는 온라인 분석 처리 시스템
과거 데이터를 포함하여 다차원 분석(Multi-dimensional Analysis)을 수행
  • 현재 시점의 데이터 처리
  • 빠른 응답 속도
  • 트랜잭션 중심
  • 과거 데이터 포함
  • 다차원 분석
  • 의사결정 지원
  • 은행 송금
  • 온라인 주문
  • 결제 처리
  • 매출 추이 분석
  • 구매 패턴 분석

 

 

  TIP💡 

OLTP vs OLAP 한눈 정리

  • OLTP → “ 실시간 처리”
  • OLAP → “ 석 및 의사결정 ”

05. 빅데이터 개요

빅데이터(Big Data)란?

빅데이터는 기존의 데이터 처리 방식으로는 관리·분석이 어려운 대규모(Volume) 데이터 집합을 의미합니다.

 

특징

  • 3V : Volume,Velocity,Variety
    • Volume (규모) : 데이터의 양이 방대함
    • Velocity (속도) : 데이터의 생성 및 처리 속도가 빠름
    • Variety (다양성) : 데이터의 형태가 다양함
  • 5V : 3V + Veracity, Value
    • Veracity (신뢰성) : 데이터가 가지는 신뢰도 및 품질
    • Value (가치) : 데이터를 통해 창출할 수 있는 가치
      (정확성, 신뢰성과 관련됨)
  • 7V : 5V + Validity, Volatility
    • Validity (유효성) : 데이터가 가지는 유효성 및 정확성
    • Volatility (휘발성) : 데이터가 의미를 가지는 기간
      (장기적인 관점에서 유용한 가치를 창출해야 함)

 

 

Byte 크기비교(KMGTPEZY)

  • KB<MB<GB< TB<PB<EB<ZB<YB
  • 킬로<메가<기가<테라<페타<엑사<제타<요타\
  • 테라바이트=10^12바이트

 

 

예시

  • SNS 게시글
  • 유튜브 영상과 댓글
  • 스마트폰 위치 데이터

06. 데이터 웨어하우스 (DW)

데이터 웨어하우스란?

데이터 웨어하우스(Data Warehouse)는
기업의 의사결정을 지원하기 위해 데이터를 통합·저장한 분석 전용 데이터베이스입니다.

 

 

핵심 포인트 

 

  • 분석 목적
  • 일정 기간 데이터 축적
  • 의사결정 지원

 데이터 웨어하우스의 특징

 

이미지에 나온 4가지는 꼭 기억하셔야 합니다.

  1. 주제지향성(Subject-oriented)
    → 고객, 상품 등 특정 주제 중심 구성
  2. 통합성(Integration)
    → 여러 시스템의 데이터를 통합
  3. 시계열성(Time-variant)
    → 시간 흐름을 반영
  4. 비휘발성(Non-volatility)
    → 저장 후 변경되지 않음

 

  TIP💡 

시험에서 가장 자주 나오는 부분입니다.


07. 데이터의 유형

 

정형 데이터

반정형 데이터

비정형 데이터

  • 구조가 명확
  • 연산 가능
  • 구조는 있으나 유연
  • 구조 없음
  • 연산 불가능
  • 테이블 형태 데이터
  • JSON
  • XML
  • 이미지
  • 영상
  • 음성

 

 

08. 데이터의 근원에 따른 분류

가역 데이터  불가역 데이터
  • 원본으로 환원 가능
  • 원본과 1:1 관계
  • 원본으로 환원 불가
  • 가공된 결과 데이터

 


09. 암묵지와 형식지

 암묵지 형식지
  • 경험 기반
  • 표현·공유 어려움
  • 문서화 가능
  • 공유 쉬움

 


10. 지식창조 메커니즘 (SECI)

 

 

  TIP💡 

공 → 표 → 연 → 내

 

  • 공통화(Socialization)
  • 표출화(Externalization)
  • 연결화(Combination)
  • 내면화(Internalization)


이 순서 그대로 외우시면 됩니다.

 


11. DIKW 피라미드

 
데이터 → 정보 → 지식 → 지혜
  • Data(데이터) : 객관적 사실 / 순수한 수치나 기호
  • Information(정보) : 데이터 가공및 처리 -> 연관관계&의미 도출 데이터
  • Knowledge(지식) : 정보 구조화 -> 분류&일반화 -> 결과물, 규칠
  • Wisdom(지혜) : 근본 원리에 댛란 깊은 이해를 바탕으로 도출되는 창의적 아이디어/ 상황, 맥락에 맞게 규칙을 적용하는 요소 
728x90
반응형
home top bottom
}