데이터 분석 입문기

[빅데이터 분석기사] – 1. 빅데이터 분석 기획: 빅데이터의 특징

터닝 2025. 5. 9. 23:39

안녕하세요! 😊
오늘은 빅데이터의 개념과 특징, 유형, 그리고 출현 배경에 대해 정리해보았습니다.
빅데이터 분석기사 자격증을 준비하시는 분들께 도움이 되시길 바랍니다!


💡 1. 빅데이터의 특징

📌 [빅데이터의 정의]

  • 빅데이터는 규모가 방대하고, 텍스트·이미지·사운드·비디오 등 다양한 형태로 존재하며, 실시간 혹은 거의 실시간으로 빠르게 생성되고 처리되는 데이터를 의미합니다.
  • 기존 데이터베이스 시스템으로는 처리하기 어려울 정도로 크고 복잡하며, 얻을 수 있는 가치 또한 매우 큽니다.

📌 [빅데이터의 특징: 3V → 4V → 7V]

  • 미국 Gartner의 Doug Laney가 2001년 제시
  • 빅데이터의 대표적 3가지 특징인 3V는 다음과 같습니다 (기출 문제)

1. 양(Volume) : 데이터의 규모
2. 다양성(Variety) : 데이터의 유형과 출처
3. 속도(Velocity) : 데이터의 수집과 처리 속도

  • 이후 개념 확장:
    • 4V: + 가치(Value) → 데이터를 통한 인사이트 확보
    • 7V: + 정확성(Veracity), 유효성(Validity), 휘발성(Volatility)

⚠️ 오답 주의: Variation(변이) ≠ 3V 구성 요소 아님


📌 [데이터 용량 단위] (기출 문제 – 순서 암기)

단위 이름 의미
KB 킬로바이트 2¹⁰ Byte
MB 메가바이트 2²⁰ Byte
GB 기가바이트 2³⁰ Byte
TB 테라바이트 2⁴⁰ Byte
PB 페타바이트 2⁵⁰ Byte
EB 엑사바이트 2⁶⁰ Byte
ZB 제타바이트 2⁷⁰ Byte 
YB 요타바이트 2⁸⁰ Byte
 

💡 2. 빅데이터의 유형

구분 기준: 다양성 (Variety)


🔹 1. 정형 데이터 (Structured Data)

  • 형태 있음 + 연산 가능
  • 행과 열 구조, 관계형 DB에서 사용
  • 📁 예시: RDBMS, 스프레드시트, CSV

🔹 2. 반정형 데이터 (Semi-structured Data)

  • 형태 있음(스키마, 메타데이터) + 연산 불가
  • 주로 파일 저장 방식
  • 📁 예시: XML, HTML, JSON, 로그

🔹 3. 비정형 데이터 (Unstructured Data)

  • 형태 없음 + 연산 불가
  • 주로 NoSQL에 저장
  • 📁 예시: 소셜 데이터, 이미지, 영상, 음성, 이메일, 텍스트

✅ 개념 정리

  • 스키마: 데이터 구조를 정의한 틀
  • 메타데이터: 데이터를 설명하는 데이터
  • NoSQL: 유연한 스키마, 대규모 분산 환경에 적합

💡 3. 빅데이터의 출현 배경

📌 [등장 배경]

  1. 산업계: 고객 데이터 축적
  2. 학계: 데이터 기반 과학 확산
  3. 기술 발전 요인
    • 디지털화 가속 (아날로그 → 디지털)
    • 저장 기술 발전 및 단가 하락
    • 인터넷 발전 → 양면시장 모델
    • 모바일 시대 도래 → GPS, 센서 등 데이터 폭증
    • 클라우드 컴퓨팅의 등장
      → 정보 수집의 확장, 처리 비용 절감
      → 예: 맵리듀스(MapReduce)

📌 [빅데이터의 기능적 비유]

비유 의미
🔧 석탄·철 산업 전반의 생산성 향상
21세기의 원유 새로운 산업 창출과 경제 성장
🔍 렌즈 Ngram Viewer 등 데이터 기반 분석도구
🧩 플랫폼 페이스북 등 제3자 활용 가능한 비즈니스 기반

📌 [데이터 처리 관점의 변화]

기존 관점 변화된 관점
사전처리 중심 사후처리 중심 (수집 중시)
표본조사 전수조사
데이터 질 데이터 양
인과관계 상관관계 중심 분석
 

📚 정리된 내용은 빅데이터 분석기사 자격증 대비데이터 분석 기초 학습에 유용하게 활용하실 수 있습니다.
궁금한 내용이 있으시다면 댓글 남겨주세요. 함께 공부해요!