본문 바로가기
✏️ 방송통신대학교 컴퓨터과학과/1학년) 유비쿼터스 컴퓨팅 개론

📘 유비쿼터스 컴퓨팅개론 14강. 빅데이터, 데이터 속에서 미래를 읽다

by minheestory 2025. 5. 10.

1. 빅데이터란?

빅데이터(Big Data)는 단순히 ‘큰 데이터’가 아니라, 정형·비정형 데이터를 포함한 다양한 대규모 데이터 집합입니다.
이 데이터를 분석하면, 패턴과 경향을 예측해 미래에 대비할 수 있어요.

📌 하루에 생성되는 데이터: 약 2.5엑사바이트(2.5EB)

 

📦 빅데이터의 대표 기술

하둡(Hadoop) 오픈소스 기반 분산 저장/처리 자바 기반, 안정성↑ 속도↓
스파크(Spark) 실시간 데이터 처리 가능 속도↑, 비용↑, 메모리 기반
NoSQL 유연한 데이터 저장 방식 몽고DB 등 (비정형 데이터 적합)
 

🔍 데이터 유형

정형 데이터 구조화된 테이블 형식 엑셀, DB
반정형 데이터 일부만 구조화 HTML, JSON, 이메일
비정형 데이터 형식 없음 텍스트, 사진, 영상
 

📊 빅데이터 특징 (3V 볼륨, 속도, 다양성 →  5V  + 정확성, 가치)

Volume 볼륨 데이터의 양 (엑사~제타바이트)
Velocity 속도 생성·처리 속도
Variety 다양성 다양한 데이터 형식
Veracity 정확성 데이터의 정확성
Value 가치 데이터로부터 얻는 가치
 

2. 빅데이터 분석 과정

수집 웹 로그, 센서, SNS 등에서 다양한 데이터 수집
적재 하둡, NoSQL 등에 저장 (영구/임시)
처리 정제, 정규화 (ex: '둘' → 2)
분석 패턴, 경향 분석 → 예측, 의사결정 지원
 

🏭 응용 사례

제조 불량품 감지, 재고 관리, 유지보수 최적화
유통 고객 행동 분석, 맞춤형 마케팅
의료 질병 예측, 진단 보조
금융 이상거래 탐지, 리스크 분석
AI 학습용 데이터 제공, 모델 성능 향상
 

예: 카카오페이는 사용자의 결제 패턴 분석 → 맞춤형 광고 제공

 

🧾 전통 DB vs 빅데이터

구분 전통 DB 빅데이터
목적 정확한 트랜잭션 처리 패턴 분석 및 예측
데이터 정형 데이터 중심 비정형 + 반정형 포함
구조 스키마 기반 유연한 구조, 동적 확장 가능

 

 

3. 빅데이터의 개인정보 이슈

비식별화 개인정보 일부를 가림 010-****-1234
재식별화 가려진 정보 유추 가능 이름+주소 조합으로 추측
 

📌 데이터 보호 기술 + 정책적 관리 필요!

 

✏️ 마무리 요약

  • 빅데이터는 단순히 큰 데이터가 아니라 ‘가치 있는 정보’로 바꾸는 기술
  • 다양한 산업에서 비용 절감, 문제 예측, 고객 분석에 활용
  • 개인정보 보호와 윤리적 책임도 함께 고려해야 함