Notice
Recent Posts
Recent Comments
Link
«   2025/07   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
Tags more
Archives
Today
Total
관리 메뉴

헤맨 만큼 내 땅

데이터 시각화 본문

카테고리 없음

데이터 시각화

Ddani_ng 2025. 6. 8. 17:28

❗ 데이터 시각화의 목적을 살펴보고, 데이터 시각화 방법에 대해 학습한다.

1. 데이터 시각화 목적

❗ **커뮤니케이션**

데이터 시각화는 단순히 데이터를 보여주는 것이 아니라, 데이터를 기반으로 의미 있는 메시지를 전달하는 것

 

- **복잡한 데이터를 쉽게 전달** : 숫자나 텍스트보다 시각적 자료가 직관적으로 정보를 전달

- **데이터 기반 의사결정을 촉진** : 데이터에 대한 신뢰도를 높이고 논리적인 결론을 도출

- **이해 관계자 설득** : 경영진, 투자자, 팀원 등 다양한 청중에게 의사결정을 유도.

 

데이터 시각화는 단순한 그래프 제작이 아니라, 데이터를 **명확하고 직관적으로 전달하는 과정**입니다. 이를 통해 조직 내에서 효과적인 의사결정이 가능해지고, 데이터 기반 전략이 강화됩니다.

 

따라서 **목적에 맞는 시각화 방법을 선택하는 것이 가장 중요**

 


 

2. 데이터 시각화 유형

1. 시계열 비교

❗ **시간에 따른 데이터 변화**를 분석하는 방법

 

**📊 주요 시각화

- **꺾은선 그래프(기본)**
- **영역 차트** → 변화량을 강조하여 시각적 효과 극대화
- **막대 그래프** → 특정 기간별(연도별, 월별) 데이터 비교

 

**🔍 예시**

- **연도별 매출 변화 분석** → 기업의 연간 매출 데이터를 꺾은선 그래프로 시각화

- **날씨 변화 분석** → 1년 동안의 일별 평균 기온을 선 그래프로 표현

- **웹사이트 방문자 수 변화** → 월별 사용자 수 변화 추이를 분석

 

 

2. 속성 비교

❗ **여러 그룹이나 범주(카테고리) 간 차이를 분석하는 방법**

서로 다른 항목들이 **어떻게 다르고, 어느 것이 더 크거나 작은지**를 비교

**📊 주요 시각화 기법**
- **막대 그래프 (기본)**
- **파이(원) 차트** → 전체 중에서 특정 항목이 차지하는 비율 확인
- **히트맵** → 여러 범주의 데이터를 색상으로 표현하여 비교

 

**🔍 예시**

1. A, B, C 3개의 브랜드가 있고, 각 브랜드의 매출을 비교

- 막대 그래프 사용 : 어느 브랜드의 매출이 가장 높은지 확인 가능

2. 서울, 부산, 대구에서 하루 동안 판매된 커피 수량을 비교

- 파이 차트를 사용 : 어느 지역에서 커피가 가장 많이 팔렸는지 한눈에 확인 가능

3. 고객 만족도를 1점~5점으로 나눠서, 각 점수를 받은 고객 수를 비교

- 히트맵을 사용 : 어느 점수가 가장 많이 나왔는지 고객 만족도 비교 가능

 

3. 분포 파악

❗ **어떤 형태로 퍼져 있는지(분포 특성)** 분석하는 방법

 

**데이터의 중심값, 범위, 이상값(Outliers)** 등을 확인

**📊 주요 시각화 기법**
- **산점도**(기본)
- **히스토그램** → 연속형 데이터의 빈도를 분석하는 데 유용

**🔍 예시**

- 시험 점수 분포 분석 → 히스토그램을 이용해 특정 점수대에 학생들이 얼마나 분포하는지 확인

 

4. 상관 분석

❗ **두 개 이상의 변수 간의 관계**를 파악하는 방법

한 변수가 증가할 때 다른 변수가 증가하거나 감소하는지를 분석

**📊 주요 시각화 기법**
- **산점도** → 두 변수 간의 관계를 시각적으로 분석

 

**🔍 예시**

- **광고비와 매출 간 관계 분석** → 산점도를 활용하여 광고비가 증가할 때 매출도 증가하는지 확인

- **키와 몸무게 간의 상관관계** → 산점도를 사용하여 키가 클수록 몸무게도 증가하는지 시각화

 

 

3. 데이터 시각화 기본

**1. 배치 순서에 의미를 두어야 함**

- 데이터를 배치할 때는 특정한 의미(시간 흐름, 크기 순서 등)를 고려하고 논리적인 흐름을 유지하는 것이 중요

🔍**예시**
- **시간 흐름을 나타내는 경우 → 연도별 매출 변화**
→ **연도 순으로 배치 (2020 → 2021 → 2022)**

- **크기 비교하는 경우 → 기업별 매출 순위**
→ **가장 큰 값부터 내림차순 정렬 (예: 1위 → 2위 → 3위)**

 

☝🏻활용 팁

- **시간 순서:** 날짜, 연도별 데이터는 반드시 시간 순으로 정렬

- **크기 비교:** 큰 값 → 작은 값 순으로 정렬하여 가독성 증가

 

### **2. 비교 대상에 따라 적절하게 그래프나 표를 조절 + 정렬할 필요가 있음**

- 비교하려는 대상에 따라 막대 그래프, 선 그래프, 원 그래프, 표 등을 적절히 선택해야 함

- 데이터의 특성에 맞게 정렬(내림차순, 오름차순 등)하여 비교하기 쉽게 만들어야 함

🔍 **예시**
- 숫자 크기 비교 → 막대 그래프 (Bar Chart)**
- 매출, 방문자 수 등 크기를 비교할 때 효과적
- 시간 흐름 분석 → 선 그래프 (Line Chart)**
- 주가, 트래픽 변화처럼 시간에 따른 변화를 표현할 때 사용
- 전체 비율 비교 → 원형 그래프 (Pie Chart)**
- 시장 점유율, 고객 비율 등 **비율을 나타낼 때만 사용 (숫자 차이가 크면 사용하지 않는 것이 좋음)**
- 범주형 데이터 정렬 → 표 (Table)**
- 수치형 데이터가 아니라 이름, 코드 등 정렬이 필요한 경우 활용

 

☝🏻 ** 활용 팁 **

- **시간 변화 → 선 그래프** (예: 2020년~2023년 매출 변화)

- **크기 비교 → 막대 그래프** (예: 기업별 매출 비교)

- **비율 비교 → 원형 그래프** (예: 제품별 시장 점유율)

- **정확한 데이터 표시 → 표** (예: 제품별 가격 비교)

 

### **3. 수치를 비교할 때는 가로보다 세로를 추천**

- **막대 그래프를 사용할 때 가로형보다는 세로형을 추천**

- 사람의 시각적 인식 특성상 **세로형 그래프가 수치 비교에 더 적합함**

- **가로형 그래프는 긴 텍스트가 있을 때만 사용하는 것이 효과적**

 

🔍**예시**

- **막대그래프(세로형)**

- 2020년 매출: 1,000억

- 2021년 매출: 1,200억

- 2022년 매출: 1,500억

 

→ **연도별 매출 증가 추이를 한눈에 보기 쉬움**

 

- **가로형 그래프**

- 기업 이름이 너무 길거나 (예: "주식회사 한국테크놀로지서비스")

- 설문조사 결과처럼 응답이 긴 경우 (예: "서비스에 만족하십니까?")

 

☝🏻**활용 팁**

- **숫자 비교는 세로형 막대그래프를 기본으로 사용**

- **긴 텍스트가 있는 경우 가로형 막대그래프 사용**

- **데이터의 변화(추세)를 보일 때는 선 그래프 활용**

 

4. 데이터 시각화 팁

### **1. 색은 강조하고 싶은 요소에만 사용**

 

- 다양한 색상을 남발하지 않고, **강조할 요소에만 색상을 사용**해야 함

- 모든 요소에 색을 부여하면 시각적으로 산만해지고, 무엇을 강조해야 하는지 모호해질 수 있음

🔍

**예시**

- 막대그래프에서 전체 데이터는 **회색**, 가장 중요한 데이터만 강조색(예: 빨간색)을 사용

- 트렌드 라인에서 일반적인 데이터는 연한 색, 중요한 변화 포인트만 진한 색으로 표시

 

### **2. 색은 최소한의 수로만 사용**

- 너무 많은 색을 사용하면 오히려 정보를 해석하기 어려워짐

- **다른 단위(굵기, 크기, 패턴 등)를 활용하여 색상의 수를 줄이는 것**이 좋음

 

🔍예시

- **라인 차트에서 여러 개의 데이터를 비교할 때** → 모든 선을 다른 색으로 설정하는 대신, 가장 중요한 선만 강조색을 사용하고 나머지는 연한 회색으로 처리

- **범례(legend)에서 색을 최소화**하고, 라벨을 직접 표시하여 혼동 방지

**잘못된 예시:**

❌ 서로 다른 10개의 데이터를 표현하기 위해 10가지 색상을 모두 사용 → 과도한 색상으로 가독성이 낮아짐

❌ 굳이 색상이 필요하지 않은 경우에도 컬러를 사용 → 정보 전달에 방해됨

### **3. 대비되는 색 사용이나 그라데이션 사용 주의**

- 대비되는 색상을 사용하면 강조 효과는 있지만, **어떤 데이터를 강조하는지 명확하지 않을 경우 혼란이 생길 수 있음**

- 그라데이션을 사용할 경우 **가장 강조하고 싶은 색이 짙은 색이 되지 않으면 시각적 강조점이 흐려질 수 있음**

 

🔍

**예시**

- **보조 데이터와 강조 데이터**를 비교할 때

- 보조 데이터 → 연한 색

- 강조 데이터 → 진한 색

- **그라데이션 차트에서 색의 강약을 조절하여 강조점 부여**

 

**잘못된 예시:**

 

❌ 대비되는 색(예: 빨강 & 파랑)을 동시에 사용하여 **강조점이 두 곳으로 분산됨**

❌ 색이 연해지는 그라데이션을 사용했지만, 강조해야 할 데이터가 흐린 색으로 표현됨

### **4. 색이 가지고 있는 컬러값들을 반영 (+/- 등 표현 시 고려)**

- 일반적으로 사용되는 색상 의미를 반영하여 데이터 해석을 용이하게 만듦

 

🔍

**예시**

- **주가 그래프**

- 상승 → 빨강

- 하락 → 파랑

- **매출 데이터**

- 목표 달성 → 파랑

- 목표 미달 → 회색

 

**잘못된 예시:**

❌ 주가 상승을 빨강, 하락을 초록으로 설정하면 사용자들이 직관적으로 이해하기 어려움

### **5. 배경색 사용 시 유의 (무의미한 배경색 지양)**

 

- 데이터 전달과 관련 없는 배경색은 가독성을 해칠 수 있음

- 기본적으로 **배경은 흰색이나 연한 회색을 유지하는 것이 좋음**

 

🔍

**예시**

- 검은색 배경에 흰색 텍스트(다크모드 디자인)는 가독성이 좋을 수 있음

- 백그라운드 색상은 최대한 절제하여 데이터가 눈에 띄도록 설계

 

**잘못된 예시:**

❌ 강한 색상의 배경 → 데이터보다 배경이 더 튀는 문제 발생

❌ 데이터와 배경의 색상이 유사하여 가독성 저하

### **6. 불필요한 장식, 테두리 설정 등은 지양**

- 차트에 불필요한 테두리, 그림자, 3D 효과 등을 사용하면 데이터 가독성이 떨어짐

- 단순하고 깔끔한 디자인이 데이터를 더 명확하게 전달함

 

🔍

**예시**

- 단순한 막대 그래프 & 선 그래프를 사용하여 데이터 비교

- 필요한 축과 라벨만 추가하고, 불필요한 요소는 최소화

 

**잘못된 예시:**

❌ 3D 그래프 → 데이터 왜곡 발생 가능

❌ 불필요한 격자선 & 그림자 효과 → 차트가 복잡해 보이고 데이터 집중력 저하