내일배움캠프_QAQC 1기/아티클

[01/02] 아티클_데이터 시각화-데이터 속 거짓말 발견하기

이지응:) 2025. 1. 7. 22:21
데이터 시각화 101: ③데이터 속 거짓말 발견하기 | 요즘IT

 

요약

데이터 왜곡에 대한 사례들을 다룸

 

막대그래프

어떤 변수의 값을 기준선으로부터의 막대 길이로 나타낸 그래프로 불연속적인 데이터를 다룸

1. 기준선이 0인지 확인 : 높이가 변수의 값으로 인식되므로 기준선을 0으로 두는 것이 매우 중요

출처 : 외교부

왼쪽 그래프의 기준선을 0으로 두면 오른쪽 그래프가 됨

2. Y축 살펴보기 : 하나의 값이 다른 값들에 비해 상대적으로 크면 막대에 물결선 표시를 해서 축약하는 경우가 있음

 

선그래프

시간에 따른 연속적인 변화를 보여주는 데이터를 표현하는 데 주로 사용

변화를 보여주는 것이 목적이므로 일반적으로 기준선을 0으로 두지 않음

1. 두 개의 Y축을 멀리하기 : 두 개의 다른 Y축을 가진 선그래프를 겹쳐 놓으면 스케일의 차이로 인해 정보가 왜곡될 수 있음

두 개의 Y축을 하나의 그래픽에서 사용하는 것은 왜곡이 클 수 있으므로 각각 두 개의 그래프로 나누어 표현하는 것이 좋음

2.누적값으로 눈속임

Y축 스케일을 표시하지 않고 과장되게 표현할 수 있으므로 이를 조심해야 함

 

파이 차트

어떤 변수의 전체 합을 100%로 했을 때 각 부분의 구성 비율을 보여주는 데 주로 사용

1. 전체 합이 100%인지 확인

2. 3D는 피하기 : 동일한 데이터라도 각도에 따라 보이는 면적이 달라 시각적으 데이터값에 대한 왜곡 일어남

 

지도

위치 정보 데이터를 시각화할 때 주로 사용

직관적으로 이해되기 때문에 데이터의 출처가 올바르고 과장되지 않게 표현해야 함

 

주요 포인트

시각화된 데이터를 우리 뇌는 직관적으로 인식하여 해석함. 하지만 직관적으로 이해된 정보가 실제와 다른 부정확한 정보를 전달하기도 하고, 시각적으로 오해를 불러일으키기도 함.

데이터 시각화를 통해 받아들이는 정보가 정확한지, 왜곡된 부분은 없는지 항상 의문을 가지고 시각화를 이해하려는 태도가 필요

 

핵심 개념

시각화된 데이터는 간혹 부정확한 정보를 전달하기도 하고 시각적으로 오해를 불러일으키키도 함

이러한 문제점이 왜 일어나는지 이해하고 데이터 시각화를 정확하게 판단하며 볼 수 있는 눈을 길러야 함