버블차트와 트리맵을 활용하는 이유와 장단점
데이터 시각화는 연구 결과를 효과적으로 전달하는 핵심 도구이다.
그중에서도 버블차트(Bubble Chart)와 트리맵(Treemap)은 여러 변수를 동시에 보여주거나 계층 구조를 표현해야 할 때 자주 사용되는 시각화 방법이다.

1. 버블차트(Bubble Chart)란?
버블차트는 산점도(Scatter Plot)의 확장된 형태로, X축과 Y축 위치에 더해 원의 크기로 세 번째 변수를 표현하는 차트이다. 필요에 따라 색상을 추가하면 네 번째 변수까지도 표현할 수 있다.
예를 들어 국가별 데이터를 분석할 때 X축에 1인당 GDP, Y축에 평균 수명, 버블의 크기로 인구수를 나타내는 방식으로 세 가지 지표를 한 화면에서 비교할 수 있다.

* 연구에서 버블차트를 활용하는 이유
- 다변량 관계 파악: 두 변수 간의 단순한 상관관계뿐 아니라 세 번째, 네 번째 변수까지 동시에 시각화하여 복합적인 패턴을 한눈에 파악할 수 있다.
- 그룹 간 비교 용이: 색상이나 카테고리별로 버블을 구분하면 집단 간 차이를 직관적으로 비교할 수 있다.
- 이상치 및 군집 탐색: 데이터 포인트들이 흩어진 형태를 통해 군집이나 이상치를 빠르게 발견할 수 있다.
* 버블차트의 장점
연구 보고서나 논문에서 버블차트를 쓰면 표나 단순 그래프로는 드러나지 않는 다차원적 관계를 효과적으로 전달할 수 있다. 특히 변수가 3~4개로 늘어나도 하나의 그래프로 압축해서 보여줄 수 있다는 점이 가장 큰 장점이다.
또한 시각적으로 흥미를 끌기 때문에 발표 자료나 보고서에서 독자의 주의를 끄는 데에도 유리하다.
* 버블차트의 단점
버블의 크기를 정확하게 비교하는 것은 사람의 눈으로 쉽지 않습니다. 면적 기반 시각화는 길이나 위치 기반 시각화보다 정량적인 비교 정확도가 떨어진다는 것이 여러 시각화 연구에서 지적된 한계입니다. 또한 버블이 많아지고 서로 겹치게 되면 오히려 가독성이 떨어지고, 작은 값을 가진 데이터는 버블이 너무 작아져 잘 보이지 않는 문제도 발생합니다.
2. 트리맵(Treemap)이란?
트리맵은 계층적 데이터를 사각형의 크기와 색상으로 표현하는 시각화 방법이다.
전체를 하나의 큰 사각형으로 보고, 이를 하위 항목의 비율에 따라 작은 사각형들로 나누어 표현한다.
예를 들어 회사 전체 매출을 부서별, 제품별로 나누어 각 사각형의 크기로 매출 비중을 나타낼 수 있습니다.

* 연구에서 트리맵을 활용하는 이유
- 계층 구조와 비중을 동시에 표현: 상위-하위 분류 구조를 유지하면서도 각 항목이 전체에서 차지하는 비율을 면적으로 직관적으로 보여줄 수 있다.
- 한정된 공간에 많은 항목 표시: 막대그래프나 파이차트로는 표현하기 힘든 수십~수백 개의 세부 항목을 하나의 화면에 압축해서 보여줄 수 있다.
- 포트폴리오 및 자원 분배 분석: 예산 배분, 시장 점유율, 키워드 빈도 분석 등 비중 비교가 중요한 연구 주제에 적합하다.
* 트리맵의 장점
트리맵은 공간 효율이 매우 높아서 많은 카테고리를 동시에 표현해야 하는 연구에 적합하다.
파이차트는 항목이 많아지면 조각이 너무 작아져 식별이 어렵지만, 트리맵은 사각형 분할 방식 덕분에 상대적으로 많은 항목도 정리되어 보인다.
또한 색상을 추가 변수로 활용하면 비중과 함께 추세나 카테고리 등 또 다른 정보를 동시에 전달할 수 있다.
* 트리맵의 단점
트리맵 역시 면적을 기준으로 값을 비교해야 하기 때문에, 비슷한 크기의 사각형들 사이에서 정확한 수치 차이를 파악하기는 어렵다.
또한 계층이 너무 깊어지면 사각형이 지나치게 작아지거나 레이블이 겹쳐서 가독성이 떨어진다.
트리맵에 익숙하지 않은 독자에게는 직관적으로 읽히지 않을 수 있다는 점도 고려해야 한다.
3. 두 차트, 언제 어떻게 써야 할까?
버블차트는 변수 간의 관계와 분포를 보여주고 싶을 때, 트리맵은 계층적 비중과 구성을 보여주고 싶을 때 적합하다.
연구 설계 단계에서 "이 데이터로 무엇을 보여주고 싶은가"를 먼저 명확히 한 뒤 차트를 선택하는 것이 중요하다.
단순히 시각적으로 화려해 보인다는 이유로 선택하면 오히려 메시지가 흐려질 수 있다.
두 차트 모두 면적이나 크기를 통해 값을 표현하는 방식이기 때문에, 정밀한 수치 비교가 핵심인 경우라면 막대그래프나 표를 함께 병기하는 것을 추천한다.
시각화는 보조 도구이지 데이터 자체를 대체하는 것이 아니라는 점을 항상 기억해야 한다.
버블차트와 트리맵은 각각 다변량 관계 표현과 계층적 비중 표현이라는 강점을 가진 시각화 도구이다.
연구 데이터의 특성과 전달하고자 하는 메시지에 맞게 적절히 선택해서 사용한다면, 복잡한 데이터도 독자에게 훨씬 쉽고 직관적으로 전달할 수 있다.
* 버블차트 이미지 출처 : https://www.tableau.com/chart/what-is-bubble-chart
Understanding and Using Bubble Charts | Tableau
Bubble charts are a visual analytics tool that displays categories in a field as bubbles of varying size. Learn more about how to read and use them.
www.tableau.com
* 트리맵 이미지 출처 : https://help.tableau.com/current/pro/desktop/ko-kr/buildexamples_treemap.htm