태블로
시각화를 통한 데이터 분석 tool
데이터 시각화를 통해 숨겨진 패턴이나 인사이트를 도출할 수 있음
사람들이 데이터를 보고 이해하는 것을 도움
태블로의 동작 원리
- 차원과 측정값
- 필드는 정성적인 값과 정량적인 값에 따라 차원과 측정값으로 구분
- 차원 : 정성적 데이터 (제품명, 날짜 등), 불연속형 데이터, 측정값을 쪼개어 보는 관점
- 측정값 : 정량적 데이터, 연속형 데이터
- 측정값은 차원을 기준으로 집계되어 표현
- 집계 : 합계, 평균, 중앙값, 카운트, 카운트 (고유), 최소값, 최대값 …
- 필드를 행선반에 놓으면 Y축, 열선반에 놓으면 X축
- 마크 선반에 있는 마크의 형태, 색상, 크기, 레이블, 세부 정보, 도구 설명 등을 통해 다양한 시각화를 만들 수 있음
- 필드는 정성적인 값과 정량적인 값에 따라 차원과 측정값으로 구분
차트
- 막대차트
- 값의 크기를 비교하는데 유용한 시각화
- 수치 데이터 값들 간의 양적 차이를 비교하는데 유용함
- 특정 참조선 (평균값, 중앙값) 등을 표현해 해당 막대가 그 참조선 값에 도달했는지 못했는지 비교 가능
- bar in bar 차트를 통해 목표값에 도달했는지 아닌지 등도 살펴볼 수 있음
- 비교를 명확하게 하기 위해서는 정렬이 필수적
- 버블차트
- 정확한 값의 비교보다는 전체적인 데이터의 트렌드 파악에 사용 가능
- 트리맵
- 계층 구조의 데이터를 표시하는데 적합한 시각화
- 전체 대비 부분의 비율이 얼마나 되는지 비교하는데 많이 사용
- 사각형의 크기와 색상에 따라 데이터의 패턴을 확인할 수 있음
- 많은 데이터를 한번에 볼 수 있음
- 스캐터 플롯 (산점도)
- 2개의 연속형 데이터에 대한 상관관계 분석시 가장 많이 사용되는 시각화
- 2개의 축으로 데이터가 얼마나 퍼져있는지 분포 확인 가능
- 상수 라인, 평균 라인, 사분위수 및 중앙값, 추세선과 같은 참조 라인을 추가하여 값의 분포를 비교하기도 유용