카테고리 없음

[신병훈련소] 1일차 : 태블로의 동작 원리, 단순한 차트

응엉잉 2024. 5. 30. 16:22

태블로

시각화를 통한 데이터 분석 tool

데이터 시각화를 통해 숨겨진 패턴이나 인사이트를 도출할 수 있음

사람들이 데이터를 보고 이해하는 것을 도움

 

태블로의 동작 원리

  • 차원과 측정값
    1. 필드는 정성적인 값과 정량적인 값에 따라 차원과 측정값으로 구분
      • 차원 : 정성적 데이터 (제품명, 날짜 등), 불연속형 데이터, 측정값을 쪼개어 보는 관점
      • 측정값 : 정량적 데이터, 연속형 데이터
    2. 측정값은 차원을 기준으로 집계되어 표현
      • 집계 : 합계, 평균, 중앙값, 카운트, 카운트 (고유), 최소값, 최대값 …
    3. 필드를 행선반에 놓으면 Y축, 열선반에 놓으면 X축
    4. 마크 선반에 있는 마크의 형태, 색상, 크기, 레이블, 세부 정보, 도구 설명 등을 통해 다양한 시각화를 만들 수 있음

차트

  1. 막대차트
    • 값의 크기를 비교하는데 유용한 시각화
    • 수치 데이터 값들 간의 양적 차이를 비교하는데 유용함
    • 특정 참조선 (평균값, 중앙값) 등을 표현해 해당 막대가 그 참조선 값에 도달했는지 못했는지 비교 가능
    • bar in bar 차트를 통해 목표값에 도달했는지 아닌지 등도 살펴볼 수 있음
    • 비교를 명확하게 하기 위해서는 정렬이 필수적
  2. 버블차트
    • 정확한 값의 비교보다는 전체적인 데이터의 트렌드 파악에 사용 가능
  3. 트리맵
    • 계층 구조의 데이터를 표시하는데 적합한 시각화
    • 전체 대비 부분의 비율이 얼마나 되는지 비교하는데 많이 사용
    • 사각형의 크기와 색상에 따라 데이터의 패턴을 확인할 수 있음
    • 많은 데이터를 한번에 볼 수 있음
  4. 스캐터 플롯 (산점도)
    • 2개의 연속형 데이터에 대한 상관관계 분석시 가장 많이 사용되는 시각화
    • 2개의 축으로 데이터가 얼마나 퍼져있는지 분포 확인 가능
    • 상수 라인, 평균 라인, 사분위수 및 중앙값, 추세선과 같은 참조 라인을 추가하여 값의 분포를 비교하기도 유용