[데이터분석] 부트캠프 TIL

20260318 TIL

myun0506 2026. 3. 18. 21:00

[Today I Learn]

- Tableau 지급강의 챕터 4


챕터 4-1 : Tableau Prep을 활용한 데이터 전처리

핵심 질문 : Tableau Prep에서 Union과 Join을 활용하여 여러 데이터 파일을 하나로 통합하는 전처리 워크플로우는 어떻게 구성되는가?

📖 Union과 Join 핵심 개념

구분 Union (유니온) Join (조인)

결합 방향 수직 결합 (행 추가) 수평 결합 (열 추가)
조건 열 수, 데이터 타입/명이 동일 최소 하나의 공통 필드 필요
비유 테이블 아래에 테이블 붙이기 테이블 옆에 테이블 붙이기

🔗 Union 실습 핵심

  • 기존 Union 위에 드래그 시 "추가", "유니온", "조인" 3가지 옵션이 나타남. 반드시 **"추가"**를 선택해야 같은 Union 단계 안에 포함됨
  • 필드명 불일치 시 → Prep 추천 병합(플러스 버튼) 또는 드래그 앤 드롭으로 병합

🔗 Join 실습 핵심

  • 데이터 값 불일치(서울/경기 vs 수도권) → 더블 클릭으로 직접 수정하여 해결
  • 전체 데이터에 부가 정보를 붙일 때는 Left Join, 공통 데이터만 필요할 때는 Inner Join
  • 단계 내 전처리는 원본 데이터에 영향을 미치지 않음! 출력 시에만 전처리가 적용됨

🧹 정리(Clean) 단계

  • Table Names(Union 시 자동 생성), 주문번호-1/지역-1(Join 키 중복) 등 불필요 필드 삭제

✅ 핵심 요약 3줄

  1. Union은 수직 결합(행 추가), Join은 수평 결합(열 추가)이며 Tableau Prep에서 드래그 앤 드롭으로 쉽게 수행 가능
  2. 필드명/값 불일치 문제는 Prep 내 병합 기능더블 클릭 수정으로 간단히 해결되며, 원본 데이터에는 영향 없음
  3. 전처리 완료 후 파일, 서버, DB 등 다양한 형태로 출력하여 Tableau Desktop 시각화에 활용 가능

챕터 4-2 : 태블로 작업 순서와 라이브vs추출

핵심 질문 : Tableau에서 라이브 연결과 추출 연결의 차이는 무엇이며, 필터 적용 순서(작업 순서)는 분석 결과에 어떤 영향을 미치는가?

📊 라이브 vs 추출 비교

항목 라이브 (Live) 추출 (Extract)

데이터 신선도 실시간 반영 추출 시점 이후 미반영
성능 DB·네트워크 성능에 의존 Hyper 기반 빠른 응답 속도
저장 공간 별도 공간 불필요 Hyper 파일 저장 공간 필요
사용 시점 실시간이 중요할 때 분석 속도 우선 / 대용량 데이터
아이콘 원통 1개 원통 2개
  • Tableau Public 게시 시 추출만 지원 (외부 데이터베이스를 허용하지 않기 때문)
  • 증분 새로고침은 새로운 행 추가에만 적합. 기존 데이터가 수정·삭제된 경우에는 반영되지 않으므로, 반드시 전체 새로고침을 주기적으로 병행해야 함

📐 필터 적용 순서

추출 필터 → 데이터 소스 필터 → 컨텍스트 필터 → (SET, Top N, Fixed LOD) → 차원 필터 → (Include/Exclude LOD) → 측정값 필터 → 테이블 계산 필터

🔑 컨텍스트 필터 핵심 사례

  • Top N 충돌 : 경상북도 매출 Top 10을 보려 했으나, Top N이 전체 기준으로 먼저 작동 → 시도 필터를 컨텍스트에 추가하여 해결
  • Fixed LOD 충돌 : {fixed [시도] : sum([매출])} 사용 시 세그먼트 차원 필터가 작동하지 않음 → 세그먼트 필터를 컨텍스트 필터로 변경하여 해결
  • 컨텍스트 필터는 Top N, Fixed LOD, 조건부 필터보다 우선 적용해야 할 때 사용

✅ 핵심 요약 3줄

  1. 라이브는 실시간 데이터 모니터링에, 추출은 대용량·오프라인 분석에 적합하며, Tableau Public 게시 시에는 추출만 지원
  2. Tableau 작업 순서는 추출 필터 → 데이터 소스 필터 → 컨텍스트 필터 → 차원 필터 → 측정값 필터 → 테이블 계산 필터 순으로 적용
  3. 컨텍스트 필터는 Top N·Fixed LOD 등과 충돌 시 특정 필터를 우선 적용하는 핵심 도구

챕터 4-3 : 데이터 원본 편집

핵심 질문 : Tableau에서 데이터를 결합하는 4가지 방식(관계, 조인, 유니온, 블렌딩)의 차이는 무엇이며, 통합문서 관리와 데이터 원본 교체는 어떻게 수행하는가?

🏗️ 논리적 계층 vs 물리적 계층

구분 논리적 계층 물리적 계층

결합 방식 관계(Relationships) 조인(Join) / 유니온(Union)
결합 시점 뷰에서 필드 사용 시 동적 쿼리 결합 시점에 즉시 합쳐짐
테이블 상태 각 테이블이 독립적 존재 하나의 단일 테이블로 결합
접근 방법 데이터 원본 탭 첫 화면 논리적 테이블을 더블 클릭

🔗 데이터 결합 4가지 방식

방식 계층 핵심 특징

관계 논리적 물리적 결합 없이 동적 조인. 파란색 선으로 연결
조인 물리적 특정 필드 기준 수평 결합. 즉시 하나의 테이블
유니온 물리적 행 단위 수직 결합
블렌딩 뷰 레벨 원본 편집 권한 없을 때 사용. Left Join 방식. 체인 아이콘 🔗
  • 관계 : 두 테이블이 물리적으로 결합되지 않고 각각 존재. 시각화 시 Tableau 뒷단에서 동적으로 조인 수행
  • 조인 : 결합 시점에 즉시 하나의 테이블로 합쳐짐. 데이터 탭에서 단일 테이블만 보임

🧪 블렌딩 핵심

  • 주 데이터 원본에 보조 데이터를 키값(예: 연도)으로 연결
  • 계산된 필드 예시 : SUM([매출])>=SUM([목표 매출(슈퍼스토어 목표 매출)].[목표 매출 (목표 매출)])

📂 통합문서 관리

  • 통합문서 합치기 : 파일 > 통합문서 가져오기 또는 복사-붙여넣기
  • 데이터 원본 바꾸기 : 마우스 오른쪽 > 데이터 원본 바꾸기 → 데이터셋 전체 교체
  • 참조 바꾸기 : 원본 교체 후 필드명이 달라졌을 때, 기존 필드와 새 필드를 매핑. 연결된 계산식이 자동으로 업데이트됨

✅ 핵심 요약 3줄

  1. 논리적 계층은 관계로 동적 결합(성능 최적화), 물리적 계층은 조인/유니온으로 즉시 결합(단일 테이블 생성)
  2. Tableau 데이터 결합 4가지 : 관계(논리적·동적), 조인(물리적·수평), 유니온(물리적·수직), 블렌딩(뷰 레벨·편집 권한 없을 때)
  3. 통합문서 합치기 → 데이터 원본 바꾸기 → 참조 바꾸기 기능으로 팀 협업 시 원활한 분업과 데이터 교체 가능

 

 

'[데이터분석] 부트캠프 TIL' 카테고리의 다른 글

20260324 TIL  (0) 2026.03.24
20260320 TIL  (1) 2026.03.20
20260317 TIL  (0) 2026.03.17
20260316 TIL  (1) 2026.03.16
20260313 TIL  (0) 2026.03.13