[Today I Learn]
- Tableau 지급강의 챕터 4
챕터 4-1 : Tableau Prep을 활용한 데이터 전처리
핵심 질문 : Tableau Prep에서 Union과 Join을 활용하여 여러 데이터 파일을 하나로 통합하는 전처리 워크플로우는 어떻게 구성되는가?
📖 Union과 Join 핵심 개념
구분 Union (유니온) Join (조인)
| 결합 방향 | 수직 결합 (행 추가) | 수평 결합 (열 추가) |
| 조건 | 열 수, 데이터 타입/명이 동일 | 최소 하나의 공통 필드 필요 |
| 비유 | 테이블 아래에 테이블 붙이기 | 테이블 옆에 테이블 붙이기 |
🔗 Union 실습 핵심
- 기존 Union 위에 드래그 시 "추가", "유니온", "조인" 3가지 옵션이 나타남. 반드시 **"추가"**를 선택해야 같은 Union 단계 안에 포함됨
- 필드명 불일치 시 → Prep 추천 병합(플러스 버튼) 또는 드래그 앤 드롭으로 병합
🔗 Join 실습 핵심
- 데이터 값 불일치(서울/경기 vs 수도권) → 더블 클릭으로 직접 수정하여 해결
- 전체 데이터에 부가 정보를 붙일 때는 Left Join, 공통 데이터만 필요할 때는 Inner Join
- 단계 내 전처리는 원본 데이터에 영향을 미치지 않음! 출력 시에만 전처리가 적용됨
🧹 정리(Clean) 단계
- Table Names(Union 시 자동 생성), 주문번호-1/지역-1(Join 키 중복) 등 불필요 필드 삭제
✅ 핵심 요약 3줄
- Union은 수직 결합(행 추가), Join은 수평 결합(열 추가)이며 Tableau Prep에서 드래그 앤 드롭으로 쉽게 수행 가능
- 필드명/값 불일치 문제는 Prep 내 병합 기능과 더블 클릭 수정으로 간단히 해결되며, 원본 데이터에는 영향 없음
- 전처리 완료 후 파일, 서버, DB 등 다양한 형태로 출력하여 Tableau Desktop 시각화에 활용 가능
챕터 4-2 : 태블로 작업 순서와 라이브vs추출
핵심 질문 : Tableau에서 라이브 연결과 추출 연결의 차이는 무엇이며, 필터 적용 순서(작업 순서)는 분석 결과에 어떤 영향을 미치는가?
📊 라이브 vs 추출 비교
항목 라이브 (Live) 추출 (Extract)
| 데이터 신선도 | 실시간 반영 | 추출 시점 이후 미반영 |
| 성능 | DB·네트워크 성능에 의존 | Hyper 기반 빠른 응답 속도 |
| 저장 공간 | 별도 공간 불필요 | Hyper 파일 저장 공간 필요 |
| 사용 시점 | 실시간이 중요할 때 | 분석 속도 우선 / 대용량 데이터 |
| 아이콘 | 원통 1개 | 원통 2개 |
- Tableau Public 게시 시 추출만 지원 (외부 데이터베이스를 허용하지 않기 때문)
- 증분 새로고침은 새로운 행 추가에만 적합. 기존 데이터가 수정·삭제된 경우에는 반영되지 않으므로, 반드시 전체 새로고침을 주기적으로 병행해야 함
📐 필터 적용 순서
추출 필터 → 데이터 소스 필터 → 컨텍스트 필터 → (SET, Top N, Fixed LOD) → 차원 필터 → (Include/Exclude LOD) → 측정값 필터 → 테이블 계산 필터
🔑 컨텍스트 필터 핵심 사례
- Top N 충돌 : 경상북도 매출 Top 10을 보려 했으나, Top N이 전체 기준으로 먼저 작동 → 시도 필터를 컨텍스트에 추가하여 해결
- Fixed LOD 충돌 : {fixed [시도] : sum([매출])} 사용 시 세그먼트 차원 필터가 작동하지 않음 → 세그먼트 필터를 컨텍스트 필터로 변경하여 해결
- 컨텍스트 필터는 Top N, Fixed LOD, 조건부 필터보다 우선 적용해야 할 때 사용
✅ 핵심 요약 3줄
- 라이브는 실시간 데이터 모니터링에, 추출은 대용량·오프라인 분석에 적합하며, Tableau Public 게시 시에는 추출만 지원
- Tableau 작업 순서는 추출 필터 → 데이터 소스 필터 → 컨텍스트 필터 → 차원 필터 → 측정값 필터 → 테이블 계산 필터 순으로 적용
- 컨텍스트 필터는 Top N·Fixed LOD 등과 충돌 시 특정 필터를 우선 적용하는 핵심 도구
챕터 4-3 : 데이터 원본 편집
핵심 질문 : Tableau에서 데이터를 결합하는 4가지 방식(관계, 조인, 유니온, 블렌딩)의 차이는 무엇이며, 통합문서 관리와 데이터 원본 교체는 어떻게 수행하는가?
🏗️ 논리적 계층 vs 물리적 계층
구분 논리적 계층 물리적 계층
| 결합 방식 | 관계(Relationships) | 조인(Join) / 유니온(Union) |
| 결합 시점 | 뷰에서 필드 사용 시 동적 쿼리 | 결합 시점에 즉시 합쳐짐 |
| 테이블 상태 | 각 테이블이 독립적 존재 | 하나의 단일 테이블로 결합 |
| 접근 방법 | 데이터 원본 탭 첫 화면 | 논리적 테이블을 더블 클릭 |
🔗 데이터 결합 4가지 방식
방식 계층 핵심 특징
| 관계 | 논리적 | 물리적 결합 없이 동적 조인. 파란색 선으로 연결 |
| 조인 | 물리적 | 특정 필드 기준 수평 결합. 즉시 하나의 테이블 |
| 유니온 | 물리적 | 행 단위 수직 결합 |
| 블렌딩 | 뷰 레벨 | 원본 편집 권한 없을 때 사용. Left Join 방식. 체인 아이콘 🔗 |
- 관계 : 두 테이블이 물리적으로 결합되지 않고 각각 존재. 시각화 시 Tableau 뒷단에서 동적으로 조인 수행
- 조인 : 결합 시점에 즉시 하나의 테이블로 합쳐짐. 데이터 탭에서 단일 테이블만 보임
🧪 블렌딩 핵심
- 주 데이터 원본에 보조 데이터를 키값(예: 연도)으로 연결
- 계산된 필드 예시 : SUM([매출])>=SUM([목표 매출(슈퍼스토어 목표 매출)].[목표 매출 (목표 매출)])
📂 통합문서 관리
- 통합문서 합치기 : 파일 > 통합문서 가져오기 또는 복사-붙여넣기
- 데이터 원본 바꾸기 : 마우스 오른쪽 > 데이터 원본 바꾸기 → 데이터셋 전체 교체
- 참조 바꾸기 : 원본 교체 후 필드명이 달라졌을 때, 기존 필드와 새 필드를 매핑. 연결된 계산식이 자동으로 업데이트됨
✅ 핵심 요약 3줄
- 논리적 계층은 관계로 동적 결합(성능 최적화), 물리적 계층은 조인/유니온으로 즉시 결합(단일 테이블 생성)
- Tableau 데이터 결합 4가지 : 관계(논리적·동적), 조인(물리적·수평), 유니온(물리적·수직), 블렌딩(뷰 레벨·편집 권한 없을 때)
- 통합문서 합치기 → 데이터 원본 바꾸기 → 참조 바꾸기 기능으로 팀 협업 시 원활한 분업과 데이터 교체 가능
'[데이터분석] 부트캠프 TIL' 카테고리의 다른 글
| 20260324 TIL (0) | 2026.03.24 |
|---|---|
| 20260320 TIL (1) | 2026.03.20 |
| 20260317 TIL (0) | 2026.03.17 |
| 20260316 TIL (1) | 2026.03.16 |
| 20260313 TIL (0) | 2026.03.13 |