[데이터분석] 부트캠프 TIL

20251224 TIL

myun0506 2025. 12. 24. 21:25

Today I Learn

: SQL 세션, 직무세션, SQL 사전캠프 퀘스트, 아티클 스터디

 

- SQL 세션

 

- 작성 순서

SELECT → FROM → WHERE → GROUP BY → HAVING → ORDER BY

 

- MySQL에서는 일반적으로 AND가 OR보다 우선순위가 높음

→ OR가 섞이면 괄호로 의도를 고정하는게 실무 습관!

 

- IN ('KR', 'JP', "CH')

- LIKE

- NULL은 무조건 IS NULL / IS NOT NULL로 비교

- CASE WHEN

- 테이블 데이터 삭제 (DELETE vs. TRUNCATE vs. DROP)

 

https://myun0506.tistory.com/45

 

SQL 기초, case when, DELETE vs TRUNCATE vs DROP

- 작성 순서SELECT → FROM → WHERE → GROUP BY → HAVING → ORDER BY - MySQL에서는 일반적으로 AND가 OR보다 우선순위가 높음→ OR가 섞이면 괄호로 의도를 고정하는게 실무 습관! - IN ('KR', 'JP', "CH') - LIKE%: 글

myun0506.tistory.com

 

 

 

- 아티클 스터디 

아티클 : 데이터 속 거짓말 발견하기

https://yozm.wishket.com/magazine/detail/1821/

 

데이터 시각화 101: 3데이터 속 거짓말 발견하기 | 요즘IT

간혹 직관적으로 이해된 시각화가 부정확한 정보를 전달하기도 하고, 시각적으로 오해를 불러일으키기도 합니다. 그 때문에 우리는 이러한 문제점이 왜 일어나는지 이해하고, 데이터 시각화를

yozm.wishket.com

 

- 요약

직관적으로 표현된 시각화 자료가 부정확한 정보를 전달하기도 하고, 오류를 불러일으키기도 함.

막대그래프에서의 기준선과 Y축의 잘못된 설정으로 인한 오해 야기 가능성

선그래프에서의 두개의 축과 누적값으로 인한 눈속임

파이차트에서의 전체100%룰의 중요성과 3D 시각자료로 인한 직관적 해석의 오류 가능성

지도에서의 기준 지표의 잘못된 설정으로 인한 사실 왜곡 문제

 

- 주요 포인트

잘못된 전달을 막기 위해 유의해야 할 점과 어떤 부분에서 주로 오해가 발생하는지 구체적으로 예시를 제시함

→ 시각자료를 비판적으로 바라보는 태도가 굉장히 중요할 것.

각 시각 자료별로 어떤 점을 더 유의해야할지 사례를 들어 설명해줘서 실제로 내가 오해할 수 있었던 부분을 정확하게 짚어주었던 것 같고, 실생활에서든 데이터 분석 업무에서든 더 의식해서 조심할 수 있게 해주는 시각을 제공해줌.
실제 뉴스나 기사에서 보도자료로 나오는 시각자료들이 이런 오해의 소지를 불러일으킬 수 있겠다는 생각이 들었고, 그동안 숫자가 포함되어 있다고 해서 정확한 시각자료라고 생각했었는데 사실은 시각적으로 와닿는 자료가 명확한 수치 데이터보다 크게 다가왔다고 생각이 듦.
보여주고자 하는 바를 명확하게 보여주기 위해서 시각자료가 과장되거나 오해의 소지를 불러일으킬 수 있으니, 보는 사람 입장에서 조금 더 비판적인 시각을 가지고 자료를 해석할 필요가 있겠다. 거짓말은 아니다… 하지만 충격!!!!
앞으로 시각화 자료 만들 때 계속 비판적으로 생각하고 이게 최선이 맞는지 확인해보기!!!!!

 

 

- SQL 퀘스트

 

- date에서 필요한 부분만 추출: year(date 형식의 값)

- 현재 날짜 반환: current_date()

- 날짜 차이 함수: datediff(이후 날짜 값, 이전 날짜 값)

- 두 날짜의 햇수 차이

 

https://myun0506.tistory.com/42

 

날짜 포맷

- 날짜 포맷select date(date) date_type, date_format(date(date), '%Y') 'Year', date_format(date(date), '%m') 'Month', date_format(date(date), '%d') 'Day', date_format(date(date), '%w') 'Day of the Week' # 일 0 월 1 화 2 수 3 목 4 금 5 토 6from pa

myun0506.tistory.com

 

 

 

- 순위 계산: 윈도우 함수 rank() over (partition by 열 order by 열)

select cuisine_type,
       restaurant_name,
       cnt_order,
       rank() over (partition by cuisine_type order by cnt_order desc) ranking
from
(
select cuisine_type,
	   restaurant_name,
	   count(*) cnt_order
from food_orders
group by 1, 2
) a;

 

 

- 가장 최신 데이터: Order by 날짜열 desc limit 1

select name, rating, join_date
from lol_users
order by join_date desc 
limit 1;

 

 

 

- 문제 사항

  • 이미 만든 테이블이 안보일 때
    • 갱신이 안된 경우
      • Database Navigator에서 해당 스키마를 우클릭하고 refresh or 단축키 F5 
    • 다른 schema (connection) 을 보고 있는 경우
      • 어떤 schema에 있는지 모르는 경우
SELECT
  TABLE_SCHEMA,
  TABLE_NAME
FROM information_schema.tables
WHERE TABLE_NAME = 'sparta_employees';

 

- 해결 방안

  • 앞으로는 무조건 스키마 명시하기
    • ex) create table basic.sparta_employees
  • 기본 스키마 먼저 지정
    • ex) use basic; (use를 쓸 땐 테이블명이 아니라 스키마명을 작성해야함)

'[데이터분석] 부트캠프 TIL' 카테고리의 다른 글

20251229 TIL  (0) 2025.12.29
20251226 TIL  (1) 2025.12.26
20251223 TIL  (1) 2025.12.23
20251222 TIL  (0) 2025.12.22
20251221 TIL  (0) 2025.12.22