[데이터분석] 부트캠프 TIL

20260210 TIL

myun0506 2026. 2. 10. 23:52

[Today I Learn]

- SQL codekata

- Python codekata

- 오전 통계학 실습 세션

- 오후 통계학 이론 세션 

- 아티클 스터디


[SQL codekata]

- 문제 1.

1. 문제 링크: https://www.hackerrank.com/challenges/weather-observation-station-8/problem

2. 정답 코드

select distinct city 
from station 
where city regexp '^a|^e|^i|^o|^u'
and city regexp 'a$|e$|i$|o$|u$'

 


[Python codekata] 

- 문제 1.

1. 문제 링크: https://school.programmers.co.kr/learn/courses/30/lessons/120854

2. 정답 코드

def solution(strlist):
    answer = []
    for word in strlist:
        answer.append(len(word))
    return answer
def solution(strlist):
    answer = [len(w) for w in strlist]
    return answer
def solution(strlist):
    answer = list(map(len, strlist))
    return answer

 

- 문제 2.

1. 문제 링크: https://school.programmers.co.kr/learn/courses/30/lessons/120819

2. 정답 코드

def solution(money):
    answer = divmod(money, 5500)
    return answer
def solution(money):
    answer = [money//5500, money%5500]
    return answer

 


[ 아티클 스터디 ]

아티클: https://medium.com/@jeongmin-ju/%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EC%9D%98-%EC%8B%9C%EC%9E%91%EC%9D%80-business%EA%B0%80-%EB%B0%98%EC%9D%B4%EB%8B%A4-47f9c84bcb34

 

데이터 분석의 시작은 Business다

데이터 분석의 시작은 Business다 들어가며 안녕하세요. 저는 제약, 패션, 배달 산업에서 데이터 분석가로 근무하면서 산업별 회사의 비즈니스 모델을 …

medium.com

 

  • 요약:
    • 전체적인 도메인 흐름을 파악하기 위해서 우리 프로덕트의 business와 market place에 대한 이해가 필요함
    • 비즈니스 → 프로덕트/서비스 → 데이터 의 순서로 데이터 분석을 진행해야함
      • 비즈니스가 어떤 산업에 속했는지, 어떤 시장의 형태를 띄는지 먼저 파악하는게 일순위
      • 목적없이 데이터를 먼저 분석하지 않고 우리 비즈니스의 goal은 무엇일지 먼저 설정하고, 현 목적에 맞는 문제 해결을 위한 데이터를 찾아야함
    • 2-sided market: Airbnb
      • 게스트와 호스트를 연결하는 숙박 플랫폼
    • 3-sided market: Uber Eats
      • 라이더, 상점주인, 고객을 연결하는 음식 배달 플랫폼
  • 주요 포인트:
    • 3-sided market에서의 수요와 공급의 불균형 문제 (사이클)
      • 주문하는 고객들이 충분하지 않으면 상점은 플랫폼에 입점을 원하지 않을 것입니다.
      • 상점이 충분하지 않으면 고객의 선택이 줄어들기 때문에 플랫폼에서 주문하려는 고객이 줄어듭니다.
      • 주문이 감소하면 라이더는 수입이 줄어들고 인센티브가 제공되지 않습니다.
      • 라이더의 수가 너무 적으면 고객에게 음식이 전달되는 배달 시간이 길어지고 고객의 경험에 영향을 줄 수 있습니다.
    • 눈여겨봐야할 주요 산업 지표우리 비즈니스를 가장 잘 측정하는 방법과 지표는 무엇일까?
      • Revenue (ex. ARR, GMV):
        • 발생하는 매출
      • Customer growth (ex. 유료 사용자, 시장 점유율):
        • 지불하는 사용자 수
      • Consumption growth (ex. 메시지 전송, 예약된 숙박):
        • 단순히 사이트를 방문하는 것 이상의 서비스의 이용 강도
      • Engagement growth (ex. MAU, DAU):
        • 단순히 서비스에서 활동하는 사용자의 수:
      • Growth efficiency (ex. LTV, CAC, Gross margin):
        • 지출 대비 수익 창출의 효율성
      • User experience (ex. NPS)
        • 서비스에 대해 고객의 경험이 얼마나 즐겁고 편리한지
    • 우리는 어떤 가치를 고객에게 제공하고자 할까?
  • 핵심 개념:
    • 마켓 플레이스
      • 마켓 플레이스 소유자가 제공하는 선별된 경험에 따라 공급업체를 고객과 연결하는 것
      • 벤더사를 소유하지 않고 플랫폼을 중심으로…
    • 2-sided market (3-sided market)
      • 두 업체를 연결하고 거래하는 플랫폼
      • 플랫폼에서 마찰없는 상호 작용과 거래를 가능하게 하는 중개자로서 두 그룹에 대해 세금 징수
      • e.g.) Airbnb, Uber Eats
내가 일하는 산업군의 도메인 지식 뿐만 아니라 진짜 현 상황에 가장 적합한 문제와 이를 분석하고 해결할 수 있는 핵심 지표를 찾아내는게 중요하겠다. 이런 능력은 해당 도메인에 대한 이해가 뒷받침되어야 할 것이고, 경험으로도 축적되지 않을까... 신입때는 도메인 지식을 쌓기 위해 무진장 노력해야겠구나!!!
저기서 3-sided market에서 악순환의 예시를 들었는데, 실제로 어떠한 이유로 배민의 배달기사가 굉장히 줄었다는 이야기를 들었는데 이로 인해서 배달이 늦어지고 또 이에 따라 소비자의 만족도가 낮아지면서 내 주변 사람들이 배민을 이용안하고 쿠팡이츠로 갈아타는 것을 몇번 봤다. 그래서 이러한 악순환이 시작되면 되돌리기 힘들어지므로 데이터 분석을 통해 사전 예방이 굉장히 중요하겠다라고 생각했다. 또 이를 위해서는, 위에서 말했듯이 현 상황, 문제에 가장 적합한 핵심 지표를 찾아 분석하는 것의 중요성을 다시 한번 인지하게 되었다.

 

'[데이터분석] 부트캠프 TIL' 카테고리의 다른 글

20260212 TIL  (0) 2026.02.12
20260211 TIL  (0) 2026.02.11
20260209 TIL  (0) 2026.02.09
20260206 TIL  (0) 2026.02.06
20260205 TIL  (0) 2026.02.05