일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 표준오차
- DATE_FORMAT
- 재귀쿼리
- calesce
- 재퀴쿼리
- Recursive
- limit
- 프로그래머스
- concat
- curdate
- 표본분포
- lambda
- 데이터 리터러시
- 날짜함수
- 정규분포
- datediff
- truncate
- dateofmonth
- 표본
- python
- 모집단
- pivot table
- rrule
- append
- 표분편차
- split
- merge
- join
- floor
- 신뢰구간
- Today
- Total
목록분류 전체보기 (105)
hyezdata 님의 블로그

이번 QCC는 제대로 풀어본게 없어서 끝나고 다시 풀음... 1. SELECT ROUND( (SUM(CASE WHEN category IS NULL or category = 'n/a' THEN 1 ELSE 0 END) / COUNT(1)) * 100, 1) AS uncategorised_call_pctFROM callsWHERE DATE_FORMAT(call_date, '%Y-%m-%d') 튜터님 답select round((sum(if(category = 'n/a' or category is null, 1, 0))/ count(1)) * 100, 1) as uncategorized_call_pctfrom callswhere date_format(call_date, '%Y-..
- 프로젝트 점검 및 정리- 머신러닝 과제 - 태블로 1~2주차 + 3주차 1, 2강
튜터님 피드백- 군집별 특정 지표 보일때 수치를 평균으로만 제공하다보니 특정한 값에 의해서 높아진건지 분포상 진짜로 높은것인지 판단할 수 없음 - 거래변동성이 높은걸 충동성으로 해석했는데 충동성으로만 해석하는게 맞는지, 과해석은 아닐지 - 파생변수 설명 부족 -> 예를 들어 거래변동성은 어떠한 지표로 만들었는지에 대한 설명 부족 - 군집별 해석 후 전략 제시하다보니 수치가 부족함, 데이터를 기반으로 해석과 어떻게 연결되고 있는지 설명 필요

오전까지 군집 분석 할 코드 공유하고 오후에 괜찮은 결과 얻기위해 계속 돌리면서 기록함 드뎌 나도 가나디 있다~~~
1. 신용카드 사용률#1. 신용카드 사용률 (CU): 신용 한도의 과도 사용 여부 → 신용 리스크 구분에 효과적# 사용자 별 총 거래 금액amount_sum = df_transactions.groupby('client_id')['amount'].sum()# 사용자별 총 신용카드 한도limit_sum = cards_df.groupby('client_id')['credit_limit'].sum()cu_df = pd.merge(amount_sum, limit_sum, left_index=True, right_index=True)cu_df['credit_utilization'] = (cu_df['amount']/cu_df['credit_limit']).round(2) 2. 거래 변동성#2 거래 변동성: 소비 일..
코드카타SQL 풀었던 문제 다시 풀어보기 & 알고리즘 통계야 놀자복습 완 머신러닝완

코드카타이 문제는 오랫동안 고민해 봤는데 도저히 모르겠어서 다른 사람 풀이를 참고함보니까 재귀쿼리를 이용해서 푸는 문제!https://hyezdata.tistory.com/107 SQL - 재귀쿼리오늘 푼 코드카타에 사용된 개념 재귀쿼리 공부함https://hyezdata.tistory.com/108 QCC 4회차https://hyezdata.tistory.com/110 오늘의 QCC 느낀점... 최대한 WITH 사용 자제해볼것...

문제 1번-- 지역별로 매출이 가장 높은 매장-- 매장 두개 이상-- ORDER BY 지역이름 WITH region AS (SELECT region_nameFROM storesGROUP BY 1HAVING COUNT(store_id) >= 2)SELECT s.region_name, MAX(sales) AS highest_salesFROM stores s INNER JOIN region r ON s.region_name=r.region_nameGROUP BY s.region_nameORDER BY region_name ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ...정답은 맞았는데 너무 어렵게 품굳이 WITH 쓰지 않고 MAX와 HAVING으로 풀 수 있음 ▼ 튜터님 답더보기SELECT regi..

WITH RECURSIVE cte_name AS ( initial_query -- anchor member UNION ALL recursive_query -- recursive member that references to the CTE name)SELECT * FROM cte_name; 재귀 쿼리의 기본적인 구조는 이렇게 생겼다.초기 쿼리를 anchor member, 재귀 쿼리 부분을 recursive member재귀 쿼리문은 anchor member와 recursive member를 UNION ALL 이나 UNION DISTINCT 사용해 결합한다. WITH RECURSIVE cte_count (n) AS ( SELECT 1 -- 초기값 UNION ALL ..
처음 내 풀이-- 시간대별 입양 건수 SELECT HOUR(datetime) AS hour, COALESCE(COUNT(animal_id), 0) AS countFROM animal_outs GROUP BY 1ORDER BY 1 -- 시간대별 입양 건수 -- 재귀쿼리 WITH RECURSIVE hours AS ( SELECT 0 AS hour UNION ALL SELECT hour + 1 FROM hours WHERE hour 재귀쿼리 : https://hyezdata.tistory.com/108