일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- Recursive
- 표준오차
- limit
- curdate
- pivot table
- rrule
- truncate
- python
- split
- 모집단
- calesce
- datediff
- merge
- lambda
- join
- 태블로
- 신뢰구간
- dateofmonth
- concat
- DATE_FORMAT
- 표본분포
- 재퀴쿼리
- 레이더차트
- tableau
- 프로그래머스
- 재귀쿼리
- 표분편차
- 정규분포
- 데이터 리터러시
- floor
- Today
- Total
목록분류 전체보기 (139)
hyezdata 님의 블로그

오늘 각자 한 eda 피그마에 정리 eda 해 본 결과 전체적인 인사이트는- 사람 타입별(머리색, 피부 타입, 피부색 등)은 평점, 추천 비율과는 상관이 없다.- 평점별로 top3 조회한 결과로 리뷰수와 좋아요수를 살펴봤더니 셀프 케어 제품(스킨케어, hair mask...) 그래서 만약 스킨케어 제품을 주력으로 간다면 크롤링이 필요하지 않을수도...

프로덕트 데이터 사이언스 - A/B 테스트 A/B 테스트는 두 개 이상의 그룹을 비교하여 변화가 목표에 미치는 영향을 측정하는 실험 방법.이 때, '대조군'은 변화를 주지 않은 그룹, '실험군'은 새로운 조건을 적용한 그룹이다.A/B 테스트에선 편향과 숨겨진 외부 요인에 대한 영향을 최소화하기 위해 랜덤화를 진행한다. 하지만, A/B 테스트로 나온 차이를 신뢰할 수 있는지 없는지 그냥 알 순 없고 표준편차(SE)를 이용한다. 샘플 크기가 클수록 표준 편차는 작아지고, 신뢰도는 높아진다. 신뢰 구간(CI) 은 같은 실험을 여러 번 반복했을 때, 모집단의 평균이 그 구간 안에 포함될 가능성이 높다는 걸 의미한다.두 그룹의 신뢰구간이 겹치지 않는다면, 두 그룹 간의 차이는 우연일 가능성이 낮다. (= 유의미하..
SQLD 공부프로덕트 데이터 사이언스종합 복습반 문제 풀기
프로덕트 데이터 사이언스(Product Data Science)는 다른 팀과 협업하여 제품 및 서비스의 의사결정을 돕는 직무. 주요 업무로는 기회 규모 추정, 지표 설계, 메트릭 변동 딥다이브, A/B 테스트 설계 및 분석을 한다. 기회 규모 추정가치와 영향을 수치로지표 설계North Star Metric, Guardirail Metrics, Input Metric메트릭 변동 딥다이브예상치 못한 변화에 대한 원인을 분석A/B 테스트 설계 및 분석데이터 기반으로 의사 결정을 내리는 방법

정욱 튜터님 피드백에 따라 1. 결측값은 일단 제외해서 해보고 모델 돌려봤을 때 필요하다 싶으면 로그 씌워서 하기 2. 만약 결측값을 확인했을 때 긴 구간에 연속되게 나타난다면 그 구간 전후로 독립적인 데이터를 둬야 함 -> 나는 날짜별로 정렬되어 있는 결측값들의 인덱스를 뽑아 어떻게 분포하고 있는지 확인했는데 팀원 중 한명 의견인 동별로 보는 게 더 좋을 거 같음 (아닌가? 시퀀스가 깨지면 안돼서 날짜순으로 봐야 하나...? 쓰면서 다시 의문 생김...) 3. train-valid 나눌 때 절대 랜덤으로 나누면 안됨 -> 2020 ~ 2022 train / 2023 valid 4. 회귀, RMSE -> 예측값이 소수점으로 나오면 제출할 때는 반올림 해서 제출하면 좋을 것 같음 5. 부산 지역별로 ..
- 코드카타- 프로젝트 주제 선정 및 데이터 살펴보기
def solution(s): answer = [] if len(s) % 2 == 0: i = len(s) // 2 answer = s[i-1] + s[i] return answer else: i = len(s) // 2 answer = s[i] return answer 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr

# 학생들이 각 과목마다 시험 본 횟수# 학생들 id랑 과목명 순으로select s.student_id, s.student_name, sub.subject_name, count(e.subject_name) as attended_examsfrom Students s cross join Subjects sub left join Examinations e on s.student_id=e.student_id and e.subject_name = sub.subject_namegroup by student_name, sub.subject_nameorder by s.student_id, sub.subject_name ★ 먼저, CROSS JOIN 으로 빈 과목들 채워주는 거 잊지 말기★ select 절에서 어..