일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- lambda
- 데이터 리터러시
- Recursive
- 표분편차
- 표준오차
- pivot table
- floor
- dateofmonth
- rrule
- concat
- 재퀴쿼리
- append
- DATE_FORMAT
- python
- join
- limit
- 재귀쿼리
- datediff
- 표본
- calesce
- 모집단
- split
- 정규분포
- curdate
- truncate
- 신뢰구간
- 날짜함수
- merge
- 표본분포
- 프로그래머스
- Today
- Total
목록내일배움캠프/TIL (43)
hyezdata 님의 블로그
넣을거임
쓸 예정

우리는 대시보드를 한명이 다 만든게 아니라 따로 따로 만들어서 합치다 보니 원본 파일이 다 달랐음 그래서 필터 초기화 설정하는데 안돼서 계속 시도해보다가 드디어 해결...ㅠ0ㅠ 필터 초기화 버튼 만들기 1. '초기화 버튼' 워크시트 만들기 2. 행을 더블클릭해서 0 넣고 엔터 3. 마크에서 도형 선택해주고 초기화 버튼으로 사용할 이미지 넣기오른쪽 데이터 탭처럼 버튼 추가할 데이터 선택 해줘야 함 4. 대시보드에 가서 초기화버튼 워크시트 넣어주기 5. 대시보드 - 동작 - 동착 추가 - 필터 ★ 6. 필터 동작 편집 부분원본시트 : 초기화 버튼만 선택, 동작 실행 조건 - 선택대상 시트 : 초기화 버튼 빼고 다 선택, 선택을 해제할 경우의 결과 - 모든 값 표시 여기서 중요함!선택할 필드 잘 설정해주기..

오늘부터 태블로 들어가기로~나는 군집 분석한 결과를 태블로에 보여주기였는데첨엔 태블로에 있는 클러스터 기능을 사용해봤지만 태블로에 있는 클러스터를 사용할 경우 수치형 변수를 사용해야 하고 표현이 내가 생각했던 대로 되지 않아 실패그 다음은 tabpy를 시도해보았지만 이것도 실패결국엔 파이썬으로 군집한 결과를 csv 파일로 다시 저장해 태블로에 보여주기로~ secondary 카테고리마다 클러스터한 결과를 tsne의 값과 함께 저장,이때 클러스터의 번호가 겹치므로 '카테고리+클러스터번호'를 새로운 클러스터 이름으로 생성 그리고 각 클러스터에 해당하는 하이라이트 카테고리도 저장해준다. 저장한 csv를 파이썬으로 돌림 tsne처럼 태블로에 나타내주면 된다. 리뷰 상위 10개 브랜드는 레이블로 브랜드 이름을 표시..

중간 발표 이후로 첨 쓰는 til같네...;; 이때까지 진행사항중간 발표 주 어제 오늘 진행 사항군집 분석마케팅 방안 도출두 팀으로 나눠서 나는 군집 분석 팀으로 진행 목표 : 제품의 특징을 나타내는 highlights 컬럼을 이용해 군집 분석으로 브랜드 포지셔닝을 파악한다.처음엔 highlights의 키워드, 총 70여개를 가지고 카테고리별로 군집 분석을 했으나 의미가 중복되는 키워드가 많아 highlights를 의미가 비슷한 것끼리 카테고리를 만듦총 9개 카테고리 secondary 카테고리로 나눠서 카테고리마다 군집 분석을 했을 때 대부분 3개로 했을 때 클러스터마다 특징이 두드러졌고, 보통 피부 타입 & 성분, 친환경/윤리적 가치, 클린 뷰티 로 나뉘어졌다.

주말동안 서로 생각해 온 분석 주제와 흐름 텍스트 전처리불용어 제거리뷰 개수 몇개 이상 필터링 할 건지특수문자 제거중복 공백 제거글자 반복 제거대문자 → 소문자gemini를 이용하여 LLM 감성 분석일단 만들어 본 코드로 돌리고 있는데 지금 151845 개 중 18777개 하는데 278m...이 속도론 낼 아침에 끝날지도...?ㅎ

오늘 각자 한 eda 피그마에 정리 eda 해 본 결과 전체적인 인사이트는- 사람 타입별(머리색, 피부 타입, 피부색 등)은 평점, 추천 비율과는 상관이 없다.- 평점별로 top3 조회한 결과로 리뷰수와 좋아요수를 살펴봤더니 셀프 케어 제품(스킨케어, hair mask...) 그래서 만약 스킨케어 제품을 주력으로 간다면 크롤링이 필요하지 않을수도...

프로덕트 데이터 사이언스 - A/B 테스트 A/B 테스트는 두 개 이상의 그룹을 비교하여 변화가 목표에 미치는 영향을 측정하는 실험 방법.이 때, '대조군'은 변화를 주지 않은 그룹, '실험군'은 새로운 조건을 적용한 그룹이다.A/B 테스트에선 편향과 숨겨진 외부 요인에 대한 영향을 최소화하기 위해 랜덤화를 진행한다. 하지만, A/B 테스트로 나온 차이를 신뢰할 수 있는지 없는지 그냥 알 순 없고 표준편차(SE)를 이용한다. 샘플 크기가 클수록 표준 편차는 작아지고, 신뢰도는 높아진다. 신뢰 구간(CI) 은 같은 실험을 여러 번 반복했을 때, 모집단의 평균이 그 구간 안에 포함될 가능성이 높다는 걸 의미한다.두 그룹의 신뢰구간이 겹치지 않는다면, 두 그룹 간의 차이는 우연일 가능성이 낮다. (= 유의미하..
SQLD 공부프로덕트 데이터 사이언스종합 복습반 문제 풀기