일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 프로그래머스
- 신뢰구간
- 표본
- floor
- 표본분포
- python
- dateofmonth
- 날짜함수
- 정규분포
- lambda
- 표준오차
- merge
- truncate
- Recursive
- append
- 데이터 리터러시
- curdate
- 표분편차
- 재귀쿼리
- rrule
- datediff
- limit
- 재퀴쿼리
- 모집단
- pivot table
- split
- calesce
- join
- DATE_FORMAT
- concat
- Today
- Total
목록내일배움캠프/프로젝트 (7)
hyezdata 님의 블로그
키워드 군집화를 이용한 연구 논문 분류에 관한 연구https://www.koreascience.kr/article/JAKO201809863002140.pdf 엘보우 기법을 적용하여 클러스터 개수를 도출하고 실루엣 기법을 이용하 여 클러스터링 성능을 검증TF-IDF 모델과 하둡 맵리듀스 프레임워크 사용TF-IDF 기법을 이용하여 각 논문을 대표하는 키워드의 중요도를 계산하였고, TF-IDF 결과 값을 이용하여 K-평균 클러스터링 알고리즘으로 군집화를 수행과정1. 논문 수집2. 키워드 사전 구축 (빈도수 상위 n개 키워드 사용)3. 각 논문 초록(요약)에서 키워드 횟수 계산4. 키워드 사전에 정의된 단어가 전체 논문 초록에서 얼마나 사용되는지 계산5. 키워드 사전에 있는 단어가 몇 개의 논문의 초록에 사용되..

01. 고객1 인사이트 고객1의 매물인 삼성래미안은 최근 2년간 거래량이 17건, 거래액이 대략 6000만원 상승하였다. 만약 지금 매물을 판다면 24년 대비 대략 18% 수익률을 얻을 수 있다. 02. 고객2 인사이트 고객2가 가지고 있는 텐즈힐1단지를 지금 판다면 전년 대비 24%의 수익률을 얻을 수 있다. 고객2의 추천 매물 '래미안 위브'는 35%의 수익률, '고덕 센트럴 아이파크'는 34%의 수익률로 래미안 위브가 더 수익률이 높다. 그러나 추천 매물의 입지와 고객2의 요구사항인 자녀의 교육 환경을 고려해봤을 때 '고덕 센트럴 아이파크'가 더 적절하다고 판단하였다.'텐즈힐 1단지'를 팔고 '고덕 센트럴 아이파크'를 매입한다면 4억 7천을 차익으로 남길 수 있다. 03. 향후 전략지속적인 시..

고객1: 고수익을 원하는 30대 남성 (매도) 고객1은 유산으로 물려받은 아파트를 빠른 시일내에 팔아 높은 수익을 얻길 원하는 고객이다. 용산구는 서울 중심지에 위치하고 있어 접근성이 좋고, 고객1의 매물인 삼성 래미안은 효창공원역과 공덕역이 도보로 10분 걸리며 원효초, 금양초 등 우수한 학군과 염리동 학원가가 인근에 위치하고 있어 초중고에 재학 중인 자녀가 있는 가족이 살기 좋다. 용산구의 연도별 평균 거래량은 21년 이후 급락후 소폭 상승하고 있으며, 가격은 22년부터 큰 폭으로 상승하고 있다. 거래량이 많을 때 평균 거래 금액도 같이 상승하는 경향이 있고, 여름철인 6~8월에 거래량과 거래 금액이 증가하는 걸 확인할 수 있다. 고객2: 새 매물을 원하는 40대 여성 3인 가족 (매수 매도) ..

00. 준비 그래프 한글 깨짐이 있어서 한글 폰트 코드 작성해주고 01. 자치구별 평균, 최대, 최소 금액1. 자치구별 평균 금액top3 → 강남구, 서초구, 용산구 2. 자치구별 최고 금액top3 → 용산구, 강남구, 성동구 3. 자치구별 최저 금액top3 → 종로구, 영등포구, 강서구 02. 월별 평균, 최고, 최저 금액 1. 월별 평균 금액top3 →7월, 6월, 8월 2. 월별 최고 금액top3 → 1월, 2월, 11월 3. 월별 최저 금액top3 → 6월, 5월(2000), 10월(2000) , 11월(2000) , 12월(2000) [자치구별]평균 금액은 강남구, 서초구, 용산구 순으로 제일 높았고,최고 금액은 용산구, 강남구, 성동구 순으로 높고,최저 금액은 종로구, 영등포구, 강서구 순으로..

18-24년도 서울시 부동산 실거래가 정보00. 준비사용할 라이브러리 데이터 불러와주고 사용할 데이터 한 테이블로 합쳐줌 데이터 타입~ 01. 결측치 확인 02. 자치구명1. 결측값 들어있는 행 확인미아동은 강북구, 강북구 코드 확인이 필요할 것 같다. 강북구 코드는 '11305' 인데 '26230'으로 잘못 들어가 있음 2. 결측치 수정자치구명과 자치구코드 변경, 채워줌 3. 수정 확인마지막으로 결측치가 제대로 수정되었는지 확인 03. 계약일1. 결측치 확인계약일에 2018년 이전 데이터도 포함되어 있음 2. 계약일과 취소일 date형태로 변경먼저 데이터 타입 변경해주고 3. 2018년 이전 데이터 제외 4. 데이터 확인 04. 취소일1. 결측치 확인계약일과 취소일 같이 보니 계약을 하지 않고 취소한 ..

01. 부동산 자료 02. 사전 분석 본격적인 데이터 분석 전에 24년 기준 6, 7, 8월에 금액이 증가한다는 걸 확인 03. 가설 설정여름철에 매물량과 매물 금액이 증가할 것이다.→ 봄이나 가을에 팔면 매물량이 적어 높은 금액으로 팔 수 있을 것이다.보통 자녀를 둔 30~40대가 거래량이 많을 것이다.토허제(토지 거래 허가 구역 해제) 전후로 서울 아파트 평균 매매 금액이 달라짐→ (토허제 전) 서울 아파트 평균 매매 하락으로 급매일 경우 가격 조정이 필요→ (토허제 후) 토허제에 해당하는 지역일 경우, 가격 상승 좀 더 구체적인 인사이트를 위해 고객을 설정하기로 결정!04. 고객 설정✔️ 투자 목적 매수 고객재개발/재건축 지역가설 : 재개발/재건축 지역은 향후 부동산 가치가 상승할 것이다.데이터 ..

BASIC 문제1. 숫자 리스트의 평균을 계산하는 방법 - 리스트, 반복문전자 상거래 플랫폼에서 고객의 평균 주문을 계산해야 합니다. 이를 위해 숫자 리스트의 평균을 계산하는 방법을 연습합니다.# 예시 데이터numbers = [10, 20, 30, 40, 50]def calculate_avg(numbers): total = 0 for i in numbers: total += i total_avg = total / len(numbers) return total_avgtotal_avg = calculate_avg(numbers)print("숫자들의 평균:", total_avg) 굳이 for문을 사용하지 않고 sum을 이용해 풀면 더 간단함 튜터님 풀이더보기# 예시 데이터nu..