hyezdata 님의 블로그

[통계학 기초] 05 상관 관계 본문

내일배움캠프/데이터 강의

[통계학 기초] 05 상관 관계

hyezdata 2025. 4. 7. 17:38

1. 피어슨 상관계수

가장 대표적으로 많이 사용하는 상관계수로, 데이터가 선형적인 관계이고, 정규분포일 때 사용한다.

  • 두 연속형 변수(숫자 형태의 값) 간의 선형 관계를 측정하는 지표
  • -1 ~ 1 사이의 값을 가짐
  • 1은 양의 선형관계, -1은 음의 선형관계, 0은 관계 없음

피어슨 상관계수는 비선형 관계에선 사용할 수 없고, 선형적인 관계가 예상될 때! 사용 가능하다.

피어슨 상관계수 그래프

 

2. 비모수 상관계수

데이터가 정규분포를 따르지 않거나, 순서형 데이터일 때 데이터 분포에 대한 가정없이 사용한다.

 

1) 스피어만 상관계수

  • 두 변수가 일정하게 같은 방향으로 올라가고 있는지 일관성을 측정
  • 데이터 내 편차와 에러에 민감

스피어만 상관계수 그래프

 

2) 켄달 타우 상관계수

  • 순위 간의 일치쌍 및 불일치쌍의 비율을 바탕으로 계산
  • ex. 키와 몸무게의 상관계수를 알고 싶을 때, 키가 크고 몸무게도 크면 일치쌍, 키는 큰데 몸무게는 적으면 불일치쌍

켄달 타우 상관계수 그래프

 

비모수 상관계수는 데이터의 분포에 대한 가정을 하지 못할 때, 순서형 데이터일 때 사용한다.

 

3. 상호정보 상관계수

 

728x90
반응형

'내일배움캠프 > 데이터 강의' 카테고리의 다른 글

[매트릭] 비지니스 메트릭 1회차  (0) 2025.05.07
[통계야 놀자] 4회차  (0) 2025.04.09
[통계야 놀자] 2회차  (0) 2025.04.04
[통계야 놀자] 1회차  (0) 2025.04.02
[통계학 기초] 04 회귀  (0) 2025.04.02