hyezdata 님의 블로그

[머신러닝] 머신러닝이란? 본문

내일배움캠프/머신러닝

[머신러닝] 머신러닝이란?

hyezdata 2025. 4. 17. 13:49

'실무에 쓰는 머신러닝 기초' 강의랑 '머신러닝 특강 세션'이랑 합쳐서 정리함

01. 머신러닝

AI, 머신러닝, 딥러닝

AI > 머신러닝 > 딥러닝 순으로 AI가 제일 큰 개념이고 그 다음이 머신러닝, 딥러닝이다.

머신러닝은 데이터로부터 특징이나 규칙을 찾아내서 학습하는 것이고,

딥러닝은 인공신경망을 여러 겹 쌓아 학습하는 알고리즘이다.

 

통계분석 VS 머신러닝

통계분석은 "왜?"라는 질문에 집중하고, (가설검증, 추론)

머신러닝은 "얼마나 잘?"에 집중한다. (정확도, 재현율)

 

02. 머신러닝의 종류

1. 지도학습(Supervised Learning)

정답값(레이블)이 있는 데이터를 학습시키는 것

 

1) 분류(Classification)

어느 그룹에 속하는지

 

2) 회귀(Regression)

숫자로 된 결과 예측

 

2. 비지도학습(Unsupervised Learning)

정답값(레이블) 없는 데이터의 패턴을 찾는 것

 

1) 군집화(Clustering)

성향이 비슷한 데이터를 묶는 방법

 

2) 차원축소(Dimensionality Reduction)

데이터의 변수가 많아 복잡한 데이터를 핵심 정보만 남기고 압축하는 기법

 

3. 강화학습(Reinforcement Learning)

강화학습

용어 설명 (ex. 게임)

1. Agent : player

2. action

3. environment : 처한 환경, 맵

4-1. state : 처한 상황 (

4-2. reward : 보상 (퀘스트를 깨면 얻는 보상)

 

agent가 enviroment와 상호작용하면서 가장 높은 보상을 받도록 하는 action을 학습하는 것

 

03. 머신러닝 모델링 프로세스

1. 데이터 수집

양질 데이터 확보 중요

 

2. 전처리(Preprocessing)

1) 결측치 처리

 

2) 이상치 처리

 

3) 스케일링

각각 다른 단위를 쓰는 데이터들을 비슷한 단위로 맞춰주는 작업

ex. 몸무게와 키를 모두 0~1 범위로 바꿈

 

3) 범주형 변환

글자로 된 정보를 숫자로 바꿔주는 작업

ex. 원-핫 인코딩, 레이블 인코딩 등

'원-핫 인코딩'
해당 범주에 속하면 '1', 아니면 '0'
ex. 빨강 = (1, 0, 0), 초록 = (0, 1, 0), 파랑 = (0, 0, 1)

'레이블 인코딩'
순서대로 숫자를 부여 (숫자에 순위의 의미가 생길 수 있으니 주의!)
ex. 옷 사이즈 → S = 0, M = 1, L = 2...

 

3. 모델링(Modeling)

지도학습일 경우 분류/회귀 선택, 비지도학습일 경우 클러스터링/차원 축소 선택

 

4. 성능평가(Evaluation)

1) 분류

  • Accurancy
  • Precision
  • Recall
  • F1-score
  • ROC-AUC 등

2) 회귀

  • MAE
  • RMSE
  • R^2 등

3) 비지도(군집)

  • 실루엣 계수 등

5. 배포

 

마지막으로 학습 데이터에 편향된 샘플이 많으면, 모델도 그 편향을 그대로 학습하므로 주의해야 한다!

 

728x90
반응형

'내일배움캠프 > 머신러닝' 카테고리의 다른 글

[머신러닝] 회귀(Regression)  (0) 2025.04.17
[머신러닝] 분류(Classification)  (0) 2025.04.17
[머신러닝] 데이터 전처리  (0) 2025.04.17