머신러닝의 학습 방법 중 지도학습(Supervised Learning)이 무엇인지 알아보겠습니다.
지도학습(Supervised Learning) 이란?
지도학습은 알고리즘에 사용하는 훈련 데이터에 레이블(label)이라는 원하는 답이 포함되어 있는 상태에서 데이터와 정답을 함께 학습하는 방법입니다.
지도학습은 모델이 데이터와 레이블 간의 관계를 학습하여, 새로운 데이터에 대한 정확한 예측이나 분류를 수행할 수 있도록 하는 학습 방법 입니다. 위 그림과 같이 개와 고양이로 레이블링 되어 있는 데이터를 주고 이를 학습 시키면, 개 인지 고양이 인지를 예측할 수 있는 지도학습 모델이 됩니다.
지도학습은 레이블이 주어진 데이터를 바탕으로 모델을 훈련시키므로, 충분하고 다양한 데이터가 중요합니다. 또한, 모델이 훈련 데이터에 과적합하지 않도록 주의해야 합니다. 과적합이 되면 훈련 데이터에는 잘 작동하지만 새로운 데이터에는 잘 작동하지 않는 상황이 됩니다. 이를 해결하기 위해서는 교차검증과 같은 기법들을 사용해서 모델을 훈련해야 합니다.
지도학습의 종류 (Types of Supervised Learning)
지도학습으로 해결 하려는 문제의 종류에 따라 나눌 수 있는데, 예측 하려는 값이 연속 값이면 회귀로, 예측하려는 값이 이산 값이면 분류로 나눌 수 있습니다.
분류 (Classification)
분류(Classification)는 종류를 예측하는 것으로 여러 범주 중 하나로 예측하는 방법입니다.
다음과 같은 특징이 있습니다.
- 예측하고자 하는 타겟값이 범주형 변수인 경우
- 예측 결과가 이산값을 가지고 있음 (연속성을 지니지 않음)
분류 방법은 예측값이 어떻게 나오느냐에 따라서 이진 분류와 다중 분류로 나눌 수 있습니다.
- 이진 분류 (Binary Classifiction): 예측값이 두가지 범주 중 하나인 경우, 정상 or 악성
- 다중 분류 (Multiclass Classification): 예측값이 세 개 이상의 범주 중 하나인 경우
회귀 (Regression)
회귀(Regression)는 연속된 값을 예측하는 것으로 수치값으로 예측하는 방법입니다.
회귀는 다음과 같은 특징을 갖습니다.
- 예측하고자 하는 타겟값이 실수(숫자)인 경우
- 손해액, 매출량, 거래량, 파산 할 확률과 같은 수치를 예측
회귀 방법은 독립 변수의 갯수에 따라 단순 선형 회귀, 다중 선형 회귀가 있습니다.
- 단순 선형 회귀(Simple Linear Regression): 하나의 독립 변수와 하나의 종속 변수 간의 관계를 모델링
- 다중 선형 회귀(Multiple Linear Regression): 두 개 이상의 독립 변수와 하나의 종속 변수 간의 관계를 모델링
지도학습 알고리즘 (Supervised Learning Algorithm)
대표적인 지도학습 기법은 아래와 같은 기법들이 있습니다.
- 나이브 베이즈 (Naive Bayes)
- 최근접 이웃 (K-Nearest Neighbors)
- 서포트 벡터 머신 (Support Vector Machine, SVM)
- 의사결정나무 (Decision Tree)
- 앙상블 기법 (Ensemble)
- 로지스틱 회귀 (Logistic Regression)
- 선형 회귀 (Linear Regression)
- 다항 회귀 (Polynomial Regression)
- 스텝 와이즈 회귀 (Stepwise Regression)
- 릿지 회귀 (Ridge Regression)
- 라소 회귀 (Lasso Regression)
- 엘라스틱넷 회귀 (ElasticNet Regression)
- 사례 기반 추론 (Case-based Reasoning)
- 인공신경망 (Artificial Neural Network)
각 기법에 대한 자세한 사항은 차차 포스팅 할 예정입니다.
이상 머신러닝 학습 방법 중 지도 학습에 대해서 알아보았습니다.
머신러닝(Machine Learning)
1. 머신러닝이란? (Machine Learning?)
2. 머신러닝 학습 방법 - 지도학습 (Supervised Learning)
3. 머신러닝 학습 방법 - 비지도학습 (Unsupervised Learning)
Comment