회귀(Regression)
회귀는 통계학과 머신러닝에서 사용되는 용어로, 1 개 이상의 독립변수(x)와 한 개의 종속변수(y) 간의 상관 관계를 분
석하고 예측하는 작업을 말한다.
일반적으로, 하나 이상의 독립 변수(입력)가 종속 변수(출력)에 미치는 영향을 설명하거나 예측할 때 사용
지도 학습(Supervised Learning)에서는 크게 회귀(Regression)과 분류(Classifier), 이 2가지 유형으로 나뉜다.
회귀: 연속된 값(Continuos Value)을 예측할 때 사용 (ex. 아파트 가격 예측, 시험 점수 예측 등)
분류 : 이산적 값(Discrete Value)을 예측할 때 사용(불량품이냐 아니냐, 7개의 라벨값 중 어느 것이냐? 등)
회귀 모델(회귀 함수)의 종류
(하도 헷갈려서 정리를 하려고 한다)
선형 함수 : 선형 방정식(Linear equation)
-> 선형 함수는 단순 선형 회귀, 다중 선형 회귀로 또 나뉜다.
단순 선형 회귀(Simple Linear Regression) : 하나의 독립 변수만으로도 y 값을 설명할 수 있을 때 사용(일차 함수)
다중 선형 회귀(Multiple Linear Regression) : 두 개 이상의 독립 변수(x)로 y 값을 설명할 수 있을 때 사용(2 개 이상의 독
립 변수로 구성된 선형 방정식(Linear Equation)
비선형 함수 : Sigmoid Model, Logistic Model, 2차 함수 등
여기서 말하고 싶은 것은 종종 회귀 모델이라 함은 습관적으로 선형 함수 모델로만 생각하기 쉽다.
그러나 이는 각종 머신 러닝 교재에서 회귀 모델을 설명할 때 선형 방정식(Linear Equation) 중심으로만 설명을 해서 그런
것 같다.
그러나 Sigmoid Model을 생각해 보면 알듯이, Sigmoid 의 그래프 형태는 선형 방정식(Linear Equation)이 아니다.
고로, 회귀 모델이라는 용어를 들었을 때에는 선형 방정식(Linear Equation)에 꽂혀서 생각하지 말고, 위에 적힌 회귀 용어
에 대한 정의를 복기해서 생각을 하자.
정리
1. 회귀 모델은 선형 모델도 있고, Sigmoid와 같은 비선형 모델도 있다.
-> 회귀란 독립 변수와 종속 변수와의 관계를 그래프로 표현한 것일 뿐!!! 2차 함수로도 얼마든지 독립 변수와 종속 변수의
상관 관계를 나타낼 수가 있다.
2. 회귀 모델은 이산적 값의 예측이 아니라, 아파트 주택 가격과 같이 연속적 값의 예측을 할 때 사용
'딥러닝을 위한 수학 > 확률과 통계' 카테고리의 다른 글
표본 평균들의 확률 분포-2 (0) | 2024.02.02 |
---|---|
표본 평균들의 확률 분포-1(Feat. 모집단, 표본 집단, 전수 조사, 표본 조사,임의 추출, 복원 추출) (1) | 2024.02.02 |
이항 분포와 정규분포의 관계(Feat. 드 누아브르-라플라스 정리) (1) | 2024.02.02 |
정규 분포(Normal Distribution)와 표준화(Feat. 확률 밀도 함수,표준 정규분포표) (0) | 2024.02.01 |
연속 확률 변수(Continuous Probability Variables) 확률 밀도 함수(Probability Density Function) (0) | 2024.02.01 |