Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
Tags
- 딥러닝
- 선형회귀분석
- 로지스틱회귀분석
- machinelearning
- 데이터분석
- 다중선형회귀분석
- deeplearning
- 하이퍼파라미터
- 지도학습
- GridSearchCV
- 시계열데이터
- scikitlearn
- 손실함수
- 데이터전처리
- 잔차분석
- dataframe
- Python
- LinearRegression
- DataScience
- 시계열 데이터
- ML
- RegressionTree
- 결정계수
- 분류
- LogisticRegression
- OrdinalEncoder
- 단순선형회귀분석
- time series
- 비지도학습
- 의사결정나무
Archives
- Today
- Total
IE가 어른이 되기까지
[Data Science] 잔차(Residual)와 오차(Error)란 무엇일까 ? 본문

오차와 잔차는
회귀식을 다룰 때 등장하는 말들입니다.
이 글을 통해 둘의 차이를
정확히 알아보도록 하겠습니다 !
우리는 회귀식을 통해
가지고 있는 데이터들을 대표할 수 있는
직선을 긋게 됩니다.

왼쪽은 모집단을 대표하는 회귀식입니다.
하지만 모든 데이터를 하나의 직선으로 이을 수는 없습니다.
이때 모집단의 회귀식에서 예측된 값 - 실제 관측값을
의미하는 '오차'라는 말이 도입되었습니다.

우리는 보통 모집단을 알 수 없기에 이를 대표하는
표본 집단을 이용하여 회귀식을 추론하게 되는데,
그것이 바로 오른쪽 그림입니다.
이때 표본 집단의 회귀식에서 예측된 값 - 실제 관측값을
의미하는 '잔차'라는 말이 생겨난 것입니다.
'DATA SCIENCE > Algorithms' 카테고리의 다른 글
| [Data Science] 다중공선성이란 무엇일까 ? (0) | 2023.01.09 |
|---|---|
| [Data Science] OneHotEncoder와 Ordinal Encoding 이란 무엇일까 ? (범주형 변수 전처리) (0) | 2023.01.05 |
| [Data Science] 정규화와 표준화란 무엇일까 ? (수치형 변수 전처리) (0) | 2023.01.05 |
| [Data Science] 과적합이란 무엇일까 ? (0) | 2023.01.05 |
| [Data Science] 지도학습과 비지도학습이란 ? (0) | 2023.01.04 |