DATA SCIENCE/Algorithms

[Data Science] 잔차(Residual)와 오차(Error)란 무엇일까 ?

기모랑의 초코 2023. 1. 9. 21:56

 

 

 

 

오차잔차

회귀식을 다룰 때 등장하는 말들입니다.

 

이 글을 통해 둘의 차이를

정확히 알아보도록 하겠습니다 !

 

 

 


 

 

 

우리는 회귀식을 통해

가지고 있는 데이터들을 대표할 수 있는

직선을 긋게 됩니다.

 

 

 

 

왼쪽은 모집단을 대표하는 회귀식입니다.

하지만 모든 데이터를 하나의 직선으로 이을 수는 없습니다.

 

이때 모집단의 회귀식에서 예측된 값 - 실제 관측값

의미하는 '오차'라는 말이 도입되었습니다.

 

 


 

 

 

우리는 보통 모집단을 알 수 없기에 이를 대표하는

표본 집단을 이용하여 회귀식을 추론하게 되는데,

그것이 바로 오른쪽 그림입니다.

 

이때 표본 집단의 회귀식에서 예측된 값 - 실제 관측값

의미하는 '잔차'라는 말이 생겨난 것입니다.