DATA SCIENCE/Algorithms
[Data Science] 잔차(Residual)와 오차(Error)란 무엇일까 ?
기모랑의 초코
2023. 1. 9. 21:56
오차와 잔차는
회귀식을 다룰 때 등장하는 말들입니다.
이 글을 통해 둘의 차이를
정확히 알아보도록 하겠습니다 !
우리는 회귀식을 통해
가지고 있는 데이터들을 대표할 수 있는
직선을 긋게 됩니다.
왼쪽은 모집단을 대표하는 회귀식입니다.
하지만 모든 데이터를 하나의 직선으로 이을 수는 없습니다.
이때 모집단의 회귀식에서 예측된 값 - 실제 관측값을
의미하는 '오차'라는 말이 도입되었습니다.
우리는 보통 모집단을 알 수 없기에 이를 대표하는
표본 집단을 이용하여 회귀식을 추론하게 되는데,
그것이 바로 오른쪽 그림입니다.
이때 표본 집단의 회귀식에서 예측된 값 - 실제 관측값을
의미하는 '잔차'라는 말이 생겨난 것입니다.