일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 단순선형회귀분석
- 잔차분석
- machinelearning
- 결정계수
- 비지도학습
- 손실함수
- LogisticRegression
- 의사결정나무
- ML
- 데이터전처리
- 다중선형회귀분석
- deeplearning
- LinearRegression
- time series
- dataframe
- DataScience
- 시계열데이터
- GridSearchCV
- RegressionTree
- Python
- scikitlearn
- 데이터분석
- 선형회귀분석
- 분류
- OrdinalEncoder
- 시계열 데이터
- 지도학습
- 하이퍼파라미터
- 딥러닝
- 로지스틱회귀분석
- Today
- Total
IE가 어른이 되기까지
[Data Science] 지도학습과 비지도학습이란 ? 본문
데이터 마이닝이란 대량의 데이터를 탐색하고 분석하여
의미 있는 패턴과 규칙을 발견하는 것입니다.
또한, 예측이 주된 목적입니다.
이러한 데이터 마이닝에는 다양한 기법들이 존재합니다.
각 기법 나름대로 장단점이 존재하며 데이터의 크기, 형태, 패턴 유형,
기법이 요구하는 가정 충족 여부, 분석 목적 등에 따라
분석에 사용할 기법들을 선택합니다.
우리는 다양한 기법들을 크게
지도학습과 비지도학습으로 분류할 수 있습니다.
지도 학습
그렇다면 지도학습이란 무엇일까요 ?
지도학습 (교사학습) 이란
입력값 (x) 과 그에 대응하는 레이블 (y) 이 주어져있고,
입력과 레이블값 사이의 관계를 규명하는 학습 방법입니다.
쉽게 말해 문제와 정답이 주어진채로 학습하는 방법입니다.
위 예시를 통해 설명해 보자면
지도학습은 고양이와 강아지라는 정답을 안채로
그림을 학습하게 됩니다.
지도학습에 사용되는 기법은
또다시 분석 목적에 따라 예측과 분류로 나뉩니다.
분석 목적이 예측일 때는
(다중) 회귀분석, 의사결정나무 중 회귀나무, KNN 등이 있고
분류일 때는 의사결정나무 중 분류나무, 로지스틱 회귀분석, KNN, SVM 등이 있습니다.
비지도 학습
반면 비지도 학습은
입력값 (x) 만 주어져있고 입력값만으로
데이터의 특성을 파악하고자 하는 학습 방법입니다.
즉, 답을 가르쳐주지 않고 학습하는 방법입니다.
위 예시로 설명해 보자면
비지도 학습의 경우, 왼쪽과 오른쪽 그림의 정답을 모르기 때문에
오로지 그림으로만 학습하게 됩니다.
비지도 학습에는 연관성 규칙, 주성분 분석, 군집분석 등과 같은
기법들이 존재합니다.
우리는 이렇게 데이터에 정답이 있는지 없는지로
분석 목적에 따라 지도 학습 혹은 비지도 학습 기법들을 선택하여
데이터를 분석합니다.
'DATA SCIENCE > Algorithms' 카테고리의 다른 글
[Data Science] 잔차(Residual)와 오차(Error)란 무엇일까 ? (0) | 2023.01.09 |
---|---|
[Data Science] 다중공선성이란 무엇일까 ? (0) | 2023.01.09 |
[Data Science] OneHotEncoder와 Ordinal Encoding 이란 무엇일까 ? (범주형 변수 전처리) (0) | 2023.01.05 |
[Data Science] 정규화와 표준화란 무엇일까 ? (수치형 변수 전처리) (0) | 2023.01.05 |
[Data Science] 과적합이란 무엇일까 ? (0) | 2023.01.05 |