일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- scikitlearn
- 데이터분석
- RegressionTree
- 다중선형회귀분석
- 로지스틱회귀분석
- deeplearning
- LogisticRegression
- Python
- OrdinalEncoder
- DataScience
- 지도학습
- 결정계수
- 데이터전처리
- 선형회귀분석
- machinelearning
- 잔차분석
- 시계열데이터
- 하이퍼파라미터
- 의사결정나무
- GridSearchCV
- 비지도학습
- ML
- dataframe
- 단순선형회귀분석
- 딥러닝
- 손실함수
- time series
- 분류
- LinearRegression
- 시계열 데이터
- Today
- Total
목록ML/Algorithms (11)
IE가 어른이 되기까지

만약 예측 시 필요한 독립변수 간 편차가 다르면 어떻게 해야할까요 ? 이런 경우, 각 독립변수에 적절한 가중치를 반영하여 유용한 변수를 생성할 수 있습니다. 이것이 바로 이 글에서 다루고자 하는 '주성분 분석' 입니다. 주성분 분석이란 ? 위 그림처럼 원 변수의 가중합 (축 회전) 을 수행하여 새로운 변수를 생성하게 되는데, 이렇게 생성된 새로운 변수를 '주성분'이라고 불립니다. 가장 중요한 특징은 주성분들 간에는 상관관계가 존재하지 않다는 것입니다. 데이터 분산 ( = 정보량) 주성분 분석은 원변수가 설명하는 분산을 가장 잘 설명하는 새로운 변수인 주성분을 원변수의 가중합을 통해 구해내는 과정입니다 이때 등장하는 '분산'이란 무엇이란 무엇일까요 ? 주성분 분석은 위와 같은 특성을 가지고 있습니다. 원변..

이번 글에서는 '군집분석' 알고리즘에 대해 알아보도록 하겠습니다. 군집분석이란 ? 군집분석은 y 레이블이 없는 비지도 학습입니다. 위 그림을 통해 알아봅시다. 원 안의 점들은 어떠한 색을 띠지도 않습니다. 오로지 이러한 점들 간의 유사성을 분석하여 임의의 개수의 그룹으로 나누는 것이 군집분석 (Clustering) 입니다. 군집분석 vs 분류 이때, 우리가 그동안 배워온 분류와 군집분석 간에 어떠한 차이점이 있는지 궁금할 것입니다. 하지만 이 둘은 분명한 차이점이 존재합니다. 분류 (Classification) 는 주어진 데이터 (x) 를 이미 정의된 클래스들 (y) 로 구분하는 문제로 종속변수가 있는 지도학습입니다. 반면, 군집분석 (Clustering) 은 주어진 데이터 (x) 들의 유사성을 분석하여..

이번 글에선 Support Vetor Machine (SVM) 이라는 알고리즘에 대해 다뤄보고자 합니다. SVM도 KNN, 로지스틱 회귀분석, 분류나무 등처럼 분류 알고리즘에 속합니다. SVM은 종속 변수 형태에 따라 범주형 변수는 Support vector classifier, 연속형 변수는 Support vector regression 으로 나뉩니다. 이 글에서는 Support Vector Classifier에서만 다루도록 하겠습니다 ! SVM 이란 ? 위와 같은 그림에서 우리는 빨간색, 파란색 점을 분류할 수 있는 다양한 선형 분류 함수가 존재합니다. SVM은 빨간색, 파란색 집단 사이의 간격, 즉 마진이 최대가 되도록 하는 최적의 선형 분류 함수를 탐색합니다. 이때 선형함수에 맞닿아 있는 관측치들..