반응형
KNN에서 k는 정해줘야 합니다.
비감독학습이 아니라 감독학습입니다. 훈련 데이터에 target값이 있습니다.
분류하려는 타겟과 가장 가까이에 위치한 k개의 점을 먼저 찾아서 확인하고, 다수결로 타겟을 분류합니다.
회귀분석과 결합시키면 연속값 예측도 할 수 있습니다.
즉, 연속/비연속 등 모든 분류 문제에 적용이 가능합니다.
I : identifier함수. 괄호 안의 수식이 1이면 참 0이면 거짓
D_x : x를 중심으로 원을 그린 것. 반경집합.
argmax_v : 괄호 안 수식의 최대 변수 v를 찾는 것.
Weighted KNN
거리를 감안한 KNN 입니다.
거리의 역수나 역수의 제곱의 역수를 가중치로 두는 경우가 많습니다.
거리를 감안하지 않는 방식보다 정확도가 더 높습니다.
이 방법 역시 모든 분류 문제에 적용이 가능합니다.
분류 결과 평가 - 혼동 행렬 Confusion matrix
혼동행렬은 대각선 모양으로 숫자가 모여 있는 것이 가장 좋은 결과를 의미합니다. 대각선 모양이라는 것은 역슬래시 모양의 위치들을 말합니다.
반응형
'IT,SW,Data,Cloud,코딩' 카테고리의 다른 글
텍스트마이닝 (0) | 2022.02.17 |
---|---|
베이즈 정리, 나이브 베이즈 (0) | 2022.02.15 |
SVM 알고리즘과 분류기, SVR 알고리즘 (0) | 2022.02.10 |
군집분석 Clustering (0) | 2022.02.08 |
[초보자용 Git 설명] Git 기본 개념 및 Git Flow 관련 용어 이해하기 (0) | 2022.02.01 |
회귀분석 Regression Analysis (0) | 2022.01.27 |
의사결정트리: 엔트로피, 정보이득, 지니계수, 카이제곱스퀘어 (0) | 2022.01.25 |
도커, 컨테이너, 쿠버네티스, 마이크로서비스, 데브옵스 (0) | 2022.01.20 |
댓글