kNN Classification (k-근접이웃 분류) 새로운 데이터 점이 주어지면, 주변에서 가장 가까운(유사한) k개의 점들의 클래스를 보고 판단하는 방법 kNN 분류 알고리즘 1. 주어진 모든 점들과 테스트 포인트 간의 유사도 or 거리 (𝑑(𝐱, 𝐱𝑖 )) 계산 2. 가장 가까운 점 k개를 찾고 레이블 읽기 3. k개 점들의 클래스 중 가장 빈도가 높은 클래스를 테스트 포인트의 클래스로 지정 k값의 선택 big k small k 의사결정 경계가 smooth 해짐 -> 잘 분류를 못함 -> 과소적합 상태와 유사함 -> bias 증가, variance 감소 계산시간 증가 의사결정 경계가 복잡 -> 과적합 상태와 유사함 -> bias 감소, variance 증가 이상치에 매우 민감 * bias : 편향..