머신러닝

knn03

K-최근접 이웃(K-Nearest Neighbor) 쉽게 이해하기

본 포스팅에서는 머신러닝에서 사용할 K-최근접 이웃(K-Nearest Neighbor)에 대한 개념 설명을 최대한 쉽게 설명한다. 정규화(normalization), k개수에 따른 과적합(overfitting), 과소적합(underfitting)에 대한 개념도 함께 소개한다.

normalized

정규화(Normalization) 쉽게 이해하기

데이터 정규화는 머신러닝에서 꼭 알아야 하는 개념이다. 매우 훌륭한 데이터를 가지고도 정규화를 놓치면 특정 feature가 다른 feature들을 완전히 지배할 수 있기 때문이다. 최소 최대 정규화, Z-점수 정규화를 통해 문제를 해결하자.