머신러닝

Bag-of-Words(BoW) 쉽게 이해하기

자연어 처리(NLP), 흔히 말하는 텍스트 마이닝에서 Bag-of-Words는 정말 단순하지만 여전히 유효한 모델이다. BoW의 개념을 최대한 쉽게 소개해본다.

K-Means 클러스터링 쉽게 이해하기

본 포스팅에서는 데이터 클러스터링(군집화)로 널리 사용되는 비지도학습 알고리즘 K-Means 클러스터링에 대해 최대한 쉽게 설명해보고자 한다. 파이썬 라이브러리 scikit-learn 사용법도 간략히 소개한다.

나이브 베이즈(Naive Bayes)를 활용한 문서 분류 쉽게 이해하기

나이브 베이즈 분류기(Naive Bayes Classifier)는 “베이즈 정리”를 활용하여 분류를 수행하는 머신러닝 지도학습 알고리즘이다. 특히 텍스트(문서)의 분류에 많이 사용되는데, 실제로 어떤 계산을 통해 분류하게 되는지 그 과정을 최대한 쉽게 소개해본다.