머신러닝

Bag-of-Words(BoW) 쉽게 이해하기

자연어 처리(NLP), 흔히 말하는 텍스트 마이닝에서 Bag-of-Words는 정말 단순하지만 여전히 유효한 모델이다. BoW의 개념을 최대한 쉽게 소개해본다.

K-Means 클러스터링 쉽게 이해하기

본 포스팅에서는 데이터 클러스터링(군집화)로 널리 사용되는 비지도학습 알고리즘 K-Means 클러스터링에 대해 최대한 쉽게 설명해보고자 한다. 파이썬 라이브러리 scikit-learn 사용법도 간략히 소개한다.

나이브 베이즈(Naive Bayes)를 활용한 문서 분류 쉽게 이해하기

나이브 베이즈 분류기(Naive Bayes Classifier)는 “베이즈 정리”를 활용하여 분류를 수행하는 머신러닝 지도학습 알고리즘이다. 특히 텍스트(문서)의 분류에 많이 사용되는데, 실제로 어떤 계산을 통해 분류하게 되는지 그 과정을 최대한 쉽게 소개해본다.

베이즈 정리 (Bayes' Theorem) 쉽게 이해하기

머신러닝 알고리즘 나이브 베이즈(Naive Bayes)를 사용하기 위해서는 일단 베이즈 정리(Bayes’ Theorem)라는 걸 먼저 이해해야 한다. 본 포스팅에서는 베이즈 정리의 개념만 최대한 쉽고 단순하게 설명해본다.

랜덤 포레스트(Random Forest) 쉽게 이해하기

본 포스팅에서는 의사결정 트리의 오버피팅 한계를 극복하기 위한 전략으로 랜덤 포레스트(Random Forest)라는 방법을 아주 쉽고 간단하게 설명하고자 한다. 파이썬 머신러닝 라이브러리 scikit-learn 사용법도 함께 소개한다.