[seaborn] 상자수염그림

  • 시각화

데이터의 분포를 확인하고 싶을 때 가장 많이 사용하는 시각화 방법 중 하나가 상자 수염 그림(box plot)이다. 파이썬 라이브러리 seaborn을 활용하여 상자 수염 그림 그리는 방법을 정리했다.

상자 수염 그림이란

상자 수염 그림은 앞선 포스팅에서 소개한 KDE 플롯과 마찬가지로 데이터가 어떻게 분포되어 있는지 알려준다. 그러나 데이터의 ‘범위’를 보여주고, 데이터의 상당 부분이 어디에 있는지, ‘이상치’가 있는지 확인할 수 있다는 장점이 있다.

해석 방법은 다음과 같다.

  • 상자는 사분위 범위를 나타낸다.
  • 상자 가운데의 선은 중앙값(median)이다.
  • 맨 끝의 선은 1분위와 3분위다.
  • 다이아몬드는 이상치를 나타낸다.

seaborn으로 상자 수염 그림 (box plot) 그리기

seaborn에서 데이터를 시각화할 때 KDE 플롯을 그리는 것보다 상자 수염 그림을 그리는 게 더 편할 수 있다. 특히 여러 값을 한 번에 비교해서 봐야 할 때.

seaborn에서 sns.boxplot() 메서드를 사용하면 쉽게 그릴 수 있다. data, x, y 값만 설정하면 끝이다.

x 및 y 값에 Pandas Series를 사용하면 축 레이블도 알아서 생성해준다.

sns.boxplot(data=df, x="구분", y="총점")
plt.show()

내가 가지고 있는 pandas 데이터프레임 df 가지고 그냥 바로 그려보니 이렇게 잘 나온다.

쉽다~ 쉬워~

앞으로 데이터의 분포를 보고 싶다면

일단 seaborn으로 box plot을 그려보자.

추천 글

댓글 남기기