데이터분석

썸네일_pandas

[pandas] 1.0 주요 업데이트 내용

파이썬에서 거의 엑셀급의 위치에 있는 데이터 분석 라이브러리 pandas가 1.0으로 업데이트 됐다. 2010년 1월 29일자로. 이전 버전이 0.25였는데 자신있게 1.0으로 내놓은 만큼 그동안 있었던 자잘한 버그들은 웬만큼 잡아놓은 모양이다.

썸네일_pandas

[pandas] 데이터 전처리 – 파일 병합, 데이터프레임 수정, 중복 값 확인 및 제거

데이터 분석을 공부할 때는 매우 clean한 데이터들을 다루기 때문에 분석에만 집중할 수 있으나 현실 세계는 그리 녹록치 않다. 실제로 현업에 들어가면 매우 dirty한 데이터들만 마주하게 된다. 그래서 본 포스팅에서는 더티한 데이터를 받았을 때 어떻게 전처리하면 좋을지 방법을 간략히 남겨보고자 한다.