[pandas] 1.0 주요 업데이트 내용
파이썬에서 거의 엑셀급의 위치에 있는 데이터 분석 라이브러리 pandas가 1.0으로 업데이트 됐다. 2010년 1월 29일자로. 이전 버전이 0.25였는데 자신있게 1.0으로 내놓은 만큼 그동안 있었던 자잘한 버그들은 웬만큼 잡아놓은 모양이다.
파이썬에서 거의 엑셀급의 위치에 있는 데이터 분석 라이브러리 pandas가 1.0으로 업데이트 됐다. 2010년 1월 29일자로. 이전 버전이 0.25였는데 자신있게 1.0으로 내놓은 만큼 그동안 있었던 자잘한 버그들은 웬만큼 잡아놓은 모양이다.
그동안 SPSS로 처리하던 탐색적 요인분석(EFA), 신뢰도(Cronbach’s alpha) 확인하는 걸 파이썬으로 해봤다.
머신러닝을 개념을 최대한 쉽게 정리해봤다.
지난 포스팅에 이어서 파이썬으로 데이터를 다룰 때 어떻게 전처리하면 좋을지, 특히 결측치를 다루는 방법을 간략히 남겨보고자 한다.
지난 포스팅에 이어서 파이썬으로 데이터를 다룰 때 어떻게 전처리하면 좋을지, 특히 문자열을 다루는 방법을 간략히 남겨보고자 한다.
데이터 분석을 공부할 때는 매우 clean한 데이터들을 다루기 때문에 분석에만 집중할 수 있으나 현실 세계는 그리 녹록치 않다. 실제로 현업에 들어가면 매우 dirty한 데이터들만 마주하게 된다. 그래서 본 포스팅에서는 더티한 데이터를 받았을 때 어떻게 전처리하면 좋을지 방법을 간략히 남겨보고자 한다.
요즘 A/B 테스트가 유행이긴한가보다. 마케팅에서 시작된 거긴 하지만 사실 아무데나 다 쓸 수 있다. 파이썬으로 A/B 테스트를 수행하는 연습을 약식으로 해보았는데, 간단히 소개해본다.