데이터분석

[pandas] 데이터 전처리 – 파일 병합, 데이터프레임 수정, 중복 값 확인 및 제거

데이터 분석을 공부할 때는 매우 clean한 데이터들을 다루기 때문에 분석에만 집중할 수 있으나 현실 세계는 그리 녹록치 않다. 실제로 현업에 들어가면 매우 dirty한 데이터들만 마주하게 된다. 그래서 본 포스팅에서는 더티한 데이터를 받았을 때 어떻게 전처리하면 좋을지 방법을 간략히 남겨보고자 한다.

파이썬으로 A/B 테스트 분석하기

요즘 A/B 테스트가 유행이긴한가보다. 마케팅에서 시작된 거긴 하지만 사실 아무데나 다 쓸 수 있다. 파이썬으로 A/B 테스트를 수행하는 연습을 약식으로 해보았는데, 간단히 소개해본다.

파이썬으로 json, csv 파일 변환

파이썬으로 데이터를 다루다 보면 json, csv 형식의 파일을 많이 만나게 된다. 데이터의 형식만 가볍게 변환하기 위한 파이썬 코드를 소개한다.