데이터 과학에서 흔히 일어나는 통계적 역설 Top 3
데이터 과학에서는 관찰 편향과 하위집단에서 나타나는 차이 때문에 통계적 역설이 발생한다. 그리고 이러한 역설을 무시하면 분석의 결론이 완전히 망가질 수 있다. 이 글에서는 데이터 과학에서 가장 널리 나타나는 나타나는 통계적 역설(오류) 세 가지를 살펴본다.
데이터 과학에서는 관찰 편향과 하위집단에서 나타나는 차이 때문에 통계적 역설이 발생한다. 그리고 이러한 역설을 무시하면 분석의 결론이 완전히 망가질 수 있다. 이 글에서는 데이터 과학에서 가장 널리 나타나는 나타나는 통계적 역설(오류) 세 가지를 살펴본다.
주피터노트북 저장할 때 코드 없이 아웃풋만 깔끔하게 html, pdf 등의 형식으로 저장하는 방법 메모.
카카오 같이가치에서 무료로 제공하는 Big 5 성격검사를 직접 실시하고, 각 문항들이 어떤 특성을 측정하는지 자세히 살펴보았다.
EPL 19-20 시즌 데이터를 가지고 공격수들의 경기당 공격 포인트(득점, 도움)를 산점도로 시각화 해보았다.
손흥민 선수의 EPL 19-20 시즌 데이터를 가지고 시각화 해보았다. 이번 시즌도 스탯이 훌륭하다.
파이썬으로 CSV파일을 읽고 쓰는 법을 간략히 남겨 보았다.
★★★★★
UC 버클리 연구자들이 미국과 중국에서 2000명이 넘는 사람들에게 다양한 장르의 음악을 들려준 뒤 그에 대한 감정 반응을 분석했는데, 그 감정들이 결국엔 총 13가지로 분류된다는 결과를 발표했다.
손흥민이 주로 어디서 슛을 때리는지, 골은 어디서 터졌는지, 슈팅을 때리는 주발은 왼발인지 오른발인지 통계치를 확인해서 시각화 해보았다.
EPL 18-19 시즌 데이터를 가지고 공격수들의 경기당 공격 포인트(득점, 도움)를 산점도로 시각화 해보았다.