손흥민 EPL 19-20 데이터(스탯) 시각화

잉글랜드 프리미어리그 이번 시즌도 드디어 끝이 났다. 코로나19 때문에 리그 중단 되기도 했지만 어쨌든 재개해서 잘 마무리 되었다.

시즌이 마무리 되니 지난 시즌 손흥민의 EPL 스탯을 가지고 시각화 한 포스팅을 했던 게 생각났다. (이때 작성한 코드도 다행히 PC에 남아 있었다.)

그래서 이번 시즌 스탯으로도 똑같이 한 번 그려보기로 했다.

참고로 이번 시즌 손흥민 선수는 잉글랜드 프리미어리그에서 10골 10도움이라는 10-10 을 기록하기도 했고, 토트넘 구단에서 주는 아래 4개 트로피를 다 탔다.

  • One Hotspur Player of the Season : 올해의 선수
  • One Hotspur Goal of the Season : 올해의 골
  • One Hotspur Juniors’ Player of the Season : 주니어 플레이어 선정 올해의 선수
  • Official Supporters’ Clubs’ Player of the Season : 공식 서포터즈 클럽 선정 올해의 선수

실제로 경기에서 남긴 스탯들도 훌륭한지 확인해보자.


데이터 수집, 전처리, 시각화

whoscored(후스코어드) 선수 스탯 테이블을 크롤링 했다. 경기당 스탯으로 요약된 summay를 가져오지 않고, detailed 테이블을 가져와서 총 개수를 90분 단위로 내가 직접 나눴다. (요약된 테이블은 소수점 1자리까지만 나타나기 때문에 선수들끼리 은근히 동률이 많이 나오게 되는 게 마음에 안 들어서 좀 더 세밀하게 보려고.)

어쨌든 크롤링한 데이터를 작년처럼 전처리 좀 했고, 특히 모든 지표들은 90분당 기록으로 계산해서 바꿔주었다. 손흥민과 비교할 선수들은 출전 시간 1000분 이상, 공격수 포지션을 기준으로 했다.

기본적인 시각화는 모두 파이썬 matplotlib과 seaborn으로 진행했고, 세부 마무리 작업은 파워포인트로 했다.

손흥민 EPL 19-20 스탯

올해도 훌륭했다. 그 와중에 데브라이너 스탯 무엇인지…

댓글로 보고 싶은 내용 남겨주시면
참고해서 그려보겠습니다.

🙂

추천 글

“손흥민 EPL 19-20 데이터(스탯) 시각화”의 3개의 댓글

  1. 안녕하세요 저도 후스코어드 사이트를 크롤링해보고 싶은데요..!
    403 Forbidden Error 오류로 권한이 안생기는거 같은데 어떻게 해결하셨나요..?!

    1. HTTP 요청을 던져서 받은 응답인 것 같네요.

      저는 파이썬 selenium이라는 라이브러리를 사용해서
      웹드라이버를 직접 동작하는 방식으로 크롤링을 했습니다.
      실제로 웹브라우저를 클릭하는 등의 행위를 재현해주고요.
      그래서 중간중간 옵션 선택할 때는 수동으로 개입을 하기도 했습니다.
      어쨌든 표만 잘 긁어오면 되니까…(?)

댓글 남기기