축구에서도 통계, 데이터 분석이 주목 받고 있다 (시각화 사례 소개)

개인적으로 해외 축구에 관심이 많아서 이런저런 유튜브 채널들도 좀 구독을 하는 편이다. 그 중 김현민 & 황덕연의 독서축구라는 채널이 있는데, 주로 “독일”과 “스페인” 축구를 다루기 때문에 독서(獨西) 축구이고, 축구를 읽어준다는 의미도 있다.

여기서 축구 통계에 대해 한 번 다룬 적이 있다.

참고로 이 채널을 운영하는 골닷컴 김현민 기자는 내가 전부터 좋아하던 분이다. 항상 긍정적인 표정으로 설명도 침착하게 잘 해주시고, 소개하거나 직접 분석하는 내용도 꽤 전문적이기 때문이다.

아무튼 위 영상에서 축구 통계, 데이터 분석을 담당한 분이 직접 함께 나와서 내용을 소개했는데, 내용이 흥미로워서 한 번 정리해봤다.


축구에서 통계, 데이터 분석이 주목 받게 된 과정

사실 축구에서 본격적으로 통계를 활용해 의미 있는 분석을 한지는 그리 오래 되지 않았다.

참고로 야구에서는 머니볼, 세이버매트릭스(Sabermetrics) 개념이 훨씬 빨리 자리를 잡았는데, 이는 야구라는 스포츠의 속성이 애초에 그렇기 때문일 거다. 플레이를 끊어서 독립시행으로 이뤄지는, 마치 통제된 실험실에 가깝기 때문이다.

반면 축구는 멈추지 않고 상황이 동시다발적으로 발생하는 스포츠이다보니 제대로 수집할 수 있는 데이터가 없었다. 그나마 골, 파울, 옐로/레드 카드, 교체 및 출전시간 정도는 쉽게 집계할 수 있지만, 다른 지표들은 그 기준을 설정하는 게 너무 어렵기 때문이다. 예를 들면 어시스트도 시대에 따라 리그마다 기준이 다르고, 포지션이라는 것도 명확하게 정해진 게 아닌 데다가 슛 개수 셀 때도 이게 슛인지 패스인지 모를 것들도 있고, 슛을 하더라도 발로 한 건지 종아리로 한 건지, 머리로 한 건지 어깨로 한 건지… 아무튼 모든 게 다 불명확하다.

그러다가 2003년 즈음부터 옵타(Opta)라는 곳을 필두로 여러 기관에서 좀 더 전문적이고 세분화된 축구 통계 지표들을 공개하기 시작한다. 어시스트와 키패스를 합쳐 슈팅으로 연결된 패스라는 의미의 CC(chance created), 명백한 찬스를 뜻하는 CCC(clear-cut chances)와 같은 지표가 대표적이다. 그리고 이런 식으로 재가공된 주요 통계 지표들이 계속 세미나나 언론에 공개되면서 축구계 전반에서 이와 관련한 관심이 높아졌다. 이 시기에 잉글랜드 몇몇 클럽에서는 새롭게 등장한 지표들을 가지고 특정 선수들을 영입할 때 활용했다고도 한다. 다우닝, 앤디캐롤, 찰리아담 등이 대표적이다. 영입 후 성적은 좋지 못했다. 아무튼.

요즘 주목 받는 통계 지표들

최근에는 xG(expected goals)라는 개념이 인기인 것 같다. 우리말로 하면 기대 골 수? 슈팅할 때의 거리와 각도, 슈팅을 한 부위(발로 했는지 헤더로 했는지), 어떤 상황이었는지(프리킥이었는지, 오픈 플레이인지, 역습인지), 슈팅할 때 수비 숫자 등 다양한 요인들을 가지고 계산한다. (사실 통계를 제공하는 곳마다 이 xG를 계산하는 기준이 조금씩 다르다는 게 함정이다. 어쨌든 본인들만의 노하우를 가지고 이렇게 데이터를 재가공해서 분석하는 게 요즘 추세니까.)

그 외에도 패킹(packing), 임팩트(impect) 개념도 주목을 받고 있는 것 같다. 상대를 얼마나 통과했느냐에 대한 지표인데, 결국 축구라는 경기에서 골을 넣으려면 수비를 뚫고 전진을 해야 하기 때문이다. 실제로 브라질 월드컵 경기들에서 이 지표를 가지고 사후 분석을 해본 결과, 승부 예측 정답률이 92% 정도 나왔다고 한다. 어마어마한 수치다.

아, 그리고 요즘 당연히 패스맵이나 히트맵 같은 것도 많이 사용된다. 공의 움직임 뿐만 아니라 선수들의 위치나 뛴 거리 같은 것도 쉽게 수집해서 시각화 할 수 있으니까.

축구 통계 제공 사이트

축구계에서도 데이터를 가공해서 분석하는 곳이 정말 많아졌다. 대표적인 해외 사이트 몇개만 가져와봤다.

옵타나 스탯츠밤 같은 곳은 아예 전문적인 솔루션 형태로 비싸게 제공하는 것 같고, 와이스카웃은 API 형태로 제공하는 거 같긴 한데 역시나 유료다. 그나마 언더스탯이나 후스코어드 같은 곳은 무료로 몇가지 지표들을 검색해서 확인할 수 있다.

축구 데이터 시각화 by @DatoBHJ

위에서 소개한 데이터들은 결국 숫자이기 때문에, 이 숫자를 사람들이 보고 이해할 수 있는 형태로 시각화하는 것도 당연히 중요한 영역이다.

포스팅에서 소개하고 싶은 데이터 시각화 예시는 DatoBHJ 라는 분의 트위터에서 가져왔다. (위에서 링크한 유튜브 영상에 출연한 분이다.) 개인 트위터 계정에 취미로 축구 데이터를 시각화해서 업로드 해왔는데, 이게 대외적으로(?) 인정을 받아서 언론사에서 기사나 잡지를 낼 때 같이 소개되기도 할 정도. 이제 외주 작업도 좀 하시는 것 같긴 하다.

아무튼 인상 깊어서 대표적인 사례 몇 가지만 가져와봤다.

홀란드 도르트문트 이적 후 스탯. 90분당 xG가 거의 1개다. 미쳤다.

오른발/왼발 사용 비율을 시각화 한 게 재밌다. 데브라이너 히트맵 보면 하프 스페이스가 눈에 딱 띈다.

스페인 라리가 클럽들의 스타일을 라리가 로고를 가지고 표현한 것도 재밌다.

데이터 시각화 분야에는 정말 숨은 고수들이 많은 것 같다. 나도 나중에 한 번 따라해봐야지.


이제는 기술의 발전으로 인해 축구에서도 이런저런 데이터를 수집하기가 용이해졌기 때문에 앞으로도 새로운 통계 지표와 분석 프레임이 등장하고 또 발전할 거다. 언론에서도 축구 통계 관련 지표를 많이 다뤄줬으면 좋겠다.

축구에서도
데이터 분석, 시각화

댓글 남기기

추천 글