Media Log

I. 축구에서 경기력을 데이터화할 수 있는가?

 

 

 

ESPN 사커넷에서 제공하는 축구경기결과 기록의 가장 대표적인 데이타입니다. 추가로 주어지는 것은 스코어, 득점시간 등이 주어집니다. 이걸 보고 일반 사람들은 삼프도리아가 유리한 경기를 했구나 하고 끝나버리긴 쉽지만, 저는 이러한 데이터를 어떠한 공식에 의해 별도의 지수로 수치화 작업을 하고 있습니다. 그것이 바로 체리쉬의 경기력지수입니다.  

 

경기력지수를 작성하게 된 계기는 제가 어릴 적부터 숫자를 너무 좋아했고, MLB 세이버매트릭스 애호자이기 때문입니다. 축구 경기에서 경기력을 데이터화할 수 있는지에 대한 답을 찾아 끊임없이 연구한 결과 실제 승률과 경기력이 어느 정도의 양의 상관관계를 지니고 있다는 것을 확인할 수 있었습니다. 

 

지금 축구에서 기록되는 득점, 실점, 슛팅, 유효슛팅 파울, 코너킥, 오프사이드, 경고, 퇴장, 점유율, 골기퍼세이브 등을 토대로 이를 어떻게 경기력이라는 데이터로 표현할 수 있을까를 꾸준히 고민하고 있습니다. 현재는 일관된 기준이 없기에 공격력과 수비력으로 나누고 있지만, 추후에는 그것이 하나의 수치로 나타날 수 있는 경기력이 되도록 프로그래밍을 해 볼 생각입니다.

 

아직까지는 이에 대한 명확한 정답을 찾지 못했지만, 추후 시간이 지나면 지날수록 더 정확한 경기력의 값을 찾아낼 수 있을 것이라 확신하고 있습니다.  

 

 

II. 경기력지수는 승부예측에 도움이 될 수 있는가?

 

스포츠에서 경기력지수는 그 자체만으로 승부예측을 할 수는 없다는 생각이 듭니다. 경기외적인 요소 및 매경기마다 변동되는 스쿼드 (부상 및 결장), 팀이 처한 상황(동기부여), 감독의 성향, 출전선수의 컨디션, 전술의 상대성, 경기장 날씨, 해외의 현금흐름 등에 의해 승부의 결과가 달라질 수 있기 때문입니다. 특히 스포츠배팅이라는 것이 존재한다는 것 자체가 경기외적인 요소를 반영하고 있다는 부분인데, 이러한 것은 반드시 고려해야 하는 부분이며 경기력이 승부예측을 정확히 해 줄 수 없는 이유이기도 합니다. 실제로 대부분의 스포츠매체는 강팀이 약팀에게 패했을 때 경기력의 문제로 답을 내리는데 과연 그것이 경기력만의 문제인 것인지에 대해서는 조금 더 생각해 볼 필요가 있습니다.

 

그 자체만으로 승부예측을 할 수는 없지만, 경기력대로 현금의 흐름이 이동하고 있는가, 이러한 경기력은 진정한 경기력인가 (누가 없을 때 얼마나 잘 했는가 등) 등을 확인할 수 있는 지표로 충분하기 때문에 승부예측에 도움이 되는 자료라고 생각합니다.

 

수치상의 문제점은 차츰차츰 보완해가고 있습니다. 중요한 것을 고려하지 않은 것이 있었는데, 내년 시즌에는 더 좋은 경기력포인트가 나올 수 있다는 강한 자신감이 듭니다.

 

 

III. 실험 : 경기력지수와 득점, 실점, 승점간으로 알 수 있었던 것.

 

지난 한 주간 세리에A 19라운드까지 마친 상태에서 현재의 방식으로 경기력을 다시 한 번 기록하면서 종합적으로 점검했습니다. 요즘 그래서 글을 많이 올리지 못했습니다. 전체//어웨이 로 나눠서 한 번 정리해보았는데 다음과 같은 재미있는 점이 발견되었습니다.

 

이러한 작업은 경기력의 데이타화(수치화)가 더욱 의미있는 이유가 되었습니다.

 

1. 팀의 특성이 드러납니다.

 

순위와 무관히 각 팀의 특징이 드러났습니다. 홈과 원정에서 어떤 팀이 강력한가, 어떤 팀은 홈과 원정에서 어떻게 경기 운영을 주로 했는지 등이 드러났습니다. 공격과 수비 둘 다 우수하기 때문에 특징이 드러나지 않는 팀도 있었지만 (피오렌티나) 많은 팀의 특성을 발견할 수 있다는 점에서 큰 소득이 있었습니다.

 

또한 홈/원정 간의 평균 수치를 통해 홈보다는 원정에서 수비적으로 경기하려는 경향을 증명할 수 있었습니다. 홈에서는 매우 공격적으로 임한 반면, 원정에서는 평균공격력지수가 급격히 하락하는 것으로 이렇게 잘 알려진 경향은 실제 데이터로도 확인되었습니다.

 

2. 득점/실점 과 공격력지수/수비력지수 의 괴리가 드러납니다.

 

득점/실점이 많다는 것이 결코 공격 및 수비가 좋다고 볼 수 없다는 결과가 나타났습니다. 죽어라도 슛팅을 날리고 유효슛팅을 날리는데도 골을 넣지 못한 팀이 있으며, 공격횟수는 적었으나 득점은 많이 하는 팀도 존재했습니다. 수비가 약하다고 생각하는 팀이 의외로 높은 수비력을 보이기도 했으며, 수비가 강하다고 생각하는 팀은 의외로 골기퍼에 많이 의존하고 있었다는 부분도 발견할 수 있었습니다.

 

또한, 공격력지수와 수비력지수 자체간의 격차도 나타났는데 평균데이타가 약 3 정도 차이가 나는 것을 보아 공/수를 비교할 때는 수비력지수에서 3점 정도를 빼는 것이 적합하다는 결론이 나왔고, /원정의 격차를 통해서 홈팀과 원정팀의 경기력 비교를 추후 용이하게 할 수 있게 되었습니다. 물론 평균적 데이터가 아닌 최근 경기력(추세적 데이터)이 더 의미있을 것입니다.

 

3. 경기효율성이라는 것에 대해 생각해 볼 수 있었습니다.

 

이러한 수치화를 통해 새로운 시각을 하나 깨닫게 됐습니다.

 

경기력(공격력, 수비력)지수가 낮다고 해서 그 팀이 득점할 확률이 낮다고 생각하는 것은 오류라는 것입니다. 경기효율성 측면에서 적은 공격횟수로 많은 골을 성공시킨 팀이 있다면, 그 팀의 경기효율성은 높다고 해석이 됩니다. 공격력, 수비력은 낮지만 많은 득점, 적은 실점을 하고 있는 팀이라면 그 팀은 효율적으로 경기를 하고 있다는 것을 깨달을 수 있었습니다.

 


IV. 검증 :
경기력지수 (공격력, 수비력) 로 정리해 보는 세리에A 전반기 리뷰

 

세리에A 20개팀을 전반기를 기준으로 4사분면 좌표에 나열해 보았습니다.

 

고등학교 수학시간에 정말 많이 봤던 좌표인데요. X축은 공격력, Y축은 수비력을 대입했습니다. 1사분면은 둘 다 평균 이상인 팀, 3사분면은 둘 다 평균 이하인 팀, 2사분면은 공격력은 좋지 않으나 수비력은 좋은 팀, 4사분면은 공격력은 좋으나 수비가 좋지 않은 팀으로 나누어 볼 수 있었습니다.

 

그럼 한 번 살펴 보실까요?

 

1. 전체 경기력

 

 

1) 전반기동안 가장 경기력이 좋았던 팀은 피오렌티나로 나타났습니다. 경기력에 비해 많은 승점을 쌓지 못했지만, 추후 설명하겠지만, 뛰어난 홈경기력을 바탕으로 상위클래스의 전체경기력을 유지하고 있었습니다. 이러한 경기력이 있었기 때문에 챔피언스리그에서 리버풀, 리옹과 같은 조에서 1위를 할 수 있지 않았을까요?

 

2) 그밖에 인터밀란, 유벤투스, AC밀란, AS로마 등이 공/수가 비교적 안정된 팀으로 나타나고 있습니다. 마지막으로 팔레르모와 우디네세가 최상위그룹은 아니지만, 공격과 수비가 둘 다 양호한 편으로 나타나고 있습니다. 우디네세의 현재 순위가 15위라는 것을 고려하면 같은 경기력을 유지할 수 있다면 추후 더 좋은 성적을 내지 않을까요?

 

3) 최악의 경기력을 지닌 팀은 볼로냐, 제노아, 카타니아로 해석되었습니다. 볼로냐(17), 카타니아(19)는 경기력대로 순위가 나오고 있지만, 제노아의 경우에는 한 경기 덜 치른 상태로 12위여서 다소 의아했습니다. 제노아는 리그에서 32득점을 넣고 있는데, 공격력지수는 최하그룹에서 자웅을 겨루고 있습니다. 이는 제노아가 다양한 슛팅 시도를 통해 골을 만들어내기보다는 결정적 찬스에서 득점을 성공시키는 패턴으로서 승점을 쌓아왔다는 것을 의미합니다.

 

4) 키예보, 아탈란타, 삼프도리아, 리보르노, 파르마, 시에나가 둘 다 평균 이하의 경기력을 보이고 있습니다. 키예보(11)에 비해 아탈란타(18)는 승점을 더 챙겨야 하는 모습을 보여주고 있습니다. 시에나(20)도 공격력에는 큰 문제가 없다는 것이 드러났네요.

 

5) 라치오와 나폴리는 공격력은 평균 이상이지만, 수비력은 평균 이하로 나타나고 있습니다. 나폴리가 클린싯 경기가 8경기인데 그걸 고려한다면 많은 위기에서 데산치스 골기퍼의 활약이 정말 뛰어났다고 해석이 됩니다. 무슬레라 골기퍼의 선방도 참 많은 편이었지요.

 

6) 반대로 칼리아리와 바리는 수비력은 평균 이상이지만, 공격력은 평균 이하로 나타나고 있습니다. 바리의 경우는 그러한 경향이 추세적으로는 줄어들고 있지만, 수비는 괜찮은 포지션을 기록하고 있네요. 칼리아리는 31득점을 넣고 있는데, 역시 제다, 마트리, 네네를 중심으로 제노아와 마찬가지로 효율적인 공격을 하고 있다고 판단했습니다.

 

2. /원정 경기력

 

 

이번엔 홈과 원정을 나눠서 경기력을 책정해 보았습니다. 일일히 다 지우고 했기 때문에, 엄청난 시간이 걸렸습니다. 보기에는 평범한 자료여도 정말 많은 시간을 들여 작성한 자료랍니다 ^^

1)
홈에서 가장 좋은 경기력을 보이는 팀은 피오렌티나, 그리고 AS로마였습니다. 그리고 삼프도리아가 홈에서 매우 강한 수비력을 보여주고 있는 것이 눈에 띕니다. (그들은 홈에서 5 5무입니다)

 

2) 원정에서 가장 좋은 경기력을 보이고 있는 팀들은 대중적인 빅3 AC밀란, 유벤투스, 인터밀란입니다.

 

3) 그밖에 우디네세는 홈, 원정에서 평균 이상의 경기력을 보여주고 있으며 (후반기 한 번 지켜 봅시다), 나폴리와 팔레르모는 홈에서 평균 이상의 경기력을 보여주고 있습니다.

 

4) 홈 최악의 경기력을 보여주고 있는 팀은 제노아로 나타나고 있는데 의외입니다. 제노아는 홈에서 6 2 1패를 기록하고 있으며, 역시 3-4-3 시스템에서 나타나는 공격기회가 많지 않으면서 결정적 찬스를 노리는 팀의 패턴을 반영하고 있습니다. 그밖에 카타니아, 칼리아리, 볼로냐, 아탈란타가 홈에서 좋지 않습니다.

 

5) 원정 최악의 경기력을 보여주고 있는 삼프도리아로 나타나고 있으며, 그 다음으로는 시칠리아를 벗어난 카타니아가 차지하고 있습니다. 그밖에 홈에서 공격력이 좋지 않은 팀은 AS바리와 볼로냐로 나타나며, 수비력이 좋지 않은 팀은 키예보, 칼리아리 정도로 나타납니다. 반면, 원정에서 공격력이 좋지 않은 팀은 볼로냐와 제노아, 칼리아리로 나타나고 있으며, 수비력이 좋지 않은 팀은 나폴리, 파르마, 시에나 정도가 있습니다.

 

6) AS바리는 홈에서 매우 강한 수비를 보이고 있으나 공격력은 볼로냐와 함께 최저 수준입니다. 아탈란타는 홈에서는 다소 경기력이 쳐져 있으나 원정에서 수비만큼은 상위권에 속해 있습니다. 팔레르모는 홈에서는 공수가 안정되어 있지만, 원정에서는 공격력이 극도록 낮아지는 것이 수치로 확인됩니다. (잘 알려진 사실) 

 

7) 그리고 원정에서 수비적으로 나서며 수비가 좋은 팀들이 그래프상에서도 확인할 수 있습니다. 칼리아리, 키예보 정도로 확인되네요. 실제로 칼리아리와 키예보는 원정에서 승점을 다른 팀에 비해 많이 얻고 있는 팀입니다. 신기하지요..

 


IV.
경기력의 수치화가 계속되어야 하는 이유

 

EPL 자료를 일부 했는데 (아직 완성하지 못했습니다) 리그별 차이도 발견되었습니다. 참 신기한 부분인데, 강팀들이 압도적인 경기를 보이는 경기가 많다는 점입니다.

 

비록 전반기 결산하는 과정에서 많은 문제점이 발견되었지만, 어느 정도 팀별 특징을 찾아낼 수있다는 것만으로도 신기합니다. 내년에 보완되어서 더 좋은 모습으로 예측에 활용될 수 있었으면 좋겠습니다.

 

세리에A 를 기준으로 일부 분들께 공개하는 경기력지수의 폼을 바꿀 생각입니다. 지금의 방식은지금 경기력지수를 보고 계시는 분들을 상대로 비밀번호 변경과 관련하여 전체 메일을 발송했습니다. 확인해 주세요.

 

저는 숫자를 참 좋아하는 녀석입니다. 그래서 이러한 자료를 직접 만들어보고 해석해 보고 하나 봅니다. 이러한 노력이 추후 적중률을 높이고 많은 분들과 함께 웃을 수 있는 시간들로 이어지길 작은 마음에 간절히 희망해 봅니다.

 

앞으로 트위터를 적극 활용할 생각입니다. 트위터로 배팅라인은 물론 세리에A 및 배팅시장의 속보를 바로바로 전할 수 있도록 노력하겠습니다. (http://twitter.com/cherishtip) 주소는 체리쉬팁입니다 ^^

 

프로토 6회차에 대한 분석도 조만간 업데이트될 예정입니다. 보시고 좋은 의견 많이 많이 남겨주세요.

 

노력하는 자는 이길 수 없다는 옛말이 있듯, 정직한 수고로움을 통해 몇 년 안에 꼭 한 번 대박 납시다! ^^

 

경기력지수와 관련하여 좋은 댓글 있으면 댓글로 남겨 주시기 바랍니다. 추후 포스팅시 참조하도록 하겠습니다 ^^

 

격려의 의미로 아래 손가락 (Daum View) 클릭 부탁드립니다. (다음뷰 숫자는 단순 수치이지만, 글 쓰는 사람에게는 추후 성의있는 글 작성을 위한 동기부여입니다)