티스토리 뷰



승리기여도를 계산하는 몇가지 방법


야구경기의 목표는 승리인 한에, 선수와 그들의 플레이를 평가하는 기준은 승리에 대한 기여도인 것이 합리적입니다.  


세이버메트릭스는 이를 위한 몇가지 지표를 가지고 있습니다.  우선 WAR 대체선수대비 승리기여도입니다.  이는 MLB 기준 최저연봉선수가 기여할 수 있는 승리 숫자를 베이스라인으로 해서 그보다 얼마나 더 많은 승리에 기여했는지는 측정합니다.  한 시즌 162경기를 치루는 것을 기준으로 할 때 주전급 선수의 WAR이 2.0에서 3.0 사이이고 4.0-5.0 이면 올스타급 플레이어를 말합니다.  6.0 이상일 때 MVP급 플레이어로 봅니다.


득점스케일 값으로 표시되긴 하지만 RC27 이나 XR27 이 비슷한 역할을 합니다.  타자에 한정된 지표이긴 하지만 이는 어떤 선수가 경기의 모든 타석에 섰을 때 팀이 몇점을 득점할 수 있을 것인지 측정합니다.  KBO 기준으로 리그 넘버원 타자는 9.0 이상의 RC27 을 가진 것으로 계산됩니다.  그 해의 경기당 평균득점을 5.0 으로 가정할 때 RC27 9.0 의 타자로 구성된 타선은 매 경기당 리그평균보다 +4.0 점을 더 만들어낼 것입니다.  경기당 +1.0득점이 보통 승률을 9% 정도 상승시키기 때문에 이 팀은 5할 대비 35%-40% 정도 더 높은 승률을 올리는 팀이 됩니다.  비현실적인 숫자처럼 보이지만 보통 수준의 투수력을 가진 팀이 박병호 9명이나 강정호 9명으로 구성된 타선을 가진 경우라고 생각하면 당연한 일이기도 합니다. 


그런데, WAR이나 RC27은 실제 성적이 아니라 가상의 기대치


그런데 이상의 기여승수 계산방법에는 중요한 전제가 있습니다.  “중립적 상황” 입니다.

점수차 10점일 때의 1점과 동점 상황의 끝내기 1점을 동일하게 간주합니다.  더 나아가 20-1로 이기는 경기에 보탠 1점 홈런과 4-7로 지고 있는 경기 9회말 2아웃의 끝내기 역전 만루홈런을 동등한 가치로 측정합니다.


타자가 타석에 섰을 때의 경기상황, 주자상황은 그 타자의 몫이 아니라고 보기 때문이며 많은 타석과 경기가 누적될 때 예외적인 클러치 상황이나 그밖의 평범한 상황에서 타자가 보여줄 수 있는 결과는 비슷한 수준으로 수렴될 수 밖에 없다고 여기기 때문입니다.


이런 이유로 흔히 세이버메트릭스의 [기여승수] 혹은 [기여득점]에 관한 지표는 “결과”에 관한 것이 아닙니다.  3점차 열세를 뒤집은 끝내기 만루홈런은 10점을 앞선 경기의 1점 홈런에 비해 비교불가의 “결과적” 가치를 가지고 있지만 이것을 고려하지 않기 때문입니다.  WAR이나 RC27, XR27, wRC 모두 “결과”에 대한 평가가 아니라 중립적이고 평균적인 상황에 대한 기대치로 조정된 “가상의” 기여도입니다.


따라서, 앞으로의 중립적 상황 기준의 기대치가 아니라, 실제 벌어진 결과에 대한 기여도를 측정하고 싶다면 다른 지표를 사용할 필요가 있습니다.  WPA(Win Probability Added)는 그런 목적으로 사용할 수 있는 지표입니다.


WPA 실제 승리확율 변화에 대한 기여도


이닝, 아웃카운트, 베이스상황, 득점차 전부를 고려해서 경기 중에 일어난 플레이가 팀의 승리확율을 어떻게 변화시켰는지 측정합니다.  10점을 뒤진 원정팀 5회초 선두타자의 1점 추격 홈런은 팀의 승리확율에 거의 영향을 주지 못합니다.  기껏 0.5% 정도에 불과합니다. 반면 3점 뒤진 9회말 2사 만루홈런은 9.4% 였던 팀의 승리확율을 승리확정 즉 100%로 만드는 것으로 승리확율에 90.6%의 변화를 만듭니다.  상황에 따라 각 플레이로 생겨난 승리확율 변화값이 WPA 입니다.


한 경기의 승패가 결정되면 승리팀 선수들의 WPA 합계는 0.5 가 됩니다.  양팀이 같은 50% 에서 출발한 경기의 승리확율이 100%로 변하는 동안 누적된 WPA 이기 때문입니다.


따라서 한 시즌 전체로 어떤 선수의 WPA 합계가 2.0 일 경우 그 선수는 5할 대비 +4승의 역할을 한 겁니다.  같은 승리기여도라고 불린다 해도 WAR이나 RC27 로 계산한 것과는 의미가 다릅니다.  WAR과 RC, XR은 중립적 상황을 전제로 계산한 가상의 승리기여도이지만 WPA로 계산한 것은 실제로 벌어진 결과에 대한 승리기여도입니다.


요컨데, 선수의 객관적 능력치를 평가하기 위해서는 중립적 지표인 WAR, RC, XR 등이 더 적당하고 선수이 결과적 기여도를 측정하는데는 WPA 기반의 지표가 더 타당하다는 것입니다.


지난 시즌 리그에서 가장 높은 WPA를 기록한 선수는 강정호입니다.  WPA 6.8 이고 다음이 테임즈 6.22 테임즈, 김태균 4.49, 서건창 4.41로 이어집니다.  그 뒤로 최준석, 이병규, 박병호, 최형우 순입니다.


올 시즌의 경우 (9월8일 기준 현재) WPA 6.69  박병호가 1위이며 테이즈, 김태균, 김현수, 필, 아두치, 김경언, 강민호, 양현종, 해커 순서입니다.  (이상 300타석 이상)


WPA 0.0 은 팀의 5할 승률을 지탱하는 주전급


그런데 WPA 라는 지표는 작은 단점이 있는데, 베이스라인이 승률 0.500 이기 때문에 최상위권 선수를 제외한 중상급 수준의 선수를 평가할 때 오차가 너무 커진다는 점입니다.  비슷한 맥락에서 팀에 승률 0.500을 기여하는 주전급 선수들의 지표값이 0.0 이 되기 때문에 그들의 기여를 과소평가하는 착시를 불러 일으키기 쉽다는 점도 좀 문제입니다.


다른 측면에서 평균 수준의 퍼포먼스 즉 팀의 승률 0.500 을 지탱하는 기여를 하면서 많은 타석, 많은 이닝에 출전한 선수들의 기여도가 반영되지 못한다는 점도 있습니다.


이런 단점을 보완하기 위해 WPA를 약간 보완할 필요가 있습니다.  WPA 0.0 즉 팀승률 0.500 에 대한 기여도를 출전타석(타자) 또는 상대타석(투수) 숫자에 맞게 반영해주는 것입니다.  WAR 계산에서 wRAA를 wRC 로 컨버팅하는 것과 거의 같습니다.


지난 14시즌의 경우 모든 팀의 승리숫자 합계는 567승입니다. (무승부 0.5승)  그리고 리그 전체 타석수는 45853번입니다.  따라서 평균적으로 타석당 0.012승에 기여했는데, 1승은 WPA 0.5 에 해당하기 때문에 출전타석 * 0.0063 의 값이 조정된 지표의 베이스라인이 될 수 있습니다.


실제로 가장 많은 승리에 기여했던 선수들


예를들면 500타석에 출전해서 정확히 리그평균수준의 WPA를 기록한 타자는 +3승을 기여한 타자입니다.  팀의 모든 타자와 이와 같은 성적을 기록했다면 그 팀은 0.500의 승률을 기록했을 것입니다.  투수의 예를들면 좀더 분명해질 수 있습니다.  20경기를 9이닝 완투하며 20무승부 라는 성적을 기록한 투수가 있다면 이 선수의 WPA는 0.0 입니다.  하지만 승리기여도는 무승부 하나당 0.5승으로 계산해서 10승이 되고 그 중 타자의 몫 절반을 빼면 +5승이 이 투수의 결과적인 승리기여도가 되는 것입니다.


아래는 2014년과 올해 (9월8일 현재 기준) 투수와 타자 통합 승리기여도 순위입니다.

** 업데이트 2015.9.21

1. 2015년 데이터가 9월 20일 기준으로 업데이트되었으며 몇가지 계산오류가 수정되었음.

2. 투수의 경우 실점억제를 같은 팀 야수와 협력하는 것이기 때문에 이를 조정할 필요가 있으나 일단 그 과정이 처리되지 않은 상태임 

3. WPA 0.5 = 1승 이기 때문에 WPbase + WPA 0.5 당 WinValue 1승으로 계산했었는데, 이 경우 공격 측면에서는 실점요인을 수비/투수 측면에서는 득점요인을 중립으로 한 조건의 값이 됩니다.  글을 쓴 이후 다시 검토하면서 이런 방법보다 오히려 같은 팀의 모든 선수 WinValue 의 합계가 승수와 같아지도록 맞추는 것이 좀더 직관적으로 이해하기 쉬운 방법이라는 생각이 들어 업데이트하면서 WP와 WinValue를 같은 스케일로 맞췄습니다.  (댓글 EVER17님 의견이 참고가 되었습니다. 감사합니다)









댓글
  • 프로필사진 Baseball Archiver WPA는 똑같은 접전 경기에서의 플레이라도 경기 초반에 나온 것과 후반에 나온 것을 다른게 보는 걸로 알고 있습니다. 예컨대 경기 시작과 동시에 터진 리드오프 홈런으로 1:0 승리를 거둔 케이스, 0:0의 접전이 이어지다 경기 후반부에 결승 홈런을 쳐서 1:0으로 이긴 케이스. 이 중 후자에서 나온 홈런이 더 값진 것으로 본다는 소린데 이런 부분은 어떻게 봐야할까요? 물론 그냥 제가 잘못알고 하는 뻘소리일 수도 있습니다. 2015.09.19 04:52 신고
  • 프로필사진 토아일당 1. 우선 wpa는 해석의 문제가 아니라 통계적 확율 문제입니다. 1회초 리드오프 홈런으로 1:0으로 앞서면서 시작된 경기에서 리드팀이 최종승리할 통계적 확율은 59% 정도입니다. 반면 9회말의 끝내기 홈런이 나온 경우, 홈런팀은 100% 승리합니다. 이 차이가 반영된 것이 wpa입니다.

    2. 리드오픈 홈런과 끝내기 홈런, 더 나아가 1점 홈런과 4점 홈런을 동일한 가치로 보는 것이 WAR의 발상입니다. war이나 wpa 어느 한쪽이 틀렸다고 볼 문제는 아니고, 해석하고 평가하려는 것이 무엇이냐에 따라 다르다고 생각합니다. 글에 적었던 것처럼, 선수의 능력을 평가하려는 것이라면 war이 더 맞을 것이고, 그 경기에서의 기여도를 평가하려 한다면 wpa쪽이 좀더 나은 정보를 제공해 줄 수 있겠죠.
    2015.09.21 03:57 신고
  • 프로필사진 EVER17 잘 봤습니다. 타격에 한해서는 본문의 방법도 좋지만 WPA는 주루와 수비가 반영되지 않는 단점이 있습니다. 종합적인 기여도는 주루,수비,포지션 가중치를 더하는게 더 좋을 것 같습니다. 제로런이 아니라 대체선수 기준이라면 WAR에서 타격 부분만 wOBA기반의 배팅런 대신 WPA로 바꿔도 괜찮을 것 같네요.

    그런데 제가 잘못 이해한 것인지 WinValue가 2배 곱한 수치인것 같네요. 강정호의 경우 WPA 6.81에 WPbase 3.28을 더하면 10.1 이 되야하는데 20.2로 나와있습니다. 다른 선수들도 모두 WPA와 WPbase를 더한 값에 2배인데 그게 맞는 값인가요?
    2015.09.19 08:13 신고
  • 프로필사진 토아일당 지적하신대로, 실점억제가 전부 투수의 몫이 아니기 때문에,,, 수비의 몫을 분리해내는 과정이 필요한게 맞습니다.

    2배. 인것은,,, wpa 0.5 가 1승에 해당되기 때문에 승수 스케일로 환산한 결과입니다.
    2015.09.21 03:45 신고
  • 프로필사진 김키 엄청 좋은 글 잘 봤습니다. 지표에 있어서 아쉬운 부분을 좀 개량해서 더 좋은걸 만들수도 있겠다는 기대감이 생기네요. 이 글에서는 실점억제부분을 투수에게 있어서 몇퍼센트 책임이 있는것으로 하셨나요? 2016.02.05 14:04 신고
댓글쓰기 폼