WPA, 클로저를 위한 세이버메트릭스

클로저와 불펜투수를 위한 세이버메트릭스 WinProbabilityAdded

KBO2014 투수 WAR Top30 과 WPA Top30 비교

한현희, 김진성, 안지만, 봉중근

이 글에서 사용하고 있는 기대득점(RunExpectabcy) 또는 승리확율(WinProbability) 개념에 대해 좀더 상세한 소개는 다음 링크를 참조해주십시요.

기대득점과 득점가치 http://baseball-in-play.com/70

WPA, 승리확율, 승리가치, 레버리지인덱스 http://baseball-in-play.com/110

세이버메트릭스는 야구경기 자체와 선수들에 대한 많은 유용한 지식을 제공합니다. 그중 대부분은 계량적인 수치로 되어 있어서 명확하고 객관적으로 보입니다. 하지만 이것은 양날이 검입니다. 더 정확하고 객관적으로 보이기 때문에 그것 안에 있는 당연한 오류와 오차 혹은 평가기준의 차이를 놓치기 쉽습니다.

최근 기아 김기태 감독의 윤석민 보직결정을 둘러싸고 선발투수와 마무리투수의 가치에 대해 팬들 사이의 논쟁이 있었습니다. 승리의 마지막을 지키는 마무리투수의 중요성을 주장하는 좀더 전통적인 시각의 팬들도 있지만 세이버메트릭스의 어떤 관점을 근거로 선발투수의 압도적 중요성을 말하는 팬들도 있습니다. 하지만 세이버메트릭스가 항상 마무리투수에 대한 선발투수의 중요성 우위만을 말하고 있는 것은 아닙니다.

(물론 그렇다해도 세이버메트릭스의 주류는 선발투수>마무리투수 의 입장에 가깝긴 합니다)

대체선수대비 승리기여도 WAR은 가장 많이 사용되고 또 신뢰받는 세이버메트릭스 선수평가 지표 중 하나입니다. WAR은 타격은 wOBA, 수비는 UZR, 피칭은 FIP 또는 RA9을 기준으로 계산합니다. 다만 여기에 1) 야수의 경우 포지션 조정상수 2) 대체선수레벨 이라는 2가지 상수가 계산에 적용됩니다.

WAR은 1) 서로 다른 포지션을 담당하는 선수들 심지어 투수와 타자들을 동일한 기준으로 측정하는 단일기준 메트릭스라는 점 2) 타격,수비,주루, 피칭을 모두 함께 계산에 넣는 종합 메트릭스라는 점 이 두가지로 인한 많은 장점을 가지고 있습니다. 승수 라는 아주 직관적인 스케일로 환산된다는 점도 매력입니다.

반면 그 정확도에 대해서는 몇가지 논란을 가지고 있기도 합니다. 계산에 사용되는 wOBA, FIP(또는 RA9), UZR 같은 기초스탯은 적어도 현존하는 다양한 평가지표 들 중 가장 나은 신뢰도를 가지고 있는 편이기 때문에 그닥 문제되지 않는 편이지만 관건은, 경기에서 서로 다른 임무와 역할을 가진 선수를 하나의 단일 척도로 평가하기 위해 사용되는 1) 포지션 조정상수 2) 대체선수레벨의 값 이 두가지가 대상이 됩니다.

1루수, 지명타자, 센터필더 같은 수비포지션의 차이를 과연 합당하게 조정하고 있는가 하는 점도 그렇고 선발투수와 불펜투수의 역할 및 비중의 차이를 고려하는 방법도 그렇습니다. 이 글의 테마는 WAR 이라는 평가방법이 선발투수와 마무리 투수를 포함한 불펜투수 사이에서 불공평한 기준을 가지고 있는게 아닌가 하는 논점에 대한 것입니다. 좀더 직접적으로 말한다면 WAR가 불펜투수의 가치와 승리기여도를 과소평가하고 있는 것이 아닌가 하는 점입니다.

WAR가 말해주는 것과 그렇지 않은 것

다음은 kbreport.com 의 KBO14시즌 40이닝+ 투수들의 WAR 순위입니다.

- 통계출처 : kbreport.com

보는 것과 같이 선발투수들이 불펜투수들보다 큰 차이로 WAR가 높습니다. WAR은 계산방법 상 더 많은 이닝을 던진 투수들이 더 높은 평가를 받도록 되어 있습니다. 그런데 논점은 선발투수가 던진 한 이닝과 박빙의 순간 마운드에 올라 던지는 불펜투수의 이닝을 동등하게 취급하는 것이 과연 옳으냐 하는 것에 대한 것입니다.

실제로 경기초반의 한두점은 승패에 결정적인 영향을 미치지 않을 수 있습니다. 하지만 동점이나 한점차 승부의 8회나 9회의 한점은 그 자체로 그때까지이 모든 경기과정을 뒤집어 승패를 결정지을 만큼 중요할 때가 있습니다. 마무리투수의 중요성을 말하는 사람들은 야구가 결국 승리에 목적을 두고 있는 바, 만약 9회의 한점을 지키지 못해서 8이닝 동안의 피칭과 타자들이 만들어낸 득점이 쓸모없어질 수 있는 게임의 본질을 주목합니다.

하지만 이에 대한 타당한 반론도 있습니다. 흔히 클로저가 등판하는 세이브조건이란 한이닝을 남기고 3점 이내의 리드를 하고 있는 상황을 말합니다. 그런데 통계적으로 이런 상황에서 경기가 뒤집힐 확율이 그리 높지 않다는 것입니다. 즉 최고 수준의 투수나 그렇지 못한 중상급 투수나 3점 이내 리그상황의 한이닝을 막아낼 통계적 확율에서 그리 큰 차이가 차지 않기 때문입니다. 한 팀이 클로저라고 해도 항상 박빙의 순간에만 등판하는 것은 아니기 때문입니다.

결과적인 승리기여도를 측정하는 WPA: Win Probability Added

WPA(Win Probability Added)라는 세이버메트릭스 지표는 이런 논점에 대한 타당한 평가방법이 될 수 있습니다. 21세기 세이버메트릭스의 새로운 교과서라고 할 수 있는 톰 탱고의 theBook에 소개된 이 지표는 이닝, 점수차, 아웃카운트, 베이스의 주자상황을 모두 고려해서 그 상황에서 홈팀이 승리할 통계적 확율을 기반으로 합니다.

WPA를 이용하면 경기 중에 일어나는 모든 플레이가 얼마만큼 팀의 승리확율을 높이거나 혹은 낮추는지 측정할 수 있어집니다. 예를들어 2점 뒤진 6회말 공격 1사 주자1루 상황에서 홈팀이 통계적인 승리확율은 15.8% 입니다. 분석기간 중 이와 같은 상황이 2596번 있었고 그중 홈팀이 승리한 경우가 410번이었기 때문입니다.

그런데 타자가 2루타를 쳐서 1루 주자가 홈으로 들어오고 1사 주자2루 상황으로 바뀌었습니다. 이 경우 홈팀의 승리확율을 30.5%로 높아집니다. 그렇다면 이 2루타는 팀의 기대승리 즉 승리확율을 14.7% 높인 것이 됩니다. 동시에 이때 마운드에 있던 투수는 팀의 승리확율을 -14.7% 잃어버린 것에 되겠죠.

50%의 승리확율 상태로 시작되는 경기가 마지막 순간 승리팀의 승리확율 100%가 될때까지를 플레이 바이 플레이로 측정하는 것이 WPA 입니다. 따라서 시즌 전체에 걸쳐서 한 선수의 WPA를 모두 합하면 WAR와 동일한 승리기여도 스케일의 평가지표를 얻을 수 있습니다.

WPA, 승리확율, 승리가치 - 클러치에 관한 세이버메트릭스

http://baseball-in-play.com/110

각각의 플레이를 중립적이고 평균적인 상황에서 일어난 것으로 취급하는 WAR와 달리, WPA는 예를들어 박빙의 상황에서 위기를 막아내는 마무리투수의 승리기여도 같은 것을 좀더 정확히 측정할 수 있는 수단이 됩니다.

같은 세이브 조건이라 해도 9회말 3점 앞선 상황에서 등판한 마무리 투수는 그 이닝을 실점없이 막아냈다 하더라도 WPA +0.04 만 받습니다. 왜냐하면 3점 앞선 9회말이 시작될 때 통계적인 팀의 승리확율은 이미 96%였고 따라서 그가 기여한 것은 +4% 일 뿐이기 때문입니다. 반면 1점차 9회말에 등판할 경우 WPA +0.20 을 받습니다. 좀 극단적인 예로 1점 앞선 9회말 무사만루 상황에서 구원등판한 투수가 그 실점없이 경기를 마무리하면 세이브 기록은 그래도 1개일 뿐이지만 WPA +0.72 를 받습니다. 한 경기의 승리의 72%를 지켜냈다는 뜻입니다.

결과적으로 한 팀이 승리를 거두게 되면 그날 경기에 출전한 모든 선수들의 WPA 합계는 정확히 0.5가 됩니다. 오르막과 내리막이 어찌 있었거나 결국 50%의 승리확율에서 출발해서 100%의 승리확율로 끝나기 때문입니다. 동시에 패배팀 선수의 WPA 합계는 -0.5가 됩니다. 한시즌 전체를 누적시켰을 때 WPA 2.0 인 선수는 팀의 5할 승률 대비 +2승을 기여했다는 뜻입니다.

WAR과 WPA 는 똑같이 팀에 대한 기여승수값으로 표시되는 메트릭스입니다. 그리고 선수의 포지션과 상관없이 타격, 주루, 피칭 등을 종합하여 동등한 기준으로 평가된다는 면에서도 같습니다. 대신 다음과 같은 차이가 있습니다.

1. WPA=0 은 팀의 5할 승률에 해당되는 기여를 말합니다. 반면 WAR=0 은 대체선수대비 승리기여 0을 뜻합니다. 따라서 동일한 기여를 했을 경우라면 WPA의 값이 WAR의 값보다 좀 낮습니다. 기준점에서 WPA가 휠씬 높기 때문입니다.

2. WAR은 선수의 능력을 평가하고 미래의 가치를 예측하기 위한 것입니다. 대신 WPA는 그 선수의 지나간 플레이의 중요도와 기여도를 측정합니다. 예를들어 WAR에서는 9회말 역전끝내기 만루홈런을 친 선수와 10-1로 앞선 9회초 1점 홈런을 친 선수를 동일하게 평가합니다. 왜냐하면 상황은 그 선수의 책임도 능력도 아니라고 보기 때문입니다. 그리고 다음 시즌에 반복될 가능성도 낮기 때문입니다. 반면 WPA에서는 전자의 선수가 더 높은 값으로 측정됩니다. 어쨌든 승리에 결정적인 기여를 한 것이기 때문입니다.

3. WAR은 UZR에 기반하여 야수의 수비능력을 따로 평가하여 반영하지만 WPA는 그렇지 않습니다.

승리확율기여WPA 로 측정한 KBO14시즌 투수 Top30

위는 KBO14시즌의 투수들의 WPA 순위입니다.

투수들의 WAR 순위가 가장 결정적으로 다른 차이는 2위 한현희, 8위 김진성, 10위 안지만, 11위 봉중근 등 불펜투수들이 대거 상위권에 자리하고 있다는 것입니다. WPA가 결과적인 승리기여도의 타당한 측정지표라고 한다면 WAR의 계산방법이 불펜투수들의 승리기여도를 제대로 반영하고 있지 못할 수 있다는 것을 암시합니다.

물론 선발투수의 경우도 소소한 자리바꿈이 있기는 합니다. 하지만 애당초 WAR이란 지표의 내재적인 오차가능범위 안쪽이 있다고 보는 것이 더 타당합니다. WAR 이란 지표의 활용방법에 대해 fangraphs.com 의 설명은 아래와 같습니다.

WAR은 선수의 공헌에 대한 완벽한 평가지표라기 보다는 기대할 수 있는 대략의 예측치입니다. 완벽할 수 없는 데이터와 계산에 사용되는 이런저런 가정으로 인해, WAR를 대략의 근사치로 볼 때 가장 유용합니다. WAR 6.0 으로 계산된 선수는 대략 WAR 5.0 에서 WAR 7.0 사이에 있다고 볼 수도 있고, 그보다 오히려 “이 선수는 올스타급 선수다” 정도로 판단하면 그게 제일 확실합니다.

WAR is not meant to be a perfectly precise indicator of a player’s contribution, but rather an estimate of their value to date. Given the imperfections of some of the available data and the assumptions made to calculate other components, WAR works best as an approximation. A 6 WAR player might be worth between 5.0 and 7.0 WAR, but it is pretty safe to say they are at least an All-Star level player and potentially an MVP.

http://www.fangraphs.com/library/misc/war/

WAR 가 원래 플러스 마이너스 1.0 정도를 오차범위로 가진 지표이기 때문에 예를들어 WAR 3위인 양현종이 WPA 1위가 되었다거나 하는 차이에 큰 의미를 부여할 필요는 없습니다. 그러나 불펜투수들의 순위변화는 그렇지 않습니다.

WAR 순위에서 불펜투수는 24위까지 단 한명도 없습니다. 반면 WPA에서는 24위 안에 10명의 불펜투수가 랭크되어 있습니다. WPA와 WAR가 목적과 구조는 다르지만 어쨌든 그 나름의 객관성과 신뢰성을 가지고 있는 평가지표들입니다. 그렇다면 WAR의 어떤 구조로 인해 WAR은 불펜투수의 승리기여도를 충분히 평가하고 있지 못하고 있다는 의견은 충분히 고려할 필요가 있습니다.

그렇다고 WPA가 WAR보다 좀더 우월한 메트릭스라고 할 필요는 없습니다. 긴 이닝을 던지며 팀에게 승리기회를 제공하는 것이 임무인 선발투수의 경우 WAR이 좀더 정확한 측정기준이 될 수도 있습니다. 대신 WPA를 볼 경우 그 투수가 얼마나 빠듯한 상황에서 공을 던졌는지에 대한 정보를 얻을 수 있습니다. 선발투수의 경우 등판조건에 따른 영향이 거의 없긴 하지만 타자들이 빠듯한 점수 밖에 내주지 못해 시종일관 한두점차의 리드에서 던진 투수들의 WPA가 약간 더 높아지는 경향이 있기 때문입니다.

이런 차이는 WPA의 구조에서 생겨나는데, 5점이나 8점을 리드하고 있을 경우 잡아내는 아웃카운트들이 팀의 승리확율에 덜 영향을 미치지만 반대로 한두점의 팽팽한 경기가 진행되면 선발투수가 잡아내는 아웃카운트 하나 하나가 좀더 큰 가치로 평가되기 때문입니다.

미국의 주요 세이버메트릭스 매체 베이스볼프로스펙터스의 Russell Carlton 은 "Why Are Smart Teams Spending Money on Relievers?" 에서 불펜투수에게 투자하는 것이 새로운 머니볼이 될 수도 있음에 대해 말한 적이 있습니다. 한때 타율을 중시하는 관점이 OPS가 높은 타자들의 저평가를 가져오고 그 틈새에서 빌리빈의 오클랜드가 소위 머니볼의 황금기를 구가했던 것처럼 점점 더 많는 메이저리그 구단들이 WAR을 중시하면서 그에 의해 과소평가될 소지가 있는 불펜투수의 저평가 현상이 생겨나고 있기 때문입니다.

WPA가 높은 구원투수에게 투자하는 것은 WAR이 높은 선발투수에게 투자하는 것보다 휠씬 더 리스크가 큰 전략입니다. WPA는 WAR보다 덜 안정적(reliable)인 메트릭스이기 때문이죠. 대신 WAR가 낮고 WPA가 높은 불펜투수들은 휠씬 가격이 쌉니다. 따라서 작은 페이롤을 가지고 경쟁해야 하는 스몰마켓 팀들에게 그리 나쁘지 않은 선택이 될 수도 있다는 것입니다.

다만 이것은 MLB의 이야기입니다. 만약 KBO의 경우 거꾸로 불펜투수의 가격이 비싸다면 옳은 전략은 그 반대일 수도 있으니까요. 머니볼이란 당시 시장에서 실제 가치에 비해 과소평가되고 있는 것이 무엇인지를 찾아내는 전략이니까요.

불펜투수의 평가에 좀더 적합한 메트릭스 WPA

하지만 자신의 책임이 아닌 위험 상황에 등판하는 불펜투수의 경우 던지는 이닝과 상황을 중립화시키는 경향이 있는 WAR이 그들의 극적인 위기탈출능력을 충분히 평가하지 못하는 것도 사실입니다.

불펜투수의 WPA에 영향을 미치는 것들은 대체로 다음과 같습니다.

1. 당연하게도 더 많은 이닝을 더 적은 실점으로 던지는 선수가 높다.

2. 점수차가 작은 상황에서 많이 던지면 더 높아진다.

3. 후반 이닝에 던질수록 높아진다. 왜냐하면 동일조건에서 7회보다는 8회가 8회보다는 9회가 더 승리결정의 중요도가 높아지기 때문이다.

4. 더 심각한 위기상황를 해결하고 이닝을 종료시키면 높아진다. 반대로 위기를 남겨놓고 강판당하면 낮아진다.

이런 이유로 계산의 난이도 문제만 아니라면 불펜투수의 결과적인 승리기여도를 가장 잘 평가할 수 있는 지표가 WPA입니다. 여기에는 어떤 분식도 허용되지 않기 때문이며 다음 투수가 잘 막아줘서 득을 볼 소지도 없습니다. 종종 사용되는 승계주자실점IRS 같은 것을 염두에 둘 필요조차 없습니다.

오해없길 바라는 것은 WPA가 WAR보다 정확한 지표라고 말하려는 것은 아닙니다. 둘은 목적이 다르기 때문에 어느 것이 다른 것보다 정확하다 말할 수 있는 것이 아닙니다. 논점은 WAR가 경기 후반의 중요 상황에 등판하는 불펜투수의 역할 자체를 충분히 반영하지 못할 가능성에 대한 것입니다. 그리고 WPA의 측정결과는 특정 투수의 가치에 대한 것이 아니라 WAR가 가지고 있는 일종의 사각지대를 발견하기 위해 사용될 수 있다는 것입니다.

WAR라는 지표 자체가 불펜투수의 중요도를 과소평가할 소지가 있다면 당연히 WAR에 의해 평가되는 어떤 투수의 가치가 실제 팀승리 기여도보다 낮게 측정될 수 있다는 뜻입니다.

불펜투수 중 WPA 1위인 한현희는 wmLI가 1.46이기 때문에 아주 위험도가 높은 상황에서 등판한 것은 아니지만 이닝이 많은 편이고 아마도 뒤로 위기를 남기지 않았기 때문인 것 같습니다.

13시즌 귀족마무리라고 놀림받던 NC 김진성은 14시즌에는 wmLI 1.8 로 상당히 터프한 등판이 많았고 봉중근은 다른 불펜투수에 비해 다소 적은 49.2이닝만을 던졌지만 순위 안의 모든 투수들 중 가장 김진성에 이어 두번째로 위험도가 높은 wmLI 1.83 에서 등판한 것 때문에 WPA가 높아진 것으로 보입니다.

그밖에도 8회나 9회에 등판하는 프라이머리 셋업과 클로저들이 WPA Top30 안에 이름을 올립니다.

간혹 선발투수들에게 wmLI가 기록된 경우가 있는데, 이것은 그들이 한두번 정도의 불펜알바가 있었기 때문이며 큰 의미는 없습니다.

WAR와 WPA를 비교한다면 다음과 같습니다.

1. WAR은 계산에 사용되는 스탯을 중립화하기 때문에 결과에 대한 평가보다 기대치의 예측에 더 적합합니다.

2. WPA는 상황에 따른 결과적인 승리기여도를 측정합니다. 선수의 능력을 평가하기에 부정확한 조건의 영향을 받기는 하지만 그 선수가 팀 승리에 얼마나 중요한 역할을 했는가를 측정하는데 적합니다.

따라서 불펜투수들의 평가에 있어서는 WAR 뿐 아니라 WPA를 참고하는 것이 좀더 객관적인 시각을 갖는데 도움이 됩니다.

비슷한 이닝, 비슷한 실점억제능력을 보여준 투수 중에서 WPA가 좀더 높아지는 것은 위에서 설명한 것처럼 좀더 터프한 상황에서 자주 던진 투수들입니다. 그런데 불펜투수들이 터프한 상황을 자주 직면하는 것은 개연적으로 타자들이 충분히 많은 점수를 내주지 못할 때 그렇습니다. 한두점 차의 빠듯한 승부가 경기 후반까지 이어지는 경우가 많은 팀의 불펜투수들이 그래서 wmLI가 좀더 높고 WPA도 약간 높아지는 경향이 생깁니다.

그런데 이것을 뒤집어 생각하면, 타격이 약해서 아슬아슬한 리드상황 혹은 추격상황이 많은 팀은 그만큼 불펜투수들이 감당해야 하는 한 타석 한 타석이 그만큼 팀 승리에 미치는 영향이 커진다는 뜻이 됩니다. (그랬기 때문에 그것을 잘 수행해낸 투수들의 WPA가 높아진 것이구요. 반대로 그런 팀의 불펜투수는 임무를 제대로 해내지 못할 경우 오히려 다른 팀의 불펜투수들 보다 더 큰 폭으로 WPA 가 하락하는 반대급부도 있습니다.

이런 것은 야구팬들에게 아주 쉽게 체감되고 심정적으로 쉽게 동의할 수 있는 사실입니다. WPA 라는 세이버메트릭스 측정지표는 그런 부분에 대한 좀더 객관적이고 통계적인 근거를 말하고 있는 셈입니다.

저작자표시 비영리 변경금지 (새창열림)

'세이버메트릭스 도서관' 카테고리의 다른 글

구종가치(PitchValue) - 구위가 좋은 공이란? (17)	2015.11.18
투수의 땅볼유도비율 - GO/AO 데이터로 GB% 를 구하는 방법 (4)	2015.07.27
WAR의 포지션조정상수 검토 - 세이버메트릭스 onKBO (8)	2015.03.24
바빕? BABIP! 타구의 과학 - 세이버메트릭스 현대 피칭이론 정립 (2)	2015.03.17
DIPS혁명과 BABIP의 발견 - 투수의 책임은 어디까지? (2)	2015.03.16

Baseball-in-Play

WPA, 클로저를 위한 세이버메트릭스

'세이버메트릭스 도서관' 카테고리의 다른 글

티스토리툴바

WPA, 클로저를 위한 세이버메트릭스

'세이버메트릭스 도서관' 카테고리의 다른 글

관련글

티스토리툴바