티스토리 뷰

클로저와 불펜투수를 위한 세이버메트릭스 WinProbabilityAdded

KBO2014 투수 WAR Top30 과 WPA Top30 비교 

한현희, 김진성, 안지만, 봉중근 



이 글에서 사용하고 있는 기대득점(RunExpectabcy) 또는 승리확율(WinProbability) 개념에 대해 좀더 상세한 소개는 다음 링크를 참조해주십시요. 

기대득점과 득점가치 http://baseball-in-play.com/70

WPA, 승리확율, 승리가치, 레버리지인덱스 http://baseball-in-play.com/110


세이버메트릭스는 야구경기 자체와 선수들에 대한 많은 유용한 지식을 제공합니다.  그중 대부분은 계량적인 수치로 되어 있어서 명확하고 객관적으로 보입니다.  하지만 이것은 양날이 검입니다.  더 정확하고 객관적으로 보이기 때문에 그것 안에 있는 당연한 오류와 오차 혹은 평가기준의 차이를 놓치기 쉽습니다.  


최근 기아 김기태 감독의 윤석민 보직결정을 둘러싸고 선발투수와 마무리투수의 가치에 대해 팬들 사이의 논쟁이 있었습니다.  승리의 마지막을 지키는 마무리투수의 중요성을 주장하는 좀더 전통적인 시각의 팬들도 있지만 세이버메트릭스의 어떤 관점을 근거로 선발투수의 압도적 중요성을 말하는 팬들도 있습니다.  하지만 세이버메트릭스가 항상 마무리투수에 대한 선발투수의 중요성 우위만을 말하고 있는 것은 아닙니다.  

(물론 그렇다해도 세이버메트릭스의 주류는 선발투수>마무리투수 의 입장에 가깝긴 합니다) 


대체선수대비 승리기여도 WAR은 가장 많이 사용되고 또 신뢰받는 세이버메트릭스 선수평가 지표 중 하나입니다.  WAR은 타격은 wOBA, 수비는 UZR, 피칭은 FIP 또는 RA9을 기준으로 계산합니다.  다만 여기에 1) 야수의 경우 포지션 조정상수 2) 대체선수레벨 이라는 2가지 상수가 계산에 적용됩니다.  


WAR은 1) 서로 다른 포지션을 담당하는 선수들 심지어 투수와 타자들을 동일한 기준으로 측정하는 단일기준 메트릭스라는 점  2) 타격,수비,주루, 피칭을 모두 함께 계산에 넣는 종합 메트릭스라는 점 이 두가지로 인한 많은 장점을 가지고 있습니다.  승수 라는 아주 직관적인 스케일로 환산된다는 점도 매력입니다.


반면 그 정확도에 대해서는 몇가지 논란을 가지고 있기도 합니다.  계산에 사용되는 wOBA, FIP(또는 RA9), UZR 같은 기초스탯은 적어도 현존하는 다양한 평가지표 들 중 가장 나은 신뢰도를 가지고 있는 편이기 때문에 그닥 문제되지 않는 편이지만 관건은, 경기에서 서로 다른 임무와 역할을 가진 선수를 하나의 단일 척도로 평가하기 위해 사용되는 1) 포지션 조정상수 2) 대체선수레벨의 값 이 두가지가 대상이 됩니다.


1루수, 지명타자, 센터필더 같은 수비포지션의 차이를 과연 합당하게 조정하고 있는가 하는 점도 그렇고 선발투수와 불펜투수의 역할 및 비중의 차이를 고려하는 방법도 그렇습니다.   이 글의 테마는 WAR 이라는 평가방법이 선발투수와 마무리 투수를 포함한 불펜투수 사이에서 불공평한 기준을 가지고 있는게 아닌가 하는 논점에 대한 것입니다.  좀더 직접적으로 말한다면 WAR가 불펜투수의 가치와 승리기여도를 과소평가하고 있는 것이 아닌가 하는 점입니다.


WAR가 말해주는 것과 그렇지 않은 것


다음은 kbreport.com 의 KBO14시즌 40이닝+ 투수들의 WAR 순위입니다.

- 통계출처 : kbreport.com 


보는 것과 같이 선발투수들이 불펜투수들보다 큰 차이로 WAR가 높습니다.   WAR은 계산방법 상 더 많은 이닝을 던진 투수들이 더 높은 평가를 받도록 되어 있습니다.   그런데 논점은 선발투수가 던진 한 이닝과 박빙의 순간 마운드에 올라 던지는 불펜투수의 이닝을 동등하게 취급하는 것이 과연 옳으냐 하는 것에 대한 것입니다.


실제로 경기초반의 한두점은 승패에 결정적인 영향을 미치지 않을 수 있습니다.  하지만 동점이나 한점차 승부의 8회나 9회의 한점은 그 자체로 그때까지이 모든 경기과정을 뒤집어 승패를 결정지을 만큼 중요할 때가 있습니다.  마무리투수의 중요성을 말하는 사람들은 야구가 결국 승리에 목적을 두고 있는 바, 만약 9회의 한점을 지키지 못해서 8이닝 동안의 피칭과 타자들이 만들어낸 득점이 쓸모없어질 수 있는 게임의 본질을 주목합니다.


하지만 이에 대한 타당한 반론도 있습니다.  흔히 클로저가 등판하는 세이브조건이란 한이닝을 남기고 3점 이내의 리드를 하고 있는 상황을 말합니다.  그런데 통계적으로 이런 상황에서 경기가 뒤집힐 확율이 그리 높지 않다는 것입니다.  즉 최고 수준의 투수나 그렇지 못한 중상급 투수나 3점 이내 리그상황의 한이닝을 막아낼 통계적 확율에서 그리 큰 차이가 차지 않기 때문입니다.  한 팀이 클로저라고 해도 항상 박빙의 순간에만 등판하는 것은 아니기 때문입니다.


결과적인 승리기여도를 측정하는 WPA: Win Probability Added


WPA(Win Probability Added)라는 세이버메트릭스 지표는 이런 논점에 대한 타당한 평가방법이 될 수 있습니다.  21세기 세이버메트릭스의 새로운 교과서라고 할 수 있는 톰 탱고의 theBook에 소개된 이 지표는 이닝, 점수차, 아웃카운트, 베이스의 주자상황을 모두 고려해서 그 상황에서 홈팀이 승리할 통계적 확율을 기반으로 합니다.  


WPA를 이용하면 경기 중에 일어나는 모든 플레이가 얼마만큼 팀의 승리확율을 높이거나 혹은 낮추는지 측정할 수 있어집니다.  예를들어 2점 뒤진 6회말 공격 1사 주자1루 상황에서 홈팀이 통계적인 승리확율은 15.8% 입니다.  분석기간 중 이와 같은 상황이 2596번 있었고 그중 홈팀이 승리한 경우가 410번이었기 때문입니다.


그런데 타자가 2루타를 쳐서 1루 주자가 홈으로 들어오고 1사 주자2루 상황으로 바뀌었습니다.  이 경우 홈팀의 승리확율을 30.5%로 높아집니다.  그렇다면 이 2루타는 팀의 기대승리 즉 승리확율을 14.7% 높인 것이 됩니다.  동시에 이때 마운드에 있던 투수는 팀의 승리확율을 -14.7% 잃어버린 것에 되겠죠.


50%의 승리확율 상태로 시작되는 경기가 마지막 순간 승리팀의 승리확율 100%가 될때까지를 플레이 바이 플레이로 측정하는 것이 WPA 입니다.  따라서 시즌 전체에 걸쳐서 한 선수의 WPA를 모두 합하면 WAR와 동일한 승리기여도 스케일의 평가지표를 얻을 수 있습니다.  

WPA, 승리확율, 승리가치 - 클러치에 관한 세이버메트릭스 

http://baseball-in-play.com/110


각각의 플레이를 중립적이고 평균적인 상황에서 일어난 것으로 취급하는 WAR와 달리, WPA는 예를들어 박빙의 상황에서 위기를 막아내는 마무리투수의 승리기여도 같은 것을 좀더 정확히 측정할 수 있는 수단이 됩니다.   


같은 세이브 조건이라 해도 9회말 3점 앞선 상황에서 등판한 마무리 투수는 그 이닝을 실점없이 막아냈다 하더라도 WPA +0.04 만 받습니다.  왜냐하면 3점 앞선 9회말이 시작될 때 통계적인 팀의 승리확율은 이미 96%였고 따라서 그가 기여한 것은 +4% 일 뿐이기 때문입니다.  반면 1점차 9회말에 등판할 경우 WPA +0.20 을 받습니다.  좀 극단적인 예로 1점 앞선 9회말 무사만루 상황에서 구원등판한 투수가 그 실점없이 경기를 마무리하면 세이브 기록은 그래도 1개일 뿐이지만 WPA +0.72 를 받습니다.  한 경기의 승리의 72%를 지켜냈다는 뜻입니다.  


결과적으로 한 팀이 승리를 거두게 되면 그날 경기에 출전한 모든 선수들의 WPA 합계는 정확히 0.5가 됩니다.  오르막과 내리막이 어찌 있었거나 결국 50%의 승리확율에서 출발해서 100%의 승리확율로 끝나기 때문입니다.  동시에 패배팀 선수의 WPA 합계는 -0.5가 됩니다.  한시즌 전체를 누적시켰을 때 WPA 2.0 인 선수는 팀의 5할 승률 대비 +2승을 기여했다는 뜻입니다.  


WAR과 WPA 는 똑같이 팀에 대한 기여승수값으로 표시되는 메트릭스입니다.  그리고 선수의 포지션과 상관없이 타격, 주루, 피칭 등을 종합하여 동등한 기준으로 평가된다는 면에서도 같습니다.  대신 다음과 같은 차이가 있습니다.


1. WPA=0 은 팀의 5할 승률에 해당되는 기여를 말합니다.  반면 WAR=0 은 대체선수대비 승리기여 0을 뜻합니다.  따라서 동일한 기여를 했을 경우라면 WPA의 값이 WAR의 값보다 좀 낮습니다.  기준점에서 WPA가 휠씬 높기 때문입니다.

2. WAR은 선수의 능력을 평가하고 미래의 가치를 예측하기 위한 것입니다.  대신 WPA는 그 선수의 지나간 플레이의 중요도와 기여도를 측정합니다.  예를들어 WAR에서는 9회말 역전끝내기 만루홈런을 친 선수와 10-1로 앞선 9회초 1점 홈런을 친 선수를 동일하게 평가합니다.  왜냐하면 상황은 그 선수의 책임도 능력도 아니라고 보기 때문입니다.  그리고 다음 시즌에 반복될 가능성도 낮기 때문입니다.  반면 WPA에서는 전자의 선수가 더 높은 값으로 측정됩니다.  어쨌든 승리에 결정적인 기여를 한 것이기 때문입니다.

3. WAR은 UZR에 기반하여 야수의 수비능력을 따로 평가하여 반영하지만 WPA는 그렇지 않습니다.


승리확율기여WPA 로 측정한 KBO14시즌 투수 Top30



위는 KBO14시즌의 투수들의 WPA 순위입니다.  

투수들의 WAR 순위가 가장 결정적으로 다른 차이는 2위 한현희, 8위 김진성, 10위 안지만, 11위 봉중근 등 불펜투수들이 대거 상위권에 자리하고 있다는 것입니다.  WPA가 결과적인 승리기여도의 타당한 측정지표라고 한다면 WAR의 계산방법이 불펜투수들의 승리기여도를 제대로 반영하고 있지 못할 수 있다는 것을 암시합니다.


물론 선발투수의 경우도 소소한 자리바꿈이 있기는 합니다. 하지만 애당초 WAR이란 지표의 내재적인 오차가능범위 안쪽이 있다고 보는 것이 더 타당합니다.  WAR 이란 지표의 활용방법에 대해 fangraphs.com 의 설명은 아래와 같습니다.


WAR은 선수의 공헌에 대한 완벽한 평가지표라기 보다는 기대할 수 있는 대략의 예측치입니다.  완벽할 수 없는 데이터와 계산에 사용되는 이런저런 가정으로 인해, WAR를 대략의 근사치로 볼 때 가장 유용합니다. WAR 6.0 으로 계산된 선수는 대략 WAR 5.0 에서 WAR 7.0 사이에 있다고 볼 수도 있고, 그보다 오히려 “이 선수는 올스타급 선수다” 정도로 판단하면 그게 제일 확실합니다.   


WAR is not meant to be a perfectly precise indicator of a player’s contribution, but rather an estimate of their value to date. Given the imperfections of some of the available data and the assumptions made to calculate other components, WAR works best as an approximation. A 6 WAR player might be worth between 5.0 and 7.0 WAR, but it is pretty safe to say they are at least an All-Star level player and potentially an MVP.

http://www.fangraphs.com/library/misc/war/


WAR 가 원래 플러스 마이너스 1.0 정도를 오차범위로 가진 지표이기 때문에 예를들어 WAR 3위인 양현종이 WPA 1위가 되었다거나 하는 차이에 큰 의미를 부여할 필요는 없습니다.  그러나 불펜투수들의 순위변화는 그렇지 않습니다.


WAR 순위에서 불펜투수는 24위까지 단 한명도 없습니다.  반면 WPA에서는 24위 안에 10명의 불펜투수가 랭크되어 있습니다.  WPA와 WAR가 목적과 구조는 다르지만 어쨌든 그 나름의 객관성과 신뢰성을 가지고 있는 평가지표들입니다.  그렇다면 WAR의 어떤 구조로 인해 WAR은 불펜투수의 승리기여도를 충분히 평가하고 있지 못하고 있다는 의견은 충분히 고려할 필요가 있습니다.    


그렇다고 WPA가 WAR보다 좀더 우월한 메트릭스라고 할 필요는 없습니다.  긴 이닝을 던지며 팀에게 승리기회를 제공하는 것이 임무인 선발투수의 경우 WAR이 좀더 정확한 측정기준이 될 수도 있습니다.  대신 WPA를 볼 경우 그 투수가 얼마나 빠듯한 상황에서 공을 던졌는지에 대한 정보를 얻을 수 있습니다.  선발투수의 경우 등판조건에 따른 영향이 거의 없긴 하지만 타자들이 빠듯한 점수 밖에 내주지 못해 시종일관 한두점차의 리드에서 던진 투수들의 WPA가 약간 더 높아지는 경향이 있기 때문입니다.  


이런 차이는 WPA의 구조에서 생겨나는데, 5점이나 8점을 리드하고 있을 경우 잡아내는 아웃카운트들이 팀의 승리확율에 덜 영향을 미치지만 반대로 한두점의 팽팽한 경기가 진행되면 선발투수가 잡아내는 아웃카운트 하나 하나가 좀더 큰 가치로 평가되기 때문입니다.


미국의 주요 세이버메트릭스 매체 베이스볼프로스펙터스의 Russell Carlton 은 "Why Are Smart Teams Spending Money on Relievers?" 에서 불펜투수에게 투자하는 것이 새로운 머니볼이 될 수도 있음에 대해 말한 적이 있습니다.  한때 타율을 중시하는 관점이 OPS가 높은 타자들의 저평가를 가져오고 그 틈새에서 빌리빈의 오클랜드가 소위 머니볼의 황금기를 구가했던 것처럼 점점 더 많는 메이저리그 구단들이 WAR을 중시하면서 그에 의해 과소평가될 소지가 있는 불펜투수의 저평가 현상이 생겨나고 있기 때문입니다.


WPA가 높은 구원투수에게 투자하는 것은 WAR이 높은 선발투수에게 투자하는 것보다 휠씬 더 리스크가 큰 전략입니다.  WPA는 WAR보다 덜 안정적(reliable)인 메트릭스이기 때문이죠.  대신 WAR가 낮고 WPA가 높은 불펜투수들은 휠씬 가격이 쌉니다.  따라서 작은 페이롤을 가지고 경쟁해야 하는 스몰마켓 팀들에게 그리 나쁘지 않은 선택이 될 수도 있다는 것입니다. 


다만 이것은 MLB의 이야기입니다.  만약 KBO의 경우 거꾸로 불펜투수의 가격이 비싸다면 옳은 전략은 그 반대일 수도 있으니까요. 머니볼이란 당시 시장에서 실제 가치에 비해 과소평가되고 있는 것이 무엇인지를 찾아내는 전략이니까요. 


불펜투수의 평가에 좀더 적합한 메트릭스 WPA


하지만 자신의 책임이 아닌 위험 상황에 등판하는 불펜투수의 경우 던지는 이닝과 상황을 중립화시키는 경향이 있는 WAR이 그들의 극적인 위기탈출능력을 충분히 평가하지 못하는 것도 사실입니다.  


불펜투수의 WPA에 영향을 미치는 것들은 대체로 다음과 같습니다.


1. 당연하게도 더 많은 이닝을 더 적은 실점으로 던지는 선수가 높다.

2. 점수차가 작은 상황에서 많이 던지면 더 높아진다.

3. 후반 이닝에 던질수록 높아진다.   왜냐하면 동일조건에서 7회보다는 8회가 8회보다는 9회가 더 승리결정의 중요도가 높아지기 때문이다. 

4. 더 심각한 위기상황를 해결하고 이닝을 종료시키면 높아진다.  반대로 위기를 남겨놓고 강판당하면 낮아진다. 


이런 이유로 계산의 난이도 문제만 아니라면 불펜투수의 결과적인 승리기여도를 가장 잘 평가할 수 있는 지표가 WPA입니다.  여기에는 어떤 분식도 허용되지 않기 때문이며 다음 투수가 잘 막아줘서 득을 볼 소지도 없습니다.   종종 사용되는 승계주자실점IRS 같은 것을 염두에 둘 필요조차 없습니다.  


오해없길 바라는 것은 WPA가 WAR보다 정확한 지표라고 말하려는 것은 아닙니다.  둘은 목적이 다르기 때문에 어느 것이 다른 것보다 정확하다 말할 수 있는 것이 아닙니다.  논점은 WAR가 경기 후반의 중요 상황에 등판하는 불펜투수의 역할 자체를 충분히 반영하지 못할 가능성에 대한 것입니다.  그리고 WPA의 측정결과는 특정 투수의 가치에 대한 것이 아니라 WAR가 가지고 있는 일종의 사각지대를 발견하기 위해 사용될 수 있다는 것입니다. 


WAR라는 지표 자체가 불펜투수의 중요도를 과소평가할 소지가 있다면 당연히 WAR에 의해 평가되는 어떤 투수의 가치가 실제 팀승리 기여도보다 낮게 측정될 수 있다는 뜻입니다. 


불펜투수 중 WPA 1위인 한현희는 wmLI가 1.46이기 때문에 아주 위험도가 높은 상황에서 등판한 것은 아니지만 이닝이 많은 편이고 아마도 뒤로 위기를 남기지 않았기 때문인 것 같습니다.  


13시즌 귀족마무리라고 놀림받던 NC 김진성은 14시즌에는 wmLI 1.8 로 상당히 터프한 등판이 많았고 봉중근은 다른 불펜투수에 비해 다소 적은 49.2이닝만을 던졌지만 순위 안의 모든 투수들 중 가장 김진성에 이어 두번째로 위험도가 높은 wmLI 1.83 에서 등판한 것 때문에 WPA가 높아진 것으로 보입니다.   


그밖에도 8회나 9회에 등판하는 프라이머리 셋업과 클로저들이 WPA Top30 안에 이름을 올립니다.  


간혹 선발투수들에게 wmLI가 기록된 경우가 있는데, 이것은 그들이 한두번 정도의 불펜알바가 있었기 때문이며 큰 의미는 없습니다.  


WAR와 WPA를 비교한다면 다음과 같습니다.


1. WAR은 계산에 사용되는 스탯을 중립화하기 때문에 결과에 대한 평가보다 기대치의 예측에 더 적합합니다.

2. WPA는 상황에 따른 결과적인 승리기여도를 측정합니다.  선수의 능력을 평가하기에 부정확한 조건의 영향을 받기는 하지만 그 선수가 팀 승리에 얼마나 중요한 역할을 했는가를 측정하는데 적합니다.  


따라서 불펜투수들의 평가에 있어서는 WAR 뿐 아니라 WPA를 참고하는 것이 좀더 객관적인 시각을 갖는데 도움이 됩니다.  


비슷한 이닝, 비슷한 실점억제능력을 보여준 투수 중에서 WPA가 좀더 높아지는 것은 위에서 설명한 것처럼 좀더 터프한 상황에서 자주 던진 투수들입니다.  그런데 불펜투수들이 터프한 상황을 자주 직면하는 것은 개연적으로 타자들이 충분히 많은 점수를 내주지 못할 때 그렇습니다.  한두점 차의 빠듯한 승부가 경기 후반까지 이어지는 경우가 많은 팀의 불펜투수들이 그래서 wmLI가 좀더 높고 WPA도 약간 높아지는 경향이 생깁니다.


그런데 이것을 뒤집어 생각하면, 타격이 약해서 아슬아슬한 리드상황 혹은 추격상황이 많은 팀은 그만큼 불펜투수들이 감당해야 하는 한 타석 한 타석이 그만큼 팀 승리에 미치는 영향이 커진다는 뜻이 됩니다.  (그랬기 때문에 그것을 잘 수행해낸 투수들의 WPA가 높아진 것이구요.  반대로 그런 팀의 불펜투수는 임무를 제대로 해내지 못할 경우 오히려 다른 팀의 불펜투수들 보다 더 큰 폭으로 WPA 가 하락하는 반대급부도 있습니다. 


이런 것은 야구팬들에게 아주 쉽게 체감되고 심정적으로 쉽게 동의할 수 있는 사실입니다.  WPA 라는 세이버메트릭스 측정지표는 그런 부분에 대한 좀더 객관적이고 통계적인 근거를 말하고 있는 셈입니다. 



댓글
  • 프로필사진 ㅇㅇ 개인적으로 LI란 걸 평가에 고려해야하는지조차 조금 의문스럽네요.
    "중요한 상황 = 어려운 상황"은 아니니까요.
    제일 명쾌한 해답은 상대의 수준을 보정하는 것 같은데 이게 제일 어려우니.
    2015.04.26 19:41 신고
  • 프로필사진 토아일당 LI가 나타내는 것이 "어려운 상황"이 아니라 "중요한 상황"이라는 것은 아주 정확한 지적입니다. LI는 "난이도"라기보다는 "위험부담"으로 해석되는게 맞겠죠.
    그런이유로 LI와 WPA를 적절하게 적용하는게 필요한거 같습니다.
    1. wmLI는 그래서 구원투수의 [등판시점]만 카운트합니다. 해서 wmLI는 기여도를 측정하는것은 아니고, "중요도" "신임도" "부담감"에 관한 지표일겁니다. 하지만 글에도 적었지만 같은 업무강도라도, 위험부담(승패결정중요도)이 많은 업무는 좀더 가치있게 봐줘야 하지 않을까요?
    2. 대신 전체적인 승패결정 기여도는 그래서 WPA로 볼 수 있는거 같습니다.
    2015.04.27 10:14 신고
  • 프로필사진 토아일당 상대수준에 따른 보정은 약간 덜 일반적인 접근같네요. 선발투수라도 강한 팀이나 강한 타자를 상대할 경우에 그걸 보정해주는 경우는 잘 없으니까요.
    상대에 따른 쏠림은,,, 직접적인 보정 보다는,,, 어느정도 이상의 이닝이 누적될때, 샘플사이즈가 충분히 커지면서,,, 통계적인 쏠림이 사라지는 결과로,,, 신뢰성이 만들어는 쪽이 맞는 해법일겁니다.
    2015.04.27 10:17 신고
  • 프로필사진 썩빡꾸 정성스러운 글 잘 봤습니다. 저도 구원 투수의 WPA를 보는게 상당히 유용하다는 의견에 동의합니다.
    그러나 WAR 계산에서는 구원투수의 이닝당 중요성(LI)을 이미 고려하고 있습니다. 이로 인해 선발투수보다 이닝당 30~50%의 가중치를 부여받습니다. 따라서 저는 구원 투수의 WAR도 충분히 의미있다고 생각하고, 심지어 WAR/eff_LI로 계산하여 완전 중립화해서도 봅니다.ㅎㅎ
    2015.05.29 17:24 신고
  • 프로필사진 토아일당 글에 적었듯이, WPA가 WAR에 비해 우월하다 말할 수 있는 것은 아닐겁니다. 당연히. 하지만 LI가 고려된 WAR와 WPA는 여전히 다른 종류의 평가방식일 수 밖에 없습니다. 그에 더해서 KBO의 경우는 현실적인 측정기준의 문제가 하나 더 생기겠죠.

    1. LI를 반영한 WAR 라도 WPA보다는 상황의존 기여도를 "덜" 반영합니다. 계산식상 그러니까요.

    2. LI를 고려한 WAR라도 "남겨놓은" 위기상황을 고려하지 않습니다. 그렇다는 것은 "지워버린" 위기상황 역시 고려하지 않는다는 뜻입니다.

    3. FIP기반의 WAR일 경우, 피칭의 질을 평가하는데 적합할 수 있지만, 피칭의 결과를 평가하기엔 부적합합니다. 이건 측정목적의 문제겠죠.

    4. (KBO경우라면) 아직도 실제 gmLI를 측정해서 투수WAR에 반영하고 있는 곳은 보지 못했습니다. 그저 투수 개인의 보직에 따라 잠정적으로 정한 상수를 일괄적으로 적용하는 수준입니다. 베이스볼랩이나 kb리포트 두군데는 그렇더군요. 이론적으로 WAR이 LI를 반영한다 해도 실제 통용되는 KBO선수들의 WAR가 그렇다고 보기는 어렵습니다.

    5. (KBO경우라면) 선발투수와 구원투수에게 적용되는 대체레벨 수준의 승리기여도(0.38승과 0.47승의 차이) 계산의 정확성 문제가 있을 수 있습니다. 선수풀과 구원투수의 경기당 소화이닝 차이로 대체레베링 좀더 높아질 가능성이 충분히 있으니까요.

    6. WAR의 구원투수 LI를 적용할 때 사용하는 "불펜체이닝"이라는 가정에 약간 불공평함이 있다는 느낌이 듭니다. gm_LI를 그대로 적용하지 않고 (1-gmLI)/2 로 적용하는 논리적 근거인데, 그 자체는 합리적이지만, 선발투수의 경우 대체레벨선수가, 측정대상이 되는 선수와 동일한 만큼의 이닝을 소화한다고 가정하는 계산방식 때문에 수준급 선발투수는 약간 과대평가될 소지가 있습니다. 그 선발투수가 부상이탈 등으로 대체선수가 그 자리를 메꿀경우 아마 소화이닝이 더 적어질텐데, 그걸 선발투수WAR에서 고려하지는 않습니다. 만약 구원투수에게 불펜체이닝모델을 적용한다면, 선발투수에게는 선발로테이션 조정에 관한 어떤 가정을 적용하는게 더 공평하다는 이유 때문입니다.

    뭐 어쨌든, (엄격한 방식으로 제대로 계산된) WAR이 좀더 보편성이 높은 평가기준이긴 하지만 그럼에도, 선수의 능력 기대치를 측정하려는 지표와, 선수의 결과적인 실제 승리기여도를 측정하려는 지표 사이의 차이는 여전히 남을 것이고, 목적에 따라 둘을 함께 고려하는게 필요하다는 생각에는 변함이 없습니다.
    2015.06.01 14:24 신고
  • 프로필사진 썩빡꾸 말씀하신대로 KBO의 경우 아직 4,5에 대해서는 많이 아쉽네요. 2015.06.01 14:54 신고
  • 프로필사진 토아일당 의견 감사합니다. 2015.06.01 15:07 신고
  • 프로필사진 EVER17 WPA는 대체선수 기준인 WAR보다 같은 평균 기준인 WAA와 비교하는게 더 적합하다고 봅니다.
    평균적인 선수는 WPA로는 누적 공헌도가 측정되지 않습니다. 100 이닝을 던지고 WPA가 0 인 선수나 10이닝을 던지고 WPA가 0 인 선수나 WPA는 똑같습니다. 심지어는 전혀 경기에 나서지 않아도 0 은 보장됩니다.
    WPA가 0 으로 같다면 실제 프로리그에서는 이닝이 많을수록, 또는 선발이 구원보다 가치가 높겠죠. PR, RAA, WAA등 평균이 기준인 스탯은 모두 이런 구조적인 문제가 있습니다. 그래서 선수의 가치 평가에 평균을 기준으로 하는 스탯은 적합하지 않다고 생각됩니다.
    WAR는 평균보다 수준이 낮은 대체선수가 기준이므로 평균적인 선수도 누적 공헌도가 반영되고 선발과 구원의 차이도 반영을 하고 있습니다.
    MLB 기준의 대체선수 수준이 KBO에 적합하지 않다는 건 물론 맞습니다. 하지만 대체선수 수준을 적절하게 잡는다면 선수의 가치 평가에는 현재까지 나온 스탯 중에서는 WAR가 제일 좋다고 생각합니다.




    2015.07.12 10:31 신고
  • 프로필사진 토아일당 1. [평균]은 대체레벨로 적당하지 않다는 의견에 동의합니다. 다만, [규정이닝] 또는 [일정한 출전이닝 이상] 이라는 기준을 함께 사용할 경우, 지적하신 문제는 대부분 해소될 수 있습니다.

    2. 그럼에도 [평균]이 역시 대체레벨로 부정합한 것에 다시 동의합니다. 어느 대체레벨이든, 그것은 충분히 낮아야 합니다. 그러기엔 평균은 너무 높습니다. 그래서 평균을 대체레벨로 사용하는 모든 지표는, 수준급 이상의 선수에게만 적용될 수 있는 단점이 있죠. (링크된 WPA 지표에 대한 설명글.에서 말한 바와 같이)

    3. 그렇다면 WPA와 같은 WP계열의 지표를, 평균이 아닌 WAR과 비슷한 대체레벨로 계산한다면, 그런면에서의 WPA 단점은 사라지고, 상황의존적인 스탯의 특징과 장점만 남길 수도 있습니다.

    4. 논점은, 최저연봉선수를 대체레벨로 하는 것이 좋으냐, 평균을 대체레벨로 하느냐가 아니라,,, 상황중립적인 지표로서 WAR와 상황의존적인 지표로서 WPA 가 상호보완적인 필요가 있다는 것입니다.

    5. 미래의 예상기여도에는 WAR 이 나을것이고, 지나간 시즌의 실제 기여도는 WPA가 그래서 낫다고 생각하는 것입니다.

    6. KBO현실에서 제일 낫다고 생각하는 대체레벨은 그래서 zero-win 또는 zero-run 레벨입니다. XR이나 RC가 잡는 것처럼. 또는 wRC가 그렇게 하고 있는 것처럼. 부정확한 MLB최저연봉기준선수.라는 대체레벨을 굳이 고집할 이유도 별로 없고 zero-run 으로도 필요한 만큼의 측정을 충분히 할 수 있으니까요.
    2015.07.12 19:10 신고
  • 프로필사진 EVER17 규정이닝 같은 누적 제한을 건다면 괜찮습니다. WPA같은 평균 기준의 스탯은 규정이닝 이상의 선발투수끼리 또는 일정이닝 이상의 구원투수끼리 같은 제한적인 조건하에서는 유용한 스탯이라고 생각합니다. 하지만 선발투수와 구원투수를 비교하기 곤란한 문제는 여전히 남습니다. 선발투수와 구원투수간의 비교는 아직까지는 WAR 외에 대안이 없다고 보네요.

    그런데 아무리 KBO라도 대체수준을 0 으로 하는건 너무 낮습니다. 그러면 누적을 너무 과대평가하게 됩니다. 그리고 투수는 타자와는 달리 0 기준으로 평가할 방법도 없습니다.
    저는 예전 스탯티즈 정도의 대체수준이면 충분하다고 봅니다. 기준이 꼭 대체선수일 필요는 없지만 적당한 기준은 있어야한다고 생각합니다.
    2015.07.12 23:09 신고
  • 프로필사진 토아일당 1. WPA와 WAR의 가장 결정적인 차이는, 대체레벨이 아니라 "실제의 결과"로 측정할 것이냐 아니면 "미래의 기대치"를 가지고 측정할 것이냐에 있습니다. 대체레벨의 경우 WP의 대체레벨을 WAR와 똑같이 맞출경우 차이가 없어질테니까요. 이렇게 본다면, WPA와 WAR은 상황의존적인 측정이냐 상황중립적인 측정이냐의 차이 만 남게 됩니다. 여기서 장단점이 보면 되는게 아닐까요?

    2. XR이나 RC처럼 대체레벨을 0으로 하는 지표들이 문제가 되는 "과대평가"의 결함을 가진다고 생각하지는 않습니다.

    zero-win level 기준으로 +2승을 한 선수와 +3승을 한 선수가 있다고 가정할 때, 대체레벨이 +1.5승으로 설정된다면, WAR 기준에서는 두 선수의 기여도는 +0.5승 +1.5승으로 측정됩니다. 3배의 차이가 생깁니다. 0-win 기준이면 두 선수의 기여도는 1.5배 차이입니다. 이것이 맞냐 틀리냐가 대체레벨을 어디에 둘 것이냐의 문제겠죠.

    3. WAR에 대한 또다른 고려사항은 "정확도"입니다. Fangraph가 말하는 것과 같이, WAR은 1.0 이하인 선수를 평가하기에 부적합하며 소숫점 이하의 차이, 즉 1.0 이하의 차이가 나는 선수들의 우열을 단정하기 어렵습니다. 2.6인 선수와 3.3인 선수 중 누가 낫다 하기 어려운 정도의 정확성만 가진 지표입니다. 선수의 클래스가 대략 어느정도인지는 말할 수 있지만 선수간 비교에 사용하기엔 정확도에서 부족함이 있습니다.

    오해없길 바라는 것은, 그래서 WAR가 나쁘다는 말을 하려는것은 아니고, WAR가 가진 한계가 있기 때문에 WPA 혹은 대체레벨을 0-win 이나 MLB 최저연봉선수수준. 정도로 조정한 WP기반 지표를 보완적으로 사용하는 쪽이 더 나은 방법이라 생각한다는 것입니다.

    4. 투수의 zero-run 기준 측정방법은 http://baseball-in-play.com/101 처럼 할 수 있다고 생각합니다.

    --- 관점 차이를 떠나서 좋은 의견 주신 것에 감사드리고 싶습니다. 도움이 되었습니다.
    2015.07.13 12:24 신고
  • 프로필사진 EVER17 WPA도 대체수준을 보완한다면 선발투수와 구원투수간 비교에 문제가 없을 것 같습니다. 전에는 그게 잘 이해가 안 되었는데 다시 생각해보니 가능하겠더라고요. 마침 WPA에 대체수준을 보완한 글도 쓰셨던데 잘 봤습니다.

    제로 기준 스탯도 그자체로 활용도는 높다고 생각합니다. 승,패,안타,타점 같은 기본적인 클래식 기록부터 모두 제로 기준이니까요. 하지만 선수간의 가치 비교에는 좋지 않다고 생각합니다. 예를 들어 A라는 선수와 B라는 선수가 똑같이 안타 200개를 쳤다고 하겠습니다. 그런데 A는 500타수 동안 친 것이고 B라는 선수는 1000타수 동안 친 것이라면 이 선수들의 가치는 같을까요? A는 타율 타이틀을 따고도 남지만 B는 1군에 붙어있기 힘든 수준입니다. 200안타를 쳤다는 것은 같지만 A는 팀에 큰 도움이 되는 선수이고 B는 있을수록 폐가 되는 선수입니다. 제로 기준이 과대평가된다는 것은 그런 의미입니다. 그래서 KBO라도 제로 기준은 대체수준으로 적합하지 않다고 생각합니다.

    WAR는 정확도가 떨어지는 단점이 있다는 것은 저도 동의합니다. 관점에 따라 실제 결과에 따른 기여도라면 WPA기반 스탯, 중립화한 기여도라면 WAR를 보면 좋을 것 같습니다.



    2015.09.19 08:44 신고
  • 프로필사진 토아일당 의견 감사합니다.
    다만, 타율, 장타율, ops 등도 대체레벨로 제로 기준이기 때문에, 500타수와 1000타수의 비교는, 제로베이스냐 아니냐보다, 비율지표냐 누적카운트 지표냐의 차이의 문제일듯 합니다.
    2015.09.21 03:44 신고
댓글쓰기 폼