티스토리 뷰

RE24, REA, REW 

- 기대득점으로 실제 득점기여도를 측정하는 세이버메트릭스 스탯  



야구통계에서 평가지표들은 보통 어떤 선수가 더 가치있는가 또는 어떤 플레이가 더 가치있는가를 판단하기 위해 사용됩니다.  다음 3가지 플레이 중 어떤 것이 득점기여도 면에서 가장 가치있는 것일까요?  


A. 무사23루에서 홈런 --> 3점 + 무사 주자없음 

B. 1사12루에서 2루타 --> 2점 + 1사 주자2루 

C. 2사만루에서 1루타 --> 2점 + 2사 주자13루


타격기록만으로 보면 홈런>2루타>1루타입니다.  스코어보드에 올려진 점수로는 3점>2점입니다.  하지만 홈런이라도 주자가 없을 때는 1점에 불과하고 단타로 3점을 내는 플레이도 있습니다.  득점이란 타자 혼자의 능력이 아니라 앞선 동료의 출루가 있어야 하며 그렇게 출루한 타자는 또 다음 타석에 설 동료에서 새로운 득점기회를 주는 것이 야구입니다.

그런데 어떤 세이버메트릭스 또는 야구통계지표는 이런 상황의 복잡성 속에서 각각의 플레이가 가진 득점기여도의 가치를 객관적으로 계산할 수 있게 해줍니다. 


RE24는 그런 목적으로 개발된 (많이 알려지진 않았지만) 아주 유용하고 매력적인 세이버메트릭스 지표입니다.   어떤 플레이로 인해 기대득점RunExpectancy이 얼마나 달라졌는지를 계산해서 전부 더한 값입니다. 


RE24의 계산방법


예를들어 이닝이 시작하고 첫번째 타자가 타석에 서면 그 상황의 RE는 0.533 (0out/없음의 RE-아래 표 참조) 입니다.  통계적으로 이 상황 이후에 기대할 수 있는 득점이 0.533점이라는 뜻입니다.  이때 볼넷으로 1루에 출루하면 RE는 0.890 (0_1의 RE)로 높아집니다.  그래서 이 볼넷의 가치는  +0.347RE 입니다.   다음타자가 우전안타를 쳐서 주자13루(0_13)가 되면 RE는 1.855가 됩니다.  이 안타는 +0.965 RE 입니다.  만약 다음 타자가 삼진으로 아웃되면 1사 13루에 해당하는 RE 1.227 이 되기 때문에 -0.628 RE가 됩니다.


기대득점 개념에 대한 참고글 - 기대득점RunExpectancy와 득점가치RunValues


이런 식으로 선수의 한시즌 전체 플레이의 플러스 마이너스(REA: Run Expectancy Added) 를 누적시키면 그것이 RE24 입니다. 뒤에 24가 붙은 것은 RE 값이 노아웃/1아웃/2아웃 3종류 아웃카운트와 없음/1루/2루/3루/12루/13루/23루/만루 8종류 베이스 상황의 조합 24 Base/Out States 를 기준으로 정해지기 때문인데, 그런 이유로 볼넷, 1루타, 홈런, 도루 무엇이든 모든 경기 중 플레이는 아웃카운트와 베이스 상황에 따라 24가지 각각 다른 가중치로 평가됩니다.  


24종류의 홈런과 삼진

이 방법을 기준으로 한다면, 야구에는 아웃카운트와 베이스 상황에 따라 총 24종류이 홈런이 있습니다.  


기대득점RunExpectancy 와 홈런의 순수한 가치

http://baseball-in-play.com/113


주자가 없는 상황에서 홈런의 REA 는 타점과 일치합니다.  만들어진 득점 전체를 타자의 몫으로 보기 때문입니다.  같은 베이스 상황에서의 홈런이라도 아웃카운트 상황에 따라 가치가 다릅니다.  2사의 만루홈런은 무사의 만루홈런보다 1점 이상 RE24 가중치가 높습니다.  왜냐하면 무사 상황에 비해 2사 상황이 더 득점하기 어려운 조건이기 때문입니다.


같은 아웃카운트의 같은 2점 홈런이라도 주자가 1루에 있을 때와 주자가 3루에 있을 때 RE24 가중치는 다릅니다.  무사 주자1루의 2점홈런의 경우 앞서 출루한 선수의 기여도가 0.356  홈런타자의 기여도가 1.644 로 배분하는데, 주자3루에서는 이미 3루까지 도달한 선수의 기여도가 0.944 홈런타자의 기여도가 1.056 입니다.  즉 무사3루의 2점홈런은 주자없는 1점홈런과 거의 같은 가치로 인식합니다. 


RE24가 평가하는 24종류의 서로 다른 삼진의 REA는 다음과 같습니다. 


RE24는 꽤 많은 장점을 가진 평가지표입니다.  특히 경기의 상황에서 팬들이 실감하는 것과 상당히 비슷한 평가기준을 가졌다는 점에서도 그렇습니다. 


글 앞에서 설정한 3가지 플레이의 득점가치는 그래서 다음과 같습니다.


A. 무사23루에서 홈런 --> 3점 + 무사 주자없음 : RE+ 1.55 

B. 1사12루에서 2루타 --> 2점 + 1사 주자2루 : RE +1.76

C. 2사만루에서 1루타 --> 2점 + 2사 주자13루: RE +1.70 


즉 위의 3가지 플레이 중에서는 1사12루의 2루타가 가장 득점가치가 높습니다.  2득점이었지만 무사23루의 3점홈런보다 가치가 높습니다. 




RE24의 특징과 장단점


1. RE24는 세이버메트릭스 지표 중 흔치 않게 중립(neutral) 스탯이 아니라 상황(situational) 스탯입니다. 


따라서 선수의 고유한 능력을 평가하는데는 한계가 있지만 선수의 결과적인 승리 기여도 같은 것을 측정하는데는 탁월합니다.  현존하는 스탯 중 이보다 나은게 없다고 해도 좋을 정도입니다. 비교할 수 있다면 WPA 가 있습니다. 


XR RC wOBA 같은 중립스탯들을 1점 홈런과 4점 홈런을 동일한 가치로 측정합니다.  반면 타점 같은 전통적 스탯은 4점 홈런의 가치를 1점 홈런에 비해 4배로 인식합니다.  RE24 는 그 중간에 있습니다.  만루홈런으로 4점이 만들어지면, 베이스위의 주자(=앞서 출루한 타자)와 타석의 타자(=홈런을 친 타자)에게 기대득점 기준으로 기여도를 배분해줍니다.   중립스탯인 XR RC wOBA 같이 상황을 완전히 제거하지도 않으며 타점처럼 주먹구구도 아닙니다. 


2. RE24는 타자와 투수 양쪽 다에게 공통적으로 적용할 수 있습니다.  


타격 이벤트 뿐 아니라 도루, 패스트볼, 폭투, 희생번트 같은 모든 플레이에도 마찬가지입니다.  타구의 위치를 측정할 수 있다면 수비수에게도 적용할 수도 있습니다.  타자는 타석 전후의 RE상황 변화가 카운트되고 투수는 타자상대 전후의 REA가 카운트됩니다.  타자의 RE가 플러스되면 그만큼의 RE가 (보통은) 투수에게 마이너스됩니다.  주자의 도루 역시 마찬가지입니다.  수비수의 실책에 대해서도 책임소재만 분명하다면 24가지 서로 다른 가중치를 적용해서 마이너스 REA를 줄 수 있습니다.  


이런 유연성과 일반성이 RE24가 가지는 중요한 장점입니다.  그래서 대체선수대비기여승수WAR의 기대득점 버전인 REW:RunExpectacnyWins 가 만들어질 수 있습니다.  REW는 득점스케일의 RE24를 승수 스케일로 전환시킨 것입니다.  WAR의 중요한 장점이 포지션과 상관없이 모든 선수에게 동일한 기준의 보편적 종합지표가 될 수 있다는 점인데 경기중의 모든 플레이를 설명하고 계산하게 해주는 RE24도 마찬가지입니다.   게다가 WAR은 타격, 피칭, 수비, 주루를 각기 서로 다른 별개의 평가지표로 일단 계산한 후 그것을 득점 스케일로 환산해서 비교하는 것에 비하면, RE24 기반의 REW는 애당초 최초의 측정방식 자체로 포지션과 상관없이 통일되어 있기 때문에 더 나은 점도 있습니다.


차이가 있다면, WAR은 기록된 결과를 토대로 계산하긴 하지만 그것을 중립화시켜 결과적인 승리기여도가 아니라 예상되는 승리기여도인 것과 달리, REW는 서로 다른 상황을 그대로 계산해서 실현된 결과적 승리기여도입니다.   따라서 WAR은 상황이나 행운과 상관없는 선수의 능력 자체에 좀더 집중한다면, RE24 REW는 운빨이든 법력이든 실제로 기여한 결과를 봅니다.  대신 타점이나 득점 같은 이전 스탯과는 달리 그 배분과 측정을 통계적인 객관성에 입각해서 하고 있다는 점이 특징입니다. 


3. RE24는 리그평균을 대체레벨(replacement level)로 사용하기 때문에 최상위권 선수들을 제외하면 적용했을 때 오차의 폭이 아주 커지는 단점이 있습니다.     


리그평균 이라는 대체레벨은 세이버메트릭스 지표들에서 착시와 오해가 생기기 쉽운 부분입니다.  리그평균이란 “보통 수준의 그저그런 선수”는 아닙니다.  흔한 오해와 달리 [리그평균league average] 에 해당하는 선수는 리그에 100명의 선수가 있을 때 그중에서 50번째에 해당하는 선수라는 뜻이 아니라 팀이 5할 승률에 해당하는 성적을 기록했다는 뜻입니다.  그래서 팀의 모든 선수가 [리그평균]에 해당하는 성적을 기록할 때 팀은 5할 승률을 기록합니다.  KBO에서라면 팀을 4강 컨텐더로 만들어줄 수 있습니다.     


어떤 종류의 대체레벨이든 그 지표로 평가하고자 하는 선수가 대체레벨에 가까워지면 오차 가능성이 급격하게 커집니다.  그런데 리그평균을 대체레벨로 사용할 경우, 팀내 주전급 선수들 중 상당수가 대체레벨 근처에 존재하게 됩니다.   

(이런 이유로 모든 대체레벨은 충분히 낮은 수준으로 설정되어야 합니다.  KBO에  WAR를 적용하지 않는 것이 좋은 이유 역시, MLB기준의 대체레벨이 너무 높기 때문입니다.  그럴 경우 소수의 상위권 선수들을 제외하고 나머지의 팀 주축급 선수들에 대한 평가가 왜곡됩니다.  상위권 선수라 해도 커리어WAR에서라면 기복이 좀 있던 시즌의 평가가 왜곡될 수 있습니다)


기대득점 기반 RE24의 가치 


RE24는 그리 유명하지도 않고 많이 쓰이지도 않지만 매력적인 면이 많고 또 유용합니다.  물론 상위권 선수들을 제외하면 적용하기 어렵다는 것이 단점이 문제이긴 하지만 (이 부분은 아래 소개하는 REAZ 라는 가공스탯으로 보완할 수도 있습니다.) 그보다 대부분의 세이버매트릭스 지표들은 이미 실현된 기여도에 대한 평가(evaluation)보다 앞으로 기대할 수 있는 기여도에 대한 예측(prediction)에 더 포커스를 두고 있기 때문이기도 합니다.  즉 스탯의 결함 때문이기보다 사용목적이 차이라고 볼 수도 있습니다.


어떤 시즌 찬스때마다 기가막힌 클러치 퍼포먼스를 선보인 베테랑 선수라면 WAR 같은 예측력 중심의 중립(neutral) 스탯을 내밀 이유가 없을 것입니다.  반면 구단 입장에서는 지나간 성과보다는 미래의 잠재적 기여도를 우선에 두고 평가기준을 삼고 싶을 것입니다.  그들에게는 WAR 같은 지표가 더 쓸모가 있습니다.


이것은 정확성의 문제가 아니라 ‘가치’와 ‘목적’의 문제입니다.  팀 입장에서 만루홈런이 1점홈런보다 낫긴 하지만, 이번시즌 만루홈런을 많이 친 선수가 내년에도 그럴 가능성은 통계적으로 희박합니다.  하지만 동시에 지난 시즌 더 많은 만루홈런은 더 많은 팀의 승리에 기여한 것도 [객관적 사실]입니다.  이런 스펙트럼 한쪽 끝에는 전통적 스탯인 타점이나 득점권타율 같은 것이 있고 반대쪽 끝에는 세이버메트릭스의 득점생산성 지표 RC, XR, wOBA 같은 것이 있습니다.  타점은 상황을 과대평가하고 wOBA는 상황을 완전히 배제합니다.  RE24는 상황을 통계적으로 합리적인 수준에서 반영하고 고려합니다.




 KBO14시즌 RE24 REAZ Top20 

- 테임즈, 손아섭, 박한이, 이병규(7), 최준석에 대한 재평가


같은 시즌성적에 대해 중립적 득점생산성 지표인 XR와 상황에 따라 가중치를 반영하는 RE24가 어떻게 달라지는지 KBO14 타자 RE24 Top20 의 XR 기준 순위와 OPS 기준 순위를 아래에서 볼 수 있습니다.


XR에 대한 참고글

XR XR27, 햇병아리 세이버메트리션의 도전 - http://baseball-in-play.com/99


또다른 통계는 가칭 REAZ 입니다.  Run Expectacy Added Above Zero-run  인데, 리그평균을 대체레벨로 삼고 있기 때문에 상위권 이외의 선수들에게 RE24를 적용하지 못하는 것을 보완하기 위해 디자인한 스탯입니다.  (원래 있는지 아닌지는 잘 모르겠습니다)


계산하는 방법은, RE24 값에 리그평균수준의 득점기여값을 더해주는 것입니다.  리그평균수준의 득점기여값은 [타석수 * 리그평균 타석당득점] 으로 계산할 수 있습니다.  KBO14시즌의 타석당 평균득점은 0.141점 정도였습니다.


이 방법은 wOBA를 가지고 WAR를 계산할 때 사용하는 방법과 같습니다.  XR이나 RC는 zero-run based 값이지만 wOBA는 그렇지가 않습니다.  따라서 일단 리그평균 wOBA와 비교해서 wRAA(리그평균대비 기여득점)을 구하고 그 다음 wRAA에 REAZ와 마찬가지로 [타석수*리그평균 타석당 득점]에 해당하는 리그평균수준의 득점기여값을 더합니다.  그러면 zero-run based 득점기여값을 구할 수 있습니다.  그것이 wRC 입니다.  타격의 WAR은 wRC 를 토대로 계산합니다.


REAZ를 wRC 대신 사용한다면 상황을 중립화시킨 예측(Prediction)목적의 WAR가 아니라 실제 이루어진 승리기여도를 평가(evaluation)하는 WAR를 계산할 수도 있습니다.  물론 한 시즌은 꽤 여러 타석의 결과로 만들어지기 때문에 그 결과가 중립WAR와 아주 큰 차이가 안날 수도 있지만, 어쨌든 찬스에 유독 강해서 결과적인 기여도가 높았던 선수들을 정당하게 평가할 수 있는 방법이 됩니다.


이렇게 했을때 XR 순위(wOBA기반의 wRC 순위도 거의 비슷할겁니다)에 비해 더 높은 평가를 받게 되는 선수들이 테임즈, 손아섭, 박한이, 이병규(7), 최준석 같은 선수들입니다.  다시말해 그들은 같은 홈런이라도 주자가 많은 상황에서 때렸고, 안타를 쳐도 득점하기 어려운 2사 상황에서 많이 쳐냈다는 뜻입니다.  



참고 - 위 통계는 주루 상황은 제외한 타석상황의 RE만을 계산한 것입니다



댓글
  • 프로필사진 혁이애비 RE24가 음수값이 나오는 경우는어떤경우일까요? 2015.10.25 17:48 신고
  • 프로필사진 토아일당 RE24 는 리그평균이 0 입니다.
    즉 RE24 인 선수가 있다면, 그는 팀에게 정확히 5할 승률 수준의 기여도를 가졌다는 뜻입니다. 그러니까 RE24 = 0 인 선수라면 수준급이라고 봐야겠죠.

    타석 출발 시점에 비해, 아웃카운트가 늘면 RE24는 마이너스 값이 됩니다. 대신, 아웃카운트가 늘어난 마이너스 값보다, 주자가 진루한 플러스 값이 더 크거나 득점성공을 하면 RE24는 플러스가 될 수도 있습니다.

    그런데, 대체레벨이 0이기 때문에 거의 전경기를 출전해서 RE24 0 즉 팀 5할승률 수준의 기여를 한 선수와,,, 딱 한타석 나와서 볼넷 하나 골라낸 선수가 있을때 후자가 높게 측정되는 문제가 있을 수 있기 때문에 글에서처럼,,, RAEZ 같은 조정을 하는게 필요하다고 생각합니다.

    대체레벨이 리그평균(=팀에게 5할승률 해당 기여도)인 지표들은 같은 약점을 가집니다. WAR 계산하기 전단계의 wRAA 도 똑같습니다. 그래서 wRAA 역시 wRC로 조정해주는 과정을 거칩니다.
    2015.10.26 17:09 신고
  • 프로필사진 혁이애비 감사합니다. 2015.10.29 22:18 신고
댓글쓰기 폼