본문 바로가기
diegobaseball
ANALYSIS

wOBA의 정의와 계산과정 (1/3) - 세이버메트릭스 on KBO

by 토아일당 2015. 1. 29.

 topic   wOBA 계산방법 타격스탯 상관관계 OPS 출루율 장타율 타율 세이버메트릭스 톰탱고 MLB 득점가치


[세이버메트릭스 on KBO] wOBA의 구조와 계산과정 (1/3)

 

wOBA: weighted On-base Average 는 가중출루율 정도로 번역될 수 있겠지만 출루율과는 좀 다른 종류의 타격스탯이다.  이런 이름이 붙은 이유는 wOBA값이 그 이전의 득점생산성 지표들과 달리 득점스케일이 아니라 출루율 스케일의 값을 가지기 때문이다.  

톰탱고의 기념비적인 성과물 The Book: Playing the Percentages in Baseball 을 통해 발표되었으며 현재 고안된 타격지표 중 가장 정확도가 높은 것으로 평가받는다.  


다른 지표들과 비교했을때, 득점과 상관관계가 가장 크기 때문이다.  야구에서 타격이란 득점을 만들어내는 것이 목적이기 때문에, 타격지표에서는 득점을 만드는 능력을 측정하는 것이 가장 중요하고 그렇다면 득점과 상관관계가 가장 큰 wOBA를 정확도가 가장 높은 타격지표라고 말하는 것은 합당하다.


MLB 30개 팀의 2009-2011 3시즌 데이터를 가지고 대표적인 타격지표들과 득점 사이의 상관관계를 선형회귀분석한 결과 다음과 같은 결과를 얻을 수 있었다.


타격지표R^2
BA0.5901
OBP0.7972
SLG0.8479
OPS0.9172
wOBA0.9295

* R^2 값이 높을 수록 상관관계가 크다는 의미이다.  다만 R^2값은 “정확도"와는 좀 다른 의미이다.  해서 “OPS와 wOBA는 정확도 1% 차이이다” 라고 말하는 것은 적당하지 않다.  굳이 해석한다면 “설명력" 정도로 할 수 있다.  

 

wOBA와 그 이전의 RC나 XR 사이의 결정적인 차이는 1루타, 2루타, 3루타, 홈런, 볼넷 등 각각이 타격이벤트에 적용되는 득점가중치를 구하는 방법이다.  대체로 회귀분석과 그를 보완하는 몇가지 시뮬레이션 프로그램에 의해 계산된 RC나 XR의 가중치와 달리 wOBA는 톰탱고가 고안한 24PA 상황에 대한 통계적인 평균득점인 기대득점RunExpectancy에 기반하여 계산된다.  

이와 같은 방법으로 득점에 영향을 미칠 수 있는 타격이벤트 각각이 기대득점을 변화시키는 값을 득점가치RunValue라고 한다.  이 득점가치를 기반으로 단타, 2루타, 3루타, 홈런, 볼넷 등의 가중치를 구하고 적용하여 계산하는 지표가 wOBA 이다.


theBook 에서 사용된 wOBA 계산식은 다음과 같다.


(0.72×고의4구 제외 볼넷 + 0.75×몸에맞는 볼 + 0.90×1루타 + 0.92×실책에 의한 출루 + 1.24×2루타 + 1.56×3루타 + 1.95×홈런) / (타석-고의4구)


톰 탱고의 오리지널 계산식은 실책에 의한 출루를 포함시키고 있지만 이 부분은 타자의 능력이 만드는 것이 아니기 때문에 후에 수정된 계산식에서는 제외된다.   최근에 사용되는 계산식은 다음과 같이 일부 수정되었다.


(wNIBB×고의4구 제외 볼넷 + wHBP×몸에맞는 볼 + w1H×1루타 + w2H×2루타 + w3H×3루타 + wHR5×홈런) / (타수 + 4B - IBB  + HBP + SF) 

 

각 타격이벤트에 곱해지는 가중치는 다음의 두가지 과정을 거쳐 결정된다.


1) 타격이벤트의 RunValue에 out 한 개에 해당하는 RunValue 절대값을 더해준다.   


예를들어 단타는 0.475점의 득점가치를 가지고 있고, 아웃을 당할 경우 -0.299 득점가치가 감소한다.  단타를 친 타자는 0.475점을 얻은 것이고 또 아웃카운트를 빼앗기지 않아서 한명의 동료 타자가 타격을 할 수 있는 기회를 더 주었기 때문에 여기에 다시 0.299점을 더한다. 


2) 위에서 계산한 값을 출루율OBP와 같은 스케일로 만들어주기 위해 1.15를 곱해준다.  


이름에서 보는 것처럼 wOBA weighted On-Base Average 는 출루율 On-Base Percentage 의 개량형 지표를 의도하고 있다.  계산된 값에 1.15를 곱해줄 경우, 리그의 평균OBP와 리그의 평균wOBA가 같아진다.  달리 표현한다면 리그의 평균OBP와 리그 평균 wOBA가 같아지는 값을 타격 이벤트별 가중치에 곱해준다는 것이다. 



가칭 KBO-metrics 는 KBO 기준으로 적용되는 세이버메트릭스 지표들의 조정과정입니다.

세이버매트릭스라는 말이 SABR-metrics 즉 Society of American Baseball Research 에서 유래했고 미국야구.라는 고유명사가 포함된 단어이다보니 아무래도 단어 자체의 부적합성이 거북한데다가, MLB의 경험적 통계적 결과를 통해 고안된 지표들을 가지고 있어 그중 어떤 것들은 리그환경이 다른 KBO에 적용했을 때 부적절한 왜곡의 소지가 있을 수 있습니다.

가칭  KBO-metrics란 KBO의 통계적 환경에 기반해서 조정되거나 혹은 re-design되는 야구통계의 연구결과를 말합니다.

이 글들은 제가 예전에 bizball Project 라는 팀과 같이 작업하면서 썼던 내용을 조금 정리한 것입니다.