본문 바로가기
diegobaseball
세이버메트릭스 도서관

BABIP 관련 투수스탯의 이론과 계산방법 - BABIP SO BB HR FB% GD% LD% [세이버메트릭스 용어]

by 토아일당 2015. 2. 6.

2001년에 발표된 보로스 맥크라켄의 DIPS이론은 세이버메트릭스 투수평가 방법론에 혁명적인 영향을 줍니다.  이 글에서 소개할 피칭메트릭스들은 그 과정을 이해하는데 도움을 줄 수 있습니다.  DIPS혁명 이후의 세이버메트릭스가 투수의 다양한 피칭 메트릭스들을 어떻게 다루는지 이야기해보겠습니다. 



BABIP Batting Average on Ball-in-Play 인플레이타율 


타자의 방망이에 맞고 그라운드를 향한 공(batted ball in play)에 대한 타율이 BABIP입니다.  

BABIP은 보로스맥크라켄의 DIPS이론 이후에 자리를 잡은, 스탯이기보다는 개념에 더 가깝습니다.   홈런, 삼진, 볼넷, 못맞공을 제외하고 수비의 대상이 되는 타구에 대한 안타비율입니다.


BABIP = (H-HR) / (PA - BB - HBP - SO - HR) 


BABIP의 가장 중요한 의미는 투수가 BABIP을 통제할 수 없다는 것입니다.  이런 입장은 처음 등장했을 때 나름 개방적이고 급진적이라 자부하는 세이버메트리션들에게 조차 낯설고 당황스러운 것이었습니다.  왜냐하면 최고 수준의 투수나 평균 수준의 투수나 일단 타자가 공을 때려서 그라운드로 들어가면 그 타구가 안타가될 확율은 똑같다는 뜻이며, 전통적으로 강한 투수는 위력적인 공을 던지고 그래서 타구가 안타가 될 확율은 당연히 낮을 것이라는 믿음과 정면으로 배치되기 때문입니다.


하지만 이후 다양한 논쟁과 검토를 이런 주장을 사실로 받아들여졌습니다.   따라서 BABIP을 가지고 투수의 우열을 판단하는 것은 합리적이지 못합니다.  그런데 ERA에는 BABIP의 결과가 아주 많이 반영되어 있습니다. 

ERA를 보완하거나 대체하기 위한 FIP SIERA 같은 ComponentERA 계열의 피칭스탯이 만들어진 이유가 바로 이것 때문입니다.

다만 좀더 엄격하게 말한다면 투수가 BABIP에 관여하는 비중은 26%에서 29% 사이입니다.



다음의 피칭 메트릭스들 즉 SO BB HR FB GB 등에 대한 스탯은 그것을 어떻게 계산하느냐가 아니라 왜 계산하느냐가 휠씬 중요한 논점입니다.  

예를들어 SO9 은 투수의 탈삼진 숫자를 9이닝당으로 환산한 것에 불과합니다. 그저 초등학교 수학 수준의 계산일 뿐입니다.  그런데 왜 그것이 생각 이상으로 중요한 스탯인지는 좀 다른 문제입니다.  HR/FB 는 투수의 허용플라이볼 숫자로 피홈런수를 나눈 것입니다.  그냥 그 뿐입니다.  그런데 왜 그런 스탯을 사용하는지가 세이버메트릭스의 의미있는 발견을 엿보게 해줍니다. 


SO% BB% BB/SO


9이닝당삼진(SO/9)이나 9이닝당볼넷허용(BB/9) 같은 투수스탯이 중요하게 취급되기 시작한 것은 BABIP에 대한 검토가 된 이후부터 입니다.  만약 투수가 타자를 상대해서 얻는 결과 중 BABIP을 제외한다면 남는 것은 SO BB HBP HR 입니다.  그중에서 투수의 능력에 의해 더 크게 좌우되는 것이 바로 SO와 BB입니다.  보통 9이닝당 비율로 사용합니다.


 BB/9 = BB / IP * 9

 SO/9 = SO / IP * 9

 BB/SO = BB / SO


이로부터 파생된 스탯으로 BB/SO가 있습니다.  투수의 지배력을 나타낼 수 있는 지표라고 볼 수도 있습니다.    BB9 이나 SO9은 예를들어 강속구로 삼진을 많이 잡는 투수가 정교한 제구력으로 타자를 상대하는 투수나 어느 일방을 설명하기에는 적합하지만 구위(탈삼진 능력)와 제구(볼넷 억제능력) 를 종합적으로 표현하기 어렵습니다.  BB/SO 가 그런 역할을 합니다.  



HR9  HR/FB


HR/9 = 피홈런 * 이닝IP / 9

HR/FB = 피홈런 / 타구 중 플라이볼 빈도


투수스탯 중에서 승리투수, 평균자책점, 홀드, 세이브 같이 팀타선의 득점지원, 수비수의 도움, 구원투수의 도움 같은 것이 종합되어 나타난 결과를 측정하는 것을 summary stats이라 하고 그것에 바탕되는 개별 요인들 BB HBP SO HR 등을 elemental stats 이라고 구분할 수 있습니다.


DIPS이론이 자리를 잡고 그로인해 BABIP에 대한 해명이 진행됨에 따라 투수의 객관적 능력을 평가하는데 있어서 elemetal stats에 대한 중요성이 매우 높아졌습니다.  elemental stats 중에서도 어떤 것들은 투수의 능력 이외의 요인들에 좀더 영향을 받고 또 어떤 것들은 투수 개인의 능력에 의해 더 크게 좌우되는 것이 밝혀집니다.  


그런 이유로 FIP 는 BABIP을 배제한 나머지 4가지 요인 SO BB HBP HR 만을 사용해서 계산합니다. 그런데 이 4가지 요인은 나름나름으로 성격이 다릅니다.  일단 HBP는 BB보다 우연성이 큽니다.  그래서 FIP 이후의 피칭스탯에서는 배제되는 경우가 많습니다.   담장 밖으로 날아가버렸기 때문에 수비의 영향은 받지 않지만 HR은 BB SO HBP와 달리 [타격의 결과]입니다.  구장의 영향을 받습니다.  게다가 가중치가 크기 때문에 평가지표에서 차지하는 비중도 큽니다.


해서 FIP 이후의 세이버메트릭스 피칭스탯들이 제각기의 방법으로 수정하고 개량한 부분이 HR을 다루는 방법이었습니다.  그 과정에서 아주 중요하게 사용되는 것이 플라이볼에 대한 홈런비율 즉 HR/FB 입니다.  HR/FB는 MLB수준의 투수 사이에는 거의 차이가 없습니다. (BABIP이 그런것 처럼 말이죠) 그런 이유로 xFIP에서는 해당 투수의 실제 피홈런 숫자가 아니라, 그 투수의 (허용플라이볼 * 리그평균HR/FB비율) 로 대체해서 FIP 수치를 계산합니다.     . 


스탯 자체는 별것도 아닌 사소한 것처럼 보이지만, 중요한 것은 계산방법 같은것이 아니라 이런 것이 중요하게 여겨진 배경과 맥락입니다.  


FB% GD% LD%


FB% =  플라이볼횟수FB / (PA-BB-HBP-HR)

GB% =  땅볼횟수GB / (PA-BB-HBP-HR)

LD% =  라인드라이브횟수LD / (PA-BB-HBP-HR)


FB% GD% LD% 는 BABIP에 대한 분석이 더 정교해지면서 중요성이 높아진 elemental stats 입니다. 

FIP 같은 DIPS기반 피칭스탯이 “BABIP은 전혀 투수의 영향을 받지 않는다” 라는 전제로 디자인되었으나 엄격하게 보면 투수는 26-28% 정도이 영향력을 가지고 있기 때문에 이로인한 부정확함이 생겨납니다.


BABIP에 대한 가장 최근의 분석결과에 따르면 투수가 BABIP에 미치는 영향 즉 투수가 BABIP을 통제할 수 있는 요인 중 가장 중요한 것은 FB% GB% LD% 라는 것입니다.  그리고 이중 LD% 는 투수의 능력 보다는 운에 많이 좌우됩니다.  반면 FB% 와 GB%는 통계적으로 투수의 고유한 능력에 의해 상대적으로 결정됩니다.  


예를들어 GB%가 높은 투수는 BABIP이 좀더 높은 경향이 있으나 대신 홈런이나 장타허용이 적습니다.  반대로 FB% 가 높은 투수는 홈런을 더 많이 허용합니다.  대체로 구장효과를 배제할 경우, MLB 수준의 투수들의 경우 허용FB당 홈런HR의 비율 HR/FB는 거의 차이가 없습니다.  


앞에서 DIPS이론에 입각해서 BABIP은 투수들 사이에 차이가 별로 없다고 했는데, 그렇다고 해도 남아있는 투수간의 BABIP 차이는 FB% GB% 에 의해 생겨납니다.  그리고 피홈런HR9 의 차이는 투수들 간의 HR/FB의 차이가 거의 없기 때문에 FB%에 의해 생겨나는 것입니다.  이런 통계적 분석결과에 기반해서 고안된 스탯들이 xFIP 같은 것입니다.