본문 바로가기
diegobaseball
ANALYSIS

BABIP이 한국에 와서 "바빕신"이 되다.

by 토아일당 2015. 6. 12.



*** BABIP 시즌조정 계산실수가 있어서, 다시 계산하여 20150615 업데이트했습니다.  


2001년 보로스 맥크라켄이라는 이름없는 대학원생에 의해 발견된 이후, BABIP 만큼 야구통계 또는 세이버메트릭스에 큰 영향을 미친 것도 별로 없습니다.


BABIP은 Batting Average on Balls in Play 의 약자인데, 홈런, 볼넷, 삼진을 제외하고 배트에 맞아 인플레이존에 들어간 타구에 대한 타율입니다.  이 개념의 핵심은 "볼인플레이된 타구가 안타가 될지 아닐지는 투수의 책임이 아니다" 라는 것이었습니다.   


참고 - 보로스맥크라켄의 DIPS혁명http://baseball-in-play.com/151


그라운드를 지배하는 보이지 않는 손 "바빕신"


야구통계에서 뿐 아니라 복잡한 이론적 개념이 널리 알려지는 과정에서, 이해하기 쉽게 단순화되는 경향이 있는데 BABIP도 그렇습니다.  흔히 알려진 맥락은 다음과 같습니다.  


1.바빕은 투수책임이 아니며, 바빕은 투수의 능력과 상관없이 리그 평균에 수렵하게 된다. 

2.바빕이 나쁜(=높은) 투수는 실력이 모자란게 아니라 운이 나빴던 것이다.  바빕이 좋은 투수는 반대로 운이 좋았던 것이다.  그래서 이번시즌 바빕이 나쁜 투수는 다음시즌 성적이 좋아질 가능성이 높고 바빕이 좋았던 투수는 성적이 나빠질 가능성이 높다.

3. 타자에게도 바빕이 있는데 투수의 바빕이 그 능력과 상관없이 리그평균에 수렴하는 것과 달리 타자는 자기 고유의 바빕이 있다.


대부분의 “요점정리”가 그렇듯 아주 틀린 것은 아니지만 맞다고 하기도 어렵습니다.  물론 이 글이 새삼스럽게 BABIP에 대한 정확한 정의를 설명하려는 것은 아닙니다.  그저 실제 KBO 데이터를 통해서 개별 투수들의 BABIP을 좀더 입체적으로 현실적으로 "관찰"해보자 정도입니다.


관찰대상은 KBO 05_14 10년 동안의 모든 투수의 피BABIP 데이터입니다.  여러 시즌의 데이터를 동등하게 비교하기 위해 다음과 같은 방법으로 시즌조정을 합니다.  


연도별 조정BABIP(BABIP-) = 리그평균BABIP / 투수BABIP * 100

adj.BABIP_year = 10시즌 전체 리그평균BABIP * BABIP-

adj.BABIP_career = 각 시즌의 BABIP-을 시즌당 투구이닝에 맞춰 가중평균한 후, 평균 0.306 스케일로 조정


아래의 모든 BABIP 데이터는 위와 같은 방법으로 시즌보정된 결과입니다. 



지난 10년 동안의 투수들이 만난 "바빕신"의 흔적  


투수의 타자상대 타석이 늘어남에 따라 BABIP에 어떻게 움직이는지 관찰하기 위해 05_14 10년동안 10타석+ 투수들의 연도별 BABIP의 분포가 어떻게 나타나는지 확인해보겠습니다. (각 1시즌의 투수BABIP 입니다)



분석기간 10년동안 10타석 이상 던진 투수는 1735명입니다.  가로축은 TBF(투수의 타자상대 타석수)입니다.  가장 왼쪽이 10타석을 던진 투수들의 BABIP이고 가장 오른쪽이 대략 1000타석 정도 타자를 상대한 투수의 BABIP입니다.  하늘색 선은 리그평균 BABIP인 0.306 를 표시합니다.  


그림의 주황색 [선형추세선]은 살짝 우하향합니다.  이 기울기의 의미는 약간이긴 하지만 더 많은 타석을 던진 투수일수록 BABIP이 낮아진다는 뜻입니다.  (다만 이 선형회귀의 R^2는 별로 높지 않기 때문에 추세선을 따른다는 의미는 아니고, 오른쪽에 있는 BABIP값이 경향적으로 작다는 정도의 해석만 가능합니다)  


왼쪽에서 오른쪽으로 갈수록 BABIP은 평균을 중심으로 모여듭니다.   그러나 400타석 정도를 넘어가기 시작하면 더이상 위아래 폭이 확연하게 좁아지지는 않습니다.  즉, 한 시즌의 BABIP이 그리 쉽게 평균으로 수렴하는 것은 아니라는 의미가 됩니다. 


하늘색 평균선(avr.=0.306)으로부터 위 아래로 크게 벗어난 선수들이 종종 있습니다.  원인은 대체로 다음 3가지 중 어떤 것으로 볼 수 있습니다.  


1) 단순한 통계적 쏠림 - 상대타석 수가 작을 경우는 이쪽이 더 유력합니다.

2) 그 시즌 유독 불운했던 경우 = 빚맞은 타구가 유독 수비수를 피해서 날아간 경우

3) 그 팀의 수비가 특별히 나빴던 경우



그렇다면 투수의 통산 BABIP 은 평균에 수렴할까?


시즌 BABIP이 그렇다면 KBO 05_14 10년동안의 커리어 BABIP은 어떨까요?



10년 동안 10타석+ 타자를 상대한 모든 투수들 BABIP 분포입니다.  마찬가지로 오른쪽으로 갈수록 평균(0.306)를 중심으로 모여들긴 하지만 여전히 선수들마다 차이는 남아있습니다.  커리어 기준 700타석이나 800타석 정도를 넘어가면 이후 2500타석이 근처까지 비슷비슷한 범위 안에 개인차를 보이며 형성됩니다. 


이 경우에도 선형추세선은 기울기가 작긴 하지만 우하향합니다.  BABIP에 관한 초기 논쟁에서도 밝혀진 바 있는데, MLB 경력이 짧게 끝난 투수들의 BABIP은 MLB 평균에 비해 높은 편입니다.  메이저리그의 주전급 투수들을 분석대상으로 했을 때, 커리어 BABIP이 리그 평균에 수렴한다고 해도,  AAA+ 레벨의 투수들을 MLB 마운드에 세워놓으면 그들의 BABIP은 리그평균보다 나쁘게 나타날 것이라는 추측이 가능합니다.      


2500타석 근처부터 다시한번 수렴하는 것처럼 보이기는 하는데, 그 이유가 BABIP 의 특성 때문인지 아니면 커리어 10년동안 2500타석+ 투수들은 평균 이상의 수준급 투수이기 때문에 결과적으로 그렇게 된 것인지는 단정하기 어렵습니다.  또는 통계의 특성상 샘플사이즈가 커지면서 자연스럽게 평균에 가까워지는 경향 때문일 수도 있습니다. 어쨌든 3000타석이나 5000타석을 넘어가는 커리어BABIP 에서도 낮은 쪽으로는 0.295에서 높은 쪽으로는 0.315 정도의 폭은 여전히 남게 됩니다.  


1시즌 동안의 BABIP은 불운이나 팀수비력 차이로 생겨날 가능성이 더 크지만, 커리어 동안 1500타석이나 2000타석 이상 타자를 상대하며 쌓인 BABIP이 예외적으로 높거나 낮다면 --- 이런 경우는 투수의 능력이 어떤 경로를 거쳐 BABIP에 영향을 주고 있다는 추측을 해야 할 수도 있습니다.



아웃라이어 : 바빕신의 손아귀를 벗어난 자들 


TBF1000+ 범위에서 아웃라이어로 추정되는 투수는 높은 쪽에서는 0.357의 김광수나 0.345의 김영민이 있고 낮은 쪽에서는 0.258의 이재우가 있습니다.


오승환은 이중에서도 두드러지는데 그는 05_14 기간 1942명의 타자를 상대하며 BABIP 0.241 라는 비현실적인 기록을 만들었습니다.  물론 클로저의 등판시점은 야수들의 집중력이 가장 높아지고 적극적인 수비 시프트가 펼쳐지기 때문에 BABIP이 다소 낮아질 수 있다는 주장도 있긴 하지만 그렇다고 마무리투수들이 전부 이렇게 낮은 BABIP을 나타낼리는 없습니다.    

MLB에서 예외적으로 낮은 BABIP을 기록하며 아웃라이어로 공인된 선수가 양키즈 마무리였던 마리아노 리베라인데, 그의 통산 BABIP이 0.263 입니다.  그와 마찬가지로 160km/h 강속구의 트레버 호프만 역시 대표적인 BABIP 예외 투수인데 그의 BABIP 역시 리베라와 같은 0.263 입니다.  그런데 오승환은 그들과 비교해도 휠씬 더 낮은 BABIP을 기록했습니다. 


2000TBF+ 범위에서는 0.265의 정우람, 0.263의 정대현이 예외적으로 낮은 커리어 BABIP을 기록한 투수들이고, 0.345의 김영민, 0.324의 밴해켄이 있습니다.


정대현의 경우 제이미 모이어 같은 경우와 비교해 볼만 합니다.  보로스 맥크라켄에 의해 처음 DIPS이론이 만들어졌을 때부터, 팀웨이크필드 같은 너클볼러나 제이미모이어 같은 soft-tossing lefty는 꾸준하게 리그평균보다 낮은 BABIP 를 유지한다는 점이 인정되었는데, soft-tossing lefty는 맥락상 해석한다면 “좌완 흑마구 계열” 정도 됩니다.  정대현은 우완 언더핸드이긴 하지만 극적인 무브먼트를 가진 느린 공으로 타자를 상대한다는 면에서 너클볼러나 흑마구 계열의 투수와 궤를 같이 합니다.  


밴해켄의 케이스는 좋은 투수라도 BABIP 이 높을 수 있다는 예가 될 수 있겠습니다.  BABIP이 높고 (당연히) 피안타율도 높지만 좋은 성적을 기록하는 투수들의 특징은 1) 삼진을 많이 잡기 때문에 인플레이된 타구의 안타허용이 많다 해도 충분히 많은 아웃카운트를 잡아내거나  2) 피안타율은 높지만 장타억제능력이 탁월한 땅볼투수들인 경우가 많습니다.  


2500TBF+ 에서는 심수창 0.328, 김선우 0.321, 배양수 0.321은 꽤 많은 통산 데이터가 쌓였음에도 불구하고 여전히 평균보다 상당히 높은 수준의 BABIP을 보입니다.  구속이 빠르지 않은 우완오버핸드 타잎 투수들의 BABIP에서 다소 높은 것은 종종 관찰되는 현상이기도 합니다.       


니퍼트 0.281, 손민한 0.293, 장원삼 0.292 는 반대로 커리어 BABIP이 리그평균보다 확연하게 낮은 투수들입니다.



톰탱고 TomTango가 틀렸다.  


다른 모든 야구 관련 메트릭스가 그렇듯이, BABIP 역시 이 지표 한가지를 가지고 투수의 능력과 특성을 설명하려 하는 것은 현명한 일이 아닙니다.  게다가 BABIP은 흔히 잘못 이해되는 것과 달리 “운”에 의해 크게 좌우되는 통계값도 아닙니다.    


BABIP에 가장 큰 영향을 미치는 것은 [운] 보다 [팀의 수비력]입니다.  


2006년 에릭앨런, 어빈휴, 톰탱고는 회귀분석을 통해 BABIP의 결정요인을 계산해서 Baseball Between the Numbers 를 통해 발표했습니다.  그에 따르면 운 44% 투수 28% 수비 17%  구장 11% 라 했습니다.  BABIP은 “운빨”이라는 인식이 이로부터 많이 왔을 것입니다.     


톰탱고와 그의 동료들이 했던 계산에서는 (정확한 회귀모형은 확인해본 것은 아니지만) 아마도 [투수] [수비] [구장]으로 설명되지 않는 나머지의 randomness 를 “운”으로 간주했을 것입니다.  따라서 “운이 44%”라는 당시의 분석결과는 [타자의 능력]이라는 BABIP의 또다른 결정요인을 포함시키지 않았기 때문에 생긴 오차로 보입니다.


BABIP의 결정요인에 대한 가장 최근의 믿을만한 분석은 베이스볼프로스펙터스의 러셀칼튼이 2013년에 한 것인데 그 결과는 다음과 같습니다.


Batted Ball Type

Batter

Pitcher

Defense

League Mean

Ground Ball

47%

29%

13%

11%

Fly Ball/Pop Up

39%

26%

21%

13%

Line Drive

46%

28%

13%

13%

BABIP, 타구의 과학 - http://baseball-in-play.com/152



BABIP을 지배하는 것은 "운"이 아니다. 


위 데이터에는 파크팩터가 빠져있는데, 이미 파트팩터조정을 한 이후의 데이터를 사용했기 때문입니다.  리그평균(mean)이 “운”에 해당하는 부분인데, 그라운드볼, 플라이볼, 라인드라이브 세가지 경우 전부 "수비"보다 비중이 작습니다.  2006년 톰탱고 등에 의한 분석에서는 타자를 고려하지 않았기 때문에 "운"으로 인식된 randomness 중 상당부분이 "타자의 능력"으로 설명되면서 달라진 결과입니다.   


그리고 2006년 에릭앨런, 톰탱고, 어빈휴가 했던 분석에 비해 투수의 비중이 휠씬 큽니다.  타자의 영향을 제외한 투수,수비,행운 중 투수의 능력이 미치는 영향은 행운에 비해 2배에서 3배 정도 큽니다.  요컨데 BABIP에 대한 영향은 투수>>수비>행운 순서입니다. 


KBO 05_14 10년 기간의 아웃라이어들, 즉 BABIP이 예외적으로 높은 투수들은 경우는 --- 대체로 소속팀 수비력이 매우 약한 편에 들어갑니다.  반대로 BABIP이 낮은 경우 대체로 리그 최고의 수비수들을 등 뒤에 두고 던진 투수이 많았습니다.  물론 아닌 경우도 있습니다.  13송창현이나 13배영수가 그렇겠죠. 


BABIP에 대한 좀더 나은 이해는 다음과 같은 것들입니다.


1) (피안타율을 중시하는 전통적인 관점과 달리) 피안타율은 볼넷허용, 탈삼진에 비해 투수의 능력을 객관적으로 설명하지 못하는 경향이 있으며, 이것이야말로 BABIP의 가장 중요한 의미이다.  


2) BABIP에 대해서 "투수의 능력"은 행운과 불운보다 2배-3배 정도 더 많은 영향을 미친다. 


3) 투수가 통제하지 못하는 부분에 대해 "수비력"이 "운(luck)"보다 더 큰 영향을 미친다. 


4) 커리어가 쌓일수록 대부분의 투수들의 BABIP이 리그평균에 수렴하는 경향이 있는 것은 사실이지만 그럼에도 불구하고 (아웃라이어가 아닌 투수들 조차) 어느정도 차이는 여전히 남는다. 


5) BB,SO 가 득실점에 미치는 영향에 비해 "안타"가 미치는 영향은 휠씬 크다.  따라서 투수들 사이에 BB,SO관련 능력의 격차는 크고 BABIP 관련 능력의 격차는 작다고 해도 --- 종합적으로 피안타 억제능력이 투수에게 덜 중요하다고 단정짓기는 어렵다.    


가장 최근의 연구와 분석들을 참고한다면, BABIP의 높고 낮음을 가지고 그 투수의 다음시즌 반등가능성을 단정적으로 예측하는 것은 별로 타당한 접근은 아닙니다.  어떤 투수의 새삼스러운 부침 중 BABIP으로 설명할 수 있는 부분은 기대만큼 크지 못할 수도 있기 때문입니다.  게다가 BABIP의 중요 성분이 "운"이라는 것고 사실과는 좀 다릅니다.  


BABIP은 매우 혁신적이고 의미심장한 아이디어였고 BABIP을 통해서 투수의 성적과 능력을 해석하고 이해하는 시각은 분명히 유용합니다.  하지만 격렬한 논쟁과 냉정한 이후 분석이 뒤따랐던 지금 시점에서 보면 --- 그것의 가장 중요한 핵심은, 피안타율이나 ERA 같은 summary stats 이 아니라 BB%, SO%, HR%, GB/FB 같은 elementary stats 를 기초로 하는 것이 더 객관적이고 신뢰할만하다라는 발상전환이었다고 보는게 맞는 것 같습니다.