오랬동안 세이버메트릭스는, "배트에 맞고 인플레이된 타구의 결과(BABIP)"는 투수의 책임이 아니라는 이론을 지지해왔습니다. 그것은 운과 수비력에 의해 결정된다고 보기 때문입니다. 좀더 엄격한 통계적 분석을 통해 그 안에 포함된 투수의 영향을 주목하는 입장도 있긴 하지만 BABIP은 투수와 무관하다는 이론에 근거해서 만들어진 FIP 같은 지표는 ERA보다 휠신 더 신뢰할 만한 것으로 평가받습니다.
같은 맥락에서, TTOs(Three True Outcomes)라는 표현 그대로, 삼진, 볼넷, 홈런 이 세가지 스탯만 투수에게 중요하고 "진짜"이기 때문에 --- 투수와 타자의 대결에서 만들어지는 타구(batted ball in play)는 관심 밖으로 밀려나게 되었습니다. 혹시 누군가가 "어떤 투수는 빚맞은 [타구]를 유도해냐는 능력을 가지고 있다"라고 말하면 그것은 무지의 소산이며 오래된 편견의 부작용 쯤으로 취급해줘야 "야구 좀 아는 사람"의 미덕이라 여기는 이들도 생겨났습니다.
참고 - BABIP이 한국에 와서 “바빕신”이 되다 http://baseball-in-play.com/203
볼티모어 오리올즈의 선발투수 첸웨인은 85년생으로 올해 만 서른살이 되고 대만출신이며 일본NPB에서 프로선수 생활을 시작했습니다. 2012년 FA자격으로 3년 총액 1200만달러에 볼티모어와 계약을 했는데 같은 NPB 출신의 다르빗슈 유에 묻혀서 크게 기대받았던 이적은 아니었습니다.
하지만 첫해부터 꾸준히 선발로테이션을 지키며 팀의 에이스 역할을 하고 있습니다. (12년 192.2이닝 ERA4.02, 13년 137이닝 ERA 4.07, 14년 185.2이닝 ERA 3.54) 그럼에도 불구하고 첸웨인은 별로 좋은 평가를 받지 못하는 투수입니다. 이런 식입니다.
"수비 무관 평균 자책점인 FIP는 4.02의 ERA와 달리 85명 중 67위인 4.42를 기록, 홈런/플라이볼 비율을 조정한 xFIP는 4.34로 85명 중 71위를 기록했다. 한마디로 운이 좋은 시즌이었다는 이야기인데, 리그 평균보다 낮은 .275의 BABIP 을 보면 수비진이 천의 안타를 줄여주는 데 큰 역할을 했다는 걸 말해준다." - 나무위키 2015년 6월1일 버전
올시즌에는 지금까지(6월28일 현재) 선발 14경기에 나와 87이닝을 던졌고 3승4패 ERA 2.90을 기록하고 있습니다. 그런데 FIP는 그보다 휠씬 나쁜 4.13입니다. BABIP 도 0.274로 리그평균보다 휠씬 낮고 LOB% 역시 82.6% 로 높습니다. 시즌 전 스탯예측시스템인 ZiPS의 예상치가 ERA 4.19 였는데 현재의 FIP와 대략 비슷합니다.
천웨인은 그저 운이 좋은 투수일까?
이런 스탯을 보이는 선수에게 (어떤) 세이버메트릭스 식의 평가는 공식처럼 일정합니다. BABIP이 리그평균보다 낮고 LOB%는 리그평균보다 높기 때문에, 그는 운이 좋았던 것이고 성적은 더 나빠질 것이다. 하지만 정말 그렇게 될까요?
만약 BABIP에 대한 고전적인 혹은 도식적인 이해처럼, "방망이에 맞고 인플레이된 타구가 안타가 될지 아닐지는 투수가 통제할 수 있는 범위가 아니다" 라면 그의 성적은 실제로 나빠질 가능성이 높습니다. 하지만 정말 그렇게 될까요?
통계는 오랬동안 세이버메트리션의 가장 중요한 무기였습니다. 야구는 거의 무한하게 다양한 상황의 연쇄로 이루어져 있어서 “야구몰라요”라는 명언도 낳았지만, 반면에 다른 스포츠 경기와 비교했을 때 엄청난 양의 수치화된 데이터를 산출해내는 경기이기도 합니다. 해서 많은 숫자들 뒤에 숨겨진 본질을 찾아내는 통계적 기술을 써먹기에 적당한 대상입니다. (물론 단순한 통계기술이 아니라 탁월한 통찰이 함께 필요하지만) 세이버메트릭스는 실제로 그런 일을 아주 잘 해냈고 야구의 많은 것을 바꾸어놓았습니다. 하지만 세상의 모든 “과학적 도구”들이 그렇듯이 통계 역시 한계를 가질 수 밖에 없습니다.
PitchFX에 이어 STATCAST의 등장
지나간 몇 십년 동안, 통계라는 수단은 야구의 본질을 객관적이고 정확하게 이해하기 위해 선택할 수 있는 최선이고 또 유일한 것이었지만 세상은 또 변합니다. 새로운 수단들, 예를들면 고성능의 광학카메라나 3D레이더 기술에 기반한 Pitch FX, 스탯캐스트 같은 것들입니다. 이런 것들이 한때 통계의 오차범위라는 어둠 속에 묻혀 있던 것들에 빛을 비추기 시작했습니다.
2015년부터 MLBAM 에서 제공하는 STATCAST 화면
지난 5월 말 FiveThirtyEightSport 에 흥미있는 아티클이 하나 실렸는데, MLB의 스탯캐스트 데이터를 근거로, 투수가 던진 공의 속도가 아니라, 타자가 때린 공의 타구속도를 측정한 결과를 소개하고 있습니다. (A Baseball’s Exit Velocity Is Five Parts Hitter, One Part Pitcher http://fivethirtyeight.com/features/a-baseballs-exit-velocity-is-five-parts-hitter-one-part-pitcher/)
이에 따르면 최상위 투수들은 리그평균보다 타구의 속도를 1.5mph 정도 더 억제합니다. Rob Arthur의 분석에 따르면 타구속도가 1.5mph 더 느려지면 BABIP은 13% 포인트 낮아지고 이는 한 경기당 0.25점 정도의 실점억제 효과를 가져옵니다. 0.25점은 그렇게 작은 차이가 아닙니다. ERA 3.75 투수와 ERA 4.00 투수의 차이이고 한 시즌 전체로 WAR 1.0 정도에 해당됩니다.
더 느린 타구는 더 나쁜 타격결과를 가져온다.
BABIP이 리그평균보다 낮다는 이유로 “운이 좋았기 때문에 과대평가된 투수"로 취급될 첸웨인은 MLB의 투수들 중 타구속도 억제가 가장 뛰어난 투수입니다. (아래표 출처 - A Baseball’s Exit Velocity Is Five Parts Hitter, One Part Pitcher)
물론 타구속도억제의 순위가 전통적인(?) FIP 순위와 아주 불일치하는 것은 아닙니다. 상위권에 있는 투수들은 대체로 팀의 에이스급이며 타구속도억제 뿐 아니라 탈삼진, 볼넷억제, 피홈런억제 역시 수준급인 투수들입니다. 첸웨인도 그런 의미에서 좋은 투수입니다. 하지만 클레이튼 커쇼 만큼 좋은 투수라고 생각할 사람은 아무도 없습니다.
현재까지의 시즌 ERA는 첸웨인 2.90 > 커쇼 3.20 입니다. 그럼에도 불구하고 (이전의 커리어를 배제한다고 해도) 많은 사람들은 커쇼가 천웨인보다 휠씬 더 좋은 투수라고 믿습니다. FIP에서 천웨인 4.19 << 커쇼 2.61 이기 때문입니다.
ERA와 FIP의 차이는 대체로 BABIP에서 옵니다. 천웨인의 BABIP은 0.274이고 커쇼는 0.304 입니다. “세이버메트릭스 가라사대 BABIP은 운이다”라고 믿는다면 천웨인은 커쇼보다 못한 투수이며 우주의 기운이 결국 그를 떠날 때 성적 역시 역전될 거라 믿을 것입니다.
어떤 투수는 타구의 속도를 억제할 수 있다
하지만 그렇지 않다면? 클레이튼 커쇼 역시 타구속도억제에 대해서 상위권에 있는 투수입니다. 그는 리그평균에 비해 타구속도를 -1.00mph 억제했습니다. 하지만 천웨인은 -1.63mph 만큼을 억제하며 리그 1위에 올랐습니다.
이런 데이터는 천웨인과 커쇼 사이에 단순히 운과 수비력 말고 다른 종류의 차이, 투수가 책임질 수 있고 투수가 영향을 미칠 수 있는 “빚맞은 타구를 만드는” 고유의 능력이 있을 수도 있다는 것을 말합니다.
물론 그렇다고 투수의 타구속도억제능력을 너무 과대평가할 일은 아닙니다. 타구속도의 차이를 만들어내는 데에는 투수보다 타자의 능력이 휠씬 더 많은 부분을 차지합니다. 투수에 의해 좌우되는 타구속도가 플러스마이너스 1.5mph 정도라고 할때 타자에 의해 좌우되는 것은 7-8mph 정도로 5배 쯤 큽니다. 그리고 투수의 능력을 더 잘설명해주는 스탯이 여전히 삼진,볼넷,홈런이라는 이론이 기각된 것도 아닙니다.
데이터를 소개하고 분석한 Rob Arthur는 첸웨인의 타구속도억제능력이 볼끝이 좋은 무브먼트라거나 공을 숨겨 나오는 딜리버리의 디셉션으로부터 왔다고 말하지는 않습니다. 첸웨인이 대체로 해설가들로부터 그런 유형의 투수로 평가받고 있음에도 말입니다.
그는 "타구속도억제"의 결과가 “볼카운트 싸움”으로부터 온 것이라고 추정합니다. 그런 면에서 그의 분석은 역시 세이버메트리션의 것이라 할만 합니다. 무브먼트나 디셉션 같은 요인과 달리, 타자를 몰아넣는 볼카운트는 “측정가능한 객관적인 데이터”이기 때문입니다.
어떤 리그의 통계에서든, 2스트라이크 이후의 BABIP은 전체평균 BABIP에 비해 좀더 낮고 타격해서 인플레이된 타구의 장타율은 그보다 더 크게 차이가 납니다. (KBO의 경우도 마찬가지입니다.)
출처 - 초구승부와 타자 노림수 효과 - http://baseball-in-play.com/186
다만, 첸웨인을 포함한 어떤 투수들이 다른 투수들보다 타구의 속도를 좀더 잘 억제하는 "유일한 수단"이 볼카운트 싸움이라고 단정하기는 어렵습니다. 아직은 그것을 타당한 가능성 중 하나로 보는 것이 적당합니다.
10년 전이라면 "타격결과의 통계"를 이용해서 간접적으로 추정할 수 밖에 없던 것이, 이제는 PitchFX나 스탯캐스트라고 하는 새로운 측정기술을 통해 "타구의 속도"라는 물리적 실체에 직접 다가설 수 있게 된 것처럼 --- 더 새로운 측정기술이 적용된다면 "볼카운트 싸움" 이외의 더 많은 것을 밝혀낼 수 있겠죠. 그것은 어쩌면 지금의 막연한 추측처럼, 공의 무브먼트나 딜리버리의 디셉션일 수도 있고 또는 생각하지 못했던 전혀 새로운 것일 수도 있습니다.
스탯캐스트에 근거해서 Rob Arthur가 관찰하고 분석한 것이 BABIP에 대한 아주 새로운 견해는 아닙니다. 이전의 통계적 방법을 통해서도 BABIP이 전적으로 투수의 능력과 무관하지 않다는 의견은 충분한 근거를 가지고 제기되어 오기도 했습니다. 대신 스탯캐스트의 데이터는 그것을 좀더 직접적으로 명백하게 알려줄 수 있습니다. 이전의 통계적 수단이 타격결과를 통해 타구과 투수이 관계를 추정한다면, 새로운 기술은 타구를 직접 관찰할 수 있기 때문입니다.
기대와 아쉬움
PitchFX 나 스탯캐스트의 데이터 역시 통계라는 방법론을 통하지 않고서는 그 의미가 제대로 드러나지 않기 때문에, 고속카메라나 레이더가 R이나 스프레드시트를 대체하는 새로운 세이버메트릭스의 무기가 된다고 하면 그건 좀 이상한 표현입니다. 스탯캐스트는 통계를 대신할 도구라기 보다는 통계가 사용할 수 있는, 새롭고 방대하며 의미있고 흥미진진한 데이터를 제공해줄 측정도구일 뿐입니다.
또 Pitch FX가 처음 등장했을 때의 열광적인 기대와 달리 그것에 기반한 야구통계의 발전 역시 생각한큼 빠르고 광범위하지 못했던 것을 보면 요즘 가장 핫한 스탯캐스트 역시 어느 정도의 변화를 가져올지 좀더 두고 볼 일입니다.
다만 이전의 이론은 항상 새로운 것으로 대체될 수 있으며, 그래서 한때 최선의 엄격함과 최고의 정교함으로 구축된 것이라도 늘 비판적으로 고려되어되어야 한다는 것을 깨닫게 합니다. 그리고 새로운 데이터 수집기술로 인해 이런 논의들이 아주 흥미진진하게 되어 갈 것이이라는 기대도 해볼만 합니다.
아쉬운 것은 KBO리그에 관심을 가지는 입장에서는 다시한번 가슴아픈 정보격차가 생겨나게 되었다는 것이네요. 이제 겨우 advaced한 KBO리그 기반 스탯사이트들이 생기고 PBP 데이터에 접근할 가능성이 생기기 시작했는데 그들은 어느새 Pitch FX 도 넘어 스탯캐스트로 가고 있습니다.
'ANALYSIS' 카테고리의 다른 글
"최적 타순"에 관한 통계적 기준 - 라인업 놀이를 위한 세이버메트릭스 가이드 (5) | 2015.07.15 |
---|---|
"메가트윈스포" 방전현상은 정말 있을까? - 다득점 경기 후유증에 대한 통계 (1) | 2015.07.13 |
[승패]를 결정하는 4가지 요인: 타격,투수,수비,상황 - WFA(Win-Factor Analysis) (8) | 2015.06.22 |
BABIP이 한국에 와서 "바빕신"이 되다. (12) | 2015.06.12 |
1번타자의 역설 - 더 자주 등장하지만 덜 효율적인 (10) | 2015.05.26 |