티스토리 뷰

BABIP, 타구의 과학: 

현대적 세이버메트릭스 피칭이론 정립 



거칠고 헛점투성이였지만 투수의 실점으로부터 수비 혹은 행운 같은 다른 요인을 구분해낼 수 있는 방법론을 처음으로 찾아낸 2001년 보로스맥크라켄의 DIPS이론으로부터 세이버메트릭스의 새로운 진전이 본격적으로 시작됩니다.


첫번째 논점은 홈런, 볼넷, 삼진을 제외하고 방망이에 공이 맞아 그라운드로 날아간 [In Play된 공의 안타비율BABIP]은 정말로 맥크라켄의 주장처럼, 투수의 통제 바깥에 있는가 하는 점이었습니다.  덧붙인다면 맥크라켄이 예시처럼 당대 최고의 투수였던 페드로 마르티네즈, 랜디존슨, 그렉 매덕스 등이 리그 평균보다 BABIP에서 뛰어나지 못한가 하는 점이기도 합니다.


* 맥크라켄은 BABIP이라는 표현대신 IPAvg.(In Play Average)라는 표현을 사용했습니다.  BABIP이라는 표현이 더 일반적이기 때문에 이글에서는 BABIP으로 통일합니다.


톰 티펫은 2003년 7월 맥크라켄과 같은 방식으로 그러나 더 많은 샘플데이터와 더 정교한 보정을 거쳐 이에 대한 통계적 반론을 발표합니다.   맥크라켄이 MLB98_99 단 2시즌의 데이터 만을 사용한 것에 비해 톰티켓은 1913년부터 2002년까지의 방대한 데이터를 분석합니다.  그리고 그 투수들의 BABIP을 시즌 리그평균BABIP을 baseline으로 조정(adjust)했고 또 투수가 상대한 팀의 평균BABIP으로 다시 조정했습니다.



보로스맥크라켄의 실수? 

"페트로와 매덕스는 그럼에도 불구하고 피안타를 통제했던 투수였다"


맥크라켄의 헛점을 여러 곳에서 발견되었습니다.  그가 리드평균과 BABIP에서 차이가 없었다고 말했던 페드론마르티네즈, 그렉매덕스, 제이미모이어 등의 커리어 전체 BABIP을 보니 좀 달랐던 것입니다. (아래 3개의 차트는 톰 티펫의 글에서 인용합니다)



페드로는 커리어 대부분의 기간 동안 리그평균보다 상당히 낮은 BABIP을 보여줍니다.  맥크라켄이 예시한 1999년이 오히려 예외라고 보는게 맞습니다.  



그렉 매덕스 역시 그렇습니다.  99년이 예외일 뿐 거의 루키시절을 제외한다면 대부분 리그평균보다 BABIP이 낮습니다.  



제이미 모이어도 마찬가지입니다.  커리어 전반부는 물론 평균이하의 BABIP 투수였습니다.  그러나 그가 본격적으로 MLB급 수준의 투수가 된 1993년을 기점으로 BABIP은 결정적으로 하락하며 커리어 나머지 내내 리그평균 아래서 움직입니다. 

BABIP의 이론을 암기과목 외우듯이 받아들여, BABIP이 평균적인 수준보다 낮았기 때문에 다음시즌에는 성적이 나빠질 것이라고 단정짓는 사람들이 제이미 모이어는 그저 10년동안 꾸준이 운이 좋았기 때문이라 주장할지는 몰라도 그보다는 그가 93년을 전후해서 BABIP을 낮출 수 있는 어떤 피칭스킬을 손에 넣었다고 보는 쪽이 더 데이터에 어울리는 추측입니다.  


톰티펫은 그밖에도 분석기간 중 MLB에 발을 들여놓긴 했지만 살아남지 못했던 AAA급 투수들과 오랬동안 커리어를 유지한 투수들을 비교할 경우 후자가 전자보다 낮은 BABIP을 가지고 있다는 결론도 얻었습니다.


물론 이런 모든 것에도 불구하고, 투수들의 BABIP의 차이는 흔히 생각하는 것만큼 그렇게 크지 않은 것은 맞습니다.  다만 맥크라켄이 주장한 것보다는 적어도 더 많은 것을 투수가 관여하고 있을 수 있다는 것입니다.  그렇다면 이제 두번째 논점으로 넘어갑니다.  투수가 BABIP에 관여를 한다면 어느정도 비중이며 어떤 형태를 통해서 그렇게 하는가 입니다.


투수의 BABIP에 영향을 미치는 것은 그렇다면 무엇인가?


여기에 대한 가장 영향력있는 분석은 2004년 2월 미첼 리히트만 Michel Lichtman의 What does play-by-play data tell us about DIPS?  이입니다.  (그는 나중에 톰 탱고의 TheBook 2006 에 참여한 공동저자 중 한명입니다)   

그리고 이 즈음이 본격적인 BABIP 이론의 시작입니다.  왜냐하면 투수가 BABIP에 미치는 영향이 얼만큼이냐 라는 논점에서, 과연 무엇이 어떤 방식으로 BABIP에 영향을 미치는가에 대한 접근방법론을 제시했기 때문에고 또 그것으로터 이후의 BABIP 관련 연구가 진행되었기 때문입니다.


아이디어의 핵심은 방망이에 맞은 공 즉 타구를 내야라인드라이브, 외야라인드라이브, 내야팝플라이, 외야팝플라이, 외야뜬공, 땅볼 이렇게 6개 타잎으로 구분하는 것입니다.  그리고 Ball in Play 에서 그 각각이 차지하는 비중과 그 각각의 경우 안타가 되는 비율을 계산했습니다.  결과는 다음과 같습니다.


Type of BIP

Percentage of BIP

Hit percentage

Line Drive IF

0.063

0.593

Line Drive OF

0.143

0.812

Pop Fly IF

0.056

0.038

Pop Fly OF

0.016

0.269

Fly ball OF

0.248

0.135

Ground Ball

0.475

0.228


보는 것처럼 라인드라이브 타구의 안타비율이 확연히 높습니다.  특히 외야라인드라이브 타구의 안타비율은 0.812에 달합니다.  반면 내야뜬공은 0.038에 불과합니다.  외야뜬공과 땅볼은 그럭저럭 비슷하게 0.269와 0.228인데 외야뜬공의 안타비율이 조금 높습니다.


새로운 논점의 발견 : 타격의 결과가 아니라 타구의 종류


그렇다면 어떤 투수가 라인드라이브 타구를 더 자주 허용한다면 그것은 그의 BABIP을 높이는 요인이 될 것입니다.  또 어떤 투수가 타자로 하여금 내야뜬공을 치도록 만다는 능력이 있다면 그는 BABIP을 낮게 유지할 수 있을 것입니다.  만약 각 투수들의 BIP 타잎별 허용비율을 구한다면 어떤 투수가 BABIP에 대해 더 강한 억제력을 가진 투수인지 확인할 수 있지 않을까요?


그런데 여기 아주 중요한 논점이 있습니다.  라인드라이브든지 뜬공이든지 타구가 특정한 BIP 타잎이 되는 것이 투수의 능력일 수 있을까요?  아니면 그건 행운의 문제일까요?  이에 대한 확인이 선행되지 않으면 방금 생각해 본 투수 타구별 허용비율 같은 것으로 투수를 평가하려는 시도는 기껏 만들어진 DIPS혁명이 무색하게 그 이전의 시대로 퇴보하는 것이 됩니다. 


미첼리히트만은 당연히 이 부분을 짚고 넘어갑니다.  투수들의 BIP 타잎별 허용비율을 year by year 상관도를 테스트했습니다.  결과는 다음과 같습니다.


Type of BIP

"r" for Percentage of BIP

"r" for Hit percentage

Line Drive IF

0.053

0.073

Line Drive OF

0.277

0.39

Pop Fly IF

0.459

0.128

Pop Fly OF

0.259

0.054

Fly ball OF

0.652

0.229

Ground Ball

0.777

0.15

All Line Drives

0.362

0.336

All BIP

N/A

0.165


땅볼과 외야뜬공에 대한 corr.은 꽤 높게 나타났습니다.  이정도면 땅볼과 외야뜬공을 이끌어내는 것은 대략 투수의 능력과 관련되어 있다고 볼만합니다.  그만큼은 아니지만 내야뜬공도 다른 것들보다는 약간 높습니다.  대신 내야라인드라이브는 극단적으로 낮은 상관관계를 보이며 외야라인드라이브 역시 <0.3 입니다.  



"땅볼은 타율을, 플라이볼은 장타율을 지배한다"


이후의 더 많은 분석을 참고하여 Fangraphs.com(2014) 이 말하는 타구 타잎별 BABIP과 순장타율ISO, wOBA는 다음과 같습니다.


Type

AVG

ISO

wOBA

GB

0.239

0.020

0.220

LD

0.685

0.190

0.684

FB

0.207

0.378

0.335


땅볼이 뜬공에 비해 BABIP이 더 높긴 하지만 대신 순장타율과 wOBA는 뜬공 쪽이 휠씬 높습니다.  당연히 땅볼이 홈런이 되거나 2루타가 되기는 어렵겠죠.  


* 땅볼과 뜬공에 대한 BABIP의 통계에서 가장 흔한 오해가 있습니다.  그것은 뜬공은 장타 허용 위험이 있긴 하지만 그래도 땅볼에 비해 안타가 되는 비율을 낮다고 생각하는 것입니다.  음?  위의 표가 그런 오해를 만드는 이유인데 그것은 착시입니다.  BABIP은 개념상 홈런을 제외한 통계입니다.  그러나 홈런도 안타입니다.  만약 BABIP에 홈런 허용 타석을 포함시킬 경우 뜬공에 대한 안타비율이나 땅볼에 대한 안타비율은 거의 비슷해집니다.  


톰티펫과 미첼리히트만을 포함해서 BABIP에 대한 검토에 참여한 세이버메트리션들에 의해 그밖에 몇가지 더 중요한 사실이 확인됩니다.


[파크팩터]의 존재였습니다.  그들이 다양한 시대, 다양한 투수들을 검토하는 과정에서 팀을 옮긴 시즌의 투수들의 경우 BABIP이 아주 큰 폭으로 변화하는 것이 관찰되었습니다.    특히 외야로 날아간 타구들에 대한 year by year corr. 이 아주 큰 차이를 보입니다.     

팀의 수비력 역시 크게 영향을 미칩니다.  이전 시즌과 비교해서 수비를 담당할 팀동료들이 바뀐 투수들의 경우 yby corr. 에서 좀더 차이를 보입니다. 


그리하여, BABIP을 지배하는 요인들이 하나씩 밝혀지기 시작합니다. 

첫째, 그동안 믿어왔던 것보다는 약하지만 투수도 어느정도 BABIP에 영향을 미친다.

둘째, (당연하겠지만) 팀의 수비력이 영향을 미친다.

셋째, 투수가 사용하는 구장이 영향을 미친다. 


그렇다면 이제 남은 것은 한가지입니다.  영향을 미친다면 얼마나 인가?


에릭앨런Erik Allen, 어빈휴Arvin Hsu, 톰탱고TomTango가 회귀분석을 통해 구한 BABIP의 결정요인은 다음과 같습니다. 


factor

percent

Luck

44

Pitcher

28

Fielding

17

Park

11

- Baseball Between the Numbers: Why Everything You Know about the Game is Wrong, 2006

 

BABIP에 대한 분석은 여기서도 좀더 나아갑니다.  사실 BABIP은 투수의 실점으로부터 투수 책임 이외의 것을 구분해내기 위한 DIPS에서 출발했지만 그것이 BABIP에 이르게 되면 다른 지표들이 그런 것처럼 타자에 대한 것도 됩니다.  만약 투수가 BABIP의 28%를 통제하고 나머지가 행운과 수비력, 그리고 파크팩터라면 타자는 뭘하고 있는거죠?



그리하여, 타격의 결과를 지배하는 것은?


베이스볼프로스펙터스의 러셀 칼튼Russell Carleton의 2013년 4월의 Rethinking Randomness: Pitchers and Their BABIPs 이 그에 대한 가장 최근의 분석일거 같습니다.  


Batted Ball Type

Batter

Pitcher

Defense

League Mean

Ground Ball

47%

29%

13%

11%

Fly Ball/Pop Up

39%

26%

21%

13%

Line Drive

46%

28%

13%

13%


이 분석은 1993년부터 2012년 기간의 데이터를 사용했다고 합니다.  야구통계에 대한 환경은 DIPS혁명이 시작된 2001년과 많이 달라져있습니다.  더 많은 기록이 더 과학적 방법으로 축적되었습니다.  러셀칼튼은 더 정교한 수비관련 데이터를 사용할 수 있었습니다.  

예를들면 타구가 2루타나 뜬공아웃이 되었는지 여부가 아니라 그라운드의 어느위치에 떨어졌는지 기록된 그리드시스템grid system 기반의 데이터 같은 것입니다.  (MLB에서 가장 많이 사용하는 수비지표 UZR 같은 것이 이런 그리드시스템 기반의 데이터를 이용해서 계산됩니다)


League Mean은 대략 [행운]에 해당되는 항목입니다.  생각보다 작은 비중입니다.  DIPS의 발상이 투수가 통제할 수 없는 Ball in Play 상황이 수비의 영향도 있지만 둥근 배트로 둥근 공을 치는 야구의 우연성을 좀 강조하고 부각시켰다는 것에 비하면 더욱 그렇습니다.

예를들어 땅볼타구가 안타가 되는 비율에 대해 투수가 가진 영향력은 [운]에 비해 거의 3배 가까이 크고 [수비]에 비해서도 2배 이상 큽니다.  뜬공 안타에 대해서는 [운]의 영향에 비해 2배 큽니다.  [수비]에 대해서는 1.2배에서 2.2배 정도 큽니다.  


BABIP에 대한 중요한 또다른 논점은, 투수가 BB, SO, HR에 비해 BABIP에 대한 영향력이 적다고 해서, 그 투수의 BABIP이 덜중요한건 아니란는 것입니다.  왜냐하면 투수가 타자를 상대하는 전체 타석 중에서 BB, SO, HR 상황에 비해 Ball in Play 상황이 휠씬 자주 발생하기 때문입니다.  탈삼진 능력은 투수마다 차이가 크고, BABIP 억제능력은 투수마다 휠씬 차이가 적다고 해도, 득점억제능력에 대해  BABIP에 부여된 가중치는 휠씬 큰 셈입니다.  

이런 저런 오해로 인해, 많은 사람들이 BABIP의 발견을 야구의 불확실성에 대한 것으로 생각하는 경우가 많습니다.  하지만 이것은 사실이 아닙니다.  한바탕의 혼란스러운 소동을 거친 후, 세이버메트릭스는 진정한 야구의 과학에 좀더 가까와졌습니다.


DIPS혁명 이후 BABIP의 정체가 좀더 분명해지자 세이버매트릭스의 평가지표에 나타난 가장 큰 변화는 투수든 타자든 그들의 스탯을 요소스탯elemental stats 와 종합스탯summay stats 으로 구분하고 종합스탯이 아니라 요소스탯의 조합을 통해 선수의 평가지표를 설계하는 경향이 강하게 나타난 것입니다.


예를들어 투수의 elemental stats 은 BB%, SO%, HR%, FB%, GB% 같은 것들입니다.  xFIP 나 tRA, LIPS 같은 지표들은 이런 elemental stats 을 기반으로 디자인되었습니다.   여기에 대해서는 다른 글에서 정리해보겠습니다.




댓글
  • 프로필사진 야구고물상 BABIP 이론은 물리학으로 말하자면 양자역학과도 같은 역할을 한 거라는 느낌이 듭니다. 과학철학자들이 말하는 패러다임의 전환 같은, 그런 비스무리한 것 말이죠. 그리고 거기에서 나온 많은 스탯들과 툴들, 그리고 파생되는 이론들은 분명 많은 야구팬들을 즐겁게 해 주고 있고, 앞으로도 즐겁게 해 줄 것이라고 확신합니다.
    그리고 가끔 드는 생각이, 요새는 Pitch F/X를 통해 각 투수의 로케이션도 확인할 수 있으니까 로케이션에 대해 형성되는 타구의 종류를 연구해 보는 것도 재밌을 것 같다는 생각이 드는데 말입니다. ㅎㅎㅎ 누가 그런 연구 안 해 주나요?ㅎ
    2015.03.17 22:17 신고
  • 프로필사진 토아일당 재미있는 비유네요. 하긴 타격쪽에서는 톰탱고의 24 B/O states라는 모델이 만들어진 것, 피칭 쪽에서는 DIPS가 패러다임을 바꾸어놓은 것이니까요.

    말씀하신 로케이션에 따른 타구의 종류는 pitchfx 이후에 연구되고 있는거 같든데요. 팬그래프의 경우, 존을 여러개로 쪼개서 로케이션 마다 컨택%, 타율, 장타율, 순장타율,땅볼비율 같은걸 보여주고 있을겁니다.

    다만, 아직은 pitchfx 의 정확도에 대해 좀 의심스러운게 많은가봅니다. 미국오덕들이 pitchfx에 엄청 기대를 하다가 좀 주저주저하나봐요. 대략의 감을 잡는 수준은 되지만 그걸로 엄격한 분석을 하기엔 좀 애매한게 많은가보네요.
    2015.03.18 13:08 신고
댓글쓰기 폼