topic 세이버메트릭스 WPA 톰탱고 봉중근 엘지트윈스 이진영 권용관 기대승률 서동욱 넥센 김용의 |
하도 조심스러워 입에도 못올렸던 엘지트윈스의 리그 1위 등극이 드디어 현실이 되었습니다. 4월도 5월도 아닌 8월도 중순이 지난 20일 프로야구 순위표 제일 윗자리에 엘지 트윈스의 이름이 쓰여져 있었습니다. (하루만에 다시 내려오긴 했어도 말입니다. 다시 올라갈테죠. ^^;)
시즌은 아직 남았고 갈 길은 멀지만 16년만의 후반기 1위라는 것은 길고 암울했던 지나간 시간들을, 견뎌야 했던 갖은 비아냥과 속터짐을 어느만큼은 털어내준 사건임은 분명합니다.
세이버매트릭스의 시선으로라면 이 역사적인(?) 한 경기를 어떻게 기록하고 기념할까를 잠시 생각하다 WPA Win Probability Above 라는 흥미로운 분석모델이 문득 떠올랐습니다.
WPA란 말그대로 경기에서 특정한 한 플레이가 팀의 승리확율을 얼마나 올라가게 하거나 반대로 내려가게 하는가를 계산하는 모델입니다. 모든 야구경기는 승리확율이 50%인 상태에서 1회초를 시작합니다. 경기가 진행되어 4회초 원정팀의 선두타자가 솔로홈런을 치고 1점 앞서기 시작하면 이때 홈팀의 승리확율은 0.374 로 떨어집니다. 대신 이어지는 4회말 선두타자가 2루타를 치고 나가고나면 홈팀의 승리확율은 0.506 으로 근소하게 50%를 넘어섭니다. 한점 뒤지고 있긴 하지만 무사2루 상황에서의 통계적인 기대득점이 1점보다 크기 때문입니다.
이 시스템과 확율테이블은 톰 탱고 등에 의해 고안되었고 실제로 벌어진 MLB의 경기들을 통계적으로 분석하여 산출해낸 것입니다. 각각의 아웃카운트 및 출루 상황이 발생한 수많은 게임들의 최종결과를 통계내어 분류한 것인데, 앞에서 예로 들었던 동점상황에서 4회초 선두타자 홈런의 결과란 --- [ 4회초 + no out + 원정팀 1점 리드 + 주자없음 ]에 해당하는 상황을 말하며, 이런 상황에 해당하는 모든 게임의 최종결과를 조사해보니 결국 홈팀이 이긴 경우가 0.374 였다는 것입니다.
이렇게 계산되는 WPA 의 아이디어는, 게임 중에 아웃카운트와 변화와 출루, 진루에 영향을 미치는 모든 각각의 플레이가 (통계적으로) 자신의 팀에게 얼만큼의 승리가능성을 가져다 주는지 계산하고 비교할 수 있게 해줍니다. WPA는 그런 면에서 흔한 영양가 논쟁에 꽤 객관적이고 정확한 통계적이고 계량적인 해답이 될 수도 있겠습니다.
*** 점수차 크게 벌어진 9회 초의 홈런에 비해 동점 상황에서 쳐낸 같은 1점 홈런이 휠씬 더 가치있는 것은 당연합니다. 그런데 얼마나 더 가치있느냐는 애매합니다. 10배 쯤일까요 아니면 37배 쯤 일까요? WPA 는 여기에 대해 비교적 객관적이고 계량적인 해답을 알려줍니다.
9회초 선두타자가 동점상황에서 홈런을 칠 경우 원정팀의 승리확율은 50%에서 83.8%로 급상승합니다. 즉 WPA +0.338 의 가치가 있다는 뜻입니다.
그런데 이미 9:3으로 6점을 리드하고 있는 상황에서 같은 1점 홈런을 칠 경우 애초의 승리확율 99.7% 에서 99.9%로 0.2% 올라갈 뿐입니다. WPA +0.002 의 가치 밖에 없다는 뜻입니다. 그러니까 두 경우의 승리가능성에 대한 가치를 비교하면 --- 170배 정도 차이가 납니다. 생각보다 더 크네요.
이 모델을 경기에서 벌어지는 각각의 상황에 적용할 경우, 팀의 승리확율이 순간 순간마다 50%에서 출발한 이후 어떻게 상승하거나 하락하는가를 볼 수 있게 됩니다.
8월20일 엘지트윈스의 역사적인 후반기 1위 등극을 결정해주었던 넥센과의 경기는 --- 1회초 박용택의 볼넷으로 시작해서 9회말 마지막 아웃카운트였던 박병호의 유격수 앞 땅볼까지, 아웃카운트와 출루, 진루에 영향을 준 총 83번의 플레이가 있었고 그것이 이어져 스코어 5:3 으로 하나의 경기가 완성되었습니다.
바로 그 83번의 플레이를 통해 오르거나 내린 엘지트윈스의 승리확율을 그래프로 표시하면 다음과 같습니다.
경기는 1회초 0.500 의 승리확율로 시작됩니다. 박용택이 볼넷을 골라서 1루에 나가는 순간 그 확율은 0.535로 올라갑니다. 왜냐하면 1회초 무사 1루 상황이 벌어졌던 모든 경기를 분석한 결과, 원정팀의 승률이 0.535 였기 때문입니다. 이것을 다르게 말한다면 박용택의 선두타자 볼넷은 WPA +0.035 의 가치를 가지고 있다는 뜻입니다. 이어진 7병규의 안타로 무사13루가 되면 승리확율은 다시 0.617로 올라갑니다.
이진영의 내야땅볼과 권용관의 적시타로 2점을 얻고 1회초 공격을 마친 순간 트윈스의 승리확율은 0.653 이 됩니다.
그림에서 0.500 으로 출발한 그래프는 0.686 까지 올라갔는데, 이때가 2사 주자12루에서 권용관이 적시타를 치고 다시 2사 12루의 찬스가 유지되고 있는 순간을 나타내고 김용의가 삼진으로 3아웃을 빼앗기며 이닝이 종료되자 한번의 기회상실로 인해 0.653 으로 이닝이 끝난 것입니다. 1회초 한이닝의 공격을 통해 타자들은 WPA +0.153 의 결과를 만들어냈습니다.
하지만 1회말 곧바로 팀은 위기를 맞습니다. 선두타자 문우람에게 2루타를 맞고 투수 신정락은 WPA -0.061 만큼을 허용합니다. 만루 상황에서 김민성에게 밀어내기 볼넷을 허용하며 2:1로 쫒기게 되자 트윈스의 승리확율은 0.530 까지 하락합니다.
1회초에 벌어놓은 2점의 승기가 거의 사라져버렸다는 뜻입니다. 이렇게 경기가 진행되면서 팀의 승리확율이 오르락 내리락 하는 것이 앞의 그래프입니다.
경기 전반의 가장 어려웠던 순간은 2회말 서동욱의 선두타자 안타로 무사1루를 허용한 상황의 0.520 입니다.
무사 선두타자 출루가 상대팀의 득점확율을 높인 상태이고 따라서 그 부분을 고려한 팀의 승리확율은 하락합니다. 그러나 허도환의 희생번트 이후 문우람과 안태영을 차례로 잡아내며 이닝을 마치자 다시 0.615로 상승합니다.
이 두타자를 상대하는 동안 투수와 야수들은 WPA +0.095 의 결과를 만들었습니다.
4회 권용관과 김용의의 연속타점으로 4:1로 리드하자 승리확율은 0.799 까지 치솟고 4회말 이택근의 선두타자 홈런으로 1점을 허용하며 0.634 로 잠시 하락했으나 이후 양팀 모두 공격의 소강상태를 보이며 서로 아웃카운트를 주고 받으며 이닝이 넘어가는 동안 리드하고 있던 엘지트윈스의 승리확율은 점점 상승합니다.
6회초 7병규의 안타로 0.900 까지 상승했던 트윈스의 승리확율은 어제 경기의 승부처였던 8회말 --- 그래프에서 보는 것처럼 급격하게 요동칩니다. 박병호가 선두타자 안타를 치고 나갔을 때까지만 해도 0.869 로 약간 떨어졌을 뿐입니다. 그후 강정호의 병살타성 타구가 권용관에게 가는 순간 (만약 이 타구가 그대로 병살처리되어 5:2로 리드한 8회말 2사 상황이 되면) 승리확율은 0.920 으로 올라가고 있었습니다. 그런데 유격수 권용관은 실책을 범하며 2사 주자없는 상황이 무사 12루로 변하게 되고 볼넷허용, 적시타 허용이 이어지며 5:3으로 쫒기는무사 만루 상황이 되자 트윈스의 승리확율은 0.490 으로 급추락하게 됩니다. 이는 승리할 확율보다 패배할 확율이 51:49로 더 높아졌다는 뜻입니다.
*** 권용관의 실책은 WPA -0.182 의 효과를 가집니다. 이때까지의 양팀의 공방에서 가장 가치가 높았던 플레이가 1회말 김민성의 밀어내기 볼넷타점이 +0.093 , 3회초의 역시 권용관 자신의 1타점 적시 2루타가 +0.122 였던 것과 비교하면 8회의 실책 하나가 얼만큼이나 치명적인 플레이였는지 알 수 있습니다. 넥센의 이택근이 3회 선두타자로 나와 때려낸 홈런도 WPA +0.092 에 불과합니다.
그후 엄청난 반전 즉 그래프에서는 '깊고 날카로운 V자형 계곡' 이 나타납니다. 서동욱의 1루땅볼 때 홈 주자를 잡아내고 봉중근이 구원등판해서 대타 송지만을 병살로 잡아내는 2번의 플레이가 0.490 즉 승리보다 패배에 더 가까웠던 승리확율을 순식간에 0.928로 끌어 올립니다. 1루수 김용의에 글러브에 걸린 단 2개이 타구가 WPA +0.438 이라는 엄청난 가치를 만들어냈다는 뜻입니다.
*** 동점 상황에서 맞은 9회초, 2사 주자없는 가운데 등장한 타자가 벼락같은 홈런을 작열시켜 1:0으로 앞서게 될 때, 이 홈런의의 가치가 WPA 가 + 0.384 입니다. 즉 8회말 클로저 봉중근이 이끌어낸 병살플레이의 가치는 9회초 2사의 1점 짜리 역전홈런 보다 휠씬 높습니다. 또는 0:2 로 뒤지는 7회초 공격에서 1사 12루 상황에 등장해 3점 홈런을 때리고 3:2 로 승부를 역전시킬 때 그 홈런의 가치가 WPA +0.426 입니다.
그래프는 9회초 트윈스 공격이 3자범퇴로 끝나며 아주 약간 하락하지만 9회말 박병호를 잡아낸 마지막 아웃카운트를 끝으로 1.000 즉 승리확정에 이르게 됩니다.
통계분석에 기반해서, 그리고 혁신적이고 창조적인 아이디어가 담긴 분석모델을 통해서 우리는 야구에 대해 생각보다 휠씬 더 많은 것을 측정하고 비교할 수 있습니다. 또 WPA는 실제로 벌어졌던 경기를 기반해서 만들어진 분석모델이기 때문에 흔히 말하는 기세, 흐름 같은 것들도 결과적으로 그 안에 반영되어 있다고 볼 수 있습니다. 즉 1회초 공격에서 선취점을 뽑았던 경기는 얼만큼의 승률을 기록했는가. 팽팽하게 동점상황으로 맞서던 5회에 한팀이 점수를 1점 뽑아낼 경우 예상승률을 어떻게 되는가 같은 물음에 대한 대답에는 적어도 지금까지 벌어진 많은 경기에서 나타났던 통계적인 결과가 반영되어 있습니다.
*** 참고로 1회초 이진영의 2루 땅볼을은 비록 1타점을 만들어내긴 했지만 WPA 에서는 -0.001 로 측정됩니다. 왜냐하면 1회초 동점+ 무사13루 의 상황의 경기가 승리했던 통계적인 확율이, 1점 리드한 1사 2루 의 경기가 승리했던 통계적 확율보다 아주 약간이지만 더 높았기 때문입니다. 만약 이진영이 내야플라이나 삼진으로 물러나서 1아웃으로 변하고 주자가 그대로 13루에 머물렀을 경우는 WPA -0.052 가 됩니다. 따라서 이진영의 1타점 2루 땅볼은 주자를 진루시키지 못하는 타격실패보다는 +0.051 만큼의 가치를 가집니다.
다른 모든 통계적 도구가 그렇듯이 WPA 역시 결함과 한계를 가집니다. 다만 이에 대한 자세한 이야기는 다른 기회로 미루겠습니다. 이 글은 그저 8월20일의 그 경기, 설사 하루천하였다 해도 잊혀지지 않을 그 순간을 기록하고 남기는 하나의 방법에 대해서 쓰려는 것이기 때문입니다. 누구는 그날 날짜의 스포츠신문을, 누구는 직관 티켓을, 누구는 엘지트윈스가 순위표 제일 위에 있는 이날의 순위표 인증샷을 그리고 또 다른 누구는 경기동영상을 추억거리로 갈무리하듯이 그냥 약간 다른 방법으로 이날의 승리를 기록해두고 싶었던 것이라고 해야겠지요.
그래프 뒷부분에 나타난, 저 깊고 날카로운 V자에서 만루 위기에 마운드에 오른 봉중근의 불같은 눈빛을, 득달같이 타구를 잡아 베이스를 찍고 다시 2루에 던져 이닝을 마무리한 또치 용의의 천진난만한 하이파이브를 떠올릴 수 있을거 같아서 말입니다.
'트윈스spot' 카테고리의 다른 글
객나적인 스카우팅리포트 - 리즈의 투구폼 (0) | 2015.01.28 |
---|---|
정의윤 - 여전히 객나적인 스카우팅 리포트 (10) | 2015.01.28 |
미국야구, 한국야구 그리고 트윈스야구 [투수편] (8) | 2015.01.28 |
미국야구, 한국야구 그리고 트윈스의 야구 (타격편) (8) | 2015.01.28 |
캐넌 김재현이 줄무늬를 다시 입는 날 - 레전드가 은퇴하는 방법 (8) | 2015.01.28 |