본문 바로가기
diegobaseball
KBOstats 실험

피타고라스승률보다 더 많이 이기는 방법 - KBO리그

by 토아일당 2018. 11. 2.


피타고리안승률은 재미있는 모델입니다.   현재의 승률과 다소 차이가 날 수도 있는 좀더 객관적인 팀전력수준을 파악할 수 있게 해줍니다.  그래서 시즌 중반 즈음에 피타고리안 기대승률과 실제 승률 중 시즌 최종 승률과 더 가까운 것이 오히려 실제승률보다 기대승률인 경우도 많습니다.


기대승률 모델의 또다른 의미는, 어떤 경기는 결정적인 한점으로 승리를 거두기도 하고 또 다른 경기는 10점 이상의 큰 점수차로 지기도 하지만, 100경기 이상의 한시즌 전체를 치르고 나면 결국 득점이 많고 실점이 적은 팀이 더 좋은 성적을 낸다는 야구의 중요한 본질 하나를 알려준다는 것입니다.  


사실 많은 세이버메트릭스 이론은 한타석, 한경기는 랜덤에 좌우되는 면이 많지만 결국 득점력과 실점억제력에 수렴하게 된다는 전제에 바탕을 두고 있습니다.  




보는 것과 같이 실제승률과 피타고리안 승률은 거의 일치합니다.   피타고리안 기대승률의 오차는 리그 전체로 보면 보통 3경기 이하입니다.  144경기 중 2% 정도 밖에 안된다는 겁니다.  단순히 득점과 실점을 제곱해서 나눈 값이 이 정도의 정확도를 보인다는 것은 놀랍고 신기한 일이기도 합니다.  우리가 이 기대승률 모델에 매료되는 이유입니다.


그런데 시즌을 마칠때까지 여전히 기대승률과 실제승률의 격차가 많이 남아있는 팀들도 있습니다.  2-3팀 정도는 실제 승수와 기대승수가 5경기 이상 차이가 납니다.  


올시즌의 경우, 한화가 꾸준히 기대승률 대비 실제승률에서 5경기 가까운 갭을 만들고 있습니다.  5승의 차이는 아주 큽니다.  5번 더 이기면 5번 덜 진다는 뜻도 되기 때문에 승차마진으로 따지면 10경기가 됩니다.  시즌 후반기를 지내며 줄어들 수도 있지만 늘어날 수도 있습니다. 


2승이나 3승 정도의 기대승수 대비 격차는 작아보이지만 그렇지 않습니다.  올스타브레이크 이전까지 올시즌 각 팀 승률이 피타고리안 기대승률과 같다면 2위부터 6위까지 팀순위가 전부 바뀔 수도 있습니다.


다음은 2008년부터 2014년까지 시즌종료시점으로 기준으로 기대승수와 실제승수의 차이입니다. 



기대승수라는 모델이란 팀의 승수란 단기적으로는 “운”의 영향을 받지만 많은 경기를 치르다보면 결국 득점과 실점 수준으로 대표되는 팀의 객관적 전력에 수렴하게 된다는 것입니다.  하지만 매 시즌 2-3팀 많을 때는 그 이상의 팀들이 5승 이상의 차이를 보입니다.  승차마진으로 10경기이며 순위 2계단도 뒤집힐 차이입니다.   


2008년 5위 한화는 4위 삼성에 1게임차 뒤지며 포스트시즌 진출에 실패했는데, 실제 승수가 기대승수와 일치했다면 순위는 반대로 되었습니다.  2009년 무승부를 패배로하는 승률계산방식이었다고 해도 SK가 기대승수 만큼의 실제승수를 거뒀다면 정규리그 우승은 SK였고 그랬다면 포스트시즌의 향방도 모르는 일입니다.   2010년에는 3위 두산과 4위 롯데의 순위가 바뀔 수 있었습니다.


그저 어떤 통계도 완벽할 수 없으니 피타고리안 기대승률모델도 그렇다고 생각할 수 있습니다.  하지만 만약 매 시즌 작지 않은 차이로 나타나는, 기대승률-실제승률 사이의 격차가 단순한 운이나 통계적 오차가 아닌 제3의 요인에 의한 것이라면, 그것은 승리의 담장 안으로 들어갈 수 있는 기막힌 개구멍을 찾는게 될 겁니다.


일단 위의 차트를 봐서는, 팀 순위나 팀 승률과는 별 관계가 없어보입니다.  초록색 마크가 승률이 높은 팀이고 붉은색 마크가 승률이 낮은 팀이며 ( ) 안의 숫자는 해당 시즌의 최종 순위입니다.   위로든 아래로든 5경기 이상 기대승수 대비 실제승수가 차이났던 팀들을 보면 상위권(초록색) 중위권(노란색) 하위권(붉은색) 팀들이 골고루 섞어 있으며, 어떤 때는 기대승률보다 많이 이기는 쪽에 있고 또 어떤 때는 기대승률보다 많이 지는 쪽에 있습니다.  


벤치의 전략이나 팀의 짜내기 능력과도 큰 상관이 없다고 밝혀져 있습니다.  올 시즌 한화가 기대승수보다 5경기 정도 더 이기고 있는 것을 야신 김성근 감독의 벤치웍이라 말하면 그럴듯하긴 하겠지만 한화는 작년에도 역대 꼽힐 수준으로 기대승수 대비 실제승수가 많았습니다.


김성근 감독의 통산 기대승수 대비 실제승수의 차이 역시 딱 평범한 수준이며 소위 전략가 소리 들었던 다른 감독들도 다 그랬습니다.  


일단 개구멍은 있습니다.   득점과 실점의 편차입니다.  어림잡아 생각하더라도 기대승률과 실제승률의 격차는 한두점이면 족한 것을 괜한 다득점으로 승리하거나, 이왕 진 경기 화끈하게 질 때 생길 수 있습니다.  이를 좀더 객관적으로 측정한 통계량이 편차(deviation)입니다.  


KBO 2008-2014 7시즌 동안 각 팀이 기록한 시즌별 팀득점/실점 편차와 기대승률 대비 플러스 승률 사이의 관계를 확인해보겠습니다.  


세로방향은, 기대승률 대비 실제승률입니다.  위가 더 많이 이긴 팀들이고 아래가 너 많이 진 팀들입니다.  가로방향은, (시즌 팀실점편차 - 시즌 팀득점편차) 입니다. 대신 팀득점/실점 수준에 따라 편차의 절대값이 커지거나 작아지는 왜곡이 있기 때문에 각각을 팀평균득점/팀평균실점으로 나눠서 조정한 결과입니다.  이런 이유로 엯시 왜곡을 피하기위해 편차값은 표준편차가 아니라 평균편차(절대편차)를 사용합니다. 


* 혹시, 득점/실점 편차를 평균득점/평균실점으로 나눠주는 것으로 인해 가짜 상관관계가 나타날 수 있지만, 앞에서 팀득점/실점 비율과 아주 강한 상관관계를 가진 팀승률이 기대득점 대비 실제득점 격차와 별 관계가 없는 것을 확인했기 때문에 이에 따른 왜곡 가능성은 좀 낮을거라 판단했습니다.  


결과는 다음과 같습니다. 



완전하진 않지만 그럴듯한 모양이 됩니다. (실점편차 - 득점편차) 값과 기대승률 대비 플러스 승률은 상관관계가 있습니다.   피어슨상관계수는 0.5 정도 됩니다.  교과서 기준으로 0.3부터 0.7 까지를 보통의 상관관계로 판단하기 때문에, 이 두 값은 관계가 있다고 의심해볼만 합니다.


 (실점편차 - 득점편차)  는 실점이 들쭉날쭉할수록 커지고, 득점이 득쭉날쭉하면 작아집니다.  따라서   (실점편차 - 득점편차) 에 비례해서 기대승률+ 가 우상향한다는 것은,  득점은 매 경기마다 비슷비슷한 수준으로 올리고, 실점은 널뛰게 허용하면 기대승수 대비 더 많이 이기게 된다는 뜻입니다.


하지만 이게 의미있는 개구멍이 되려면 여기 들어갈 방법이 있어야 합니다.  즉 득점수준의 널뛰기 정도 또는 실점 수준의 널뛰기 정도에 영향을 미치는 (운이 아닌) 전력요인이 있어야 하고 또 그것을 찾아내야 한다는 말입니다.


예, 들어갈 방법이 있습니다.  그 방법이 충분히 만족스러울지는 모르겠지만. 



이것은 팀 피SLG와 실점편차 사이의 상관관계입니다.  -0.7 정도의 피어슨 상관계수를 보입니다.  강한 상관관계이며 마이너스 상관관계입니다.  즉 피장타율이 높으면 실점편차가 작아집니다.  직관적으로는 장타를 많이 많으면 대량실점하는 경우가 많고 실점편차가 클 것 같지만 반대입니다.


시즌 전체로 같은 수준의 팀실점일 때, 장타를 많이 맞으며 실점하면 실점편차가 작고, 장타억제를 하면서 볼넷이나 단타를 많이 허용하며 실점을 할 경우 득점편차가 커집니다.  




장타율과 득점편차 역시 -0.7 정도의 강한 음의 상관관계입니다.  장타를 많이 치면 일정한 득점력을 꾸준히 유지할 수 있습니다.  반면 장타가 아닌 출루와 단타 위주의 득점패턴은 득점편차를 크게 만듭니다.


요컨데, 팀의 피타고리안 기대승률+ 승수는 (실점편차-득점편차) 와 정의 상관관계를 갖고 있고, (실점편차-득점편차) 값은 장타율은 높고 피장타율이 낮을 때 가장 커집니다.  


같은 득점/실점 수준일 때, 타자들은 이왕이면 장타 위주의 공력패턴을 갖고 있고, 반대로 투수는 볼넷과 단타를 많이 주더라도 장타를 확실히 억제해주면 같은 수준의 득점/실점이라도 더 많이 이길 수 있습니다.


이게 피타고리안 기대승수 대비 +승수를 올리기 위한 “개구멍”의 정체입니다.


따라서 타자의 경우, 같은 득점생산성 수준이라도 꾸준한 쪽이 팀에 기여도가 높고, 투수는 같은 실점억제력을 가졌다면 꾸준하고 안정적인 것 보다 다소 롤코 기질이 있는 쪽이 더 기여도가 높습니다.  물론 팬들의 멘탈에는 악영향을 미치겠지만요.


30경기를 꾸준하게 6이닝 3실점으로 막아 시즌 ERA 4.5 를 기록한 투수가 있고, 5이닝 5실점과 7이닝 1실점을 퐁당퐁당 해서 ERA 4.5 를 기록한 투수가 있다면 클래식이든 세이버메트릭스든 둘의 평가지표는 똑같지만 전자의 투수보다 후자의 투수가 팀승리에 더 이롭습니다.


--- 도루나 희생번트, 불펜투수ERA로도 해보면 재미있을텐데, 그건 다음 기회에.