티스토리 뷰

 topic   투수놀음 KBO 장명부 세이버메트릭스 선언 피타고라스 승률 팀득점 팀실점 상관관계 94엘지 우승



야구는 정말 투수놀음일까? : KBO 22시즌 분석 

- 2013.8.1




"야구는 투수놀음이다"라고 합니다.   정말 그런가요?

2013년 현재 리그에서 타격이 가장 강한 팀은 두산입니다.  하지만 그들은 별로 안전하지 못한 4위에 머물고 있습니다.

투수력이 가장 좋은 팀은 삼성입니다.  그들은 시즌 내내 1위를 굳게 지키고 있습니다.

심심찮게 등장하는 흔한 신문기사들을 기억해도 이에 대한 주장과 검증은 여러번 있어왔습니다.

팀 순위는 대체로 팀타율보다는 팀평균자책점과 더 많이 일치했습니다.

이것은 사실입니다.

 

David Grabiner 에 의해 작성된 세이버메트릭스 선언The Sabermetric Manifesto 에는 다음과 같은 이야기가 나옵니다.

 

당신이 “피칭은 야구의 75%이다”라고 주장한다면, 그리고 그것이 사실이라면 당신은 타격이 좋은 팀보다 피칭이 좋은 팀이 정규시즌에서 우승할 것이라고 결론 내릴 것이다. 그러나 사실은 그렇지 않다. (피칭과 수비를 포함한) 리그 최소 실점팀이 정규시즌 우승을 한 경우는 대략 절반 이하 정도이고 (모든 타격 요소를 포함한) 리그 최다 득점팀이 우승한 경우를 더 자주 볼 수 있다. 


피칭이 야구의 75%이다 라고 주장한 것은 아마도 메이저리그의 전설적인 감독 코니 맥(Cornelius McGillicuddy)일겁니다.  1894년부터 1950년까지 활동하며 월드시리즈 5번 우승, 아메리칸리그 9번 우승을 기록했고 필라델피아 시절 50연승 기록을 가지고 있습니다.  1937년 명예의 전당에 올랐습니다.  잘은 모르겠지만, 야구는 투수놀음이라 다로 말한 기원 쯤 될겁니다.

 

하지만 그래비너는 그것이 사실이 아니라고 말합니다.  세이버매트리션이란 사람들이 괜히 복잡한 이야기를 할 지언정 어떤 의도를 가진 구라는 즐기지 않는 이들이니 뭔가 들여다볼만한 이유는 된다고 봅니다.

 

야구에서 승리란 좀더 많은 득점을 하고 좀더 적은 실점을 하기 위한 경기입니다.  득점은 공격력의 결과이고 실점은 (투수력을 포함한) 수비력의 결과입니다.

 

사실 득점과 실점은 야구를 설명하고 예측하는 놀라울만큼 명쾌하고 직접적인 스탯입니다.

이제는 많이 알려진 피타고리안 승률은

 

  기대승률 = 팀득점^2 / (팀득점^2 + 팀실점^2) 

 * 여기서 2라는 승수는 1.83 으로 조정되어 사용되기도 합니다.  시즌 후반에 갈 수록 승수2 보다는 승수 1.83이 더 정확해집니다.

 

이라는 지극히 단순한 수익으로 계산됩니다.

그런데, 이 결과값은 놀라울 정도로 실제 승률과 일치합니다.  아니 어떤 면에서는 실제 승률보다 더 정확합니다.  그러니까 시즌 중반에 피타고리안 승률과 실제 승률이 차이가 나는 경우, 시즌이 끝나보면 당시 승률보다 저 간단한 계산식으로 구한 기대승률에 휠씬 가까운 결과로 변해있는 것을 볼 수 있습니다.

모순적인 말이지만, 득점과 실점으로 계산되는 승률은 현실의 실제승률보다 더 정확할 수도 있다는 뜻입니다.



<> KBO 22시즌 동안 팀득점, 팀실점과 승률 사이의 상관관계


KBO의 역대 팀 스탯을 가지고, 득점과 실점 그리고 팀성적과의 상관관계를 다음과 같이 테스트했습니다.


각 연도별 각 팀의 (경기당 평균득점-경기당 평균실점) 의 값과 그 연도의 팀 최종승률을 선형회귀분석합니다.  이 방법은, 그해 그팀의 득점-실점 의 스탯이 얼만큼 최종적인 승률과 상관관계가 있는지를 통계적으로 밝해줄 수 있습니다.  결과는 다음과 같습니다. 



가로방향은 득점과 실점의 차이, 세로방향은 그 팀이 그 시즌 승률입니다.  

그래프에 보이는 것처럼, 득점-실점 값은 그 팀의 승률과 거의 직선에 가까운 모습으로 정확히 비례합니다.

R^2 는 파란점으로 표시된 각 통계값이 얼만큼 강한 상관관계를 보이느냐를 측정하는 값이며, 거의 0.9에 가까운 저 정도의 숫자면 이론수학이 아니라 현실통계에서는 거의 완전히 일치한다고 봐도 좋을 수준입니다.


사용한 데이터는 1989년부터 1998년, 그리고 2001년부터 2012년까지의 총 22시즌의 데이터입니다.  나머지 연도를 제외한 이유는

   1) 전후기리그로 나누어 진행된 1982-1988 기간은, 전기우승팀이 결정된 이후 시리즈 상대고르기 등으로 인해 비정상적인 어뷰징이 있어왔기 때문에 부적절한 데이터일 수 있습니다.

   2) 1999-2000 2시즌은 양대리그로 나누어 진행했기 때문에 실제로는 서로 다른 2그룹의 팀을 상대한 결과이기 때문에 섞어서 사용할 수 없습니다.


도대체 저게 뭔소리야 싶은 분들도 많으실테니 좀더 눈에 보이는 방법으로 저 분석결과를 적용해보겠습니다.


      팀의 기대승률 = 0.1023 * (팀평균득점 - 팀평균실점) + 0.5 : 토아승률


제가 디자인한 수식이기 때문에 생색내기 위해 피타고리안 승률과 동일한 기능을 가진 "토아누스 승률"이라 명명하겠습니다.   파라메터로 사용한 0.1023 은 근사치로 0.1 을 대신 사용해도 무방합니다.  거의 같은 결과를 얻을 수 있습니다.  

 

 

<> 승리의 득점공식 : 1승을 만드는데 필요한 득점은 9.8점 

 

이 토아승률식으로 계산한 2013년 8월1일 기준 9개 팀의 기대승률, 피타고리안식으로 계산한 기대승률 그리고 실제 승률의 비교입니다.


* P승률1 = 승수를 ^2 로 해서 계산한 피타고리안 승률

  P승률2 = 승수를 ^1.83 으로 해서 계산한 수정 피타고리안 승률

  토아승률 = 0.1023*(평균득실차) + 0.5 로 계산한 기대승률


토아누스 승률식이라 명명한 [0.1*(평균득실차)+0.5] 로 산출한 값은 빌제임스가 고안했고 널리 사용되고 있으며 정확성이 상당한 수준으로 검증된 피타고리안 승률식에 의한 결과값과 거의 일치합니다. 


한시즌 내내 여러 경기를 하다보면, 큰 점수차로 이기는 경기도, 한점차의 아슬아슬한 경기도 있지만 결국 시즌 전체를 보내고나면 결국 그 팀의 성적은 얼마나 많은 득점을 올렸고 얼마나 적은 실점을 내주었는지에 대한 아주 단순한 산술적 계산결과와 놀랄만큼 일치합니다.  

토아승률식은 이미 충분히 검증되어 널리 사용되는 피타고리안 승률식과 비교해서 정확도에서 거의 비슷한 수준입니다.  [ 승률 = 0.1* 득실차 + 0.5 ]라는 단순무식한 수식으로 그 허다한 상황과 상관없이 기대승률을 계산해낼 수 있다는 결과는 팀의 성적이 득점과 실점 이라는 두가지 변수에 의해 얼만큼 직접적으며 강력하게 상관관계를 가지는지에 대한 증거입니다.

 

여기까지의 결론은 일단 아주 상식적입니다.

즉 많은 득점, 적은 실점이 승률의 가장 중요한 요인이란 것은 일단 당연하니까요.  다만 그 상관관계가 얼만큼이나 강한가에 대해서는 새롭게 기억해둘 필요가 있습니다.


우리는 흔히, 한점차 승부를 이기는 팀이 강한팀이고 결국 높은 승률을 올린다고 말하고 믿습니다.  하지만 그건 어떤 면에서 사실이 아닐 수도 있습니다.  기분상 한점차 승리가 짜릿하고 기분상 한점차 패배가 아프지만 그리고 흔히 야구는 흐름의 경기이고 분위기를 탄다고 해서 이런 것에 큰 의미를 부여하지만, 통계가 명백히 증명하는 것은, 닥치고 많은 득점, 적은 실점만 중요하다는 것입니다.  


어떤 팀이 

3-2승 5-4승 1-0승 0-8패 2-12패   (1점차 승부에 강한 3승2패)  

이렇게 했을때, 이 팀이 강팀이라는게 우리 통념이지만 이런 식의 기록을 내고 있는 팀은 시즌이 끝나보면

10-1승 12-2승  0-1패  5-4패  5-6패   (1점차 승부에 약한 2승3패)   

이런 성적을 낸 팀한테 최종 승률에서는 역전당할 가능성이 아주 높다는겁니다.  적어도 90% 이상.   그렇기 때문에, 시즌 중반 실제 승률보다 피타고리안 승률에 의한 순위가 시즌이 끝나보면 더 믿을만하다는 신비로운 현상이 생겨나는 것입니다. 

 

이 말은 또 다르게 풀면 이렇습니다.


팀의 [평균득점-평균실점]이 1점 많아질때마다 팀의 승률은 5할에서 정확히1할씩 올라갑니다.  

대충 그정도 비율로 그쪽 방향으로 올라간다는게 아니라 정확히 그만큼 단순산술적으로 올라간다는 뜻입니다. (오차범위는 백분율 승률기준으로 1-2% 전후입니다.)


증명해보겠습니다. 

트윈스는 현재 평균득점 5.02 평균실점 4.01 차이는 1.01 입니다.  계산하면 0.601 이 되고, 실제승률은 0.585이며 오차는 0.016 입니다.   넥센은 평균득점 5.32 평균실점 4.91 차이는 0.41  계산하면 0.541  실제승률과 오차는 0.015, 두산은 평균득점 5.48  평균실점 5.07  차이는 0.41  계산하면 0.540  실제승률과 오차는 0.001 입니다. 이정도 승률 오차는 승수로 환산했을때, 1승에서 2승 정도에 불과합니다.  

 

그런데 이 오차 조차도, 좀 모순적인 말이지만 --- 현실을 계산모델이 반영하지 못해서 생기는 것이 아니라, 현실의 승률이 야구의 본질을 반영하지 못하고 있어서 생기는 결과라고 할 수 있습니다.  토아누스 승률과 동일한 기능, 비슷한 정확도를 가진 피타고리안 승률 에서 이미 증명되었듯이, 시간이 지날수록 시즌의 종반에 다가갈수록 실제 팀의 승률은 지금의 실제 승률이 아니라, 득실차 1점당 1할 이라는 계산식의 결과로 수렴할 확율이 더 높기 때문입니다. (계산식의 구조로만 보면, 토아누스 승률식이 시즌 막판에 가면 피타고리안 승률식보다 더 정확도가 높아질겁니다)


한 경기에서 실점없이 득점을 1점 하게 될 경우, 128경기로 진행되는 2013KBO의 경우 시즌의 최종승률은 0.00078 정도 높아지고 승리횟수로는 0.1승 정도의 효과가 있습니다.  추가득점을 10점 할 경우 시즌 최종승률 기대값은 0.0078 높아지고 기대승수는 0.98승 늘어납니다.  좀더 정확하게는 10점의 추가득점을 만들어내는 팀전력이 시즌 전체로 0.98승을 만들어내는 것이지요.

대략 1점 = 승률 0.00078 = 0.1 승이 동일한 가치입니다.  반면 실점을 할 경우 동일한 수치가 하락하게 됩니다.    


시즌 전체로 5할 기준에서 1승을 더 하기 위해서는 실점보다 득점이 9.8점 많으면 됩니다.  트윈스는 현재 실점보다 득점이 83점 많으며 따라서 5할 승률 대비 8.5 승을 더 하게 됩니다.  실제로 5할기준인 41승에 비해 7승을 더 하고 있습니다.  1.5승 만큼의 오차가 있네요.  

나머지 8팀에 모두 적용시켰을 때, 오차범위는 최대 2.5게임을 넘지 않습니다.  야구 참 쉽네요.   그리고 다시 말하지만 이 오차조차도 시즌이 진행될수록 점점 사라져갈겁니다.  (적어도 통계적으로는 그럴 확율이 압도적으로 높습니다)

 

세이버매트리션들이 안타 하나 볼넷 하나의 득점가치를 계산해내고 그것을 토대로 선수의 플레이를 분석하는 것도 이와 비슷한 통계분석의 결과로 얻은, 기대득점, 기대승률 모델 같은 것으로부터 출발합니다.


머리아픈 이런 테스트를 실행하고 결과를 이야기하는 이유는 다음과 같습니다.


1. 이 글에서 야구가 정말 투수놀음인가 를 검증하기 위해 사용되는 "선형회귀분석"이라는 통계적 수단이 야구를 설명하고 해명하는데 충분히 타당하고 적합한 수단이라는 점을 증명하기 위해 

*** 실제로 선형회귀분석은 세이버매트리션들이 야구를 다루면서 가장 흔하게 그리고 가장 믿을만하게 사용하는 분석도구입니다


2. 야구란 엄청나게 복합적이지만, 목표가 승리 즉 높은 승률에 있다고 했을때, 

1) 더 많은 득점을 내기 위한 행동  

2) 더 적은 실점을 허용하기 위한 행동

으로 치환해서 이해할 수 있다는 것에 대해 증명하기 위해


3.그리하여 야구의 모든 플레이는 매 상황이 특수성과 복잡성, 의외성에도 불구하고 그 하나하나를 통계적으로는 거의 90% 이상 일치가 보장되는 기대승수, 기대승률로 계산해낼 수 있다는 뜻입니다.  



<> 득점과 실점이 승률에 미치는 영향 : 어느 쪽이 더 큰 영향을 미치나?


득실차는 팀의 공격력과 수비력의 밸런스를 의미합니다.  그렇기 때문에 득점,실점 이라는 요인과 팀승률의 직접적이고 1차방정식스러운 강한 상관관계를 해명해주기는 하지만 야구에서 투수력의 비중에 대해서는 아닙니다.  그렇다면, 같은 방법으로 득실차가 아니라, 실점과 상관없는 팀 득점 그리고 득점과 상관없이 팀 실점 이 각각 팀의 승률에 어떤 상관관계를 가지고 있는지 테스트합니다.  즉 득점요인과 실점요인 중 어느쪽이 더 승률에 강한 상관관계를 가지고 있느냐를 통계적으로 분석하면, 야구가 과연 투수놀음인가에 대답에 좀더 다가설 수 있습니다.  


분석방법은 동일하게, 그팀의 그 시즌 득점과 그 시즌 승률의 상관관계입니다.  그리고 실점과 승률이 상관관계입니다.  대상데이터 역시 동일하게 전후기시즌 년도 및 양대리그 년도를 제외한 22시즌입니다.





득실차-승률 분포도에 비해 직선을 중심으로 휠씬 더 많이 흩어져 있습니다.  상대적으로 상관관계가 득실차 보다는 더 작다는 뜻입니다.  득점이 많을수록 그리고 실점이 적을수록 승률이 높기 때문에 득점-승률 분포도는 우상향하고, 실점-승률 분포도는 우하향합니다.  

팀득점-승률, 팀실점-승률의 상관관계는, 투타 밸런스라는 요소를 배제하고 (중립화시키고) 하는 분석입니다.  즉 투타 밸런스를 떠나서 순수하게 득점 자체와 실점 자체가 시즌 최종승률과 얼만큼 더 강한 상관관계를 가졌는지 테스트하는 것입니다.  결과는 다음과 같습니다.


1) 득실-승률 의 상관관계와 비교했을때, 득점-승률,  실점-승률 무두 R^2 값이 더 낮다

: 더 흩어짐

2) 1차회귀선의 기울기 절대값이 0.084, 0.086 으로 득실-승률의 0.1023 보다 작다

: 기울기가 더 완만

3) 득점-승률의 R^2=0.3749 이고,    실점-승률의  R^2=0.367 이다.

 

그런데, 팀득점-승률 상관관계의 R^2 값은 0.3749 로 팀실점-승률 상관관계의 0.367보다 작은 차이지만 더 높습니다.  즉, 득점이 실점보다 승률에 대한 상관관계가 더 높다는 뜻입니다!!!!!!!!!!!!!!!!

오마이갓.  야구는 투수놀음 아니었나요?

(물론 아주 작은 차이이기 때문에 통계학적으로는 득점>실점 이라고 결론낼 수준은 아닙니다)


야구는 투수놀음이라 할때, 투수력이란 결국 실점을 줄이는 역할입니다.  실점은, 투수력과 야수의 수비능력이 합쳐져서 만들어진 팀 수비력의 결과입니다.  투수력 뿐 아니라 야수의 수비력까지 합친 요소 즉 팀실점보다, 야수의 타격능력만으로 만들어지는 팀득점이 팀의 승률에 더 강한 상관관계를 가졌다는 뜻입니다!!!!!!!!!!!!!!!!!

(저 궁서체입니다)


그렇다면 도대체 우리가 속고 있었던 걸까요?  TV야구해설자들이 하는 이야기야 애초에 믿지 못할 구석이 많으니 그렇다쳐도 꽤 많은 신문기사에서 우리는 야구가 투수놀음이라는 주장의 통계적 실증적 증거를 본적이 있습니다.  그렇다면 무엇이 진실일까요?


* 말이 나와서 하는 이야기인데, 지금 우리는 방송 해설가, 대표적으로 하일성에게 야구를 배워왔다는 사실을 솔직히 인정하고, 또 그걸 극복하기 위해 야구팬들끼리 무슨 운동이라도 해야한다고 굳게 믿고 있습니다. 하일성의 어처구니없는 해설에 난감해하면서도 우리는 여전히 그에게서 배운, 아니면 다른 해설자가 하일성에게서 배워다가 응용한 해설로 야구를 배우고 있고 그걸 근거로 경기를 이해하고 선수를 까고 있기 때문입니다.  최근 몇년 사이에 투수의 초속-종속 차이라는 것이 상당히 황당무개한 이론이다는 것이  밝혀졌다고 치고 앞으로 갈길이 멉니다. 


기억해보시면, 야구는 투수놀음이라 라는 주장을 증명하기 위해 사용되는 방증은 대체로 팀평균자책점과 팀타율에 관한 것이었습니다.   여기서 결정적인 오해와 거짓이 생겨났습니다.


우선 팀평균자책점은 투수의 스탯이고 그렇기 때문에 이것이 투수의 실점억제력이라고 오해하기 쉽습니다.  하지만 평균자책점은 투수의 몫이면서 동시에 8명의 다른 수비수들의 몫입니다.  이 둘 사이의 책임 비중이 얼만큼인지는 불분명하지만 적어도 오직 투수의 순수한 능력과 책임에 돌릴 수 있는 몫은 볼넷, 탈삼진, 홈런 뿐이며 나머지는 어떻게든 수비수의 능력과 관련됩니다. 

팀평균자책점은 투수 혼자의 것이 아니라 투수+수비수의 것입니다.  따라서 팀평균자책점을 기준으로 야구가 투수놀음인가를 논하면 이것은 명백하게 투수의 역할과 비중을 과대평가하게됩니다.


더 큰 문제는 팀의 공격력을 팀타율로 측정하는데서 옵니다.  

이제 점점 기본상식으로 자리잡아가는 야구이론은 타율은 팀의 공격력 즉 득점능력을 설명하는 좋은 스탯이 아니라는겁니다.  팀공격력(=득점력)에 영향을 미치데 있어서 타율은 출루율보다 못하고, 출루율은 장타율보다 못하며, 장타율은  OPS(출루율+장타율) 보다 못합니다.  

---  타율 < 출루율 < 장타율 <  OPS

 

우리가 비교적 자주 사용하는 공격스탯 중 타율은  팀 공격력과 가장 상관관계가 떨어지는 스탯이라는 뜻입니다.  반면 평균자책점은 투수의 능력 뿐 아니라 야수의 수비능력까지 반영된 스탯이기 때문에 팀의 종합적인 수비력(=실점억제력)을 아주 잘 설명하는 스탯입니다.  팀평균자책점은 사실 팀 평균실점과 거의 90% 이상 일치합니다.  왜냐하면 비자책 상황의 실점을 제외한다면 팀평균자책점=팀실점 이기 대문입니다.  


통계적인 테스트결과에서도 KBO  22시즌에서 타율-승률 상관관계의 R^2 값은 0.2805로 득점-승률의 0.3749보다 휠씬 낮습니다.  반면 평균자책점-승률의 R^2는 0.365 로 실점-승률의 R^2 0.367 과 거의 비슷합니다.  따라서 당연하게도 타율-승률의 R^2 0.2805과 비교하면 평균자책점-승률의 R^2 즉 상관관계가 휠씬 높습니다.  그러니 팀타율과 팀평균자책점을 비교하면 후자가 명백히 팀 성적에 대해서 높은 상관관계를 나타낼 수 밖에요. 


그런이유로, 팀평균자책점과 팀타율을 가지고 투수놀음을 말한다는 것 자체가 어불성설입니다.  팀평균자책점과 팀성적이 팀타율과의 그것보다 휠씬 더 강한 상관성을 가진다는 것은 사실이지만, 이것이 투수와 투수 이외의 팀전력 사이의 비중을 설명하는데 사용되었다는 것은 애초에 넌센스라는 겁니다.


마치 아시아의 1인당GNP와 프랑스의 1인당 GNP를 비교한 후, 싱가폴이 유럽연합평균보다 가난한 나라라고 말하는 것과 같습니다.   이런 비교는 투수의 역할을 명백하게 과대평가하고 잇으며 타자의 역할을 끔찍하게 과소평가하게 만듭니다.



<> 투수력이 팀전력에서 차지하는 비중은 어쩌면 25%에 불과합니다.


반면, 정확히 통제된 분석방법, 즉 팀공격력(득점능력)과 팀수비력(실점억제능력)을 비교할 경우 KBO 22시즌이 결과는 거의 같다고 봐야 합니다.   따라서 야수 수비력을 제외한 투수력의 비중은 적어도 50%보다 한참은 더 작을겁니다.


미국 댈러웨이 대학의 찰스 파빗 교수가 지난 2011년 The Journal of Quantitative Analysis in Sports 에 발표한연구결과에서는 타격45% 투수25% 수비25% 도루5% 로 말하고 있습니다.  이 연구는 1951년부터 1998년까지 48년동안의 MLB 기록을 통계적으로 분석한 결과입니다.   (타격+도루=득점능력=50% 이고 투수+수비=실점억제력=50% 이니까 이 글에서의 22시즌 동안의 KBO 케이스 분석과 일치합니다.  다만 타격과 도루의 비중, 투수와 수비의 비중은 이 글에서 논외입니다)

 

다만 이 분석은 MLB의 경우를 대상으로 하는 통계분석에 의한 것이기 때문에, 동일한 야구를 하고는 있지만 KBO 처럼 다른 리그에서는 다소 다른 결과가 나올 수도 있습니다.  

예를들어 MLB의 리그 평균 장타율은 명백하게 KBO의 그것보다 높습니다.  이런 점은 동일한 플레이에 대한 득점가치 같은 것이  MLB와 KBO 사이에서 아주 크게는 아니더라도 달라질 수 있다는 가능성을 말합니다.  

특히 이런 부분은 한국의 세이버매트리션 또는 그 지지자들이 MLB의 통계적 결과를 근거로 디자인된 스탯들을 그대로 적용하는 데 중요한 유의사항입니다.  물론 결정적인 차이가 없을 가능성이 더 높지만요.  

 

이상의 결론은 다음과 같습니다. 

1) 팀타율에 비해 팀평균자책점은 승률에 대해 휠씬 큰 상관관계를 가진다.

2) 팀타율은 공격력의 아주 일부만을 설명하며, 팀평균자책점은 투수력보다 휠씬 더 많은 것을 설명한다.

3) 팀득점-승률, 팀실점-승률의 상관관계는 거의 비슷하다.  다만 22시즌의 분석결과 아주 근소하게 팀득점의  상관관계가 더 강했다.  (통계학적으로 의미있는 차이는 아니다)

4) 야구는 투수놀음이다 라고 하는 것은 사실이 아니다.  적어도 그렇다고 볼만한 근거는 없다. 

5) 팀타율과 평균자책점을 가지고 야구가 투수놀음이라고 말하는 것은 멍청하고 부정확한 논리이다. 

  

 

<> 역대 22시즌 동안,  타격의 팀, 수비의 팀, 완벽한 팀  

 

이제 좀더 체감할 수 있는 사례 즉 22시즌 동안의 팀 순위를 타율과 평균자책점이 아니라 팀득점과 팀실점이라는 스탯으로 다시 살펴보겠습니다. 

 

순위는 페넌트레이스 순위입니다.  득점 실점 데이터를 페넌트레이스에서 추출한 것이기 때문에 그로 인한 결과는 포스트시즌 결과를 반영한 KBO 해당 시즌의 최종순위가 아니라 페넌트레이스 승률로 매긴 정규시즌 순위로 해야 맞습니다.

 

왼쪽 세로방향이 해당 시즌의 득점(실점)순위이고 가로방향이 시즌 최종순위입니다.


득점 1위를 기록한 팀이 시즌 1위를 차지한 경우는 10번이고 실점(최저기준) 1위팀이 1위가 된 경우가 13번으로, 실점 1위팀이 시즌 1위인 경우가 더 많았습니다.  득점 1위팀이 시즌 3위 이내에 든 경우는 18번으로 실점1위팀이 3위 이내에 들었던 경우 19번과 거의 비슷합니다.  여기까지보면 1위 또는 3위 이내의 상위랭크 확율은 실점1위 팀 쪽이 19>18 로 약간이지만 높습니다.  

 

반면 득점 3위 미만의 팀이 정규시즌 우승을 한 경우는 한번도 없었습니다.  대신 실점 3위 미만의 팀은 22시즌 중 4번이나 우승을 했습니다.  이러 면에서는 좋은 성적을 내는데 득점이 더 중요했습니다.


실점 1위팀의 22시즌 동안 평균순위는 1.86으로 득점 1위팀의 2.05보다 약간 더 좋습니다.  대신 득점 실점 2위팀의 평균순위는 2.50 으로 실점 2이팀 평균순위 2.96 보다 더 좋습니다. 

 

공격의 팀

- 팀실점 6위를 하고서 우승을 했던 팀은 2003현대였습니다.  그해 4위 SK, 8위 롯데를 제외하고 모든 팀이 현대보다 실점이 적었지만 타율1위, 홈런2위, 팀득점 2위로 우승을 차지했습니다.  

- 팀실점 4위로 우승을 했던 3개의 팀은 1995OB, 2002삼성, 2006삼성 입니다.


수비의 팀

- 팀득점 3위로 우승한 팀은, 1990엘지, 1991해태, 1992빙그레, 2010SK,  2011삼성 이렇게 5개 팀입니다.  

- 팀득점 순위가 3위 아래였던 팀이 우승한 적은 22시즌 동안 한번도 없었습니다. 


가장 완벽했던 팀

- 가장 완벽한 공수밸런스로 우승을 차지한 팀 즉 득점과 실점 모두 1위를 하면서 시즌 1위를 기록한 팀은, 1994신바람LG, 1998현대, 2007SK, 2009SK, 2012삼성 이렇게 5개 팀입니다. 

- 그런데 2009SK는 공식기록에서 정규시즌도 1위가 아닙니다.  무승부를 패배로 간주한 기묘한 룰 때문에 승률계산에서 기아에 밀려 정규리그 2위가 되었고 한국시리즈에서도 패배합니다.

- 더구나 득점과 실점 뿐 아니라 평균자책점, 타율, 홈런까지 팀순위에서 모두 1위를 차지한 22시즌 동안의 유일한 퍼펙트팀이었는데도 말입니다.  94LG는 홈런4위, 98현대는 홈런2위, 07SK는 팀타율4위, 12삼성은 홈런3위로 퍼펙트팀은 아닙니다.  

- 2009SK는 KBO 22시즌 (전후기시즌 및 양대리그 시즌 제외) 동안 가장 완벽했던 팀이면서 동시에 가장 불운한 팀입니다.  또 득점과 실점에서 모두 최고였던 5개 팀중 한국시리즈 챔피언이 되지 못한 유일한 팀입니다.  

  


결론은?  팀의 성적에 있어서 공력력과 투수력을 포함한 수비력의 비중은 거의 같습니다.  오히려 야구는 투수놀음이라는 말과 정반대로 수비력이 약한 팀이 우승할 수는 있어도, 공격력이 약한 팀은 우승할 수 없다고 말해도 좋을 정도입니다.  


야구는 투수놀음이 아닙니다.  그렇게 말하고 주장할 때 나름 참조했던 통계적인 증거조차 잘못 사용된 것입니다.  야구에서 공격력고 수비력의 비중은 거의 50:50 입니다.  그리고 투수력이 차지하는 비중은 확실하진 않지만 25%-40% 사이일 것 같습니다.  


 MLB를 기준으로는 25% 정도라고 하는 연구결과가 있긴 하지만 KBO에서도 같을지는 미지수입니다.  이것은 메카닉의 해명이 아니라 통계적인 결과의 해석이기 때문에 선수들의 능력치 분포 형태가 다른 리그에서 똑같이 적용할 수는 없을 것입니다. 

또 그 분석의 정확한 가정과 모델을 알 수 없기 때문에 무조건 옮다고 보기는 어렵습니다.  다만, 세이버매트리션의 성향상 명확하게 설명되지 않는 불확실성을 일단 배제하는 태도가 마찬가지로 적용되었다면 투수력의 비중을 다소 과소평가했을 가능성은 높다고 생각합니다.  예를들어 BABIP를 결정하는 요인은 다소 명확하지 않습니다.  하지만 투수가 그것을 통제하는 범위가 알려진 것보다 혹은 확인된 것보다 좀더 클수도 있습니다.  

만약 투수의 역할이 25%라고 하는 연구결과가 BABIP 같은 것들을 투수중립적으로 간주하고 계산한 것이라면 실제 투수력의 비중은 25%보다 클 것이라고 생각합니다.  

 


<> 허술한 그러나 흥미있는 아이디어 : 2013 한국 프로야구의 머니볼 가능성


또 한가지 아주 중요한 것이 있습니다.  공격력과 수비력의 비중이 아니라, 투수와 야수의 비중으로 본다면 투수=투수력 vs 야수 = 야수수비력 + 타격 + 도루 가 됩니다.  그렇다면 투수와 야수의 팀 성적에서의 비중은 최소한 야수쪽이 60% 어쩌면 75%가 됩니다.   이것이 흥미로운 것은 또다른 한국형 머니볼의 가능성 때문입니다.


아시다시피 머니볼은 스몰마켓팀 오클랜드가 부자구단인 양키스나 레드삭스에 비해 휠씬 적은 비용으로 대등한 혹은 더 나은 성적을 거두는 과정을 설명합니다.  그 핵심은 출루율과 장타율에 대한 발견!!!에 잇었습니다.   즉 팀 승리에 공헌하는 면에서 보면, 타율이나 주루능력보다 출루율과 장타율의 역할이 휠씬 큽니다.  


*** 머니볼의 기반이 되었던 이와 같은 핵심 명제도 이 글이 하고 있는 분석처럼 통계적인 결과를 가지고 각 전력요소와 승률 사이의 상관관계를 선형회귀분석한 결과로 얻은 것이란 점을 상기할만 합니다.


반면, 당시의 야구판에서는 타율이 높고 도루능력이 있는 선수들에 비해 출루율과 장타율이 높은 선수들의 가격이 싸게 매겨져 있었습니다.  준족의 똑딱이 타자들은 비싸지만 팀 승리에 공헌하는 바가 적고, 느리고 타율은 낮지만 볼넷을 잘 고르고 틈틈히 뜬금포를 쳐대는 타자들은 값이 싸다는 거죠.  

그래서 오클랜드이 GM 빌리빈 선생은 이런 선수들을 모아다가 좋은 성적을 낸 것이 머니볼이라 불리게 되었습니다.  즉 가성비가 좋은 선수를 사라!!!


하지만 이제는 출루율과 장타율 즉 OPS를 기준으로 팀을 구성하는 것은 머니볼이 아닙니다.  왜냐하면 지금은 OPS가 높은 선수들이 가장 비싸게 되었으니까요.  따라서 머니볼이란 그리고 머니볼을 통한 성공이란, 알려져 있지 않은 그러나 야구를 지배하고 있는 어떤 전략적 요소를 먼저 알아내고 그것을 팀 전력 구성에 사용해서 이득을 보는 것을 말합니다.  


그런데, 한국의 경우는 어떤가요?  모두가 다 야구는 투수놀음이라고 말하고 믿고 있습니다.  실제로 MLB와 비교해서 한국의 경우 투수가 타자보다 높게 평가되며, 특히 마무리투수에 대한 가치가 상대적으로 더 높다는 이야기를 들으신 적 있을겁니다.   즉 투수는 그들이 팀 승리에 기여하는 바에 의해 더 높은 가격이 매겨져 있고 반대로 야수들은 반대입니다.    


그렇다면 2013년 현재 한국에서 성립할 수 있는 머니볼 케이스가 존재한다는거죠.  즉 팀승리에 더 많은 기여를 하지만 상대적으로 저평가된 타자=야수 를 우위에 두고 팀구성을 할 수 있을겁니다.


물론 이런 아이디어는 여러가지 보완적인 분석을 더 필요로 합니다.  하지만 만약 팀 운영에 있어서 통계적으로 분석된 투수의 승리기여도 대비 평균연봉이 타자의 그것보다 확연하게 높은 수준에서 형성되어 있다면 정말로 한국야구에서 적용가능한 머니볼 모델이 성립할 가능성이 없는건 아닙니다.  

물론 대기업의 스폰서쉽에 의존하는 한국의 프로구단들이 이런 효율성에 대해 얼만큼 진지하게 관심을 가질지는 좀 다른 문제지만 말입니다.  게다가 실제로 오클랜드의 팬들이 그런것처럼, 여전히 전통적인 시선으로 야구를 바라보는 많은 팬들이 승리를 만드는데는 더 유리하지만 조금 꼴사나운 팀 운영전략을 지지하기가 쉽지 않은 면도 있을겁니다.  


여하튼, 야구는 투수놀음이 아닙니다.  투수가 팀 전력에서 차지하는 비중은 작으면 25% 아무리 많아도 40%를 넘지는 않을겁니다.  적어도 통계적으로 그러했으며, 그 통계에 기반한 예측모델로 도출한 가설들은 거의 대체로 현실과 일치했습니다.






댓글
  • 프로필사진 br 열심히 분석해주신 글 잘 읽었습니다!!
    야구에 대해 많이 모르고 있었는데 많이 배워가요~~
    떠도는 소문이 다 진실은 아니었네요!!
    페이스북에 담아갈게요~~
    2015.08.09 20:06 신고
  • 프로필사진 수급 좋은 투수가 부족한 한국 리그 실정상 실제 투수의 비중과 조금 다르게 투수가 귀한 대접받는것도 이해 못할것은 아닙니다. 타격+주루와 투수+수비력이 동급이라는것은 공감합니다. 야수가 타격 주루 수비까지 다 하니 절반 이상이네요 2015.09.17 11:16 신고
댓글쓰기 폼