티스토리 뷰


KB리포트에 이어 스탯티즈가 서비스를 시작했습니다.  척박했던 환경이 점점 달라지는 것을 느끼며 기쁩니다.  


스탯 사이트가 오픈되면 팬들이 가장 관심있어 하는 것은 어쩔 수 없이 “줄세우기”입니다.  객관적인 지표에 근거해서 선수들의 득점, 승리기여도를 측정하는 것이 나쁘다 하긴 어렵지만, 어떤 종류의 지표든 늘 오차와 왜곡의 여지를 가지고 있습니다.


WAR은 포지션, 시즌 등등의 차이를 보정해서 모든 선수를 하나의 척도로 평가할 수 있다는 장점이 있어 많이 선호되지만 그러나 동시에 가장 오차와 왜곡의 여지가 큰 지표 중 하나이기도 합니다.  흔한 오해와 달리 WAR의 장점은 “정확도”가 아니라 “종합지표”라는데 있기 때문입니다.


수비퍼포먼스를 정확하게 측정하는 방법은 애당초 raw-data의 문제이기 때문에 우선 보류한다면 정확도에 영향을 미칠 수 있는 것은 크게 2가지입니다.  (그밖에 대체레벨 문제도 있긴 하지만 그건 다른 기회에 다루겠습니다)


객관적인 WAR 계산을 위해 전체


첫째, 타격이벤트에 대한 정확한 런밸류 계산 문제입니다.

런밸류를 계산하는데는 보통 2가지 방법이 있습니다.  하나는 좀더 정통적인 방법으로, 해당 시즌의 RunExpectacy와 RunValues를 play-by-play 데이터 기준으로 계산한 후 적용해주는 것입니다.   다른 방법은 해당 시즌의 1H,2H,3H,HR,BB,HBP 를 대입해서 추정치를 구하는 방법입니다.


최근 시즌의 경우 PBP데이터가 기록되었기 때문에 전자의 방법을 적용하는 것이 더 나을 수 있지만 이럴 경우 일관성 문제가 생길 수 있습니다.  


좀 딜레마인데, 최근 시즌에만 PBP 기반으로 구한 좀더 정확한 값을 적용할 것이냐, 아니면 전체 시즌의 일관성을 위해 추정치 계산공식으로 구한 값을 사용할 것이냐 문제가 됩니다.  게다가 추정치 계산방법이 MLB의 득점환경을 기준으로 만들어진 수식이다보니 그걸로 KBO 런밸류를 계산할 때 생기는 오차도 좀 거슬리는 문제입니다.


둘째는 수비 포지션에 따른 보정상수 계산의 문제입니다.  WAR에서 포지션 보정상수는, 각 수비포지션의 수비난이도 차이를 고려하기 위한 것인데 예를들어 유격수는 수비난이도와 중요도 때문에 공격력이 약한 경우가 많고 1루수나 지명타자는 그 반대입니다.  MLB의 경우 162경기 스케일에서 수비난이도가 가장 낮은 1루수가 -12.5점, 포수 다음으로 수비난이도가 높은 유격수가 +7.5점으로 사용됩니다.  


포지션 조정상수에 대한 오해 


포지션 보정값은 그 선수의 주력 포지션에 따라 무조건 적용되는 것은 아니고 실제 수비출전이닝에 비례해서 적용됩니다.  만약 162경기의 수비이닝 중 절반을 출전한 유격수라면 +7.5점의 50% 인 +3.75점이 적용됩니다. 


그런데 종종 있는 오해와 달리 포지션 조정상수는 그 선수의 수비능력과는 전혀 관계가 없습니다.  수비능력을 측정한 것이 아니라 수비포지션에 따른 공격력 격차를 조정해주기 위한 것입니다. 그래서 포지션 조정상수로 조정한 WAR 이라도 여전히 공격WAR입니다.


그런데, MLB와 KBO는 선수들의 신체적 능력이나 특성이 좀 다릅니다.  리그의 득점환경도 좀 다르고 출루, 장타, 주루 성향이 다릅니다.  따라서 포지션에 대한 합리적인 조정상수값이 서로 다를 수 있습니다.   이것은 해당 리그 선수풀의 희소성 차이인데, 예를들어 MLB에서는 좌익수와 우익수의 수비난이도를 동등하게 봅니다.  하지만 KBO의 경우 외야수의 송구능력은 휠씬 희소성이 높은 스킬입니다.  우익수와 좌익수 두 포지션의 수비난이도가 달라질 수 있다는 뜻입니다.


KBO 포지션 플레이어의 공격력 분포


다음은 2010년부터 2015년까지 전체 타석에 대해서 각 포지션 플레이어들의 공격 기여도 결과입니다. 


지표는 공격기여도wRAA인데, 리그평균에 비해 플러스 득점기여도입니다.  3루수는 +5.4점인데 이는 기간 중 전체 평균에 비해 3루수로 출전했던 선수들은 한 시즌(144경기 기준) 동안 +5.4점의 플러스 득점기여를 했다는 뜻입니다.



MLB의 조정상수는 각 포지션 공격력에서 DH > 1B > LF=RF > CF=2B=3B > SS >CH 를 전제로 하는데, 2010-2015 기잔 중 KBO 포지션 플레이어들의 공격력 분포는 1B > DH > LF > 3B > RF > CF > 2B > SS > CH 순서입니다.


개연적으로 생각했던 것과 비슷한 면도 다른 면도 있습니다.  그중 특이사항들은 다음과 같습니다.  


- 포수와 유격수의 평균적인 공격력이 매우 낮습니다.  MLB의 포수 포지션 조정값보다 더 낮습니다.

- 1루수 공격력이 매우 높습니다.  MLB 조정상수 이상입니다.

- MLB에서는 동등한 조정값을 부여하는 우익수와 좌익수, 2루수와 3루수의 격차가 꽤 큽니다.


KBO 선수에 대한 WAR 계산에서 그동안은 보통 MLB의 값을 그대로 사용해왔습니다.  다음은 한 스탯 사이트의 조정상수 테이블입니다.



KBO에 맞게 조정한 값이라고 말하고 있긴 하지만, 실제로는 162경기 스케일의 값을 128경기 스케일로 환산한 것 뿐입니다.(MLB값*128/162)  즉 각 포지션 플레이어에 대한 선수 희소성은 전혀 고려되지 못했다는 뜻입니다.


정확한 WAR 측정을 위한 수비포지션 별 조정상수 값은 장기적으로 해당 리그의 포지션별 공격력과 일치해야 합니다.  개념상 WAR의 포지션 조정상수는 수비난이도의 차이라고 설명되긴 하지만 정확하게 말한다면 해당 포지션의 수비난이도 때문에 생기는, 공격력 희소성입니다.   


따라서, 단기적으로는 특정한 선수에 의해 특정 포지션 공력력이 예외적으로 높거나 낮아지기도 하지만 각 포지션의 평균적인 공격력은 포지션 전환의 수요-공급 논리에 의해 수비난이도와 비슷한 수준으로 수렴하게 될 것입니다.  반대로 긴 기간동안 여전히 포지션별 공격력 격차가 포지션 조정상수와 차이를 보인다면, 조정상수가 정확하지 않다는 뜻이 됩니다. 


그렇게 본다면 정확한 WAR 계산을 위한 포지션 조정상수는 해당 리그의 장기적인 포지션별 공격력 수준에 맞게 결정되는 것이 합리적입니다.  


2010년부터 2015년까지의 6시즌 동안의 통계가 충분한 안정성을 갖고 있느냐가 관건이지만, 만약 그렇다고 가정할 경우 KBO에서 WAR의 포지션 조정상수는 다음의 몇가지 방향을 향해 결정될 필요가 있습니다.


1. 포지션별 조정상수가 더 큰 격차로 디자인될 필요가 있습니다.  


144경기 스케일의 공격력 격차가 포수 -15.5점, 1루수 13.4점 이기 때문에 162경기 스케일의 MLB 값보다 오히려 더 큽니다.  MLB와 비교해서 선수층이 매우 얇기 때문에 이로 인해 잘하는 선수와 그렇지 못한 선수의 수준차이가 더 커지기 때문일 수 있습니다.  또 외국인 타자들의 주력 포지션이 1루수인 것이 영향을 주었을 수도 있습니다.  여하튼 이런 것도 결국 KBO의 리그특성입니다.


2. 우익수 조정상수는 좌익수보다 더 높아져야 합니다.  


이 부분은 앞서도 잠깐 이야기한 것처럼 아시아 선수들의 피지컬 특성으로 생기는 차이일 것 같습니다.  강견 외야수의 희소성에서 차이가 있으니까요.  


3. 3루수 조정상수는 2루수보다 낮아져야 합니다. 


MLB에서 2루수와 3루수는 똑같이 +2.5점으로 부여하는데, KBO에서 이 두 포지션의 공격력에서 무려 9점 차이가 납니다.    


참고로 2010년부터 2015년까지 각 시즌의 포지션별 공격력 변화입니다.



포수의 경우13-14년의 공격형 포수 실종, 1루수는 최근 2년동안의 테임즈, 박병호의 몬스터급 활약, 2루수는 14시즌 서건창, 나바로 투톱의 질주 정도가 두드러지는데, 결국 6시즌 전체의 평균 속에서 대략 상쇄된 것 까지를 고려한다면 이런 요인들이 전체 계산의 정확도에 심각한 영향을 주었다고 보이지는 않습니다.



참고 - 계산방법에 대한 몇가지 전제 


계산은 실제 포지션 플레이를 했던 타석 만으로 합니다.  평소에 우익수로 뛰던 선수라 해도 지명타자 포지션을 가지고 타석에 선 경우는 지명타자 타석으로 계산한다는 뜻입니다.  대타 타석은 아직 수비위치가 결정되기 전이기 때문에 마찬가지로 제외됩니다. 


그밖에 리그전체의 통계이기 때문에 파크팩터 적용은 필요하지 않으며, 시즌마다 각 포지션의 타석수도 거의 동일하기 때문에 시즌 득점환경 보정도 생략합니다. 


일반적인 wRAA계산방법과 약간 달리한 것도 있었습니다.  


wRAA는 보통 wOBA를 먼저 계산한 후 다시 환산을 하게 되는데, 이 포스팅에서는 굳이 wOBA값이 필요하지 않았기 때문에 타격이벤트 횟수와 타격이벤트 득점가중치를 곱해서 직접 wRAA를 계산합니다.  몇가지 차이가 더 있는데

1) wOBA는 IBB를 아예 배제하고 계산하지만 여기서는 IBB를 BB와 다른 IBB 고유 가중치를 적용해서 포함시킵니다.

2) wOBA는 SO와 나머지 아웃카운트를 구분하지 않고 계산하지만 좀더 정확도를 높이기 위해 SO와 인플레이된 타구의 아웃 횟수를 각각의 가중치로 구분해서 계산했습니다.


다만, 이로인한 계산값 차이가 별로 크지는 않을 겁니다. 


댓글
  • 프로필사진 ㅇㅇ 메이저리그에서도 포지션 보정에 대해선 항상 말이 많은 것 같더라고요.
    개인적으론 저쪽도 2루수는 좀 저평가되는 느낌이 들긴 합니다.
    2015.10.16 16:46 신고
  • 프로필사진 삼팬 포지션마다 0.1이나 0.01단위로 조정상수를 높이거나 낮추면서 WAR를 계산해서 상관관계를 일일히 따져보는건 어떤가요? 너무 힘든 작업인가요? 2015.10.16 19:39 신고
  • 프로필사진 토아일당 별로 어려운 작업은 아닙니다. 컴퓨터가 할테니까요. ^^;
    다만, 필요한 작업이 아닌거 같습니다.

    충분히 긴 기간 동안의 데이터라면, 해당 포지션의 평균적인 공격력 수준이 그대로 WAR 포지션 조정상수가 되면 됩니다.

    3루수 포지션의 선수들이 오랜기간 2루수들보다 높은 공격력을 보이고 있음에도 불구하고, 기존 혹은 신규선수들의 포지션 조정과 그로인한 포지션별 평균공격력 수렴현상이 없었다면 ---

    그건 이미 3루수 포지션의 수비난이도와 2루수 포지션의 수비난이도가 같지 않다는 의미입니다. 이런 식의 포지션별 공격력 수준의 평형상태(equilibrium) 가 이루어지는 것이 자연스럽기 때문에,,, 포지션별 공격력 수준이 곧 합리적인 포지션 조정상수 값이 됩니다.

    더구나 WAR 이라는 평가지표의 발상 자체가, 리그의 선수풀의 시대적, 상대적 상태에서 [대체선수]에 해당하는 수준을 기준점으로 측정한다는 것이니 더욱 그렇죠. 말하지만 시장가격 대비 플러스값. 이란 발상이니까요.

    2015.10.18 00:18 신고
댓글쓰기 폼