topic 엘지트윈스 타격 XR RC RC27 타율 타점 세이버메트릭스 박용택 오지환 이진영 손주인 정성훈 이병규 |
타자의 능력을 평가하는 지표로 가장 흔히 사용되는 것은 타율(Batting Average) 입니다. 안타 갯수를 유효한 타석수(=타수, 타석에서 사사구, 희생타 등을 뺀 숫자)로 나눈, 말하자면 안타비율은 가장 오래되고 가장 많이 사용되지만 타자의 가치를 평가하는데 한계가 있다는 지적을 많이 받습니다. 타격이란 결국 득점을 얻어내기 위한 행위라고 했을 때, 높은 타율이 많은 득점 득점을 만들어내는 능력과 상관관계가 의외로 적은 편이기 때문입니다.
타율이라는 지표는, 사사구를 통한 출루를 포함하지 않고 있습니다. 애초에 타율이라는 지표가 고안된 시점에는 볼넷은 타자의 능력이 아니라 투수의 실수로 여겨졌으며 그래서 볼넷과 사구는 오랬동안 타자의 스탯이 아니라 투수의 스탯으로만 사용되었기 때문입니다. 또 타율은 홈런과 단타를 동일한 가치로 평가합니다. 하지만 단타와 홈런 등의 장타는 팀의 득점을 만들어내는데 아주 큰 차이가 있습니다. (홈런은 단타에 비해 약 3배 정도의 득점가치를 가지는 것으로 알려져있습니다. 그리고 볼넷은 단타의 약 65% 정도의 가치를 가집니다)
최근 타자의 능력을 평가하는 지표로 가장 높게 평가받는 것은 OPS입니다. 출루율(OBP)에 장타율(SLG)를 합쳐서 아주 단순하게 산출하는 이 지표는 세이버매트릭스가 고안해낸 가장 잘 알려진 그리고 널리 사용되는 타격지표입니다. 머니볼이라는 새로운 팀 운영전략을 통해 빌리빈의 오클랜드가 2000년대 초반 이루어낸 주목할 만한 성공이 OPS라는 지표의 가치를 증명했고 싼 가격에 효율적인 선수를 산다는 의미에서 비롯된 머니몰이란 말이 무색하게도 이젠 높은 OPS는 이제 타자가 가진 가장 비싼 능력치로 공인되었습니다.
그런데, 타율에 비해 OPS가 득점생산력에 좀더 가까운 지표라는 이유로 좀더 낫다고 여긴다면, [타자의 득점생산력] 자체가 가장 의미있고 유용한 평가지표가 되는 것은 당연합니다. 만약 그것을 타당하게 계산해낼 수 있다면 말이죠.
>>> 다음은, 엘지트윈스의 타자들이 13년시즌(8월26일 현재) 안타, 홈런, 볼넷, 도루, 희생타 등을 통해 얼만큼의 득점을 만들어냈는지 측정한 XR (eXtrapolated Runs) 지표의 현황입니다.
XR(추정득점) 은 짐 퍼타도가 고안한 지표입니다. 다음과 같은 계산식을 통해 구합니다.
XR – Extrapolated Runs =
(.50 × 1B) + (.72 × 2B) + (1.04 × 3B) + (1.44 × HR) + (.34 × (HBP+TBB−IBB)) + (.25 × IBB)+ (.18 × SB) + (−.32 × CS) + (−.090 × (AB − H − K)) + (−.098 x K)+ (−.37 × GIDP) + (.37 x SF) + (.04 × SH)
계산식을 통해 알 수 있듯이, XR 은 1루타, 2루타, 3루타, 홈런, HBP, 볼넷, 고의사구, 도루, 도루실패, 희생번트, 희생플라이, 병살타, 삼진, 삼진이 아닌 범타아웃 각각에 특정한 가중치를 곱해서 모조리 더한 값입니다. 즉 타자가 득점에 관여하는 모든 도움이 되는 혹은 방해가 되는 타격, 주루행위에 가중치를 부여한 선형방정식을 통해 구합니다. XR은 전통스탯인 타점이나 득점과 같은 스케일의 지표입니다. 즉 XR 이 70 이라는 것은 이 타자가 그 기간 중 70점의 득점을 만들어냈다는 뜻입니다. 그렇기 때문에 이론적으로는, 그 팀의 모든 타자들의 XR 값을 합하면 팀 득점과 일치하게 됩니다.
*** 이 계산식의 구조는 첫째, 사용되는 변수의 정류 둘째, 곱해진 가중치의 타당성 두가지로 압축됩니다. 보는 바와 같이 측정가능한 모든 타격, 주루 및 타격실패, 주루실패가 포함되어 있으며 사용된 가중치는 1955년부터 1997년까지의 MLB 경기결과를 토대로 통계분석을 통해 얻은 값입니다.
간접적으로 이 계산식을 통해 각 타격 및 주루 행위의 득점가치에 대해 참조할 수 있습니다.
단타를 1.0 기준으로 할 때, 2루타는 1..44, 3루타는 2.08 홈런이 2.88 도루가 0.36 희생번트가 0.08 희생플라이(득점할 경우) 0.74 볼넷이 0.68 고의사구 0.5 입니다.
XR 에 대한 짐 퍼타도의 글 - Why Do We Need Another Player Evaluation Method by Jim Furtado - The 1999 Big Bad Baseball Annual
트윈스의 타자들 중 득점기여도가 가장 높은 선수는 63.97점을 만들어낸 박용택이며 그 다음은 56.18점으로 정성훈입니다. 타율이 2할5푼이 채 안되는 불과한 오지환이 55.01 로 세번째라는 것은 주목할 만한 결과입니다.
캡틴 이병규가 46.51 로 팀내 득점공헌도 5위에 머무른 것은 XR 이 타율이나 출루율과 같은 비율스탯이 아니라 타점이나 홈런 같은 누적스탯이기 때문입니다. 비슷한 퍼포먼스를 보였다고 할 때, 더 자주 타석에 선 선수들이 더 많은 득점에 기여하는 것은 당연한 일입니다.
비율스탯이 선수들의 능력을 측정하는 목적에 더 어울린다면 누적스탯은 결과적인 기여도를 측정하는데 더 잘 맞습니다. 하지만 득점, 타점과 같은 전통적인 누적스탯이 타자 스스로의 기여도보다는 선행타자 및 주자 또는 다음타자의 역할에 크게 의존하고 있기 때문에 한 선수의 독립적인 기여도를 측정하는데 부적합하고 불공평한 것에 비하면 XR 은 다른 선수들의 플레이와 독립된 타자 스스로의 온전한 기여도를 측정합니다. 박용택의 XR 이 63.97 이라는 것은 팀 전체 득점 515점 중 12.5%를 혼자서 만들어냈다는 뜻이 됩니다.
XR 에 대한 유용한 논점은 두가지 입니다.
첫째는 이 지표가 과연 얼만큼 정확하며 합당한가 입니다. 야구란 아주 다양한 상황이 벌어지고 그 가운데서 득점을 얻습니다. 혼자서 플레이하지 않고 팀 타선의 연결을 통해 공격을 이어나갑니다. 그런데, 한 타자가 기록한 스탯에 단순히 가중치를 곱하는 것만으로 얻어낸 값이 과연 얼마나 정확할 수있을까 그것을 한 타자가 만들어낸 추정득점이라고 할 수 있을까 하는 것입니다.
>>> 다음은 엘지트윈스를 포함해서 KBO 9개 팀의 타자 개인별 XR 의 합계와 같은 날짜까지 기록된 팀 득점의 비교입니다.
타자 개인의 안타, 홈런, 도루, 희생타 등 개인 누적스탯에 특정한 가중치를 곱해서 얻은 개인별 XR를 단순 합산했을때 얻어지는 값은 실제 팀 득점값과 약간의 오차가 있긴 하지만 거의 일치하는 것을 볼 수 있습니다. 즉 XR 이라는 지표는 그리고 개인별 누적스탯에 가중치를 부여해서 합산하는 계산식의 구조는 정확도 면에서 충분히 믿을만한 것을 알 수 있습니다.
타격지표 XR 의 두번째 논점은, 그렇다고 해도 단순히 개인의 득점기여도로 타자의 팀 공헌도를 말하는 것이 합당한가 라는 의문입니다. 한점차 승부에서 만들어낸 1점과 큰 점수차로 이긴 일방적 경기에서의 1점은 서로 다른게 아닌가 하는 발상입니다. 물론 이런 문제제기는 당연히 옳습니다. 박빙 승부의 1점과 원사이드한 게임의 1점은 동일한 가치일 수 없습니다. 야구에서 타격이란 더 많은 득점을 얻기 위한 행동이지만 그 득점은 경기에 이기기 위한 목적을 가지고 있으니까요. 하지만 한번의 경기가 아니라 126경기로 이루어진 시즌 전체로 볼 때, 한점차 승부의 득점과 10:0 게임의 득점을 굳이 구분하지 않는 것이 치명적인 오차를 만들어내는 것은 아닙니다.
이제는 많이 알려지고 사용되는 피타고리안 승률 같은 시스템을 볼 때 이런 점을 확인할 수 있습니다. (득점^2+실점^2) / (득점^2) 라는 아주http:// 심플한 계산식으로 구성된 피타고리안 승률식은 실제 팀의 승률과 놀랄만큼 일치합니다. 심지어 실제 승률보다 더 정확하다고 말할 수 있을지도 모릅니다. 왜냐하면 시즌 중반 즈음에 피타고리안 승률과 실제 팀 승률이 격차를 보이는 경우, 경기가 더 많이 치루어지고 시즌 후반으로 향할 때, 팀이 승률은 오히려 중반에 계산했던 피타고리안 승률에 더 가깝게 변화하는 경우가 휠씬 많기 때문입니다.
그렇다면 팀의 승리는 한 경기만 놓고 보면 결정적인 1점 또는 크게 의미없는 1점들로 이루어진 것처럼 보이지만 한 시즌 전체로 놓고 보면 닥치고 많은 득점, 닥치고 적은 득점 이라는 수치 만으로도 팀의 승률 즉 팀의 승패가 거의 설명된다고 말할 수 있습니다. 따라서 XR 이 계산하는 타자 개인의 득점공헌도는 그 자체로 팀 승리를 위한 타자의 공헌도로 간주할 수 있습니다. 모든 통계가 그렇듯이 100% 완전무결하게 일치한다고 말할수는 없겠지만, 적어도 우리가 알고 있고 야구에서 사용되는 어떤 다른 지표 만큼의 혹은 그 이상의 통계적인 설명력과 신뢰도를 가지고 있다고 봐야 합니다.
"닥치고 득실점이다" 에 대한 참조 - 야구는 정말 투수놀음일까? : KBO22시즌 분석
http://blog.naver.com/toanus/60197159823
득점생산력 지표의 발명
타자 개인의 득점기여도를 측정하기 위한 지표는 사실 XR 뿐 아니라 아주 아주 많습니다. 세이버매트릭스의 출발 자체가 야구에 대한 전통적인 관념을 비판하고 극복하는 것에 있었고 따라서 타자 또는 타격이 퍼포먼스를 전통적인 타율, 타점, 홈런과 같은 부정확하고 상황적인 지표가 아니라 좀더 독립적이고 객관적인 지표를 통해 측정하고 평가하고자 하는 것은 당연한 지향점이었으니까요. 유명한 것들만 해도 대략 10가지가 넘습니다.
이중 가장 유명하고 여전히 가장 널리 사용되는 것이 빌 제임스에 의해 고안된 RC Runs Created 입니다. 세이버매트릭스 자체가 그렇듯이 타자의 기여도를 평가하는데 다른 무엇이 아닌 득점생산력이 가장 중요하다는 아이디어 자체가 빌 제임스의 것이기도 합니다. 그는 1985년 발표한 The Bill James Historical Baseball Abstract 라는 책에서 이렇게 말합니다.
"타자를 보는데 있어서 가장 중요한 질문은 바로 그의 방망이와 주루로 인해 몇 점을 만들어 냈냐 이다. 윌리 매코비는 통산 .270의 타율, 353개의 2루타, 46개의 3루타 521개의 홈런을 치고 1345번 볼넷을 얻어냈지만 그의 역할은 2루타, 3루타 혹은 홈런을 치거나 볼넷을 얻어내는 것이 아닌 바로 스코어보드에 점수를 만들어 내는 것이다. 그럼 그 결과로 인해 몇 점을 만들어 낸 것일까?"
그리고 그는 질문에 답하기 위해 RC 라는 지표를 고안해냈습니다. 그래서 짐 퍼타도의 XR 은 빌 제임스의 RC 를 개선한 수정안 쯤 된다고 보면 됩니다.
>>> 엘지트윈스 타자들의 XR, RC, RC/27 의 비교입니다.
*** RC 는 최초 빌 제임스에 의해 고안된 이후 오랜 시간을 거쳐 정확도 등을 개선하고 최초에는 포함시키지 않았던 주루 등에 의한 기여도를 추가하기 위해 아주 여러번 업데이트되었으며 이 글에서는 2002년 버전의 계산식을 사용했습니다.
*** (당연하겠지만) XR 과 RC 는 거의 비슷한 결과값을 산출합니다. 정확도를 비교하기 위해 개인별 XR, RC값의 합계를 실제 팀득점과 비교했을 때도 오차는 거의 비슷했습니다. (XR의 합계 쪽이 아주 근소하게 오차가 더 적습니다)
*** 짐 퍼타도의 XR 과 빌 제임스의 RC 중에서 후자 쪽이 더 널리 사용되는 이유는, RC 가 원조이기 때문이기도 할테지만 실용적으로 RC/27 이라는 변형스탯이 존재하기 때문입니다.
누적스탯으로서 XR과 RC는 결과적인 기여도를 측정하는데는 유용하지만 그럴경우 출장경기가 많고 타석수가 많은 타자가 더 높게 측정되는 것이 당연하기 때문에 서로 다른 출장기회를 가진 타자들의 기여도를 비교하기 위해서 비율스탯이 필요해지고 RC/27은 그것을 위해 고안된 지표입니다.
야구란 경기는 27개의 아웃카운트를 담보로 공격을 행하는 게임인데, 그래서 RC/27 은 특정한 타자가 팀의 모든 타석에 들어설 경우 팀이 얼만큼의 득점을 만들어낼 수 있을 것인가로 환산한 지표입니다. 투수의 평균자책점이라는 지표가, 그 투수가 한 경기 9이닝을 던졌을 때 얼마를 실점할 것인가로 환산해서 지표의 직관성을 높인 것처럼, RC/27 은 그와 동일한 능력의 타자들로만 팀을 구성했을때, 한 경기당 얼만큼의 득점을 만들어낼 수 있을것인가로 환산한 지표라고 보면 됩니다. 트윈스에서 RC/27이 가장 높은 타자는 7.86 을 기록한 이진영입니다. 9명의 타자가 이진영과 동일한 능력을 가진 팀은 한 경기당 7.86점을 얻을 수 있습니다. 이 팀의 리그 평균수준의 실점을 허용한다고 할 경우, 약 0.800 정도의 승률을 기록할 걸로 보입니다.
>> 트윈스 타선의 빅4 - 이병규, 이진영, 박용택, 정성훈
캡틴 이병규가 아니라 이진영이 가장 득점생산력이 높은 타자인 것은 그의 타율 0.352 가 9병규 0.369 보다 낮고 장타율도 0.461 로 캡틴의 0.487 보다 낮지만 출루율에서 0.421 > 0.401 로 높고, 더 많은 도루 (5성공 2실패 > 1성공 2실패)를 성공시켰으며, 더 적은 병살타 (진영 3 < 병규 6) 를 기록했기 때문입니다.
XR과 RC에서 박용택에 이어 팀내 두번째 득점생산력을 기록한 정성훈은 RC/27 에서는 6.76 으로 박용택에 근소하게 앞서는 팀내 4위입니다.
>> 다크호스 작뱅
작뱅은 출장경기수가 적은 이유로 누적스탯인 XR, RC 에서는 하위권이지만 비율스탯으로 환산한 RC/27 에서는 9병규에 약간 뒤지는 7.11 로 팀내 2위에 오릅니다. 7.11 이라는 RC/27 수준은 100타석 이상 기록한 리그 타자 116명 중 11위에 해당하는 압도적인 성적입니다. 9위 SK박정권과 10위 삼성 최형우 바로 다음 순위이며, 두산 김현수, 한화 김태균이 그보다 낮은 순위에 있습니다. 7병규가 비슷한 RC/27 순위의 경쟁자들보다 OBP에서 상당히 높은 편이긴 하지만 상대적으로 낮은 SLG 로 인해 OPS가 최상위권은 아님에도 불구하고 RC/27 이 높은 이유는 병살타가 한개도 없기 때문인거 같습니다. 병살타를 RC/27 계산해서 제외할 경우 7병규의 리그 RC27 순위는 18위로 떨어집니다. (그래도 여전히 높은 순위네요)
>> unsung hero 오지환, 손주인, 권용관
비율스탯인 RC27 에서도 오지환의 성적이 그리 나쁘지 않은 것도 유의해서 볼만한 결과입니다. RC27 값은 리그 평균득점 수준과 비교했을 때 그 차이로 평가할 수 있습니다. 2013시즌 현재 KBO의 리그 평균득점은 대략 4.8점 정도 입니다. 따라서 거의 전경기를 출전하면서 4.98 로 리그평균보다 높은 RC27 을 기록하고 있는 오지환은 적어도 공격력 면에서 리그 평균 이상의 타자입니다. 유격수가 포수 다음으로 낮은 공격력만 요구하는 수비 포지션인 것을 감안하면 그리 나쁘지 않은 성적이라고 해도 좋습니다. 낮은 타율과 출루율에도 불구하고 상대적으로 높은 장타율, 22개의 도루(실패 7), 타석수에 비하면 많지 않은 병살타, 평균 이상의 희생타와 희생플라이 덕분입니다. 손주인과 권용관의 XR 및 RC27 수치도 비교적 무난한 편입니다. 적어도 리그 평균 수준의 공격력을 보여주었습니다.
>>> 참고로 2013년 8월 26일 기준, 득점생산력 기준의 KBO 탑50 타자입니다. 기준은 XR 이며, 참고로 RC27 과 중요 타격스탯을 함께 붙입니다.
*** RC27와 타율, OPS 의 비율스탯은 규정타석이 아닌 200타석 이상의 타자들을 대상으로 순위를 정했습니다. XR 이 누적스탯이기 때문에 적은 타석기회에도 불구하고 50위 안에 들었다면 그 선수의 비율스탯을 무의미하다고 배제할 필요는 없었기 때문입니다.
앞에서도 말했듯이 XR 은 누적스탯입니다. 대상이 되는 타자들을 동등한 조건에서 비교하기보다는, 실제 치루어진 경기에서의 결과적인 기여도를 측정할 수 있습니다. 이것은 어떤 면에서 공평합니다. 더 많은 경기에 출전해서 더 많은 득점기여 타격행위를 한 선수가 높게 평가되기 때문입니다. 더구나 XR 은 타자가 타석에서 빼앗긴 아웃카운트를 마이너스하는 지표입니다. 따라서 무조건 많은 타석에 들어서는 것만으로 높은 수치를 기록할 수 없습니다. 그런 이유로 우리가 알고 있는 스탯 중, 팀에 대한 기여도, 공헌도를 측정하는데 가장 어울리는 지표라고 해도 좋습니다.
반면 타석수 등을 기준으로 조정된 RC27 은 비율스탯에 가깝습니다. (다만 타율이나 출루율처럼 완전한 상태의 비율스탯이라고 하기에는 오차가 좀더 클 수 있습니다. 이미 RC 계산식 자체가 일대일 대응의 선형식에서 너무 많이 벗어났기 때문에 어쩔 수 없는 결과입니다.) 따라서 RC27 순위는 높지만 XR 순위가 낮은 타자들은 출장경기수가 적고 타석수가 적은 선수들입니다.
타자의 능력을 설명하는데 가장 유효한 스탯으로서의 OPS는 타율 뿐 아니라 출루능력, 장타능력을 포함하고 있지만, 주루능력이나 희생타 같은 situational batting 능력을 충분히 설명하지 않습니다. 반면 XR 은 도루와 도루실패, 희생타, 희생플라이, 병살타, 삼진에 의한 아웃과 타격 후의 아웃의 차이 를 고려하고 있으며 따라서 OPS와 XR 의 차이는 타격기회의 차이 뿐 아니라 이런 평가대상의 차이로부터도 생겨납니다.
* RC27 에비해 XR 이 높은 타자들 : 최형우, 김현수, 이호준, 박용택, 강정호, 홍성흔, 오지환, 이승엽, 황재균 등. 이들은 한 경기에서의 퍼포먼스는 떨어지지만 꾸준하고 많은 출장을 통해 팀의 공격력에 기여한 타자들입니다. 흔히 사용하는 비율스탯은 이들을 과소평가합니다. 다만 이들의 대체선수가 이들보다 나은 비율스탯을 기록할 수 있었다면 좀 다를 수는 있습니다.
* RC27에 비해 XR이 낮은 타자들 : 채태인, 박정권, 이진영, 이병규, 신종길. 이들은 부상 등의 이유로 출장경기수가 적지만 매우 효율적인 타격 퍼포먼스를 기록한 선수들입니다. 규정타석 미달의 장외타격왕 경쟁을 하고 있는 채태인, 이진영, 9병규가 여기 포함되어 있는 것은 당연합니다.
* 타율에 비해 XR이 높은 타자들 : 최형우, 이호준, 나지완, 강정호, 김종호, 김민성, 오지환, 이범호, 오재원, 강민호, 이성열. 이들은 장타능력 또는 출루능력에서 탁월한 퍼포먼스를 보인 선수들입니다. 대체로 타율에 비해서 OPS가 높은 타자들이 여기에 많이 속합니다.
* OPS에 비해 RC27 이 낮은 타자들 : 강정호, 이범호, 김민성, 김강민, 이성열. 이들은 OPS에 포함되지 않는 공격행동들, 즉 주루플레이, 희생타와 희생플라이, 병살타 등에서 상대적으로 약점을 보였던 선수들입니다.
* OPS에 비해서 XR 및 RC27 이 높은 타자들 : 손아섭, 박용택, 김종호, 정근우, 배영섭, 이용규, 박한이. 이들은 주루플레이와 희생타, 희생플라이,병살타 등 OPS와 같은 일반적인 타격스탯에는 반영되지 않는 공격행동에서 기여도가 높았던 선수들입니다.
XR 또는 RC와 같은 득점생산력 관련 지표들에서 배울 수 있는 흥미로운 통찰은 다음과 같은 것들입니다.
1. 야구는 아주 복잡하고 상황 의존적인 게임이지만 일련의 통계적이고 수학적인 분석을 통해 각각의 플레이가 팀 득점에 미치는 영향을 구분해서 측정할 수도 있다.
2. 한명의 타자가 공격부분에서 기여하는 득점을 측정할 수 있다는 것은 그로인해 몇번의 승리를 더 거둘 수 있는지도 측정할 수 있다는 뜻이다. 즉 팀이 리그 평균수준의 실점을 허용한다는 가정을 둘 경우, 타자 한명이 얻어내는 리그 평균을 초과하는 득점은 곧 일정한 승수로 계산될 수 있다. 이 계산의 정확성은 통계적으로 어느정도 신뢰할만하다. (이 발상을 통해 RC 의 아이디어는 WAR Wins Above Replacement 로 발전했습니다.)
3. 출루, 장타, 주루, Situational Batting 같은 질적으로 서로 다른 타격행위들도 득점기여도 라고 하는 하나의 통일된 목적을 염두에 둔다면 통계적으로 신뢰할만한 기준으로 비교될 수 있다.
이 모든 것과 함께 강조하고 싶은 것이 하나 더 있습니다. XR 이나 RC 와 같은 누적스탯과 RC27, OPS 와 같은 비율스탯의 차이입니다. 많은 경우 우리는 누적스탯보다는 비율스탯을 좀더 믿을만하고 유용한 지표로 여깁니다. 특히 전통적인 스탯 범주에서 누적스탯인 타점, 득점 등이 워낙에 상황의존적인 지표였고 그래서 설명력이나 공평함이 결여되어 있기 때문에 자연스럽게 생겨난 시각인 면도 있습니다.
하지만 그것은 타점이나 득점이라는 지표가 가진 결함이지 누적스탯이라서 생긴 결함은 아닙니다. 그런 이유로 XR 과 같은 지표는 관심을 가질만한 가지가 있습니다. 누적스탯이면서도 상황의존적이 아니라 플레이어 개인의 성과를 측정하고 있고 상당하게 높은 객관성과 정확성을 가지고 있기 때문입니다.
비율스탯도 사실은 누적스탯과 마찬가지로 '능력'에 대한 지표가 아니라 '실적'에 대한 지표일 뿐입니다. 다만 서로 다른 기회를 중립화시켜 비교 가능하게 만들었을 뿐입니다. 과거의 좋은 실적이 미래의 나은 결과로 연결될 가능성이 높은 것은 사실이며, 미래를 미리 알 수 없는 한에 지나간 실적을 근거로 미래를 예측하려하는 것은 어쩔 수 없는 일입니다. 하지만 미래에는 늘 또다른 변수가 생겨난다는 것도 당연한 일입니다.
서로 다른 기회와 상황에 놓인 실적을 비교가능하게 만들어주는 비율스탯의 유용함으로 인해 우리는 종종 비율스탯이 실적이 아니라 능력을 설명한다는 오해에 빠집니다. 하지만 공평함을 위한 시도가 또 다른 불공평함이나 부당함을 낳는 것은 세상 일이나 야구의 지표나 비슷합니다. 더 객관적이라 여기기 때문에 과도한 신뢰성이 부여됩니다. 즉 비율스탯은 지나간 실적이 아니라 고유하고 영속적인 능력이라고 확대 해석하게 만든다는 것입니다.
더구나 비율스탯은 누적스탯과 달리, 통계적인 신뢰성을 가질 때만 유효합니다. 하지만 많은 경우 이 부분이 의도적으로 혹은 무의식적으로 무시됩니다. A라는 타자가 B 라는 투수를 상대해서 1개이 홈런을 쳤다는 것은 말 그대로 있는 그대로의 실적입니다. 그런데, 그 1개의 홈런이 첫번째 대면, 유일한 타석이었다고 할 때, 이것을 비율스탯으로 측정할 경우 타율 1.000, 장타율 4.000 이 되어버립니다. 당연히 믿을 수 없는 지표입니다. 하지만 그렇다고 A라는 타자가 B라는 투수를 10번쯤 상대해서 타율 0.200 장타율 0.800 으로 대략 야구선수의 스탯 비슷하게 변한다고 이 숫자를 믿을 수 있을까요? 당연히 아닙니다. 최소 300타석, 아마도 1000타석 정도의 데이터가 필요합니다.
누적지표를 대할 때 당연하게 유지되는 상식적이고 객관적인 판단력은 이상하게도 그 지표가 비율스탯으로 표시되는 순간부터 교란되고 오작동하는 일이 생겨납니다. 즉 "그런 실적을 냈던 선수"가 아니라 "그런 능력과 특성을 가진 선수"로 단정짓게 만드는 이상한 힘이 비율스탯에 있는거 같습니다. 3번의 만루기회에서 2번의 안타를 친 것은 그런 일이 있었던 것 뿐이며 통계적으로 아무런 의미도 신뢰성도 설명력도 없습니다. 하지만 왜인지 그 선수를 "만루에 강한 사나이" 로 착각하게 만듭니다.
더구나, 많은 경우에 비율스탯보다 누적스탯이 오히려 더 공평합니다. 기여도와 공헌도를 측정하고 싶다면 말입니다. 박용택이 더 자주 출장해서 더 많은 득점에 기여했다면 (그가 그의 대체선수보다 뛰어나다는 전제에서는) 비율스탯이 아니라 누적스탯을 기준으로, 박용택이 더 팀에 대한 기여도가 높은 선수라고 평가하는 것이 당연히 옳기 때문입니다. 사실 팀을 승리로 이끄는 것은 아마도 가지고 있을거라 추측되는 능력치가 아니라 실제 경기에서 이루어낸 실적이니가 말입니다. 이정도가 적당하겠지요. "7병규가 아마도 박용택보다 더 좋은 타자일 가능성은 있지만 2013시즌 팀의 성적에 휠씬 더 큰 기여를 하고 있는 것은 박용택이다"
요즘처럼 팬들의 평가가 첨예하고 공격적인 시절에, 아주 흔히 사용되지만 통계적으로는 충분한 신뢰성을 가지지 않는 데이터들이, 그것이 데이터라는 이유로 과도한 객관성과 신뢰성을 부여받고 있는 것은 조심스러운 일입니다. 일반적이고 더 유명한 RC-RC27-WAR 모델이 아니라 XR 모델을 분석에 사용한 것은 다음 2가지 이유였습니다.
1. RC 모델이 RC27 이라는 비율스탯 버전을 갖고 있다는 이유로 더 널리 사용되지만 XR 도 정확도 면에서 전혀 손색이 없습니다.
2. "(출루요소*진루요소) /기회" 로 구성되는 RC 계산식에 비해 [ play1*가중치 + play2*가중치 ...... + playN*가중치] 로 구성된 XR 계산식이 --- '타자의 득점생산력을 측정하는 기술적 방법'의 로직을 명료하게 보여주고 있기 때문이었습니다.
사실 오랬동안 '계산하기 복잡한 지표들'은 그 유용함과 정확함에도 불구하고 흔히 사용되기 어려웠습니다. 하지만 대략 손으로 하는 계산보다 엑셀로 하는 계산이 더 쉽고 익숙해진 시대라면, 그리고 KBO에서 공개하고 제공하는 제한된 데이터만으로도 계산할 수 있다면 2013년 현재 XR 이나 2002버전 RC 는 꼭 계산식이 복잡해서 쉽게 접근하기 어려운 지표라고만 치부할 필요는 없다 싶습니다. IT가 만들어낸 온라인 커뮤니티의 난폭한 광기를 받아들이고 견뎌야 하는 것과 동시에 좀더 객관적인 선수들의 측정지표를 써먹을 여지가 생겨난다는 것은 나름 동전의 양면이 아닐까 생각합니다.
'ANALYSIS' 카테고리의 다른 글
12가지 키워드로 이해하는 [세이버매트릭스] - 1/2 (9) | 2015.01.28 |
---|---|
강팀의조건 - 1점차 승부의 비밀 (4) | 2015.01.27 |
짧은 생각: 야구에 관한 객관적 지식 (0) | 2015.01.27 |
야구는 정말 투수놀음일까? : KBO 22시즌 분석 (6) | 2015.01.27 |
오지환은 정말 수비범위가 넓은 유격수인가? (1) | 2015.01.27 |