티스토리 뷰

ANALYSIS

Mr.클러치를 찾아서 : KBO2010_2015

토아일당 2015. 9. 22. 17:18

Mr.클러치를 찾아서

RVA by WPA Mapping : KBO 2010-2015


WPA는 세이버메트릭스 계열의 지표 중 가장 상황의존적(situational)이고 그 반대편에는 RunValue 기반의 wOBA 같은 중립적(neutral)한 지표가 있습니다.  


wOBA 같은 중립적 지표는 상황과 무관한 선수의 플레이를 평가합니다.  10점을 앞선 상황에 나온 1점 홈런과 3점차 열세를 뒤집는 끝내기 만루홈런을 동등한 가치로 간주합니다.  똑같이 하나의 홈런이며 1.4점 정도의 가치를 가진 플레이로 봅니다.   반면 WPA는 이 두 플레이를 약 40배 정도의 차이로 평가합니다.


둘 중 어느 하나가 틀렸다고 할 수는 없습니다.  둘다 합리적이고 객관적인 통계적 근거에 입각해 있습니다.  1점 홈런과 4점 홈런의 차이는 타자의 능력이 아니라 경기의 상황에서 생겨난 차이이기 때문에 이를 동등하게 평가하는 중립적 지표도 합리적이며 그러나 1점홈런과 4점홈런이 승패에 미치는 영향은 확연하게 다르기 때문에 상황적 지표도 합리적입니다.


요는, 어떤 목적으로 그 지표를 사용하느냐에 달려있을 것입니다.


상황중립적 vs 상황의존적


중립적 지표의 평가에 비해 상황적 지표에서 확연하게 더 나은 퍼포먼스를 보여주는 선수를 클러치 플레이어라고 부릅니다.  이를 측정하기 위해 득점권 타율을 사용하는 경우가 많지만 썩 좋은 방법은 아닙니다.  


클러치퍼포먼스라는 의미를 염두에 둔다면, 승패에 큰 영향을 미칠 수 없는 조건에서의 “적시타”와 결정적인 승패결정 플레이의 차이를 구분할 수 없기 때문입니다.  또 2아웃 만루의 홈런과 무사 3루의 1루타를 똑같은 한 개의 득점권 안타로 카운트 하는 것 역시 객관적이라 하긴 어렵습니다.


다음은 2010년부터 2015년(9월20일 현재 기준) 까지 가장 중립적인 성향을 가진 RVadded 와 가장 상황적인 성향을 가진 WPA 를 두 개의 차원으로 리그의 타자, 투수를 표시한 결과입니다.



가로축은 RVadded 입니다.  타자/투수의 플레이 결과에 대해 각각의 RunValue를 모두 더한 결과입니다.  예를들어 홈런은 1.4 근처의 해당 시즌 RV 값이 더해지고 땅볼아웃은 -0.3 정도의 시즌RV 값이 더해집니다.  wOBA와 동일한 통계적 기반으로 계산되기는 하지만, 첫째, wOBA는 아웃된 타석에서 마이너스 값을 더하는 대신 outvalue = 0  으로 보고 대신 아웃되지 않은 타석에서 -OutValue의 합쳐서 계산한다는 점, 둘째 그렇게 계산된 전체값을 타석수로 나눠준다는 방식이 다릅니다.  


Run Value Added x Win Probability Added


wOBA는 지표의 이름처럼 출루율 스케일로 맞춰주기 위해 그런 과정을 거치지만 RVadded는 그 자체로 득점생산결과에 해당합니다.  wRAA와 비슷하다고 볼 수 있습니다.  


RVA의 특징을 좀더 설명한다면 이것은 1루타, 2루타, 3루타, 홈런, 볼넷, 몸맞공을 플레이 상황과 완전히 별개로 동일한 가치로 봅니다.  아웃된 결과에 대해서도 마찬가지인데, 1타점 희생플라이와 병살타를 똑같은 1번의 아웃 타석으로 간주합니다.  이 둘의 차이는 타자의 능력이 아니라 상황에 따라 결정되기 때문입니다.  


유일하게 차이를 두고 구분하는 것은 희생번트와 삼진입니다.  이 부분이 wOBA와 다른 점인데, 희생번트는 타자의 의도한 플레이이고 그 결과는 일반적인 아웃과 다릅니다.  삼진 역시 똑같은 한개의 아웃카운트이긴 하지만 타자의 능력에 따라 생겨난 결과이며 근소하게 타격한 아웃에 비해 약간 낮은 득점가치를 가집니다. 


RVA는 WPA 처럼 누적스탯이면서 리그평균수준이 득점기여를 한 선수가 0.0 의 값을 가집니다.  


세로축은 WPA입니다.  WPA는 각각의 플레이에 따라 상승하거나 하락하는 팀의 승리확율변화의 누적합계입니다.  경기가 시작할 때 승리확율은 0.5 이고 승리가 결정될 때 1.0 이 되기 때문에 WPA 0.5  가 1승에 해당됩니다.


따라서 우상향하는 추세선을 기준으로 위쪽은 더 좋은 클러치 퍼포먼스를 보여준 선수이고 아래쪽은 그 반대입니다.


올해의 Mr.클러치, 피이이일!!!!!


RVA by WPA 차원에 표시된 선수의 위치와 추세선 사이의 세로거리는 그 선수가 중립적 지표로 평가된 수치에 비해 얼마나 더 많은 상황적 승리기여를 했는지 보여줍니다.  예를들어 15시즌 KIA의 필은 RVA로 측정한 것에 비해 WPA가 3.3 정도 더 높습니다.  3승 이상의 추가적인 승리기여가 있었다는 뜻입니다.  한 시즌의 3승은 엄청난 차이입니다.  승차로 6경기이며 순위 한두개가 뒤집히고 가을야구의 유무가 달라집니다. 


RVA by WPA 차트는 어떤 선수를 영웅시하거나 혹은 겁쟁이로 매도하기 위한 수단은 아닙니다.  야구가 가진 두가지 얼굴, 즉 긴 시즌을 치루며 통계적으로 결국 평균으로 수렴하게 되는 중립적 성향과 그럼에도 불구하고 여전히 승패를 직접적으로 결정하는 상황적 성향 사이의 관계를 좀더 이해하기 위해서입니다.


야구통계는 선수와 선수의 플레이를 평가하기 위한 수많은 지표와 시스템을 디자인해왔습니다.  RVA는 그중에서 가장 극단적으로 중립적인 성향을 갖고 있고 WPA는 그 반대입니다.  타석 전후 상황의 기대득점(RunExpectancy)의 차이로 계산되는 RE24 같은 지표가 이 중간 어디쯤에 있습니다.  (RE24 는 많이 사용되지는 않지만 정말 매력적인 지표입니다.  기회가 되면 이를 좀더 자세히 소개하겠습니다) 


그런데 RVA by WPA 차트를 보면 이 둘 사이의 괴리가 그렇게까지 크지 않다는 사실을 알 수 있습니다.  소수의 아웃라이어를 제외한다면 대부분의 선수들은 완전하지는 않지만 추세선 근처에 모입니다. 차트는 200타석+ 로 걸러냈는데 아웃라이어들이 대체로 적지않은 누적타석을 가진 선수들임을 고려하면 이보다 최소타석을 늘린다고 해도 추세선을 기준으로 하는 흩어짐이 아주 큰 차이를 보일 것 같진 않습니다.  관건은 이것을 어떻게 해석할 것인가 입니다.  


상황의존적인 지표는 객관적이지 못한가


이런 결과에 대해 어떤 이는 이렇게 생각할 수도 있습니다.  가장 극단적인 상황지표인 WPA 조차 어느정도 중립지표에 수렴하기 때문에 wOBA 같은 중립적 지표로 충분하다.  하지만 저는 이에 동의하기 어렵습니다.  시각화한 RVA와 WPA의 관계를 두가지를 모두 말하고 있습니다.  상황지표는 결국 중립지표에 수렴한다.  하지만 완전히 수렴하지는 않는다. 


절대로 잊지 말아야 할 것은 선수에 대한 객관적 평가라는 것이 오직 중립적 측정, 그리고 그로 인한 재현가능성을 좀더 높은 정확도로 예측하는 것에 있는 것만은 아니라는 것입니다.  그것이 어떤 과정을 거쳤든 반복될 가능성이 높든 낮든, 스코어보드에 기록된 득점, 순위표에 쓰여진 승리와 패배의 숫자는 절대 되돌려지지 않습니다.  그것이야말로 야구에 관해 가장 “객관적인” 사실입니다.  


세이버메트릭스는 태어날 때부터 “야구란 수없이 다양한 상황과 조건에 따라 그 이상으로 다양한 평가와 측정이 생겨날 수 밖에 없다”는 상대주의적 가치관과 맞서왔습니다.  같은 홈런이라도 경기상황에 따라 수없이 다양한 결과를 빚어내는데 그것을 객관적으로 측정할 기준이 있을리가 없다는 통념 반대편에서 그런 것들과 싸우며 발전해왔습니다.  


그것은 물론 객관적인 태도였고 존경할만한 열정으로 그것을 뒤집었고 지금의 야구이론을 확고하게 지배하는 세이버메트릭스가 구축될 수 있었습니다.  하지만 동시에 그런 과정이 “상황적” 접근 자체를 경시하는 또다른 경도를 낳은 것도 사실입니다.


톰탱고와 그의 동료들이 만들어낸 환상적인 새로운 패러다임, RE, RV, WPA 시스템은 상황의 다양성을 통계적으로 측정하고 계산할 수 있게 해 주었습니다.   뉴튼 물리학의 절대 시공간은 이전의 중세적 신비주의에 대해서는 분명히 진보적이지만 현대 물리학의 상대성이론이나 불확정성 원리에 비춘다면 퇴보적일 수 밖에 없습니다.


상황 의존적인 플레이를 합리적으로 계산해낼 수 있는 수단이 있다면 그것을 배제할 이유가 없으며 오히려 배제하는 것이 객관적 지식에 반하는 일이 됩니다. 


이호준이 "클러치히터가 아닌 것"을 증명할 수 있을까요? 


 KBO 2010_2015 기간 중 1500타석+ 타자/투수의 RVA by WPA 는 다음과 같이 나타납니다.



2399타석의 이진영, 2634타석의 이호준, 2913타석의 이종욱, 3231타석의 김현수는 충분히 많은 데이터 샘플사이즈에도 불구하고 RVA 보다 휠씬 높은 WPA 수준을 보여줍니다. 


클러치히터란 존재할까요?


세이버메트릭스의 역사 그 자체였던 빌 제임스는 2008년 “Mr.Clutch”라는 글을 통해 클러치히터에 대한 논쟁을 다시한번 촉발시켰습니다.  흔한 오해와 달리 클러치히터 부재증명은 완전히 이루어졌다고 말하기 어렵습니다. 이전 논쟁에서 중요한 역할을 했던 대부분의 아티클은 충분히 많은 데이터를 사용하지 않았고 결론을 도출해낸 통계적 방법 역시 엄격하고 정교하다 하긴 어려웠습니다.   


빌 제임스가 Mr.Clutch 에서 겨냥한 것은 클러치히터를 믿는 낭만주의자가 아니었습니다.  오히려 “클러치히터는 없다” 고 설불이 단정짓는 동료 세이버메트리션들의 “객관적이지 못한 인식”이었습니다.  


그는 이렇게 말합니다.  “클러치히터의 존재가 통계적으로 증명된 적이 없는 것은 사실이다.  하지만 증명된 적이 없다는 것이 존재하지 않는다는 것의 증명일 수 있는가?”  지구가 태양의 주위를 돈다는 것이 증명되지 못했던 수천년 동안 그렇다면 태양이 지구 주위를 돌고 있었던 것일까요?


논쟁은 포스트-빌제임스의 시대를 열고 있던 톰 탱고에 의해 맺음되었습니다.  그는 대략 이런식으로 말했습니다.  “음…개인적으로  클러치히터가 있을 것 같다는 생각도 듭니다.  하지만 그것을 증명하는 것은 아마 불가능할겁니다.  안정적인 통계값을 가지려면 7600타석의 클러치 케이스가 필요합니다”


세이버메트릭스의 역사 내내 가장 핫한 논제였던 이 클러치히터 논쟁을, 빌 제임스가 제기하고 톰 탱고가 마무리지었다는 것도 퍽 상징적으로 보입니다.     


그것은 존재하지 않지 않는 것도 아니다!!! 


그런데 통산 타석이 아니라 클러치 상황 타석 7600타석이 필요하다면 그것은 곧 “클러치히터 존재증명”은 통계적인 대상일 수 없다는 뜻이 됩니다.  이것이 가장 정확한 클러치히터 논쟁의 결론입니다.  클러치히터는 통계적으로 다룰 수 있는 대상이 아니다.  적어도 지금 조건에서는. 


하지만  명백하게 말할 수 있는 것은, 커리어 내내 예외적인 클러치퍼포먼스를 보여주고 있는 타자는 확실히 존재한다는 것입니다.   이것은 야구에 관한 객관적 지식이 포괄할 수 있는 매력적인 테마입니다.  동시에 조심스럽고 위험한 테마이기도 합니다. 


빌제임스는 Mr.Clutch에서 이렇게 말합니다.  


내가 (엄격한 데이터가 없는 상태에서) 클러치 히팅에 대한 글을 쓰는 것이 꺼려지는 이유는 야구경기의 내용을 가지고 그것을 선수의 인격테스트로 간주하는 것이 달갑지 않기 때문이다.  만약 당신이 자니 베이스볼이 형편없는 클러치 히터라는 글을 쓴다면, 그 글은 자니 베이스볼이 겁쟁이라고 말하는 것과 같을 것이다.  

나는 어떤 선수든 간에 확률적으로 벌어진 결과의 데이터를 가지고 그 사람의 인격을 조롱하는 것을 극도로 싫어한다. 그리고 그 반대의 경우도 마찬가지다. 


영웅 만들기 같은 저널리즘의 왜곡, 스포츠가 경기의 중요한 순간들마다 성공을 위한 강인함과 용기를 깨달으며 깊은 내면으로부터 진심으로 노력하여 성취하는 선수들의 인격테스트라고 믿게끔 강요하는 왜곡들이 있다. 나는 거기에 동참하고 싶지는 않다. 나는 데이터와 그것이 우리에게 어떤 의미를 주는지를 볼 뿐이며 운동선수들의 인격에 관한 어떠한 판단에도 가까워 질 뜻이 없다. 


어쩌면 스포츠 토크쇼 진행자들은 그것이 편할지도 모르겠으나, 그건 그들의 직업이지 내 직업이 아니다. 이 논쟁은 오랫동안 혼란스럽게 계속될 것이며, 나의 유일한 목표는 이것을 조금이라도 명확하게 정리하는 것이다.



상황의존적인 결과 역시 객관적 사실의 일부


소수의 아웃라이어를 제외하고 대부분의 선수들이 RVA와 WPA 차원 추세선 근방에 위치한다는 것은 WPA같은 지표를 사용한 평가가 그 특성으로 인한 치명적 오류를 별로 가질 이유가 없다는 뜻으로 해석되는 것이 더 옳습니다.


그리고 소수의 예외들을 대상으로 그런 예외적인 퍼포먼스가 야구라는 경기에 미치는 영향에 대해 객관적인 태도로 탐색해 볼 수 있는 기회로 이해하는 것이 맞습니다.  


WPA는 존재하는 가장 상황중심적인 지표이지만 동시에 가장 객관적인 지표이기도 합니다.  앞서도 말했던 것처럼, 야구에 관한 모든 사실 중, 순위표에 기록된 승리와 패배의 결과 만큼 “객관적인 사실”은 달리 없기 때문입니다.  





댓글
  • 프로필사진 ㅇㅇ 이런 관점에서 계속 생각하다보니 결국 이런 생각이 들더군요, '어차피 이럴 거라면 게임 내 중요도가 아니라 시즌 내 중요도를 따져야 하는 거 아닌가?' 김현수를 클러치히터였다고 생각할 사람들은 없지 않을까요. 포스트시즌에서 찬물을 끼얹었으니...개인적으로 시퀀싱까지는 고려할만하다고 봅니다.(RE24) 이 부분은 기술적인 영향이 있다고 볼 수 있는 영역이니까요. 하지만 WPA 이상은 글쎄다 싶습니다. 사실 상황의존성이 강하다고 해서 팬심에 더 잘 부합하는 것도 아니죠. 클러치는 양념이고 결국엔 컨텍스트프리한 양적 기록(기량)이 뛰어난 선수가 사랑받더라고요. 2015.09.23 17:18
  • 프로필사진 토아일당 일리가 있는 지적입니다. 클러치라는 것 자체가 "인상적인 기억"과 관련된 부분이다보니 그렇긴 하죠. 대신 몇가지 다른 논리도 있을 수 있습니다.

    김현수가 시즌 중에 잘하지 못했다면, 그가 삽을 푼 그 포스트시즌도 없었다. 뭐 이런식이랄지. (대신 이런 식이라면 리드오프 홈런으로 1:0 승리한 경기와 9회말 끝내기홈런으로 1:0 승리한 경기를 서로 다르게 측정하는 WPA 취지가 또 이상해지죠)

    빌제임스의 경우는 Mr.Clutch 에서 님고 비슷한 생각을 했던 것 같습니다. 포스트시즌 진출여부가 이미 결정나버린 경기를 클러치 조건에서 제외하는 방식 같은걸 사용했습니다.

    결국 "클러치"가 뭐냐의 정의 문제가 늘 따라다니죠. 따라서 WPA가 클러치다 라고 말하기도 좀 어렵습니다.

    다만, "WPA는 확율적인 승리기여도" 라는 정의를 전제로 보는 정도는 합리적인 수준이라고 생각합니다. 그것이 클러치의 여러 정의 중 하나쯤은 될 수 있다고 생각하구요.
    2015.09.23 18:19 신고
댓글쓰기 폼