본문 바로가기
diegobaseball
KBOstats 실험

KBO 시즌별 득점가치(Run Values) : 2005-2014

by 토아일당 2015. 8. 19.


관련된 다른 포스팅을 먼저 참고하시는게 좋습니다.



이 포스팅으로, 세이버메트릭스 국산화(?)를 위한 KBO 통계 기준의 기대득점, 득점확율, 득점가치에 대한 정리를 완료합니다.  



한 시즌은 보통 4만번의 타석빈도를 가지는데, 작지 않은 숫자이긴 하지만 3루타, IBB, HBP는 상대적으로 빈도수가 작기 때문에 개별 시즌의 득점가치는 randomness 로 인한 오차의 여지가 좀 있습니다.  


시즌에 따라 몇가지 특성이 있습니다.  평균득점이 높았던 시즌은 타격이벤트의 전체적인 런밸류가 높습니다.  예를들어 볼넷출루를 했을 때 뒤 타석의 타자들이 더 잘치기 때문에 당연히 그렇게 됩니다. 하지만 시즌의 특성을 드러내는 것은, 각 타격이벤트의 절대적 득점가치 크기가 아니라 상대적 크기입니다.  


다음은, [1루타]를 기준으로 다른 타격이벤트들의 상대적 크기를 계산한 결과입니다.



HBP, IBB, 3루타는 상대적으로 적은 빈도수에 인해 쏠림의 여지가 많기 때문에 잠시 접어두고, 볼넷, 2루타, 홈런의 상대적 득점가치 크기를 보면, 타고시즌에는 오히려 장타의 상대적 득점가치 크기가 좀더 작아집니다.  2005-2014 기간 중 시즌 평균득점이 가장 높았던 2014년의 경우, 홈런의 상대적 득점가치는 2.857점 입니다. 이는 2014시즌의 홈런은 단타의 2.857배의 가치를 가졌다는 뜻입니다.  2루타는 1.609입니다.  마찬가지로 단타의 1.609배의 가치를 가진 것입니다.


반면 투고시즌이었던 2006년이나 2012/2013년은 홈런과 2루타의 상대적 가치가 더 큽니다.  타격이벤트들의 상대적 득점가치의 크기는 보통 두가지 요인의 영향을 받습니다.  하나는 리그평균득점으로 드러나는 득점환경의 높고 낮음이고 다른 하나는 출루율과 장타율의 비율입니다. 출루율과 장타율은 둘다 타율이라는 공통요인을 갖고 있기 때문에 좀더 풀어본다면, 타석당 볼넷 비율과 순장타율(IsoP = SLG - BA) 사이이 관계라고 할 수도 있습니다.


같은 고득점환경=타고시즌 이라고 해도, 출루율의 상승이 주도하는 타고시즌이 있는가 하면, 장타율의 상승이 주도하는 타고시즌도 있습니다.  이런 유형에 따라 장타 또는 볼넷의 단타대비 상대적 득점가치 크기가 달라질 수 있습니다.


[장타의 희소가치] 법칙 : 장타의 상대가치 --> 리그 출루율 / 리그 타석 당 득점

 또는  득점 - 순장타 == 출루 

타석당 득점이 같은 수준일 때, 출루율이 높으면 장타의 가치도 높아지고, 출루율이 같을 때 평균득점(타석당 득점)이 높아지면 장타의 가치는 낮아진다.


즉, 단순히 타고시즌이냐 아니냐 또는 장타율이 높으냐 아니냐가 해당 시즌의 장타 득점가치를 결정하지 않습니다.  수식으로 표현한다면, [장타의 가치 = 출루율 / 타석당 득점] 이 됩니다.  2005년부터 2014년까지 10년동안 출루율/타석당 득점이 가장 낮았던 시즌은 2006-2012-2007 순서입니다.  실제로 단타 대비 2루타, 홈런의 상대적 득점가치는 2006년>2012년>2007년 순서로 높습니다. 


이런 요인이, 같은 평균득점수준이라 해도 출루율이 상대적으로 높고 장타율이 상대적으로 낮은 성향이었던 KBO에서 세이버메트릭스 지표를 적용할 때 MLB의 것과 다른 가중치를 사용해야 하는 가장 결정적인 이유입니다.


(물론 14시즌 이후의 타고성향 + 전체적인 리그장타율 증가가 어떤 결과로 이어질지가 또다른 변수이기도 합니다.)


참고로 톰탱고가 기대득점, 득점가치 모델을 처음 발표하며 theBook에서 소개한 2000년대 초반의 MLB 런밸류는 다음과 같았습니다.  

 

타격이벤트별 득점가치는 wOBA 계산에 사용됩니다.  wOBA를 기준으로 구하는 공격WAR의 기본이 되는 것이기도 합니다.  MLB와 KBO리그를 비교해보면, (개별시즌의 득점환경에 따라 달라지기는 하지만) 대체로는 2루타, 홈런 등 장타의 득점가치가 KBO 쪽에 좀더 높은 편입니다.  


다만 2014년과 같은 타고시즌일 경우라면 반대일 수도 있습니다.  장타 인플레이션으로 인해 오히려 KBO쪽의 장타가치가 MLB보다 더 낮습니다.  


흔히 득점가치(RunValue)라고 말하는 것에는 혼돈하기 쉬운 3가지 용법이 있습니다.  우선은 위에서 보인, 그 타격이벤트가 얼만큼의 평균적인 득점을 만들어냈는가 입니다.  2루타는 평균적으로 0.820점을 만들어냅니다.


다른 용법은, "아웃당하지 않은 가치"를 함께 고려하는 방법입니다.  출루한 모든 타격이벤트는, 그 타석에서 만들어낸 득점가치가 있지만 "아웃당하지 않았기 때문에" 그 다음 타자에게 기회를 주는 것으로 만들어낸 가치가 있습니다.  이것은 OutsValue를 빼주는 것으로 구할 수 있습니다. 2루타의 경우 0.820 + 0.290 = 1.110 이 됩니다.


굳이 표현하면 "2루타는 0.820점을 만드는데, 2루타를 친 타석의 가치는 1.110점이 된다" 입니다. 


이 차이는 중요한데, 아웃밸류를 고려하지 않은 상태에서, 1루타와 홈런의 차이는 3배 정도 됩니다.  하지만 "아웃당하지 않은 가치"까지 고려할 경우, 1루타와 홈런의 차이는 이보다 휠씬 줄어들어서 2.3배가 됩니다. 타석결과의 가치를 측정한다는 면에서는 이 두번째 용법이 더 정확한 득점가치 개념이 될 수 있습니다. 


세번째는 (엄밀하게 말하면 이것은 득점가치는 아니지만) wOBA를 계산할 때 사용하는 득점가중치입니다.  wOBA(weighted OnBase Average)는 말 그대로 [출루율] 스케일의 지표입니다.  따라서 2번째 용법의 득점가치로 리그 전체의 wOBA 해당값을 구한 후, 그것이 리그전체 출루율과 같아지도록 조정해줍니다.  


아웃밸류를 고려한 득점가치



참고 - 득점가치(RunValues) 를 구하는 또다른 방법  


기대득점과 득점가치는 기본적으로 Play-by-Play 데이터에 기반해서 구합니다.  하지만 득점가치에 준하는 wOBA 가중치는 다른 방법으로도 근사치를 구할 수 있습니다.


득점가치 개념을 만든 톰탱고가 고안한 방법인데, 시즌의 타석당 득점을 기반으로 몇가지 상수를 적용하는 것입니다.  다음 링크를 참조하십시요.  톰탱고의 공개 아카이브 같은 곳입니다. 


  http://www.insidethebook.com/ee/index.php/site/comments/woba_year_by_year_calculations/


최근 KBO리그에 대한 세이버메트릭스 지표를 제공하는 사이트들에서도 아마 같은 방법을 사용하고 있는 것으로 압니다.  다만 몇가지 문제점은 있습니다.


앞에서 설명한 것처럼, 리그의 평균득점이 같다고 하더라도 장타율과 출루율의 밸런스나 수비능력 같은 것에 따라 상황별 기대득점과 타격이벤트별 득점가치는 달라지게 됩니다.  톰탱고의 wOBA가중치 계산방법은 당연히 MLB의 리그환경을 염두에 두고 계산된 것이기 때문에 이를 KBO리그의 메트릭스 계산에 사용할 경우 다소간이 왜곡이 생겨날 소지는 있습니다.


아주 큰 차이는 아니겠지만, 예를들어 장타율은 낮지만 고타율의 컨택형 타자라거나 출루율과 타율보다는 장타율을 강점으로 하는 타자라거나 하는 유형에 따라 어느 한쪽이 과소평가되거나 과대평가될 소지가 있습니다.