본문 바로가기
diegobaseball
세이버메트릭스 도서관

조정지표 Adjusted Stats, 시즌과 구장에 대한 보정 - 세이버메트릭스 키워드

by 토아일당 2015. 2. 2.

 topic   조정ERA ERA+ OPS+ 타고투저 세이버메트릭스 우규민 노경은 파크팩터 야구통계 신뢰성

Adjusted Stat. 조정지표들 - 세이버메트릭스 키워드



조정지표Adjusted Stats는 서로 다른 시즌, 서로 다른 구장을 사용하는 선수들의 스탯을 좀더 객관적으로 측정하고 비교하기 위해 설계된 개념입니다. 


2013시즌 노경은의 ERA는 3.84 였고 14시즌 우규민의 ERA는 4.04 였습니다.  그렇다면 노경은이 우규민보다 더 좋은 성적을 냈다고 말할 수 있을까요?


KBO 14시즌은 다시없던 타고시즌이었고 리그평균ERA가 5.21 에 달했습니다.  반면 13시즌의 리그평균ERA는 4.32 였습니다.  따라서 이 두명의 투수를 비교하기위해서는 그 기록이 작성된 시즌의 특성에 따라 지표를 [보정adjusted] 하는게 필요합니다.  계산방법은 (선수ERA/리그평균ERA) 입니다.  따라서 리그평균과 같은 ERA를 기록한 선수의 조정ERA(ERA+ 로 표기합니다)는 100이 되고 100보다 크면 평균보다 낮은 ERA, 100보다 크면 평균보다 많은 ERA를 뜻합니다.  


조정ERA로 계산했을때 우규민의 ERA+는 1.29  노경은은 1.13 으로 우규민이 더 좋은 성적을 기록한 것을 알 수 있습니다.

그런데 선수의 기록은 시즌에 따른 편차 뿐 아니라 구장의 특성에 따른 편차도 조정할 필요가 있습니다.  만약 트윈스이 홈구장 잠실처럼 외야펜스가 멀고 파울지역이 넓어 투수에게 유리한 구장환경은 대체로 ERA에서 유리합니다.  이것을 보정해주는 것이 파크팩터입니다.  해서 조정ERA(ERA+)의 정확한 계산식은 (선수ERA/리그평균ERA*파크팩터) 입니다.


다만 MLB와 다르게 KBO의 경우 파크팩터의 객관적 적용에 몇가지 한계가 있을 수 있습니다.

우선 30개 이상인 MLB의 팀과 구장과 달리 8개 또는 9개에 불과한 KBO의 주요 구장은 통계적으로 신뢰할 만한 파크팩터를 계산하기에 제약이 있습니다.  30개의 데이터 샘플 사이즈가 보장할 수 있는 통계적 신뢰성과 8개의 샘플사이즈 사이에는 차이가 있을 수 밖에 없습니다.

비슷한 이유로 30개 팀이 아니라 9개 또는 10개 팀의 리그로부터 계산되는 파크팩터의 경우, 홈팀의 투수력에 의한 오차가 좀더 커집니다.  이밖에도 최근 10년 동안 잦은 구장 개보수와 증축으로 외야펜스의 거리가 자주 변경되었기 때문에 충분히 많은 데이터샘플을 가지기 어려운 면도 있습니다.    


통계를 이용한 객관적 야구지식을 목표하는 세이버매트릭스 관점에서 이와같은 시즌과 구장에 따른 편차보정은 당연히 필요합니다.  투수의 지표 뿐 아니라 타자의 지표 역시 같은 방식의 조정지표를 가지고 있으며 계산식도 같습니다.