본문 바로가기
diegobaseball
세이버메트릭스 도서관

투수스탯의 이론과 계산방법-실점억제능력 ERA RA ERC FIP SIERA xFIP tERA [세이버메트릭스 용어]

by 토아일당 2015. 2. 6.


이 글에서 소개할 야구통계 또는 세이버메트릭스 투수스탯은 투수의 실점억제능력을 평가하는 지표들입니다.  

클래식 투수평가지표 - ERA RA9

DIPS 이전의 세이버메트릭스 투수지표 - 빌제임스의 ERC

DIPS 이후의 component ERA 들 - FIP SIERA QERA xFIP tERA


 



ERA 평균자책점

ERA = 허용자책점ER  / 투구이닝IP * 9


가장 많이 사용되는 투수 스탯입니다.  9이닝당 허용자책점ER입니다.

야구경기에 투수의 역할이 타자를 상대하며 실점을 억제하는 것이기 때문에 가장 직관적이며 이해하기 쉬운 투수스탯입니다.  

다만 투수의 실점 또는 자책점의 경우 투수의 능력 이외의 요인들, 즉 팀의 수비력이나 우연에 의해 영향을 받는 면도 있습니다.  이를 보완하기 위해 이후 수많은 투수스탯들이 개발됩니다.     


RA/9  평균실점

RA/9 = RA / IP * 9


9이닝당 자책점ER/9를 평균자책점이라 부르니까 RA/9 은 평균실점이라고 해도 좋을 것입니다.

ERA와 비슷한데, 차이가 있다면 자책점만 계산하지 않고 비자책점도 계산합니다. 

RA에는 포함되지만 ERA에는 포함되지 않는 것은 대표적으로 다음과 같은 것들입니다.  


1) 야수의 실책, 타격방해, 패스트볼, 주루방해에 의한 실점

2) 실책, 타격방해로 출루한 주자의 득점

3) 앞선 투수가 출루시킨 주자의 득점 

4) 수비의 실책이 없었을 경우 이닝이 종료되었을 상황 이후에 허용한 득점


보통 ERA는 보통 RA의 0.92 수준이며 그래서 RA 스케일의 값을 ERA 스케일로 환산할 때 0.92를 곱합니다.


ERA에 비해 부정확하다고 생각하기 쉽지만 자책점과 비자책점을 구분하는 기준이 투수의 책임여부와 꼭 일치한다고 보기는 어렵습니다.  따라서 어떤 시각에서는 ERA보다 RA9을 더 중요하게 봅니다.   미국의 대표적인 세이버메트릭스 사이트인 baseball-reference.com는 투수 대체선수대비승리기여도WAR를 구할 때 ERA 대신 RA/9 을 기준으로 사용합니다.  


빌제임스가 디자인한 선수들의 승리기여도 윈셰어WinShares 에서는 비자책 실점을 자책점의 50%에 해당하는 투수책임으로 간주합니다.    



ERC by 빌제임스


ERA의 단점을 보완하기 위해 디자인된 투수 스탯입니다.  빌제임스가 만들었고 Compenent조합 ERA 라는 뜻입니다.  이것은 실제의 자책점(실점)이 아니라 투수가 허용한 안타, 볼넷, 홈런 등의 숫자를 이용해서 가상의 허용자책점(실점)을 계산하는 방식을 말합니다.  


빌제임스의 것 말고 다른 ComponentERA 도 있기 때문에 보통 빌제임스의 component ERA를 ERC라고 부르고 component ERA 라는 일반적 개념을 줄여 부를 때는 CERA라고 부르기도 합니다.  component ERA를 종종 peripheral기대 ERA 라고 부르기도 하는데 이것은 지표의 구성방식이 아니라 지표의 의도와 기능을 기준으로 부르는 말입니다.  왜냐하면 가상의 ERA를 계산하는 CERA는 보통 투수의 미래 성적을 예측하기 위해 만들어진 것이기 때문입니다. 


계산방법은 다음과 같습니다. 

2004 edition of the Bill James Handbook:

ERC = (((H + BB + HBP)×PTB)/(BFP×IP))×9 − 0.56

where H is hits, BB is bases on balls (walks), HBP is hit by pitch, BFP is batters faced by pitcher, IP is innings pitched, and PTB is defined as:

PTB = 0.89×(1.255×(H − HR) + 4×HR) + 0.56×(BB + HBP − IBB)

where HR is home runs, IBB is intentional walks, and others are as above.


IBB를 구할 수 없을 때의 계산식: 

PTB = 0.89×(1.255×(H − HR) + 4×HR) + 0.475×(BB + HBP)


If ERC is less than 2.24, the formula is adjusted as follows:

ERC = ((((H + BB + HBP)×PTB)/(BFP×IP))×9)*0.75


ERC는 투수의 실제 실점이 아니라 투수가 허용한 안타, 홈런, 볼넷, 몸맞공의 숫자에 통계적으로 측정된 가중치를 곱하는 방식으로 계산됩니다.  ERC는 투수가 실제로 허용한 실점에 의해 계산되는 ERA가 투수 고유의 능력 뿐 아니라 빗맞은 안타와 같은 우연과 불운, 팀 수비력, 구장의 영향 같은 요인에 의해 영향을 받는 한계와 결함을 보완하기 위해 개발되으며 ERC 이후의 다른 많은 ERA 대체 지표들도 이런 면에서 같은 목적을 가지고 있습니다.  


ERC는 opponent RC 라고 할 수도 있습니다.  타자의 득점생산성을 RC로 측정하는 것처럼 ERC는 투수의 허용RC를 계산한 것과 같은 구조이기 때문입니다.  


빌제임스가 2000년에 발표했으며 그래서 ERC는 가장 일찍 만들어진 ComponentERA 중 하나입니다. ERC에는 “타자의 방망이에 맞아 그라운드를 향한 타구의 결과 BABIP”가 반영됩니다.  이후 2001년 보로스맥크라켄의 DIPS이론 이후 BABIP에 대해 투수가 관여하는 비중이 매우 낮다는 사실이 통계적으로 검토되면서 BABIP을 배제한 최근이 Component ERA가 주류가 됩니다.   톰탱고의 FIP 같은 것들이 대표적입니다.


(저의 생각이지만) ERC는 그러나 여전히 유용한 면이 있습니다.  우선 투수의 능력을 평가하는데 FIP 처럼 BABIP을 배제하는 것이 더 객관적이긴 하지만 그렇다고 100% 다 배제할 경우 투수가 실제로 관여하는 26%-29%에 대한 오차가 생기게 됩니다.  이런 것을 보완하기 위해 FIP 이후 (뒤에 설명할) SIERA xFIP tERA 같은 것이 고안되긴 했지만 KBO에 대해서는 기초데이터가 없어서 사용할 수가 없습니다.

또 FIP의 계산에는 피홈런 스탯의 비중이 꽤 큰데 피홈런은 파크팩터의 영향을 크게 받습니다.  하지만 KBO 조건에서 신뢰할만한 파크팩터를 구하기 어렵습니다.  


반면 ERC는 나름대로 괜찮은 설명력도 가지고 있고 (- 적어도 RC만큼의) 계산구조 상 홈런의 비중이 상대적으로 작기 때문에 FIP와 함께 ERC를 고려하는 것도 도움이 된다고 생각합니다. 즉 지금 KBO의 raw-data 환경이 어쩌면 빌제임스가 ERC를 디자인하던 시점과 비슷하다보니 21세기 이후의 최신 세이버메트릭스 지표들보다 오히려 그 이전의 지표들이 더 적합한 아이러니라 할까요?



FIP : Fielding Independent Pitching Stats 수비무관자책점


FIP는 2001년 발표된 보로스맥크라켄의 DIPS이론을 바탕으로 2006년 톰탱고가 theBook을 통해 발표한 ERA 대체 스탯입니다.  수비무관피칭스탯Fielding Independent Pitching Stats 이라는 뜻입니다.  

종종 있는 오해와 달리 보로스맥크라켄의 DIPS는 FIP와 동일한 이론적 기반을 가지고 있긴 하지만 그의 dERA는 도저히 보통사람이 사용불가한 복잡함과 난해함을 가지고 있었고 실제로 DIPS를 기반으로 좀더 실용적으로 사용할 수 있는 투수스탯이 FIP라고 할 수 있습니다.


이젠 꽤 유명해진 FIP:Fielding Independent Pitching Stats. 의 계산식은 다음과 같습니다.

FIP = ((13*HR)+(3*(BB+HBP))-(2*K))/IP + constant

FIP Constant = lgERA – (((13*lgHR)+(3*(lgBB+lgHBP))-(2*lgK))/lgIP)


상수constant는 시즌마다 조금씩 달라집니다.  타고나 투고가 지나치게 나타나는 시즌이 아닐 경우 3.20 정도가 됩니다.  Fangrphs 에는 보통 3.10 정도라고 말하는데, KBO의 경우 몇가지 이유로 3.20 정도가 더 일반적인 값으로 보입니다.   대략 리그평균득점 4.5-4.9 사이에 있는 무난한 시즌의 경우라면 FIP상수=3.20 으로 계산해도 오차가 그리 크진 않습니다.  

그러나 KBO14 처럼 같은 좀 예외적인 득점환경이 시즌이라면 정확히 계산하는게 필요할겁니다. 




FIP 외에도 DIPS 이론에 기초하여 ERA를 대체하거나 보완하기 위한 피칭스탯이 여러개 만들어졌습니다.  이제부터 소개할 4종류의 component ERA가 그중 대표적인데 끔찍하게 복잡해보이지만 맥락은 비슷비슷합니다.  FIP 이후의 ERA 스케일 피칭스탯들은 거의 대부분 component ERA 형태입니다.


피칭 메트릭스 중 승리, ERA, RA, 세이브, 홀드 같은 것들을 summary stats이라 합니다.  이런 것들은 실제경기상황의 종합적인 결과인데, 투수 고유의 능력 외에 팀의 수비력, 행운과 불운같은 우연성, 팀 타선의 득점지원 같은 것의 영향을 많이 받습니다.  그에 비해 SO BB HBP HR 같은 것들을 elemental stats이라고 합니다. 다. 그리고 그중 어떤 것들은 투수 고유의 능력 이외의 요인을 비교적 적게 받기 때문에 투수의 능력을 평가하는 지표를 만들 때 더 중요하게 취급됩니다.  


그런 이유로 FIP와 그 이후의 피칭스탯들은 elemental stats를 기반으로 하여 가상의 투수허용실점을 계산하는 방식의 component ERA 가 주류가 됩니다.  이들의 차이는 다음 두가지 논점을 어떻게 다루느냐에 따라 생겨납니다. 

첫째, BB HBP SO HR GB FB LD 와 같은 elemental stats 중 어떤 것을 어떻게 가공해서 사용하는가?

둘째, 각각의 elemental stats에 어떤 방식으로 가중치를 부여하는가?


그런데 존경스러운 열정과 노력에도 불구하고 그중 어느 것이 독보적으로 뛰어난 설명력이나 예측력을 가지고 있다고 보기는 어렵습니다.  FIP에 비해 그리 많이 사용되는 것도 아닙니다.  다만, 열정 넘치는 세이버메트리션들이 우연이나 수비, 파크팩터의 영향을 배체한 투수 고유의 실점억제능력을 평가하기 위해 elemental stats을 통계적으로 어떻게 다루고 있는지 구경해보는 정도면 충분할 것 같습니다.  


SIERA Skill-interactive ERA


SIERA는 스탯의 이름 그대로 투수의 능력을 고려하여 계산하는 Component ERA의 일종입니다.  다만 계산식을 보시며 느끼듯이 좀 험하게 복잡합니다.  일반적으로 사용할 수 있는 피칭스탯이라기보다는 야구통계에 대한 오덕질의 극한처럼 보일 뿐입니다.  2010년에 발표되었습니다. 


SIERA = 6.145 – 16.986*(SO/PA) + 11.434*(BB/PA) – 1.858*((GB-FB-PU)/PA) + 7.653*((SO/PA)^2) +/– 6.664*(((GB-FB-PU)/PA)^2) + 10.130*(SO/PA)*((GB-FB-PU)/PA) – 5.195*(BB/PA)*((GB-FB-PU)/PA)

where the +/- term is a negative sign when (GB-FB-PU)/PA is positive and vice versa

http://www.baseballprospectus.com/glossary/index.php?search=SIERA


SIERA 는 미국의 세이버메트릭스 그룹 중에서도 가장 하드코어한 성향의 Baseball Prospectus를 통해 발표되었으며, 현존하는 모든 피칭스탯 중 미래에 대한 예측력을 최고수준으로 높이려는 목적으로 만들어졌습니다.  (다만, 발표 이후의 격렬한 토론으로부터 나온 결론은 FIP에 비해 확연하게 우월하지 못하다 정도인거 같기도 합니다.  그저 각기 장단점이 있는 지표다 정도일까요?)


이런 이유로 SIERA라는 스탯에서 읽을만한 것은 summary stats에 비해 투수 고유의 능력을 더 많이 반영하고 있다고 하는 elemental stats 중에서도 그것을 어떻게 다룰 때 팀의 수비, 행운과 불운, 파크팩터로도 제거하지 못하는 구장의 영향 같은 것을 최소화할 수 있는지에 대한 하드코어 세이버메트리션의 열정과 노력인거 같습니다.  


예를들어 GB% FB% 보다 (GB-FB-PU)로 계산식을 구성하는 것이 좀더 오차의 여지가 적다거나 하는 통계적 고려 같은 것입니다.  계산식으로 봐서는 어느정도 설명력과 통계적 안정성이 검증된 투수 elemental stats인 SO BB GB FB PU 등을 독립변수로 하여 설명력을 극대화시킬 수 있는 회귀식을 찾아 만든 스탯같습니다.



QERA QuickERA


SIERA 이전에 그와 비슷한 구조의 ERA 스케일 지표가 있었는데 그것이 QERA입니다.  이것 역시 BP를 통해 SIERA 보다 4년 앞선 2006년에 발표되었습니다.  


QERA = (2.69 - 3.4*K% + 3.88*BB% - 0.66*GB%)^2


극악해보이는 SIERA와 달리 QERA는 그럭저럭 봐줄 만 합니다.  그리고 그 의도와 맥락은 거의 비슷합니다.  


FIP는 BB SO HR을 3가지를 factor로 사용했고 BB는 3, SO는 -2, HR은 13 이라는 심플한 가중치를 사용했습니다.   QERA를 FIP와 비교한다면 다음과 같은 차이가 있습니다.  

1. QERA는 K%(SO%) BB% GB% 3가지 피칭메트릭스를 사용한다.  

2. SO(K)와 BB에 부여되는 가중치 비율이 다르다. (물론 QERA는 제곱식을 사용합니다)

3. HR을 사용하는 대신 GB%를 사용한다.  HR은 보통 FB%에 비례하는데, FB%는 GB%가 커질수록 작아질 수 밖에 없기 때문에 GB%에 붙은 파라메터는 마이너스 값이다. 

4. 투수의 능력은  SO BB HR(또는 GB% 나 FB%로 추정된 가상의 HR)의 1차 선형식보다는 제곱식에 비례한다.


어쨌든 야구통계에 대한 전문적 관심이 있는게 아니라면, SIERA든 QERA든 그저 세이버메트리션들이 투수의 elemental stats을 다루는 방법에 대해 어떤 고민과 판단을 하고 있는지 엿보는 정도면 충분합니다.  


xFIP


그에 비하면 xFIP는 투수개인의 능력 이외의 다른 요인들을 최대한 배제하고 elemental stats만으로 ERA 해당 값을 추정하는 면에서 같지만 SIERA나 QERA 같은 것보다 휠씬 간명하고 이해하기 쉽습니다.


FIP가  [13*HR + 3*(BB+HBP-IBB) -2*SO] 라는 계산구조를 가지고 있는 것과 비교했을 때 xFIP는 이와 똑같은 계산구조를 사용하되 다만, HR 자리에 (FB * 리그평균HR/FB%) 를 바꿔넣습니다.


xFIP = ((13*(Fly balls * lgHR/FB%))+(3*(BB+HBP))-(2*K))/IP + constant

FIP 상수는 xFIP나 FIP나 같습니다. 


xFIP는 이름과 달리 톰탱고가 만든 업드레이드버전은 아니고 하드볼타임즈를 통해 발표된 지표입니다.  xFIP이 이론적 배경은 투수의 HR허용 갯수는 운과 구장효과에 좌우되는 면에 크고 MLB수준의 투수들의 경우 통계적으로 분석해보니 이 투수나 저 투수나 장기적으로 보면 HR/FB 즉 허용한 플라이볼 중 담장 너머까지 날아가게 되는 비율은 거의 비슷하더라는 것입니다.  즉 한 시즌 정도만 놓고 보면 투수마다 HR/FB가 차이가 나지만 이것은 투수의 능력때문에 그렇게 된 것이 아니라 우연히 그렇게 되었다는 겁니다.  (엄격하게 집요하게 통계적으로 추적해서 얻은 결론이라고 하니 그럴거라고 믿으면 될겁니다) 


해서 실제 투수가 허용한 홈런의 숫자로 평가하지 말고 리그의 평균적인 HR/FB의 비율을 그 투수의 FB% 에 곱해주면 가장의 피홈런 숫자를 계산할 수 있으며 이 가상의 피홈런 숫자를 대신 사용한다는 것입니다.  이럴 경우 얻을 수 있는 또다른 장점은 파크팩터를 적용해줄 필요가 없다는 것입니다.  왜냐하면 xFIP 계산에 사용되는 BB SO 는 어차피 구장특성과 무관하며 투수가 허용한 플라이볼 비율 역시 그렇습니다.  그런데 그 플라이볼이 실제로 담장을 넘어갔는지를 보는게 아니라 모든 구장의 결과를 평균한 리그전체의 HR/FB를 곱해서 가상의 홈런 갯수를 구한 후 계산에 적용하기 때문입니다.


* 아직은 아니지만 FB% GB% 는 상대적으로 쉽게 기록될 수 있는 종류이기 때문에 만약 KBO에서 제공이 된다면 꽤 유명하게 사용될 수 있는 투수평가지표가 xFIP입니다.  더구나 모든 스탯에 공통적인 골치거리인 파크팩터 문제로부터 자유로울 수 있다는 것이 특히 매력적입니다.


tERA


tERA는 가장 극단적인 elemental stats 기반 componentERA입니다.  

이 지표는 투수가 상대한 타석의 결과를 다음과 같은 8가지로 나누고 그 각각에 대해 out value와 runs value 를 적용해서 계산합니다.  역시 투수가 매 타석마다 초래한 8종류 결과가 모두 리그의 평균적인 결과가 되었을 때 그 투수는 몇점을 실점할 것인가에 대해 계산하는 것입니다.

테이블의 out value와 Run value는 톰탱고의 기대득점RunsExpectancy 기반으로 계산된 것입니다.


tRA = expected_runs / expected_outs * 27 


expected_runs 및 expected_outs 계산 기준 테이블

EventOut valueRun value
Strikeout1–0.105
Walk00.329
Hit by pitch00.345
Line drive0.3050.384
Groundball0.8120.053
Outfield fly ball0.830.046
Infield fly ball0.985–0.096
Home run01.394



ERA- FIP- 조정ERA 조정FIP

ERA- = 리그평균ERA / 투수개인ERA      (낮으면 좋다)

FIP- = 리그평균FIP / 투수개인FIP          (낮으면 좋다)

ERA+  = 투수개인ERA / 리그평균ERA     (높으면 좋다)

FIP+  = 투수개인FIP / 리그평균FIP         (높으면 좋다)


ERA- FIP- 는 팬그래프의 센스가 돋보이는 스탯입니다.  이것은 ERA+ FIP+ 와 같은 조정지표adjusted stats입니다.   ERA와 FIP 뿐 아니라 OPS, OBP 같은 거의 모든 스탯에도 이와 같은 구조의 조정지표가 있습니다.  


리그평균과 같을 때 100의 값을 가지며 리그평균보다 좋으면 100+ 값을 나쁘면 100- 값을 가지게 됩니다.  그런데 OPS나 OBP SLG 같은 것은 높을수록 좋은 지표입니다.  그런데 ERA FIP는 반대로 낮을수록 좋은 지표입니다.


해서  ERA이 조정지표를 ERA+ 로 할 경우 더 뛰어난 투수의 ERA+가 더 큰 값을 가지게 됩니다.  이게 좀 부자연스럽다는 것입니다.  ERA는 왠지 낮아야 좋은 것 같은 느낌이니까요.


이런 이유로 사소하지만 팬그래프는 ERA+ FIP+ 가 아니라 ERA- FIP- 를 대신 사용합니다.  세이버메트릭스가 야구통계에 대한 오덕질인건 명백하지만 세이버메트리션들 중에서도 이런 종류의 섬세하고 대중적인 센스가 있는 그룹과 그렇지 않은 그룹이 있습니다.  


같은 DIPS에 기반했지만 그 원조 보로스맥크라켄의 dERA는 재앙에 가까운 복잡함으로 인해 역사 속으로 사라졌지만 톰탱고의 FIP는 오히려 DIPS 계열 피칭스탯의 대표이며 원조로 남았습니다.   이런 차이는 베이스볼프로스펙터스의 SIERA와 하드볼타임즈의 xFIP 사이에서도 볼 수 있습니다.