티스토리 뷰


야구를 보며 “구위가 좋다”라는 말을 자주 합니다.  그런데 “구위”란 뭘까요?

구속이 빠르다고 무조건 구위가 좋다 할 수는 없을겁니다.  공의 움직임 또는 볼끝이 구위라고  말하는 이도 있습니다.  구속=구위 라고 생각하는 것보다는 좀더 낫지만 불분명한 것은 마찬가지입니다.


공의 움직임 = 구위 라고 말하는 것이 의미있는 정의가 되고 그것을 통해 투수 또는 투구를 평가하려면 다음 3가지가 성립해야 합니다.  


1) 공의 무브먼트가 좋으면 타자 상대로 더 좋은 결과를 얻는다.

2) 공의 무브먼트를 측정할 기준이 있어야 한다. 

3) 2번의 기준을 가지고 실제로 그 양을 측정할 수 있는 수단이 있어야 한다.   


이런 전체가 성립하지 못하면 “구위=무브먼트”라고 말하는 것은 “구위=구속”이라고 말하는 것보다 오히려 못합니다.  구속은 적어도 객관적으로 측정할 수 있지만 무브먼트는 그렇지 못하기 때문입니다.


무브먼트는 구위의 기준이 될 수 있을까?


요즘엔 pitchFX 와 같은 새로운 테크놀러지 덕분에 공의 수평, 수직 무브먼트를 측정할 수 있게 되었습니다.  그래서 위의 2번과 3번 기준은 충족되었다고 말할 수도 있습니다.  하지만 투수의 손 끝을 떠나 홈플레이트를 통과할 때 까지의 수평, 수직 변화량을 표시하는 VertMovement 와 HorzMovement 는 그 자체로 구위를 평가할 수 있는 기준이 되지 못합니다.  V무브, H무브가 크다고 더 좋은 결과를 얻는 것이 아니기 때문입니다.   상관관계가 매우 약합니다.   


회전량을 기준으로 하는 것도 무의미하기는 마찬가지입니다.   게다가 더 많은 회전량이 더 큰 무브먼트를 일으키지도 않습니다.  그것은 회전방향 때문인데 흔히 자이로회전 또는 탄환회전(bullet spin)이라 불리는, 공의 진행방향을 축으로 도는 회전량은 공의 무브먼트에 영향을 미치지 않습니다.  엄청난 회전량을 가진 탄환이 휘어지기는 커녕 오히려 더 똑바로 날아가는 것과 같은 이치입니다.


구속이 그런 것처럼 무브먼트 역시 큰 것이 대체로 좀더 좋은 결과를 얻기는 하지만 그 자체를 구위의 기준으로 삼기에는 적합하지 않다는 것입니다.


야구통계에서 의미있는 지표의 전제는 늘 같습니다.   첫째, 그것은 팀의 승리 (득점생산 또는 실점의 억제)에 얼마나 기여하고 있는가 둘째, 그것은 객관적으로 측정가능한 대상인가.  셋째, 그것은 팀의 동료나 벤치가 아니라 선수 자신의 능력에 의해 만들어진 결과인가. 


구종가치 : 얼마나 실점억제에 기여했는가?


그렇게 고안된 지표가 구종가치(Pitch Value) 입니다.


다른 많은 세이버메트릭스 지표가 그런 것처럼 피치밸류 역시 톰 탱고의 기대득점모델를 기반으로 합니다.  그것은 “어떤 플레이가 이루어지기 전과 후 사이에 기대득점이 얼마나 달라졌는가”를 평가합니다.


투수가 던진 투구(Pitch)는 볼, 스트라이크, 인플레이된 타격결과 셋 중 하나의 결과를 남깁니다.  그것을 통해서 변화는 것은 볼카운트와 아웃카운트, 득점, 그리고 주자의 위치입니다.  따라서 이 네 가지 조건에 따른 기대득점(RunExpectancy)를 구하고 투구된 공이 기대득점을 얼마나 변화시켰는지 측정하면 그 값이 플레이의 가치가 됩니다.


구종가치는 그래서 패스트볼, 슬라이더, 커브 등등의 각각 구종이 평균적으로 한개 던질 때마다 몇점의 득점가치를 보였는지 계산한 결과입니다.


KBO2010_2015 6시즌 동안 데이터를 기준으로 각 볼카운트 상황의 기대득점과 그걸 기준으로 계산한 볼카운트의 +득점가치는 다음과 같습니다.


BallStrike

adj.RE

BS_value
000.0030
100.0440.041
200.1120.109
300.2400.237
01-0.042-0.045
11-0.012-0.015
210.0470.044
310.1570.154
02-0.106-0.109
12-0.088-0.091
22-0.041-0.044
320.0750.072


계산방법은 베이스/아웃 조건의 기대득점을 계산하는 방식과 같습니다.  예를들어 2010_2015 동안 경기 중 볼카운트 1-1 상황은 100602번이 있었고, 그 시점을 기준으로 이닝 종료까지 득점은 54069점이었습니다.  그 상황의 득점 기대치가 0.537점이라는 것인데, 그때의 아웃,베이스 조건에 따른 기대득점을 조정해주면 -0.012점의 득점효과가 있었다는 것을 알 수 있습니다.  타석 시작인 0-0 카운트를 0으로 조정하면 1-1 카운트의 득점가치는 -0.015점이 됩니다. 


이 테이블은 꼭 구종가치 계산이 아니라도, 임의의 볼카운트에서 스트라이크 하나, 볼 하나의 가치가 얼마인지 계산하는 기준이 되며 포수의 프레이밍 가치 역시 같은 기준으로 계산됩니다. 


인플레이 타구나 볼넷, 삼진의 타석결과에 대해서는 리그의 타석 이벤트 득점가치를 적용합니다. 


BS_value 가 0보다 크면 타자에게 유리한 카운트라는 뜻이 되고 반대면 투수에게 유리한 볼카운트입니다.


구종가치를 계산하는 방법


투수가 1-1 카운트에 슬라이더를 던져서 스크라이크를 잡으면 기대득점은 -0.015 에서 -0.091 로 변합니다.  그래서 이 피치(pitch)의 득점가치는 0.076 입니다.  이런 식으로 투수의 피칭 전부를 구종별로 누적시킨 결과가 [구종가치]입니다.  따라서 그 공을 통해 기간 동안 몇점의 득점을 허용 또는 세이브했는지 측정한 결과가 됩니다.


비율스탯으로 나타낼 때는 값이 작기 때문에 피치당 밸류에 100을 곱해서 [100피치당 가치] 로 표시하는게 보통입니다.


피치밸류에서 리그평균은 0 입니다.  따라서 어떤 투수의 특정 구종이 0 의 피치밸류를 갖는다면 그 구종인 리그평균 수준의 실점을 허용하게 되는 구종임을 뜻합니다.


PV/100 은 패스트볼의 경우 -1.5에서 +1.5 정도로 분포되며 +2.0 이 넘으면 리그 최상급의 구위를 가졌다고 볼 수 있습니다.  피치밸류는 득점가치 스케일이기 때문에 100개의 공을 던지는 동안 2.0점을 세이브했다는 것은 100구를 던진 선발투수가 리그평균보다 2점을 더 세이브했다는 뜻이기 때문입니다.


패스트볼 외의 다른 구종은 이보다 좀더 선수간 차이가 좀더 큽니다. 샘플사이즈가 작은 이유도 있을 것이고 타자에게든 투수에게든 비중이 좀더 작기 때문에 대응능력의 편차가 크기 때문일 수도 있습니다. 


구종가치라는 지표는 "구위"에 대한 세이버메트릭스 식의 해법입니다. 제구력과 로케이션의 개념을 재정립한 것이 그렇듯이, "구위가 좋은 공이 좋은 결과를 얻는다"가 아니라 "좋은 결과를 얻는 공을 구종가치 높은 공이라 한다"는 접근을 합니다.  



몇가지 통계적 특성


MLB 기준으로 투수들의 피치밸류는 year-by-year 로 0.25 미만의 상관계수를 가집니다.(팬그래프)   한 두 시즌의 데이터로 투수의 능력을 충분히 안정적으로 평가하기에 어려움이 있다는 뜻입니다.   타석결과 기준의 지표들에 비해 한 시즌 휠씬 더 큰 샘플사이즈를 가지긴 하지만 타격결과에 따른 플러스 마이너스 효과가 꽤 클 수 밖에 없기 때문에 --- 타격결과에 영향을 미치는 운luck 의 작용을 피하긴 어렵습니다.


한계에도 불구하고 피치밸류라는 지표가 유용하게 취급되는 이유는 “객관적으로” 각 투수 구종의 효과를 측정하게 해주기 때문입니다.   게다가 득점가치 스케일의 값이기 때문에 각 구종이 얼마나 효율적으로 실점을 억제했는지 합리적으로 비교할 수 있습니다.  


스탯티즈의 오픈 이후 KBO 투수들의 피치밸류가 제공되기 시작했습니다.  다만 아직은 보완할 것이 좀 남아있습니다.


우선 구종판정의 정확성입니다.  특히 체인지업과 싱커, 커브와 슬라이더, 패스트볼과 커터는 보는 사람에 따라 보는 시점에 따라 다르게 판정될 소지가 있습니다. 기계장치에 의한 구종판정이 사람의 것보다 무조건 정확하다고 단정짓긴 어렵습니다.  하지만 일관성을 유지할 수 있습니다.  무엇을 커브라고 판정하고 무엇을 슬라이더라고 판정할지에 대해 이론이 있을 수 있지만 어쨌든 모든 투구에 대해 일관된 판정기준을 유지하는 것은 사람보다 기계가 나을 수 밖에 없습니다.   


또 피치밸류 계산의 기준이 되는 볼카운트별 기대득점값을 KBO 기준에 맞게 조정했는지 여부도 중요할 수 있습니다.  그밖에는 필터링 조건이 해당 구종의 투구수가 아니라 단순한 투구이닝으로만 제공되기 때문에 예를들어 김광현이 시즌 내내 10개도 채 안던진 싱커에서 구종가치 1위로 평가되는 것 같은 아쉬움이 있습니다.



데이터는 경기력 향상에 도움이 될까


MLB의 사례를 보면 좀더 정확하고 세밀한 데이터는 전력강화에 매우 유용하게 활용되고 있습니다.  지난 2014년 이후로 PitchFX  분야의 가장 핫한 이슈인 투구배열(Pitching Seqhuence) 같은 것이 그렇습니다.  효과적인 볼배합은 수십년 동안 배터리와 벤치의 전략이었지만 기억이나 메모 또는 전력분석팀의 인상과 수기에 의존하는 것과 정확한 전수 데이터를 활용하는 것은 다를 수 밖에 없습니다.


다음의 2가지 데이터 중 어떤 것이 더 효율적인 전략수립이 도움이 될까요?


A. 평생 야구를 해온 전문가 입장에서 볼 때, 이 투수는 변화구 다음에 패스트볼을 던질 때 더 적은 안타를 맞는다. 

B. 이 투수의 패스트볼-패스트볼의 조건부 구종가치를 1.0 으로 할 때 커브-패스트볼은 1.3배, 슬라이더-패스트볼은 1.6배, 체인지업-패스트볼은 0.9배 더 높다. (+ 투수가 가진 모든 구종의 조합에 대한 각각의 조건부 피치밸류)


측정장치 또는 측정의 알고리즘이 경기력 향상에 도움이 될까요?  웨이트트레이닝과 달리 스톱워치나 랩타임 기록지는 육상선수의 근력이나 순발력에 직접 작용하지 않습니다.  하지만 스톱워치 없이, 랩타임 기록이라는 측정 알고리즘 없이 훈련하는 선수가 효과적으로 자신의 기록을 향상시킬 수 있을까요?  또 스톱워치라 해도 단거리 스프린터에 대해 1초 단위로 밖에 잴 수 없는 스톱워치가 충분히 효과적일까요? 


세이버메트릭스 같은 데이터 지향의 패러다임은 종종 전통주의자로부터 사후평가의 숫자놀이에 불과하며 결국 그라운드에서 야구를 하는 것은 선수라는 비판을 받기도 합니다.  하지만 더 정확하고 세밀한 데이터는 대체로 더 좋은 경기력을 끌어내는데 도움이 됩니다.


PitchFX 와 같은 새로운 테크놀러지에 기반한 데이터들, 그리고 그것을 해석하기 위해 고안된 통계적 알고리즘 역시 그럴 것이라 생각합니다.  단순히 하드코어팬이나 저널리스트들의 흥미꺼리로 치부할 이유가 없어보입니다.  게다가, 미국에서는 이미 그렇게 되고 있다는군요.    



15시즌 Trackman 데이터 기준으로, 패스트볼 구종가치가 가장 높은 투수는 권혁이었습니다. 단 측정된 범위의 데이터에서만 그런 것이라 시즌 전체와는 다를 수 있습니다. 사진 - nocut news




댓글
  • 프로필사진 ㅇㅇ 유명한 경영학자인 피터 드러커가 한 말이 있죠.
    "측정할 수 없으면 관리할 수 없고, 관리할 수 없으면 개선할 수 없다.”
    2015.11.18 21:13
  • 프로필사진 삼팬 스탯티즈에 나와있는 싱커볼, 스플리터, 너클볼의 구종가치는 던지는 투수들도 별로 없으니 측정하기가 좀 그런 것 같습니다. 싱커볼러면 정대현 말고는 모르겠는데 김광현이 1위라는 것은 뭔가 수정이 필요할 것 같습니다. 분류기준에 투구수 개수가 있으면 의미있는 숫자가 나올 것 같습니다. 2015.11.18 23:05 신고
댓글쓰기 폼