본문 바로가기
diegobaseball

세이버메트릭스 도서관34

기묘했던 1999년. 그리고 FIP의 탄생 보로스 맥크라켄이 How Much Control Do Hurlers Have? 라는 글을 발표한 것은 2001년이다. 그는 흔하디 흔한 대학원생 중 하나였지만 이 글을 통해 야구분석의 패러다임을 통째로 바꾸어놓는다. 그는 타자 배트에 맞아 페어그라운드로 날아간 공이 안타가 될지 아웃이 될지는 --- 투수의 능력이나 책임이 아니라, (거의) 전적으로 운이거나 또는 수비의 몫이라고 주장했다. 세이버메트릭스가 막 대중적 관심을 받던 시절이다. 주류 야구계에 대한 영향력은 지금보다 휠씬 약했을지언정 --- 매니아들의 열정과 결기는 오히려 더 뜨거웠다. 사람들을 그의 주장을 '미쳤다'고 일축했다. 안타를 억제하는 것이 투수의 가장 중요한 책임이고 역할인데 --- 리그 최고의 투수나 평균이하의 투수나 안타억제능력이.. 2019. 9. 21.
Mr.Clutch by 빌제임스 *** The Hardball Times Baseball Annual 2008 에 실린 빌제임스의 글 Mr.Clutch 의 부분 번역입니다.이 글은 클러치히팅에 대한 통계적 분석이라기 보다는, 그 논제를 다루는 세이버메트릭스이 시각에 관한 것입니다. (번역의 품질은, 물론 장담하기 어렵습니다. ) 세이버메트릭스 초창기 그러니까 공룡들이 아메리칸리그 서부지구를 산책하던 그 시절에, 우리는 근본적인 오류를 범했었다. 내 동료 하나는 어떤 글에서 “클러치히터는 존재하지 않는다”고 단언해버렸다. 사실 그때 우리는 이 문제를 제대로 다룰 만한 능력을 갖고 있지도 않았다. 우리에겐 경기에 대한 play-by-play 데이터도 없었다. 누구도 “아니야 클러치히터는 존재해” 라고 반론 조차 할 수 없었다. (그들도 마.. 2016. 7. 25.
도루 손익분기점이 "객관적으로" 계산될 수 있을까 세이버메트릭스가 마이너리티였던 시절 세이버메트릭스가 올드스쿨을 무찌르며 야구 패러다임 지배권을 손에 넣는 과정에서 혁혁한 공을 세운 첨병들이 몇 있는데 도루와 희생번트의 손익분기점에 관한 것도 빼놓을 수 없습니다. 빌제임스가 일찍이 그의 [십계명] 4번째에서 “70% 이상의 성공율이 아니면 도루하자 마라”며 갈파했고 톰 탱고와 그의 동료가 쓴 theBook은 그에 대한 거의 완벽한 이론적 분석을 덧붙였습니다. 한국에서도 비슷했는데, 희생번트는 결코 공격팀에 이로운 작전이 아니며 도루 역시 상당히 높은 성공율이 아닌 한 그렇다는 주장이 세이버메트릭스 도입 초기에 이 새로운 아이디어의 파격적 가치를 드러내는데 앞장을 섰습니다. 세월이 흘렀고 MLB에서 세이버메트릭스는 혁신자가 아니라 주류의 지배자가 되었습니.. 2016. 1. 22.
[대체레벨]이란 무엇인가? - 세이버메트릭스의 문제아 WAR WAR과 대체레벨(replacement level player) WAR 즉 "대체레벨 선수 대비 승리기여도"는 대표적인 [통계적 선수평가지표]입니다. 하지만 세이버메트릭스가 지상의 가치로 여기는 [객관성]이라는 관점에서 보면 아주 아슬아슬한 경계선 위에 있는 지표이기도 합니다. 계산이 복잡할수록 더 정확할 것이라는 편견과 달리, WAR은 정확도에서 장점을 갖고 있지는 못합니다. 오히려 반대입니다. 타격, 수비, 주루, 피칭 각각의 평가지표를 종합해서 단일척도로 환산하는 과정에서 개별 요소의 평가정확도는 조금씩 마모될 수 밖에 없습니다. 또 수비, 주루 요인의 평가는 피칭과 타격에 비해 정확도가 떨어지는 평가지표를 사용할 수 밖에 없기도 합니다. 투수와 야수, 서로 다른 필딩 포지션, 타격-주루-수비 각각.. 2016. 1. 13.
새로운 데이터, 새로운 세이버메트릭스 투수의 릴리즈포인트와 공의 궤적을 추적하는 PitchFX 데이터라는 것이 세상에 나타나자 세이버메트리션들은 격한 환호를 보냈습니다. 첫 선을 보인 것은 MLB 2006 플레이오프 부터 였을 겁니다. 2000년대는 세이버메트릭스의 황금기라고 해도 좋은 시기였습니다. 2001년 보로스맥크라켄의 DIPS혁명은 타격 분야에 비해 다소 정체상태였던 피칭 이론의 급격한 발전을 추동하며 새로운 10년을 열었고, 2006년 톰탱고의 theBook 이 기대득점(RunExpectancy) 모델을 기반으로 득점가치(RunValue) 승리확율(WPA)로 확장되는 일련의 거대통합이론을 만들어내기까지의 과정은 정말 거칠 것이 없어보였습니다. 그 사이 변방의 기행 또는 호사처럼 보였던 세이버메트릭스는 오클랜드의 머니볼 신화를 계기.. 2015. 12. 1.
구종가치(PitchValue) - 구위가 좋은 공이란? 야구를 보며 “구위가 좋다”라는 말을 자주 합니다. 그런데 “구위”란 뭘까요?구속이 빠르다고 무조건 구위가 좋다 할 수는 없을겁니다. 공의 움직임 또는 볼끝이 구위라고 말하는 이도 있습니다. 구속=구위 라고 생각하는 것보다는 좀더 낫지만 불분명한 것은 마찬가지입니다. 공의 움직임 = 구위 라고 말하는 것이 의미있는 정의가 되고 그것을 통해 투수 또는 투구를 평가하려면 다음 3가지가 성립해야 합니다. 1) 공의 무브먼트가 좋으면 타자 상대로 더 좋은 결과를 얻는다.2) 공의 무브먼트를 측정할 기준이 있어야 한다. 3) 2번의 기준을 가지고 실제로 그 양을 측정할 수 있는 수단이 있어야 한다. 이런 전체가 성립하지 못하면 “구위=무브먼트”라고 말하는 것은 “구위=구속”이라고 말하는 것보다 오히려 못합니다. .. 2015. 11. 18.
투수의 땅볼유도비율 - GO/AO 데이터로 GB% 를 구하는 방법 2000년대 초반의 DIPS이론이 대두된 이래로, 투수의 땅볼, 뜬공 비율은 선수의 성향과 능력을 측정하는 아주 중요한 메트릭스가 되었습니다. 올해 개편된 KBO홈페이지 기록실에서 투수의 AO(뜬공아웃), GO(땅볼아웃) 기록이 제공되고 있는 것은 그래서 아주 반갑고 고무적인 일입니다. GB%는 투수의 특징이 드러나는 가장 “안정적인” 메트릭스입니다. ERA는 말할 것도 없고 FIP 조차 홈런이 차지하는 비중으로 인해 신뢰할 만한 정보를 얻기 위해서는 꽤 많은 데이터 샘플 사이즈가 필요합니다. 하지만 GB%는 200타석이나 300타석 정도의 샘플사이즈로도 통계적으로 신뢰할 만한 데이터를 얻을 수 있습니다. 피칭의 결과를 "타격하지 않은 결과"(BB, SO)와 그외 나머지 타격한 결과로 나누어서 볼때, “.. 2015. 7. 27.
WPA, 클로저를 위한 세이버메트릭스 클로저와 불펜투수를 위한 세이버메트릭스 WinProbabilityAddedKBO2014 투수 WAR Top30 과 WPA Top30 비교 한현희, 김진성, 안지만, 봉중근 이 글에서 사용하고 있는 기대득점(RunExpectabcy) 또는 승리확율(WinProbability) 개념에 대해 좀더 상세한 소개는 다음 링크를 참조해주십시요. 기대득점과 득점가치 http://baseball-in-play.com/70WPA, 승리확율, 승리가치, 레버리지인덱스 http://baseball-in-play.com/110 세이버메트릭스는 야구경기 자체와 선수들에 대한 많은 유용한 지식을 제공합니다. 그중 대부분은 계량적인 수치로 되어 있어서 명확하고 객관적으로 보입니다. 하지만 이것은 양날이 검입니다. 더 정확하고 객관.. 2015. 4. 1.
WAR의 포지션조정상수 검토 - 세이버메트릭스 onKBO 14시즌 포지션별 공격력 수준과 WAR의 포지션조정상수 비교 WAR와 포지션조정상수 대체선수대비 승리기여도 WAR는 포지션과 상관없이 선수들의 승리기여도를 측정하기 위한 세이버메트릭스 지표입니다. 이를 위해서는 야수의 경우 공격, 수비, 주루에 관한 평가지표들이 필요한데 수비와 주루관련 스탯이 아직은 사용불가능하기 때문에 대체로 공격부분에 한정해서 WAR을 계산하고 합니다. 이 경우 수비난이도가 서로 다른 포지션 차이를 고려하기 위해 [포지션 조정상수]를 사용합니다. 예를들어 수비난이도가 가장 낮다고 보는 1루수의 경우 MLB에서는 -12.5점을 조정합니다. 일종이 패널티입니다. 공격력이 높은 선수들이 적은 유격수는 MLB기준 +7.5점을 조정합니다. 어드밴티지입니다. 다만 이 포지션 조정상수에 대해 오.. 2015. 3. 24.
바빕? BABIP! 타구의 과학 - 세이버메트릭스 현대 피칭이론 정립 BABIP, 타구의 과학: 현대적 세이버메트릭스 피칭이론 정립 거칠고 헛점투성이였지만 투수의 실점으로부터 수비 혹은 행운 같은 다른 요인을 구분해낼 수 있는 방법론을 처음으로 찾아낸 2001년 보로스맥크라켄의 DIPS이론으로부터 세이버메트릭스의 새로운 진전이 본격적으로 시작됩니다. 첫번째 논점은 홈런, 볼넷, 삼진을 제외하고 방망이에 공이 맞아 그라운드로 날아간 [In Play된 공의 안타비율BABIP]은 정말로 맥크라켄의 주장처럼, 투수의 통제 바깥에 있는가 하는 점이었습니다. 덧붙인다면 맥크라켄이 예시처럼 당대 최고의 투수였던 페드로 마르티네즈, 랜디존슨, 그렉 매덕스 등이 리그 평균보다 BABIP에서 뛰어나지 못한가 하는 점이기도 합니다. * 맥크라켄은 BABIP이라는 표현대신 IPAvg.(In P.. 2015. 3. 17.
DIPS혁명과 BABIP의 발견 - 투수의 책임은 어디까지? [Baseball Stats Glossary] 보로스 맥크라켄 Voros McCracken의 DIPS혁명 1990년대 후반, 허다한 세이버메트리션들이 [수비]의 영향을 제거하여 [투수]가 책임져야 할 실점 만으로 측정되는 평가지표를 찾기 위해 골머리를 앓고 있을 때, 이와 전혀 다른 발상을 떠올린 서른살짜리 청년 보로스 맥크라켄Voros McCracken이 등장합니다. 그는 당대 세이버메트리션의 요람이자 살롱 역할을 하던 야구카드게임 커뮤니티인 로티세리리그Rotisserie league 의 멤버이기도 했습니다. Nolan Ryan's BABIP versus MLB BABIP 그는 먼저 투수의 여러 스탯을 수비의 영향을 받는 것들과 그렇지 않은 것들로 나누었습니다. 1루타, 2루타, 3루나타, 희생타, 땅.. 2015. 3. 16.
승리Winning 그 이하의 승리, ERA 그 이상의 ERA [Baseball Stats Glossary]승리Winning 그 이하의 승리, ERA 그 이상의 ERA 타석당 안타비율 따위를 계산하는 [타율] 대신, 야구경기의 진짜 목적 “득점을 만드는 생산력”을 측정하기 위해 RC:Runs Created 라는 타격지표가 만들어진 것이 1985년이었습니다. 반면 투수의 평가지표에 관해서는 1990년대 후반에 이르기까지 확연한 진보를 찾아보기 힘듭니다.(단타와 홈런의 차이를 무시하는 [타율]이란 지표에 대해 20세기 초반의 한 선각자는 “주머니에 든 동전의 갯수나 지갑에 든 지폐의 장수를 가지고 상대가 얼마나 많은 돈을 가졌는지 논하는 바보” 라는 식으로 일갈한 적이 있습니다) 야구통계 혹은 평가지표에서 가장 중요한 원칙은 두가지입니다. 첫째, 지표는 야구경기의 목적.. 2015. 3. 12.