
oddsportal.com의 전세계 주요 베팅사이트의 kbo리그, npb, mlb경기의 배당률을 기준한, 예상승률을 보면, 1. 약팀 승률의 과대평가 2. 원정팀 승률의 과대평가 를 관찰할 수 있었습니다. 그런데 여기까지는 야구에서 그렇습니다. 그렇다면 축구는 어떨까요? #1 도박사는 약팀을 좋아해 https://baseball-in-play.com/358 도박사는 약팀을 좋아해 - 도박사의 승부예측은 얼마나 정확할까 #1 야구경기에서 승부예측을 가장 잘할 사람들이 누굴까요. 세이버메트릭스 혁명 이후 구단 내부 혹은 주변에서 일하는 데이터분석가들의 역할이 커지긴 했지만 그와 별개로 '도박사'들을 빼놓긴 baseball-in-play.com #2 원정팀 과대평가 https://baseball-in-play..

첫번째 포스트에서 oddsportal.com 에 공개된 2014년 이후 kbo리그, MLB, NPB경기의 배당률과 실제 경기결과를 비교했습니다. 관찰된 결과는, 베팅회사는 약팀의 예상승률을 과대평가, 강팀에 대해 과소평가하는 경향이 있다는 것이었습니다. 예상승률이 과대평가되면 배당률은 낮아지고 예상승률이 과소평가되면 배당률은 높아집니다. (https://3onbase.tistory.com/358) 이유와 배경이 무엇인지 판단하는 것은 아직 이릅니다. 그저 개연적으로 추측해볼 수 있는 정황은 1. 약팀은 배당률이 이미 높기 때문에, 거기서 다소 하향된다고 해도 여전히 베터들에게 소구할 수 있기 때문에 베팅회사가 선택한 마케팅전략일 수도 있고 2. 배당률이란 베팅회사에서 일방적으로 정하는 것이 아니라 베터들..

야구경기에서 승부예측을 가장 잘할 사람들이 누굴까요. 세이버메트릭스 혁명 이후 구단 내부 혹은 주변에서 일하는 데이터분석가들의 역할이 커지긴 했지만 그와 별개로 '도박사'들을 빼놓긴 어렵습니다. 게임방식에 따라 다르긴 하지만, 스포츠베팅에서 가장 인기있는 것은 베팅회사게 제시한 배당률을 보고 플레이어가 거기에 돈을 거는 방식입니다. 2018년 엘지트윈스와 두산베어스 경기가 있다 치면, 베팅회사는 경기결과에 대한 배당률을 공개합니다. 예를들어 두산베어스승리=1.5배 엘지트윈스승리=3.8배 처럼. 이 숫자의 의미는, 베어스승리에 돈을 걸면 맞췄을 때 베팅한 금액의 1.5배(원금 포함)를 주고 트윈스 승리에 걸어서 맞추면 3.8배(원금 포함)를 준다는 뜻입니다. 배당률을 표현하는 형식에는 이것 말고도 몇가지 ..

김광현의 인터뷰 중 '내추럴커터'를 다룬 대목이 있었다. 링크: [이영미 人터뷰] “결정구를 주무기 대신 커브로, 바보 아닌 강심장이고 싶었다” 김광현-편 sports.news.naver.com/news.nhn?oid=380&aid=0000001456&fbclid=IwAR36tjwxbN0XQWkmX4r7BADVU9WdDKOC6jOFuTwsOlkXLLVc9MtlzI9oe0M 좀 길지만 옮겨보면 다음과 같다. 올시즌 김광현 선수가 던진 구종 중 ‘내추럴 커터(자연 발생적 커터)’가 적잖은 화제를 모았습니다. 스프링캠프 때만 해도 그런 질문을 하면 김광현 선수는 “나는 그냥 패스트볼을 던진 건데 그렇게 들어갔을 뿐이다”라고 말했어요. 그런데 시즌 들어가서 내추럴 커터가 유독 눈에 많이 띄더라고요. 어떻게 된 ..

리그 [타고완화]는 [▲반발력]이 아니라 [(공기저항변화에 따른 ▲비거리] 때문일 수 있습니다. 이유가 뭐든 득점이 줄었고, 타율이 낮아졌고 홈런이 감소했습니다. 대체로 [공인구 반발력 변화] 때문이라고 합니다. 하지만 타구추적데이터로 보면 약간 다른 양상이 나타납니다. 공의 반발력이 줄어서 득점이 줄어든거라면 --- 타구속도감소가 나타나는게 제일 알기쉬운 지표일텐데, 18년에 비하면 0.8kmh 느려졌지만 17년에 비하면 오히려 1kmh 더 빨라졌습니다. 17시즌의 타고성향도 18시즌만큼 뜨거웠던 것을 고려한다면 --- 적어도 19시즌이 리그평균 타구속도는 득점감소, 타율하락, 홈런감소를 설명하지 못합니다. 생각해볼 수 있는 또다른 가설은 타구각의 비효율성입니다. 같은 속도의 타구라도 너무 띄우거나 아..
--- 일간스포츠 칼럼 [베이스볼인플레이]에 게재한 글입니다. 교정교열과정에서 변한것이 있으니 그것과 약간 다른 버전이기도 합니다. 분량상 좀 쳐냈던 세세한 코멘트들이 좀더 살아 있는 버전입니다. --- 일부이긴 하지만, 글이 게재되었을 때, 김형준님 칼럼에서 다룬 것과 비슷하다는 댓글이 좀 있었습니다. 또 댓글 중엔, 김형준님 글을 보고 한국데이터를 적용한 것이니 그 나름 가치가 있다고 애써 변호하시는 분도 있었습니다. 다만 어느 쪽이든 사실과는 좀 다르겠습니다. 저는 김형준님이 어떤 글을 썻는지 일단 본적이 없습니다. 궁금해서, 김형준+패스트볼+로케이션 같은 키워드로 검색을 해봤으나 찾아내진 못했습니다. 물론, 아주 열심히 검색해보진 못했습니다만... 혹시 어떤 글인지 아시면 알려주셔도 좋겠습니다. ..
--- 2014년 말 네이버 팬카페 쌍둥이마당.에 썼던 글입니다. 잊고 있었는데 검색하다 우연히 발견하고 기억이 났습니다. 최근 버전의 데이터를 업데이트해서 이 주제를 다시 쓰고 싶긴 합니다만, 우선 리로드 해둡니다. 몇개 구단을 제외하고 팀당 3명(KT는 4명)인 외국인 선수의 영입이 거의 끝나가고 있습니다. 이들이 전력에 차지하는 비중이 크고 KBO에서는 내국인 선수들의 팀간 이동이 활발하지 않은 편입니다.미국의 경우 마이너리그 경우라도 선수에 대한 스탯과 정보가 풍부하게 제공되기 때문에 새로운 외국인선수들의 데이터를 참고해서 전력상승의 여지를 가늠하는게 겨울시즌의 중요한 재미입니다. KBO에 오는 외국인선수들의 경우 대체로 AAA에서 AAA+ 레벨의 선수들이 많기 때문에 가장 많이 참조가 되는 것은..
*이것은 4월6일자 일간스포츠 칼럼 - [베이스볼인플레이: ‘한구커브’와 ‘미국커브’는 다르다]를 좀더 풀어서 정리한 글입니다. 분량제한 때문에 포함시키지 못했던 몇가지 데이터가 추가합니다. 올해 KBO리그 개막은 20명의 외국인 투수와 함께 시작한다. 작년에 등판기록이 있는 외국인 투수는 27명이다. 이들의 패스트볼 평균구속은 146kmh이었다. 내국인 투수 평균 143kmh 보다 약간 빨랐지만 더 위력적이었다고 보긴 어렵다. 왜냐하면 구위를 평가하는 가장 객관적 지표 헛스윙%에서 오히려 내국인 투수 평균이 6.0%로 5.6%인 외국인 투수보다 약간이지만 더 높다. 인플레이 타구에 대한 패스트볼 피장타율도 내국인 투수가 0.507로 외국인 투수 0.535보다 더 좋다. 슬라이더 헛스윙%도 내국인 투수가..
얼마 전 출간된 [프로야구 2016 스카우팅리포트]에 이성훈님이 "외국인타자의 패스트볼 대응능력"에 관한 글이 있습니다. KBO리그는 미국에 비해 상대적으로 패스트볼 구사비율이 높습니다. 그리고 같은 패스트볼이라도 투심성 패스트볼이나 커터성 패스트볼이 미국 특히 MLB와 비교해서 많지 않습니다. 따라서 패스트볼에 강점을 가진 유형의 타자들이 한국에 왔을 때 자신의 미국시절성적보다 좀더 나은 퍼포먼스를 낼 수 있다는 "가설"입니다. 보통 음식이나 선후배관계, 락커룸 분위기 같은 것들을 들어 외국인선수의 "적응"을 논하는 것에 비하면 휠씬 분석적이고 또 흥미로운 발상입니다. 하긴, 어떤 투수가 한국에서 좋은 성적을 내고 있는 이유를 그저 굴비를 좋아하는 식성 때문이라 해석하는 것은 좀 이상하죠. 한국이나 미..
한화 김태균은 리그 최고 타자 중 하나다. 복귀 첫해인 12년에는 타율1위(0.365) 13년에는 5위(0.319) 14년에는MVP 서건창 다음으로 2위(0.365)였다. 장타율도 모자랄게 없었다. 12년 리그 4위(0.536)를 시작으로 3년동안 탑10을 벗어난 적이 없다. 출루율이야말로 김태균의 독보적인 분야다. 3시즌 연속 출루율 1위였고 15년에도 테임즈의 괴물모드만 아니었다면 4연속 1위를 차지했을 것이다. 출루율과 장타율을 종합한 OPS 역시 당연히 최상위권인데 1위-4위-5위-5위를 기록했다. 그럼에도 불구하고 그는 종종 논란에 시달린다. 홈런과 타점이 적다는 이유다. 부동의 4번타자 임에도 화끈한 한방이 아니라 꾸준한 안타와 출루가 두드러지는 그의 성향은 좀 갑갑한 느낌을 주기도 한다. 게..
2015년 10월26일 현재 한국시리즈 1차전이 열립니다. 가을야구가 정점을 향해 가고 있다는 뜻이며 또 2팀은 제외한 나머지 8팀의 야구는 이미 끝났다는 뜻도 됩니다. 틈틈히 올렸던 각 팀의 승리요인분석(WFA) 최종편입니다. 지난해도 비슷하긴 했지만 올시즌 가장 주목할 만한 점은, 상위권 팀은 공통적으로 공격력이 강했다는 점입니다. 엘지트윈스는 팀 ERA 2위를 하고도 전체 순위 9위로 밀려났습니다.WFA 기준으로 투수력이 리그평균 이하인 두산, 넥센은 정규리그 3위, 4위에 오르기도 했습니다. 15시즌의 전체 순위는 거의 팀 공격력 순위와 일치했습니다. 야구는 투수놀음이라는 속설은 애당초 사실과는 좀 다릅니다. 공격력과 수비/투수력은 50:50 정도의 비중으로 승패에 관여합니다. 그럼에도 올 시즌의..
야구에서 득점에 관한 가장 중요한 규칙은, "1) 3개의 아웃카운트 이내에 2) 출루1개 + 진루3개 를 얻어야 득점한다" 입니다. 더 효율적인 배팅라인업이란 위의 2가지 조건을 최대한 잘 이용하는 방법을 말합니다. 무엇이 최선이냐에 대해 한가지 정답만 있는 것은 아니겠지만, 대체로 다음의 몇가지 원칙은 대략 말해볼 수 있습니다. 1) 잘치는 타자들을 타순의 앞쪽에 모아둔다. 9명의 타자 모두가 똑같은 수준의 공격력을 가질 수는 없기 때문에 이왕이면 잘치는 타자는 앞에 모아둡니다. 1번타자부터 타석에 서기 때문에 경기 동안 한번이라도 더 타석에 선다는 잇점도 있고 또 3번의 아웃카운트 안에 4개이 진루를 만들어야 득점하기 때문에 흩어져 있는 것보다는 몰려 있는게 더 낫기 때문입니다. 2) 출루율이 높은 ..
KB리포트에 이어 스탯티즈가 서비스를 시작했습니다. 척박했던 환경이 점점 달라지는 것을 느끼며 기쁩니다. 스탯 사이트가 오픈되면 팬들이 가장 관심있어 하는 것은 어쩔 수 없이 “줄세우기”입니다. 객관적인 지표에 근거해서 선수들의 득점, 승리기여도를 측정하는 것이 나쁘다 하긴 어렵지만, 어떤 종류의 지표든 늘 오차와 왜곡의 여지를 가지고 있습니다. WAR은 포지션, 시즌 등등의 차이를 보정해서 모든 선수를 하나의 척도로 평가할 수 있다는 장점이 있어 많이 선호되지만 그러나 동시에 가장 오차와 왜곡의 여지가 큰 지표 중 하나이기도 합니다. 흔한 오해와 달리 WAR의 장점은 “정확도”가 아니라 “종합지표”라는데 있기 때문입니다. 수비퍼포먼스를 정확하게 측정하는 방법은 애당초 raw-data의 문제이기 때문에 ..
잠실구장은 타자에게 불리하다. 다른 구장이면 넘어갈 타구들이 펜스 앞에서 잡힌다. 좌우중간의 거리는 메이저리그 기준으로도 최상위권에 속할 만큼 크다. 다음은 잠실X존이 사라진 2011년부터 2015년(9월10일 현재 기준) 잠실과 잠실이 아닌 구장의 모든 타석에 대한 통계이다. * Run/40PA 는 경기당 득점 대신 사용한다. 경기당 득점은 연장이닝의 차이, 홈팀이 9회말 공격을 하지 않고 끝낸 경우 등으로 인한 오차 때문에 타석당 득점이 좀더 정확한 득점환경 지표가 된다. 대신 좀더 직관적인 이해를 위해 한 경기 당 타석수에 해당하는 [40타석 당 득점]으로 변환한 것이다. 모든 타격지표에서 비-잠실이 더 높다. 넓은 구장으로 인해 외야의 타구가 안타가 될 확율이 높다고 생각하기 쉽지만 BABIP 조..
흔히 말하듯이, 득점권(RISP) 타율은 결국 커리어 타율에 수렴하기 때문에 큰 의미가 없다는 것은 맞지 않습니다. 꽤 많은 타석수가 누적된 이후에도 자신의 커리어타율보다 꽤 높은 득점권 타율을 유지하는 타자들은 종종 있습니다. 다음은 KBO 2010년 이후 현재(2015.9.20) 까지 전체 누적타율과 득점권상황(RISP) 타율을 차원 상에 표시한 결과입니다. (500타석+) 왼쪽 위 영역과 오른쪽 아래 영역을 나눈 오렌지색 점선은, 전체 타율과 RISP타율 사이의 선형추세선입니다. 따라서 왼쪽 위에 있는 타자들은 자신의 타율보다 높은 득점권 타율을 보인 경우이고 오른쪽 아래는 그 반대입니다. 박용택, 유한준, 박석민, 최정, 정수빈 등은 자신의 평균타율보다 2푼에서 3푼 정도 높은 득점권 타율을 보입..
Mr.클러치를 찾아서 RVA by WPA Mapping : KBO 2010-2015 WPA는 세이버메트릭스 계열의 지표 중 가장 상황의존적(situational)이고 그 반대편에는 RunValue 기반의 wOBA 같은 중립적(neutral)한 지표가 있습니다. wOBA 같은 중립적 지표는 상황과 무관한 선수의 플레이를 평가합니다. 10점을 앞선 상황에 나온 1점 홈런과 3점차 열세를 뒤집는 끝내기 만루홈런을 동등한 가치로 간주합니다. 똑같이 하나의 홈런이며 1.4점 정도의 가치를 가진 플레이로 봅니다. 반면 WPA는 이 두 플레이를 약 40배 정도의 차이로 평가합니다. 둘 중 어느 하나가 틀렸다고 할 수는 없습니다. 둘다 합리적이고 객관적인 통계적 근거에 입각해 있습니다. 1점 홈런과 4점 홈런의 차이는..
타석승부는 볼카운트 싸움부터 시작합니다. 유리한 카운트는 확율적으로 더 나은 결과를 가져옵니다. 타자에게 가장 유리한 볼카운트는 단연 3B0S 입니다. 14시즌 볼카운트 별 타격결과를 보면, 3B의 결과는 평균보다 많이 좋습니다. 타출장 .500/ .972/ .887 입니다. 하지만 이 기록의 대부분은 볼넷에 관한 것입니다. 3B에서 승부가 결정된 타석은 45853타석 1101번인데 그중 939번은 볼넷이고 몸에맞는공이 2번 있습니다. 이걸 빼고나면 3B0S 에서 실제로 타격이 이루어진 경우는 62번 밖에 안됩니다. 좀더 데이터가 많은 05_11 기간을 보면 타출장 .365/ .956 .626 으로 14시즌보다는 약간 낮습니다. 7시즌 동안 타격이 이루어진 횟수는 422번입니다. 전체 타석결과 중 0.1..
1점차 리드한 상태로 마지막 이닝 9회말이 시작될 때, 수비팀의 승리확율은 78%입니다. 이는 MLB 1979년부터 1990년까지 12시즌의 모든 경기를 분석한 결과입니다. (기준은 경기당 득점 5.0) 대략 이런 상황 네번 중 한번 정도 역전패를 허용한다는 의미가 됩니다. 이때 선두타자 출루를 허용한다면? 승리확율은 65%로 낮아집니다. 50%보다 높기는 하지만 승리를 장담하긴 어려운 숫자입니다. 대신 첫타자를 잡아내며 1사 주자없음 상황이 되면, 승리확율은 88%로 높아집니다. 야구는 모르지만, 동시에 확율의 경기입니다. 득점차, 아웃카운트, 베이스 상황에 따라 수많은 경기에서 벌어졌던 결과를 분석하면 경기결과에 대한 통계적 확율을 예측할 수 있습니다. 적어도 과반의 승리확율을 유지할 수 있는 조건은..
야구의 매력 중 상당부분이 “전략게임”에 있는 바, 내 맘대로 감독 노릇하며 즐기는 라인업 놀이야 말로 “팬질” 중의 “팬질”이라 할 수 있겠습니다. 거기에 방대한 야구통계에 기반한 각종 데이터를 첨가하면 금상첨화라 할 수 있겠네요. 세이버메트릭스 또는 최근의 야구통계를 고려했을 때, 1번부터 9번까지의 최적 라인업에 대한 통계적 기준에 대해서입니다. 리드오프 - 닥치고 출루 “1번타자는 단지 1회에 처음 등장하는 타자일 뿐이다.” 라고 말하기도 하지만 꼭 그렇지는 않습니다. 1번타자는 다른 타순의 타자들에 비해 통계적으로 휠씬 더 많이 이닝 선두타자로 나오고 휠씬 더 자주 주자없음 타석에 섭니다. 전체 이닝 중 1번타자가 선두타자로 나오는 비율은 21% 정도이고 다른 타자들은 평균 10% 미만입니다. ..
야구팬 입장에서 응원팀이 화력 폭발로 다득점 경기를 하는데 마다할 이유는 없습니다. 하지만 좀 아껴서 다음 경기에 쓰면 안될까 하는 생각도 합니다. 왠지 에너지가 과도하게 방전되서 다음 경기에는 빈타에 허덕일 것 같은 걱정도 듭니다. 이런 것을 “메가트윈스포 신드롬(?)"이라 하는데, 유래는 어떤 팀이 지독한 암흑기에 빠져있던 2008년으로 거슬러 올라갑니다. "메가트윈스포"의 유래 엘지트윈스는 6월20일 롯데전 부터 시작해서 5경기동안 1점, 3점, 0점, 2점, 1점씩 득점하고 있었습니다. 경기당 1.5점도 안되는 득점력이었습니다. 그러다가 6월26일 삼성전에서 뜬금없이 대폭발을 일으키며 20:1 대승을 거둡니다. 홈런 3개 포함 21안타로 상대팀 마운드를 두들겼습니다. 그리고 다음 경기부터 다시 침..
오랬동안 세이버메트릭스는, "배트에 맞고 인플레이된 타구의 결과(BABIP)"는 투수의 책임이 아니라는 이론을 지지해왔습니다. 그것은 운과 수비력에 의해 결정된다고 보기 때문입니다. 좀더 엄격한 통계적 분석을 통해 그 안에 포함된 투수의 영향을 주목하는 입장도 있긴 하지만 BABIP은 투수와 무관하다는 이론에 근거해서 만들어진 FIP 같은 지표는 ERA보다 휠신 더 신뢰할 만한 것으로 평가받습니다. 같은 맥락에서, TTOs(Three True Outcomes)라는 표현 그대로, 삼진, 볼넷, 홈런 이 세가지 스탯만 투수에게 중요하고 "진짜"이기 때문에 --- 투수와 타자의 대결에서 만들어지는 타구(batted ball in play)는 관심 밖으로 밀려나게 되었습니다. 혹시 누군가가 "어떤 투수는 빚맞은..
올 시즌 KBO리그는 6월22일 기준 672경기를 치뤘고 이는 전체 경기 중 47%에 해당합니다. 이 시점에서 7위 SK는 32승32패1무로 정확히 5할 승률을 맞추고 있고 1위 NC와는 로 정확히 SK는 6경기 뒤져 있습니다. NC가 5할 승률에 비해 더 이긴 6번의 승리가 평범한 팀과 리그 1위팀 사이의 격차입니다. 그렇다면 이 6번의 승리는 무엇으로 만들어졌을까요? 야구라는 경기는 더 많은 득점과 더 적은 실점으로 승부를 가립니다. 팀승률과 그 팀의 득점과 실점 데이터 사이에는 상당히 강한 연관성이 있습니다. 한 경기만 놓고 보면 10점차가 넘는 경기도 있고 1점차의 아슬아슬한 승부도 있지만 한 시즌 100경기 이상을 치르고 나면 팀의 전체 득점과 실점 기록은 승률과 거의 일치하게 됩니다. 이를 이..
*** BABIP 시즌조정 계산실수가 있어서, 다시 계산하여 20150615 업데이트했습니다. 2001년 보로스 맥크라켄이라는 이름없는 대학원생에 의해 발견된 이후, BABIP 만큼 야구통계 또는 세이버메트릭스에 큰 영향을 미친 것도 별로 없습니다. BABIP은 Batting Average on Balls in Play 의 약자인데, 홈런, 볼넷, 삼진을 제외하고 배트에 맞아 인플레이존에 들어간 타구에 대한 타율입니다. 이 개념의 핵심은 "볼인플레이된 타구가 안타가 될지 아닐지는 투수의 책임이 아니다" 라는 것이었습니다. 참고 - 보로스맥크라켄의 DIPS혁명 - http://baseball-in-play.com/151 그라운드를 지배하는 보이지 않는 손 "바빕신" 야구통계에서 뿐 아니라 복잡한 이론적 개..
경기를 보다보면 이번 이닝은 타순이 좋다 또는 타순이 나쁘다고 하는 이야기를 합니다. 타선의 9명이 모두 똑같이 잘칠 수는 없으니 보통 앞에 출루를 잘 하는 선수를 두고 3-4-5번에 팀에서 제일 잘치는 타자를 배치해서 득점을 노리는 게 보통입니다. 그렇다면 어떤 타자가 이닝의 선두타자로 나왔을 때 가장 많은 득점을 할 수 있을까요? 즉 가장 좋은 타순이란 어떤 것일까요? 지난 14시즌을 기준으로 보면 2번타자부터 시작되는 타순입니다. 1번타자보다 오히려 2번타자가 이닝의 첫타석에 섰을 때 평균적으로 더 많은 득점을 올립니다. 분석대상은 KBO2014 576경기 9회 이전 이닝입니다. 9회 이후 이닝의 경우 홈팀과 어웨이팀 공격횟수가 다르고 끝내기 승리로 완료되지 않는 이닝이 있기 때문에 제외합니다. 1..
선두타자 출루의 가치와 책임- 삼성이 선두타자 출루에 실패하고도 리그 득점2위가 된 이유 야구에서 선두타자 출루는 공격팀에게 당연히 유리합니다. 그렇다면 얼마나 유리할까요? 분석대상은 KBO 14시즌 576경기이며 9회 이전 이닝의 결과로 합니다. 9회 이전의 이닝만을 분석대상으로 한 것은 다음 몇가지 이유 때문입니다. 1) 홈팀과 원정팀의 공격횟수가 다르기 때문에 공격팀의 득점력 차이로 인한 왜곡 가능성2) 끝내기 승리로 인해 이닝이 완료되지 않는 경우가 있기 때문에 3) 경기 후반 극단적인 스몰볼 전략으로 평균적인 경우와 득점환경이 달라지기 때문에 득점은 3.3배 득점확율은 2.8배 증가 전체 9194 이닝 중 선두타자가 출루한 경우는 3422회 입니다. 전체 이닝당 평균득점은 0.64점이고 선두타자..
타선의 메트릭스 - 2번타자득점환경과 진루타의 가치변화가 "강한2번타자"의 본질 이 글의 첫번째 버전은 2014년 초에 bizball project라는 팀과 함께 작업하며 썼던 글입니다. 그리고 베이스볼긱에 게재된 칼럼이기도 합니다. 이런 저런 사정으로 중단되었는데 틈틈히 다시 시작해보려 합니다. 타순에 대한 전통적인 "관점"과 통계적인 "사실"을 비교합니다. 어떤 것은 실제로 그랬을 것이고 어떤 것은 아닐 겁니다. 분석에 사용된 데이터는 KBO07_11 5시즌 동안의 것과 KBO2014 시즌의 것 두종류입니다. 07_11 기간이 약 20만 타석, 14시즌이 6만 타석 정도의 결과입니다. (2014시즌 데이터에 관한 것은 나중에 붙이는 것이라 따로 명시되지 않은 것들은 대체로 07_11기간의 데이터입니다..
스트라이크와 볼의 득점가치(Run Values) - 볼카운트의 이해 볼카운트의 이해 초구 타격이 타자에게 정말 유리한가? (1/3) http://baseball-in-play.com/185 초구승부와 타자의 노림수 효과 (2/3) http://baseball-in-play.com/186 스트라이크와 볼의 득점가치 (3/3) http://baseball-in-play.com/187 앞의 글에서 “초구승부” 및 “볼카운트 싸움”에 관한 몇가지 믿음은 통계적 사실과는 좀 다르다는 것을 확인했습니다. 1. 초구는 여러가지 볼카운트 상황 중 특별히 더 중요하다고 보긴 어렵다. 2. 초구타격의 결과가 실제로 타자에게 유리하지 않다. 3. 볼카운트에 따른 타자의 노림수가 타격결과에 영향을 미쳤다고 보기 어렵다. 볼카..
초구승부와 타자의 노림수 효과 - 볼카운트의 이해(2/3) 볼카운트의 이해초구 타격이 타자에게 정말 유리한가? (1/3) http://baseball-in-play.com/185초구승부와 타자의 노림수 효과 (2/3) http://baseball-in-play.com/186스트라이크와 볼의 득점가치 (3/3) 볼카운트의 이해 1편 "초구타격이 타자에게 정말 유리한가"에서 확인한 잠정적 사실은 다음과 같습니다. 1. 초구스트라이크 상황보다 초구 볼 상황이 타자에게 유리한 것은 당연하다. 하지만 초구에서의 볼/스트라이크 결과 차이가 다른 카운트, 예를들어 1B1S에서의 볼/스트라이크 결과차이보다 특별히 더 크지는 않다. 2. 초구타격 시 타율과 장타율은 리그평균보다 휠씬 높다. 그러나 그렇다고 초구타격이 타..
초구 타격이 타자에게 정말 유리한가? - 볼카운트의 이해(1/3) '볼카운트' 그리고 '초구승부'의 이해 초구 타격이 타자에게 정말 유리한가? (1/3) http://baseball-in-play.com/185초구승부와 타자의 노림수 효과 (2/3) 스트라이크와 볼의 득점가치 (3/3) 타자와 투수의 싸움에서 초구가 중요하다고 합니다. 이와 관련해서 MLB통산 355승을 기록했고 4번의 사이영상을 수상한 그렉매덕스의 말도 흔히 인용됩니다. “내가 가진 최고의 구질은 초구 스트라이크다.” (그런데 매덕스가 진짜로 어떻게 말했는지는 확인하기 어려웠습니다. 물론 그가 지독할 정도로 초구 스트라이크를 잘 잡아낸 투수인 것은 확실합니다) KBO05_11 7시즌 동안의 통계 역시 그와 비슷한 결과를 보입니다. 첫번..
[타선의 메트릭스] 1번타자 배영섭과 이종욱, 누가 더 좋은 1번타자일까? 이 글은 2014년 초에 bizball project라는 팀과 함께 작업하며 썼던 글입니다. 그리고 베이스볼긱에 게재된 칼럼이기도 합니다. 이런 저런 사정으로 중단되었는데 틈틈히 다시 시작해보려 합니다. 타순에 대한 전통적인 "관점"과 통계적인 "사실"을 비교합니다. 어떤 것은 실제로 그랬을 것이고 어떤 것은 아닐 겁니다. 사용된 데이터는 KBO07_11 5시즌 동안의 것이며 약 20만타석의 결과입니다. 다만 이 데이터를 기초로 확인되는 [통계적 사실]은 모든 통계적인 분석이 그렇듯이 설명가능한 제한 안에서만 이해되어야 합니다. 07_11시즌 기간 동안 각 타순에서 만들어진 데이터는 그 기간 중 KBO의 8개팀 벤치가 선택한 특정..