본문 바로가기
diegobaseball

야구통계12

AI, 오픈소스 - 세이버메트릭스가 세상을 먹어치운 비결 [뻘글] 손정의 회장이 문재인대통령을 만나 했다는 조언이 흥미로웠다. 3가지. AI, AI, AI 그가 한국대통령에게 조언을 한 것이 처음이 아니다. (이번에 안 일이지만) 97년 금융위기 직후인 98년 김대중대통령을 만나 --- 미래의 먹거리에 대해 3가지를 이야기했다고 한다. 그 셋이 브로드밴드, 브로드밴드, 브로드밴드. 그것 하나만으로 모든게 설명될리는 없지만 어쨌든 --- 그 브로드밴드(초고속인터넷망)는 한국의 IT산업, 좀더 넓게 보면, 온라인게임, 대중음악, 웹툰 등 컨텐츠산업 전체에 강력한 이니셔티브가 된 것이 사실이다. 그리고 이번에 AI, AI, AI. 의.미.심.장. 그런데 AI를 어떻게 활성화하지? 브로드밴드는 어떻게 하는지 대략 각이 나온다. 땅 파고 전신주 세우고 선로 깐다. 연결.. 2019. 7. 23.
피타고라스승률보다 더 많이 이기는 방법 - KBO리그 피타고리안승률은 재미있는 모델입니다. 현재의 승률과 다소 차이가 날 수도 있는 좀더 객관적인 팀전력수준을 파악할 수 있게 해줍니다. 그래서 시즌 중반 즈음에 피타고리안 기대승률과 실제 승률 중 시즌 최종 승률과 더 가까운 것이 오히려 실제승률보다 기대승률인 경우도 많습니다. 기대승률 모델의 또다른 의미는, 어떤 경기는 결정적인 한점으로 승리를 거두기도 하고 또 다른 경기는 10점 이상의 큰 점수차로 지기도 하지만, 100경기 이상의 한시즌 전체를 치르고 나면 결국 득점이 많고 실점이 적은 팀이 더 좋은 성적을 낸다는 야구의 중요한 본질 하나를 알려준다는 것입니다. 사실 많은 세이버메트릭스 이론은 한타석, 한경기는 랜덤에 좌우되는 면이 많지만 결국 득점력과 실점억제력에 수렴하게 된다는 전제에 바탕을 두고 .. 2018. 11. 2.
타고투저, 투수들은 도망가지 않았다 [베이스볼인플레이] 타고투저, 투수들은 도망가지 않았다일간스포츠 2016.12.27 '역대급' 타고시즌이 3년째 이어졌다. ‘타고(打高)’란 다른 말로 ‘투저(投低)’다. 그러다보니 과거보다 투수 수준이 떨어졌다는 말이 많이 나온다. 사실일 수도 있다. 하지만 단정은 이르다. 야구에서 투수와 타자의 실력이 그대로여도 환경에 따라 타율이 높아지고 홈런이 늘어나고 득점이 많아질 수 있다. 공과 배트의 반발력, 외야펜스 거리, 파울지역의 넓이, 스트라이크존의 크기 등은 타고투저, 투고타저에 큰 영향을 미친다. 2011~2013년은 타고가 아니라 투고의 3시즌이었다. 투고 3년과 이후 타고 3년을 비교하면 인플레이타율(BABIP)이 0.307에서 0.329로 높아졌다. 규정타석을 채운 타자 55명 중 40명이 .. 2018. 1. 17.
역대 타고투저, 이유는 각각이었다 [베이스볼인플레이]역대 타고투저, 이유는 각각이었다일간스포츠 2016년11월25일 2016년 KBO리그를 가장 잘 설명하는 단어는 '타고투저'다. 10개 구단의 경기당 평균 득점은 5.61점이다. 역대 최고였던 2014년(5.62점)에 이어 2위다. 역대 3위 시즌인 1999년의 5.38점과는 꽤 차이가 있다. 타고투저와 투고타저를 가르는 기준이 대략 경기당 4.5점이라는 점에서 역사적인 '타자들의 시대'다. 한국야구위원회는 올시즌을 앞두고 스트라이크존을 좁히는 등 타고 완화를 위한 시도를 했다. 시즌 초만 해도 노력은 효과가 있는 듯 보였다. 4월말까지 118경기 평균득점은 4.84점이었다. 2014년(5.25점)과 2015년(5.06점)에 비해 확실히 떨어졌다. 하지만 5월이 넘어가면서 야구장은 다시.. 2018. 1. 14.
“왜 KBO리그 구단은 데이터 활용에 소극적입니까?” [베이스볼인플레이] “왜 KBO리그 구단은 데이터 활용에 소극적입니까?”일간스포츠 2016.09.29 미국은 '야구통계'의 천국이다. 야구 팬의 상상을 뛰어넘는 세밀하고 방대한 데이터가 공개돼 있다. 타율, 홈런, 타점 등 고전적인 기록은 논할 바도 아니다. 야수의 수비범위나 송구능력, 타구방향 등은 이제 기본이 됐다. 메이저리그 공식사이트(mlb.com)가 2007년 '피치FX'를 도입한 이후 구종, 투구궤적, 스트라이크존 통과위치 등 정보도 손쉽게 접할 수 있다. 메이저리그는 2015년 스탯캐스트(STATCAST)를 공식 런칭했다. 이젠 타구속도와 각도, 수비수의 반응시간, 주자의 주루속도 등도 측정되고 대중에 공개된다. 야구의 많은 것이 '보이지 않는 그 무엇'이 아닌 객관적이고 명료한 숫자로 표현.. 2018. 1. 9.
풀카운트 승부에 관한 통계적 관찰 [베이스볼인플레이] '풀 카운트' 코너 몰렸다면..슬라이더를 던져라일간스포츠 2016.08.30 3볼 2스트라이크,풀카운트는 그 자체로 승부처다. 야구에서 볼카운트는 투수와 타자가 더 유리한 위치를 점하기 위해 벌이는 전략싸움이다. 하지만 풀카운트가 되면 결국 피할 곳이 없어진다. '진검 승부'다. 파울로 승부가 연장되는 경우를 제외하면 볼넷, 삼진, 타격 셋 중 하나의 결과가 나와야 한다. 올해 전체 타석 중 풀카운트 승부 비율은 13.7%다. 전체 볼카운트 중 2-2와 1-2 다음으로 높은 비중이다. 타석 당 풀카운트 승부비율은 해마다 조금씩 다르다. 그런데 흥미로운 사실이 발견된다. 연도별 풀카운트 비율은 리그 평균득점과 거의 일치하는 추세를 보인다. 타고시즌에는 풀카운트가 많고 타저시즌에는 적다... 2018. 1. 5.
도루 손익분기점이 "객관적으로" 계산될 수 있을까 세이버메트릭스가 마이너리티였던 시절 세이버메트릭스가 올드스쿨을 무찌르며 야구 패러다임 지배권을 손에 넣는 과정에서 혁혁한 공을 세운 첨병들이 몇 있는데 도루와 희생번트의 손익분기점에 관한 것도 빼놓을 수 없습니다. 빌제임스가 일찍이 그의 [십계명] 4번째에서 “70% 이상의 성공율이 아니면 도루하자 마라”며 갈파했고 톰 탱고와 그의 동료가 쓴 theBook은 그에 대한 거의 완벽한 이론적 분석을 덧붙였습니다. 한국에서도 비슷했는데, 희생번트는 결코 공격팀에 이로운 작전이 아니며 도루 역시 상당히 높은 성공율이 아닌 한 그렇다는 주장이 세이버메트릭스 도입 초기에 이 새로운 아이디어의 파격적 가치를 드러내는데 앞장을 섰습니다. 세월이 흘렀고 MLB에서 세이버메트릭스는 혁신자가 아니라 주류의 지배자가 되었습니.. 2016. 1. 22.
세이버메트릭스 선언 The Sabermetric Manifesto By David Grabiner 세이버메트릭스 선언 The Sabermetric Manifesto By David Grabiner 1994 "야구 통계는 경기에 대한 이해를 높일 수 있을 때 가치를 지닌다. 그렇기에 통계는 경기에서 일어나는 이벤트들을 얼마나 잘 평가할 수 있느냐에 따라 심판 받아야 한다. 의미 없는 통계는 무시되어야 하며 교체되어야 한다. 결함을 가진 통계는 개선되어야 하며 잘 만들어진 통계는 게임과 플레이어의 토론의 자료로서 중요하게 쓰여야 한다." (Baseball statistics are useful only if they enhance your understanding of the game. Therefore, they should be judged by how well they measure what act.. 2015. 1. 28.
강팀의조건 - 1점차 승부의 비밀 topic 1점승부 불펜 강팀 야구 통계 KBO 확율게임 09SK 11SK 10삼성 세이버메트릭스 승률 강팀의조건 - 1점차 승부의 비밀KBO08_12 5시즌 1점차 승부의 통계2013.8.30 연달아 빼앗긴 1점차 승부가 저를 낙담하게 만들었습니다. 왜 하필 그들만 만나면... 아쉽게 패한 1점차 승부는 두고두고 기억에 남으며 "1점차 승부를 이겨내는 힘이야 말로 진정한 강팀의 조건"이라는 흔한 말이 자꾸 떠올라 편치가 못합니다. 그런데, "1점차 승부에 강한 팀"이 정말 강팀인걸까요? 박빙의 승부를 이겨내는 어떤 특별한 능력이 강팀이 되기 위한 필수요건인걸까요? 2008년부터 2012년까지 5시즌 동안 벌어진 2635경기를 대상으로 1점차 승부에 대해 이야기해보려 합니다. 다음은 1점차 승부의 승패만.. 2015. 1. 27.
2013년 득점기여도가 가장 높은 타자는? : 추정득점 XR, 득점생산 RC topic 엘지트윈스 타격 XR RC RC27 타율 타점 세이버메트릭스 박용택 오지환 이진영 손주인 정성훈 이병규 타자의 능력을 평가하는 지표로 가장 흔히 사용되는 것은 타율(Batting Average) 입니다. 안타 갯수를 유효한 타석수(=타수, 타석에서 사사구, 희생타 등을 뺀 숫자)로 나눈, 말하자면 안타비율은 가장 오래되고 가장 많이 사용되지만 타자의 가치를 평가하는데 한계가 있다는 지적을 많이 받습니다. 타격이란 결국 득점을 얻어내기 위한 행위라고 했을 때, 높은 타율이 많은 득점 득점을 만들어내는 능력과 상관관계가 의외로 적은 편이기 때문입니다. 타율이라는 지표는, 사사구를 통한 출루를 포함하지 않고 있습니다. 애초에 타율이라는 지표가 고안된 시점에는 볼넷은 타자의 능력이 아니라 투수의 실수.. 2015. 1. 27.
야구는 정말 투수놀음일까? : KBO 22시즌 분석 topic 투수놀음 KBO 장명부 세이버메트릭스 선언 피타고라스 승률 팀득점 팀실점 상관관계 94엘지 우승 야구는 정말 투수놀음일까? : KBO 22시즌 분석 - 2013.8.1 "야구는 투수놀음이다"라고 합니다. 정말 그런가요?2013년 현재 리그에서 타격이 가장 강한 팀은 두산입니다. 하지만 그들은 별로 안전하지 못한 4위에 머물고 있습니다.투수력이 가장 좋은 팀은 삼성입니다. 그들은 시즌 내내 1위를 굳게 지키고 있습니다.심심찮게 등장하는 흔한 신문기사들을 기억해도 이에 대한 주장과 검증은 여러번 있어왔습니다.팀 순위는 대체로 팀타율보다는 팀평균자책점과 더 많이 일치했습니다.이것은 사실입니다. David Grabiner 에 의해 작성된 세이버메트릭스 선언The Sabermetric Manifesto.. 2015. 1. 27.
빌 제임스가 세이버매트리션이 아니라구요? topic 세이버메트릭스 빌제임스 야구통계 야구에대한객관적지식 클러치히터 스탯 야구의 스탯과 마법의 수정구슬 스탯을 보는 것은 본질적으로 차근차근 경기를 직접 보는 것과 별로 다를게 없는 일입니다. 경기에 없던 것이 스탯에만 있을 수는 없으니, 유독 비밀스러우면서도 또한 과학적인 무언가가 스탯 안에 있다는 것은 허상입니다. 그저 차이가 있다면 물리적으로 모든 경기를 다 보는 것은 거의 불가능하다는 것, 직접 본 경기라도 그전부 기억할 수 없다는 것 정도입니다. 중요한 또 한가지는, 기억은 그리 많은 것을 담지 못하며 종종 우리는 속인다는 것입니다. 대부분의 경우, 선수들의 스탯을 보면 우리가 알고 또 믿어왔던 것과 비슷합니다. 154km짜리 강속구를 가진 OOO의 9이닝당 탈삼진 숫자는 실제로 높고, 유.. 2015. 1. 27.