본문 바로가기
diegobaseball
ANALYSIS

도박사는 약팀을 좋아해 - 도박사의 승부예측은 얼마나 정확할까 #1

by 토아일당 2021. 6. 25.

야구경기에서 승부예측을 가장 잘할 사람들이 누굴까요.  세이버메트릭스 혁명 이후 구단 내부 혹은 주변에서 일하는 데이터분석가들의 역할이 커지긴 했지만 그와 별개로 '도박사'들을 빼놓긴 어렵습니다. 

 

게임방식에 따라 다르긴 하지만, 스포츠베팅에서 가장 인기있는 것은 베팅회사게 제시한 배당률을 보고 플레이어가 거기에 돈을 거는 방식입니다.  2018년 엘지트윈스와 두산베어스 경기가 있다 치면, 베팅회사는 경기결과에 대한 배당률을 공개합니다.  예를들어 두산베어스승리=1.5배  엘지트윈스승리=3.8배 처럼.  이 숫자의 의미는, 베어스승리에 돈을 걸면 맞췄을 때 베팅한 금액의 1.5배(원금 포함)를 주고 트윈스 승리에 걸어서 맞추면 3.8배(원금 포함)를 준다는 뜻입니다.  배당률을 표현하는 형식에는 이것 말고도 몇가지 다른 스타일이 있습니다.

 

프로야구에 이정도로 승패배당이 갈리는 경우는 흔치 않습니다만, 그럼에도 2018년만 한정했을 경우 1년 내내 두산베어스 승리에 베팅했다면 꽤 짭짤했겠지요. 

 

1.5배 대 3.8배라는 배당률의 의미는, (페이아웃비율 보정을 하고나면) A팀의 예상승률이 71.6% B팀이 예상승률을 28.3%로 본다는 뜻입니다.  만약 예상승률이 양쪽 다 똑같이 50%였다면 배당률은 2배:2배가 됩니다.  확률이 50%니까 이기면 보상은 2배.라는 뜻이지요.  물론 실제 스포츠베팅에서는 환급(payout)비율이라는게 있어서 이보다 약간 적어집니다.  50% 게임을 맞추면 계산상으로는 2배지만 베팅회사 수수료 같은걸 좀 떼고 그 나머지를 주는 겁니다.

 

스포츠베팅이 이렇게 운영되는 한, 베팅회사는 정확한 승부예측을 해야 합니다.  분석을 잘못해서 강팀에게 높은 배당을 건다면 베팅회사는 돈을 잃게 됩니다.  베팅회사에서 승부예측을 바탕으로 배당률을 결정하는 사람들을 odds-maker라고 합니다.  스포츠이벤트가 있을 때 "도박사들의 예상" 같은 키워드로 거론되는 숫자들이 이런 겁니다.

 

그렇다면 과연 --- 베팅회사에서 배당률을 정하는 도박사들의 승부예측을 얼마나 정확할 것일까요? 

 

kbo리그 2014년부터 2020년 기간 중 oddsportal.com에서 정리한 전세계 베팅사이트들의 경기별 최종배당률 정보와 실제 경기결과를 비교해서 이걸 알아봅니다.  도박사들은 과연 얼마나 정확하게 승부를 예측했던 것일까요.

* 분석에서 사용된 데이터가 기간 중 모든경기.는 아닙니다.  정규시즌 경기 중 베팅사이트에 등록이 안된 경기도 있고 반대로 시범경기나 포스트시즌경기도 있기 때문에, 편의상, 기간 중 4월부터 9월 사이, 베팅사이트에 배당률 정보가 있는 경기.로 한정합니다.  이후 모든 데이터가 다 그렇습니다.

 

들쭉날쭉하긴 하지만 실제승률과 비슷하게 갑니다.  대략 승률과 비교했을 때 1%p에서 3%p 정도 격차가 보통입니다.  이게 정확다고 봐야 할지 아닐지는 좀더 복잡한 평가가 필요합니다.  어쩌면 경기가 있던 날을 기준, 단순하게 양팀의 시즌승률만 보고 배당률을 결정했다고 해도 --- 결과적으로는 비슷비슷하게 가긴 할테니까요.  여기에 대한 분석은 좀 시리즈가 좀더 진행되면서 다룹니다.  일단 오늘의 주제는, "도박사들의 승부예측이 어떤 편향이 존재하는가?" 라서요.

 

다음 차트는 kbo리그 2014년부터 2020년까지 팀별 전체승률과 도박사들이 예측한 승률의 비교입니다. 오른쪽 0.0%p를 중심으로 좌우로 갈라진 bar가 실제승률 대비 도박사가 과대평가했거나 과소평가한 정보를 표시합니다.

보시다시피 일단 kbo리그를 기준한다면, 상위팀은 과소평가되었고 하위팀이 과대평가되는 경향이 관찰됩니다.  두산베어스와 키움히어로즈는 실제 승률에 비해 도박사의 배당률이 과소평가되었습니다.  기간 중 배당률이 가장 과대평가된 팀은 롯데자이언츠입니다.  의미는, 두산베어스나 키움히어로즈 승리에 베팅했을 경우 상대적으로 유리했을 것이며, 롯데자이언츠나 기아타이거즈에 베팅했다면 상대적으로 불리했다는 것입니다.  더 간단하게 말한다면 --- 역배당은 가급적 피해라.가 될려나요.

 

다른 리그도 봅니다.

 

 

kbo리그 뿐 아니라 mlb나 npb역시 비슷합니다.  강팀은 과소평가되고 약팀은 과대평가됩니다.  왜 그런지 맥락을 찾아보는건 좀더 많은 분석이 필요하겠지만 관찰된 결과로 본다면 "도박사는 약팀을 좋아해"입니다.

 

추측해 볼 수 있는 사연은 아마 이런것들입니다.

1. bettor들은 낮은 배당보다는 높은 배당을 선호한다. 따라서 높은 배당이 나올 약팀은 상대적으로 과대평가를 한다고 해도 기꺼이 승부를 건다.  베팅회사의 영업전략 차원에서 합리적인 선택이다.

2. 베팅회사의 배당률은 한번 결정되면 불변하는 것이 아니라 베터들의 선호도에 따라 조정된다.  베터들이 많이 걸면 회사는 배당률은 조금씩 낮춰서 조정한다.  혹시 이런 요인이 반영되었다면, 도박사들이 약팀을 좋아했기 때문에 아니라 베터들이 강팀을 좋아했기 때문일 수도 있다.

 

일단은 여기까지 입니다.  다음과 같은 주제들을 틈틈히 다뤄볼까 합니다.

 

1. 글 앞에서 잠깐 언급했는데, 위와 같이 나타난 도박사들의 예측정확도를 과연 어떻게 평가해야 할 것인가.  이건 실험군-대조군의 문제입니다.  전력의 강약을 잘 반명하고 있는 것처럼 보이지만, 사실 도박사 아니라도 강팀의 승률은 높고 약팀의 승률은 낮게 보는건 너무 당연합니다.

- 경기일 기준 양팀의 승률만 가지고 배당률을 설정했을때와 비교해서, 도박사들의 승부예측은 좀더 정확했을까

- 만약 경기일 시준 승률 대신, 피타고라스 기대승률로 배당률을 설정했다면?

 

2. 도박사들의 약팀선호는 어디서 유래했을까.  앞서 언급한 마케팅전략 차원도 있겠지만 그 이전에, 분석 상의 편향 때문일 수도 있습니다.  예를들어 전년도 성적을 반영하면서 생긴 오차라든가, 최근성적에 좀더 가중치를 두었기 때문이라든가 선발투수의 비중을 너무 높게 혹은 너무 낮게 두고 평가를 했기 때문이라든가.

 

3. 야구 말고 다른 종목에도 비슷한 편향이 있는지 그 편향의 배경에 있을 것으로 추측되는게 뭘지 찾아보려 합니다.

 

4. 몇가지 알고리즘을 테스트해볼겁니다.  주식에서 퀀트투자알고리즘을 테스트하는 것과 비슷합니다.  back-test라고 하는데, 디자인된 알고리즘을 과거 히스토리에 적용해서 수익률을 시뮬레이션해보는겁니다.