야구 이야기 : 세이버 메트릭스 ‘스코바 메트릭스’의 탄생을 기대하며

타율, 타점, 평균자책점, 탈삼진. 야구는 기록의 스포츠라고 불릴 정도로 온갖 기록들을 수치화해서 이용한다. 그리고 그 기록의 정점에 세이버 메트릭(Sabermetrics)라는 계량학문이 있다. 세이버 메트릭스는 야구에 게임이론과 통계를 도입해 기존 야구 기록을 보완하고, 숫자를 통해 야구에 대해 좀 더 학문적이고 깊이 있는 접근을 시도한다. 부대신문과 함께 세이버 메트릭스의 세계로 들어가 보자. -편집자 주

야구를 계량적으로 측정하는 학문

 

우선 세이버 메트릭스(Sabermetrics)는‘세이버’(Saber-The Society for American Baseball Research)와 ‘메트릭스’라는 용어의 합성어이다. 세이버는 미국야구연구회를 뜻하는 영어단어의 머리글자를 따서 발음하기 좋게 SABR을 Saber로 바꾸었고, metrics 라는 단어는 metric이란 단어에 접미어 ics를 붙인 것인데 ics는 흔히 학문을 나타내는 접미어로 사용된다. metric은 양적으로 측정하다는 뜻으로 자(ruler)를 의미하기도 한다. 즉, metrics는 ‘계량적으로 측정하는 학문’을 총칭한다. 예를 들어, econometrics (economy+metrics)는 계량경제학, biometrics (biology+metrics)는 계량생물학을 의미한다. 결론적으로 세이버 메트릭스는 ‘미국 계량야구연구학’ 정도로 번역될 수 있다. 즉, 미국 야구를 연구하되 계량적 접근을 하는 학문이다. 그렇다면 야구의 계량적 접근 이란 무엇인가? 야구 시합 중 상황에 따른 감독의 작전이 직관이나 주관이 아닌 계량적 판단에 따라 시행되는 것으로, 주로 과거의 자료에 근거하여 통계적으로 판단하는 것이다. 또한, 선수를 평가하여 연봉을 책정하거나 선수를 스카웃할 때 선수에 대한 평가 기준을 계량적으로 마련하는 것이다. 이는 마치 학생이 교수를 평가할 때 단순히 우수한 교수, 실력 있는 교수 등이 아닌 여러 평가 항목을 개발하여 어떤 교수의 강의를 계량적으로 평가하자는 시도와 같다고 볼 수 있다.

어떤 원리로 통계를 낼까

1971년 미국야구 “명예의 전당”에서 야구를 체계적이고 학문적으로 접근하자는 취지로 처음 결성된 세이버 메트릭스(Sabermetrics) 는 1978년 초 캔자스 주의 한 시골 마을 통조림 공장의 야간 경비원으로 일하고 있던 빌 제임스가 미국의 스포츠 주간지 ‘스포팅뉴스’의 한 구석에 다음과 같은 광고를 실음으로써 가속화되었다. <1977년 야구의 요약 : 완전히 새로운 18개 항목의 야구 통계가 실려 있음. 권당 3.58달러. 돈 보내실 주소 : 캔자스 주 로렌스, 66044> 빌 제임스는 이 책에서 새로운 야구 통계를 몇 가지 제안하였는데 주로 수비에 대한 새로운 통계량을 제안하였으며 예를 들면 다음과 같은 것이 있다. 어떤 수비수의 수비능력을 따지는 측도로 수비율(fielding percentage)을 주로 이용하는데 이는 (P+A)/(P +A+E)로 계산된다. 여기서, P는 putouts(자살 또는 척 살로 번역)을 나타내며 수비수가 타구를 원바운드 또는 노바운드로 잡아 스스로 아웃시킨 경우 수비수에게 주어진다. A는 assists(보살)인데 수비수가 아웃카운트를 잡을 수 있도록 도움을 준 다른 수비수에게 주어진다. 한편, E는 수비 에러를 의미한다. 수비율은 단순히 경기당 수비 에러의 평균 개수만 따지는 개념과 큰 차이가 있다. 출범 초기에는 큰 관심을 끌지 못했던 세이버 메트릭스는 해를 거듭할수록 합리적이고 객관적인 평가라는 인정을 받음으로써 이제는 거의 모든 구단에서 매우 귀중한 평가 자료로 활용하고 있다. 세이버 메트릭스는 많은 통계량을 개발하였는데 현재 우리나라 야구 중계나 신문의 스포츠 섹션에 흔히 등장하는 용어 몇 가지를 소개한다. 먼저, OPS (Onbase Plus Slugging percentage)라는 것이 있는데 이는 출루율(OBP; On-base Percentage)과 장타율(SLG ; Slugging Percentage)을 합한 것으로 타자의 능력을 평가하는 기준이 된다. 여기서 출루율은 타자가 베이스에 얼마나 많이 살아 나갔는지를 백분율로 나타낸 수치로서 (안타+사구)/ (타석수)이다. 한편, 장타율은 [1루타의 개수 +(2루타의 개수×2) +(3루타의 개수×3) +(홈런의 개수×4)] / 타석수로 정의된다. 4번의 타석에서 2개의 1루타를 친 A선수의 타율은 5할이 고장타율도 5할이다. 한편 4번의 타석에서 1개의 홈런을 친 B선수의 타율은 2할 5푼이 지만 장타율은 10할이다. 즉, B선수가 A선수보다 타율은 낮지만 장타율은 높다는 것이다. 국내에서도 인기를 끈 영화‘머니 볼(Money Ball)’의 주인공 빌리빈(브래드 피트 분)은 선수를 선발하는 전통적 방식에 반기를 들고 기존의 방식을 버리고선 통계를 통해 선수를 선발하는 방식을 선택한다. OPS와 같은 통계량을 선수 평가의 기준으로 삼는다. 안타, 홈런, 타점으로만 선수를 판단하던 당시 야구계에서 OPS는 신선한 충격이었고 그 결과는 대성공이었다. 방어율(ERA; Earned Run Average - 평균자책점 이라는 번역이 더 적절함)로 주로 표현되던 투수의 능력은 최근 WHIP(Walks plus Hits divided by Innings Pitched)이란 용어로 더욱 구체화되었다. WHIP은 말 그대로 사구와 안타 수를 합하여 투수가 던진 이닝 수로 나눈 것으로 낮을수록 좋은 값이다. 물론 방어율과 WHIP간에는 높은 상관관계를 가지지만 각 측도가 의미하는 바는 크게 차이가 있다. 그 외에도 세이버 메트릭스에서 개발한 여러 가지 측도가 있는데 그중 하나가 야구에서의 피타고라스 승률이 있다. 피타고라 스 정리는 주지하다시피 직각삼각형에서 짧은 두 변의 길이의 제곱의 합이 다른 긴 변의 길이의 제곱과 같다는 것이다. 야구에서 승률을 예측하는 수식으로 RS제곱 / (RS제곱 +RA 제곱)을 피티고라스 승률이라 하는데 여기서 RS(Run Scored)는 득점, RA(Run Allowed)는 실점을 나타내며, 이는 한 경기의 득점과 실점이 아니라 한 시즌 전체의 득점과 실점을 대입해야 더 의미 있게 된다. 실제 승률이 피타고라스 승률보다 높으면 1-2점 차의 승리를 많이 하여 운이 좋게 작용한 경기가 많았다는 것이고, 그 반대의 경우도 같 은 논리로 해석할 수 있다. 1-2점 차의 승리가 많은 팀은 마무리 투수가 강했고, 1-2점 차의 패배가 많은 팀은 마무리 투수가 약했다는 해석도 할 수 있다.

통계학과 야구의 관계

▲ 일러스트=김예지

야구는 모든 스포츠 중에서 가장 많은 통계 자료를 쏟아낸다고 할 수 있다. 실제로 여러 분야의 논문을 발표하는 대규모의 국제통계 학회에서 다른 스포츠는 몰라도 야구에 대한 세션이 따로 있을 정도로 야구는 통계학과 밀접한 관계가 있다. 특히, 최근에 큰 이슈가 되고 있고 많은 연구자들의 관심을 끌고 있는 빅 데이터(Big data) 분석 기법도 야구에 적용될 수 있다. 지금까지 야구에 대한 수많은 평가 측도들이 개발되고 제시되었고 새로운 측도 개발을 위한 연구가 지속되고 있다. 계량적 평가에서 가장 중요한 것은 측도의 타당성과 객관성이다. 불합리하고 주관적인 측도는 대중을 미혹시킬 뿐이다. 더불어, 너무 많은 평가 잣대가 제시되면 오히려 야구의 본질을 훼손하는 역기능을 할 수 있다. 평가 측도는 단순하고 간단할수록 좋다. 측도의 개발 못지않게 중요한 과제는 한국 야구에서 발생된 여러 가지 자료를 근거로 통계적 분석이 끊임없이 시도되어야 한다. 예를 들어, 투고타저와 타고투저 현상의 시계열적 분석, 무사 1루의 상황에서 번트와 강공의 득점력 비교, 루키의 2년 차 성적에 대한 분석, streaky 팀(연승 또는 연패가 많은 팀)의 특성 등이다.

야구의 발전을 위하여

현재 국내에서도 다양한 야구 연구회가 활동 중이다. 세이버 메트릭스가 아닌 가칭 ‘스코 바 메트릭스 (Society for KOrean BAseball Research metrics - 한국계량야구 연구학)’의 창설을 기대해 본다. 끝으로, 우리가 좀 더 고민해 봐야 할 분야는 평가측도의 개발과 해석뿐만 아니라 무분별하고 여과 없이 들여오는 야구용어다. 야구(baseball), 유격수 (short-stop), 중견수 (center fielder), 우익수(right fielder), 좌익수(left fielder) 등은 일본에서 만든 용어로 다시 한 번 생각해 봐야 할 정도로 납득하기 어렵다. 아울러 최근 많이 사용하고 있는 OPS나 WHIP에 대한 쉽고 제대로 된 우리말 번역도 시급하다.

▲ 김충락(통계) 교수
     
 
저작권자 © 채널PNU 무단전재 및 재배포 금지