이렇게 해석한다. "나무의 레벨이 d라고 할 때 노드의 수 N이 조건을 만족한다."
그럴듯해 보이지만 이해가 쉽지 않을 것이다. 바로 이것이 사기꾼들이 야구 기록을 그럴듯하게 포장하는 기법이다. 쉽게 설명할 수 있지만 사기꾼들은 복잡하게 왜곡시킨다. 대중의 등을 쳐서 돈을 벌기 위해서이다.
윈도우 운영체제에는 탐색기가 있다. 탐색기를 열면 수많은 폴더가 있고, 사용자가 특정 폴더를 제거할 수도 있고, 특정 폴더 안에 또 다른 폴더를 생성할 수도 있다. 나무(tree) 알고리즘에 의해 탐색기의 폴더를 제거/생성할 수 있는 것이다. 알고리즘은 데이타 처리가 아무리 복잡해도 정확하게 작동하는, 즉 신뢰할 수 있는 논리적인 공식을 의미한다. 마찬가지로 야구에서 사용되는 숫자놀음이 논리가 되려면 신뢰할 수 있어야 한다. 그러나 야구의 숫자놀음에 논리적인 공식은 존재하지 않는다.
<참고> 세이버매트릭스 - 방어율(ERA), FIP, 숫자놀음은 사기꾼 도구
타율은 결과 비율이지만 방어율은 가상 비율
1%는 100개 중에서 1개라는 뜻이다. 100번의 타격 기회에서 30번의 안타를 치면 3할이라고 한다. 여기에서 30번의 안타가 바로 결과이며, 이를 비율로 표현한 것이 타율이다.
[타율] 안타 ÷ 타수 [ERA] 자책점 × 9 ÷ 이닝
방어율은 설명 불가능한 상수 '9'가 사용되는 가상 비율 기록이기 때문에 타율에 비해 신뢰도가 떨어진다. '9'는 야구의 9이닝을 의미하는 것으로, 어떤 투수가 3이닝 1자책점을 기록하고 교체되었다면, 그 투수의 경기 방어율은 3점이 된다. 3이닝을 가상으로 9이닝으로 확장시킨 결과이다. 당연히 결과 비율인 타율에 비해 방어율의 신뢰도는 떨어진다.
그렇다면 방어율을 결과 비율로 만들 수 있는 방법은 없나?
상수 '9'를 신뢰할 수 있는 숫자로 만들면 된다. 9이닝 투구 또는 8이닝 완투패의 경우에만 방어율을 계산하면 타율처럼 결과 비율이 된다. 그런데 그 방법에는 문제가 있다. 야구는 정치적인 스포츠이기 때문이다.
KBO는 2010시즌에 스트라이크존 좌우폭을 공 0.5개씩 확장하겠다고 공표한 바 있다. 그런데 문제가 있었다. 적용이 불가능했기 때문이다. 프로야구 투수의 공은 빠르고 변화무쌍하다. 심판은 인간이며, 인간의 눈깔로 가상 라인을 설정하면 오류가 발생한다.
스트라이크존 좌우폭이 공 6~7개 크기로 작동하는 프로야구 리그는 없다. 심판이 홈-플레이트를 확실하게 통과한 공만 스트라이크로 잡아주겠다고 작정하지 않는 이상, 그런 스트라이크존은 존재할 수가 없다.
홈-플레이트 좌우에 걸치거나 스치는 공은 어떻게 할 것인가? 그렇기 때문에 실질적인 가장 좁은 스트라이크존 좌우폭은 공 8~9개 크기로 확장되고(포스트시즌), 정규시즌의 스트라이크존 좌우폭은 일반적으로 공 1개 이상 더 확장된다(9~10개). 이상적인 스트라이크존 좌우폭은 투수 관점이 아닌 타자 관점에서 정의되어야 한다. 타자가 감안해야 할 좌우폭은 9개 기반, 10개 이내에서 작동되어야 한다. 80년대 KBO는 정규시즌에서 무려 11개 기반의 좌우폭이 적용되었고, 선동열의 엽기적인 방어율 기록은 당시의 몰상식한 스트라이크존을 대변하고 있다.
선동열의 방어율 기록에서 결과 비율을 구할 수 있는 경기만 따로 계산하면 어떤 결과가 나올까?
그런데 몰상식한 스트라이크존이 또 문제가 된다. 그렇다고 방법이 없는 것은 아니다. 상식적인 스트라이크존이 적용된 포스트시즌에서의 선동열 방어율 기록, 그 중에서 결과 비율을 구할 수 있는 경기만 따로 계산하면 된다.
1986년 한국시리즈 1차전 9이닝 투구(3실점)
1989년 한국시리즈 1차전 8이닝 완투패(4실점 3자책점)
1991년 한국시리즈 1차전 9이닝 완투승(4실점)
26이닝 11실점(10자책점) 3.46 방어율을 기록했다. 상식적인 스트라이크존에서, 그리고 강팀과의 대결인 한국시리즈에서 선동열의 방어율 결과 비율은 통산 방어율 1.20에 비해 무려 3배 가까이 폭등했다는 사실을 알 수 있다.
만약 선동열이 각각 6이닝을 투구했다고 가정하면, 1986년 0실점 + 1989년 1실점 + 1991년 2실점 18이닝 3실점 1.50
놀랍지 않은가? 이처럼 방어율은 (상식적인 스트라이크존에서) 가상 비율일 때와 결과 비율일 때가 완전히 다르다. 80년대 KBO는 특급 에이스에게 완투, 연투가 당연시 되었고, 더구나 내구력이 떨어지는 선동열에게 국보급 투수라는 수식어는 감당하기 힘든 무게였다. 선동열은 10년을 앞서 태어난 투수였다. 만약 1995년에 프로에 입단했다면, 분업화된 환경에서 KBO 역사상 최고의 마무리 투수로 기억되었을 것이다. 논란에 휘말리는 일은 없었을 것이다. 그렇다면 최동원의 경우에는 어떤 결과가 나올까?
1984년 한국시리즈 1차전 9이닝 완봉승(0실점)
1984년 한국시리즈 3차전 9이닝 완투승(2실점)
1984년 한국시리즈 5차전 8이닝 완투패(3실점 2자책점)
1984년 한국시리즈 7차전 9이닝 완투승(4실점)
35이닝 10실점(9자책점) 2.31 방어율을 기록했다. 최동원의 통산 방어율은 2.46이다. 상식적인 스트라이크존에서, 그리고 강팀과의 대결인 한국시리즈에서 최동원의 방어율 결과 비율은 통산 방어율과 사실상 차이가 없었다.
최동원의 경우에도 각각 6이닝을 투구했다고 가정하면, 1984년 1차전 0실점 + 3차전 1실점 + 5차전 2실점(1자책점) + 7차전 4실점 24이닝 7실점(6자책점) 2.25
최동원은 (상식적인 스트라이크존에서) 가상 비율일 때와 결과 비율일 때, 심지어 통산 방어율과도 차이가 없었다. 더욱 놀라운 것은 엽기적인 연투의 결과라는 사실이다. 어떻게 가능했던 것일까? 스트라이크존 좌우폭에 의존하지 않는 최상위 레벨의 완성도를 갖추었기 때문에 가능했던 것이다. <참고> 최동원의 완성도 - 류현진, 구로다 히로키와 무엇이 다른가?
짝퉁 제구력을 완벽한 제구력으로 둔갑시킨 아메리칸 스케일
투수의 투구는 음식맛과 동일하다. 화려한 식당이 최고의 음식맛을 보증하지는 않는다. 먹어봐야 음식맛을 가늠할 수 있는 것처럼 투수의 기량은 실전 투구에서 가늠할 수 있다. 기록은 기량을 대변하지 않는다. 야구는 정치적인 스포츠이기 때문이다.
![]()
1986년 만 20세에 (확장 엔트리때) 메이저리그 커리어를 시작한 그렉 매덕스는 1987년에 6승 14패 155.2이닝 5.61 방어율로 뚜렷한 한계를 드러냈다. 그런 투수가 1988년에 갑자기 진화하여 메이저리그 현대 야구사 최고 투수 반열에 오른 것이다.
1988년은 스포츠 기적의 원년이었고, 그렉 매덕스는 1988년에 신인류로 진화했던 것이다. 노모히데오가 아시아 야구 기적의 시작이었다면 메이저리그에는 그렉 매덕스가 있었다. 이무기가 용이 되는 해괴망측한 시대가 도래한 것이었다! <참고> 그렉 매덕스(Greg Maddux)는 제구력 마법사가 아니었다!