기사 본문 영역

상세페이지

[데이터]① 프로야구 팀 전력 차 ‘16년 만에 최대’
입력 2019.10.17 (14:58) 수정 2019.10.17 (14:59) 데이터룸
전력지수 산출…구단 전력 차 16년 만에 가장 커
시즌 70%나 남았는데 포스트 시즌 경쟁 끝나
KBO도 “위기 상황” 인정
[데이터]① 프로야구 팀 전력 차 ‘16년 만에 최대’
4년 연속 800만 관중 돌파는 낙관적이었습니다.

정규시즌 개막에 앞서 전략을 테스트하는 시범경기에도 1만 명이 넘는 유료 관중이 몰렸습니다. 정규리그가 개막한 날에는 5개 구장 중 4개 구장이 매진됐습니다. 개막 날과 이튿날 경기 모두 10만 이상의 관중이 모였습니다. 이틀 연속 10만 관중이 모인 건 프로야구 38년 사상 처음 있는 일이었습니다. NC가 기존 구장보다 관람석이 2배 많은 홈 구장(2만2,000석)을 새로 개장했다는 점을 감안해도 야구의 높은 인기를 실감할 수 있었습니다.

뜨거웠던 야구장의 열기는, 하지만 얼마 가지 않아 사그라들었습니다.

아래 그래프는 2017년부터 2019년 프로야구 정규시즌 경기별 관중 수를 누적해 만든 그래프입니다.


시즌 초반 관중 수는 3개년 모두 비슷한 흐름을 보입니다. 그러다가 시즌의 30% 정도를 소화했을 때부터 관중 누적 상승세에 차이가 나기 시작합니다. 2019년 프로야구가 개막한 지 두 달여 만에 야구장을 찾는 팬들의 발길이 과거에 비해 줄어든 겁니다. 러시아 월드컵이 열려 야구에 대한 관심이 줄어든 2018년보다도 야구장의 응원 소리는 작았습니다.

자랑스럽게 내세웠던 프로야구 800만 관중 시대는 그렇게 3년 만에 막을 내렸습니다.

관중 감소를 이끈 건 하위권 구단이었습니다.


최하위 롯데와 한화의 홈 관중은 지난해에 비해 각각 24.7%, 24.4%나 줄었습니다. kt와 KIA 전년 대비 각각 19.7%나 많은 좌석이 비었습니다.

승리와 패배라는 상대적인 결과가 존재하는 스포츠 리그에서 상위 팀과 하위 팀은 언제나 존재합니다. 그럼에도 2019년 시즌 특히 하위권의 관중 감소가 심했던 이유는 무엇일까요?

■ 싱거운 프로야구? 데이터로 따져보니…

프로야구 정규시즌의 묘미는 무엇보다도 포스트 시즌 진출권을 놓고 다투는 치열한 경쟁일 것입니다. 한국시리즈 직행 표를 따내는 정규시즌 1위만큼 포스트시즌 막차를 타는 5위 경쟁 역시 팬들의 주목을 끕니다. 이것은 정규시즌 막판 관중들을 모으는 대표적인 흥행 요소입니다.

이 같은 관점을 바탕으로 KBS 데이터저널리즘팀은 올 시즌 프로야구가 팽팽한 경쟁을 이어가며 팬들에게 재미를 줬는지 살펴봤습니다.

먼저 데이터저널리즘팀은 2019년 구단별 승률 데이터를 통해 승리가 전 구단에 골고루 퍼졌는지, 혹은 일부 팀에 몰렸는지 따졌습니다.

2019년 시즌 승률의 표준편차는 0.097로 계산됐습니다. 하지만 이것만 봐서는 애초 보고자 했던 승리의 쏠림 현상 여부를 파악하기 어렵습니다.

따라서 2001년부터 2019년까지 승률의 표준편차를 비교했습니다. 2001년은 프로야구 양대 리그(1999~2000년) 시행 중 나타난 리그 간 전력 불균형 등 문제를 해소하고자 단일리그로 환원된 첫해입니다.

그 결과, 2019년 시즌 값(0.097)은 2002년(0.113), 2003년(0.106)에 이어 세 번째로 높은 것으로 나타났습니다.


16년 만에 프로야구 승률의 편차가 가장 커진 겁니다. 승리의 쾌감은 특정 팀의 팬에 몰렸고, 나머지 팬은 패배로 인해 쓰라린 속을 거듭 달래야 했습니다.

그런데 승률 데이터가 갖는 한계가 있습니다. 승률은 승리와 패배, 즉 이분법적으로 나타난 결괏값만 내포하기 때문입니다. 쉽게 말해 0 대 10으로 일방적으로 진 팀과 7 대 8로 아슬하게 패배한 팀의 전력 차를 승률은 담아내지 못합니다. 따라서 구단별 전력을 보다 면밀히 따지기 위해서는 보다 많은 기록이 필요합니다.

■ 팀별 전력지수, 19년 치 산출하니…

KBS 데이터저널리즘팀은 한국야구위원회(KBO) 홈페이지를 통해 2001년부터 구단별로 타격·투수·주루·수비 등 4개 부문의 총 70여 개 세부 기록을 확보했습니다. 이 데이터를 합성·가공해 투수력, 타력, 득점력, 기동력, 수비력 등 부문별 전력지수를 산출했고, 이를 모두 합산해 종합전력지수를 매겼습니다.(전력지수의 자세한 내용은 기사 하단에 있습니다.)

그리고 종합전력지수의 표준편차를 시즌별로 따져보니 2019년 시즌 값(1.404)이 2003년(1.450)에 이어 두 번째로 높게 나타났습니다.


프로야구단 전력지수 편차는 단일리그로 환원된 시즌인 2001년(0.605) 가장 작았습니다. 그 후 2003년 최고점을 찍은 뒤 등락을 반복하다 2019년 다시 치솟았습니다.

야구 경기를 구성하는 상황과 변수들은 다른 스포츠와 비교해 매우 다양하고 복잡합니다. 그로 인해 야구 구단의 전력을 정확히 나타내기란 매우 어려운 일입니다. 따라서 데이터저널리즘팀은 한 가지 기준이 아닌 복수의 잣대로 2019년 프로야구 리그의 특징을 파악하고자 했습니다. 그 결과 승률로 보든, 전력지수를 기준으로 하든 2019년 시즌은 극심한 팀 간 전력 차이로 리그의 긴장감이 떨어진 이례적인 시즌이었습니다.

10개 구단이 모두 ‘프로’라는 이름으로 운동장에 나서지만, 거기서 보이는 능력의 차이는 매우 크다는 의미로 해석됩니다. 팬들이 일부 구단을 상대로 “고교 야구팀 수준”이라고 비난하는 배경으로도 읽힙니다.

아래는 2019년 구단 순위 변동 그래프입니다. 한국시리즈로 직행하는 1위 자리를 놓고 두산과 SK가 정규시즌 마지막 경기까지 치열하게 싸운 것을 볼 수 있습니다.

반면 포스트 시즌 막차 경쟁을 해야 할 5위와 6위 사이의 공백이 크게 자리하고 있습니다. 특히 4월 중순부터 8월 초순까지는 단 한 번도 6위 팀이 5위로 상승하지 못합니다. 마치 그 사이에 넘지 못할 벽이 있는 것처럼 포스트 시즌에 진출하는 상위 5개 구단은 좀체 바뀌지 않습니다. 앞서 프로야구의 흥행 요소로 꼽았던 시즌 막판 치열한 중위권 경쟁이 사라진 겁니다. 5강·5약 구단이 확연한 반쪽짜리 리그로 전락한 겁니다.


KBO 측은 이러한 상황을 엄중하게 받아들이고 있습니다. KBO 관계자는 “올 시즌 초반부터 팀 순위의 양극화가 굳어지면서 리그의 재미가 떨어져 관중 감소로 이어졌다”며 “KBO와 10개 구단은 현재 프로야구가 위기 상황이라는 것에 공감하며 이를 해결하기 위한 논의를 시작했다”고 밝혔습니다.

그렇다면 과연 극심한 전력 편차를 가져온 원인은 무엇일까요? 다음 기사에서는 프로야구의 전력 양극화가 발생한 배경에 대해 살펴보겠습니다.

데이터 수집·분석 : 김명윤, 윤지희
데이터 시각화 : 임유나

■ 전력지수 개요
- 종합전력지수 = 투수력 + 타력 + 득점력 + 기동력 + 수비력
- 투수력 구성 요인 : 평균자책점(ERA), 탈삼진, 세이브, 홀드, 피희생타, 피선구, 이닝당 출루허용율(WHIP), 완투완봉(완투+완봉), 피안타율, 피출루율, 범타처리능력(DER)
타력 구성 요인 : 출루율(OBP), 타율(AVE), 선구안(4구+고의4구+사구), 희생타(희타+희비), 삼진당볼넷, OPS(장타율+출루율), 장타율, 순장타율(ISOP), 호타준족(PSN)
- 득점력 구성 요인 : 타점율, 홈런, 추정득점(XR), 타득점
- 기동력 구성 요인 : 도루, 도루성공율
- 수비력 구성 요인 : 수비율(FPCT), 실책
- 범위와 의미가 동일하지 않은 야구 기록 데이터를 비교하기 위해 각 변수에 대해 정규화 진행.(요소값 – 동일 계열 최솟값 / 동일 계열 최댓값 – 동일 계열 최솟값). 이후 정규화한 변숫값에, 각 변인과 승률과의 상관계수를 가중치로 적용한 뒤 이를 합산해 전력지수 산출.

■ 전력지수 참고 문헌
채진석, 엄한주(2010). 프로야구 구단의 성적변화 추이와 상대적 전력 비교평가, 체육과학연구, 제21권, 956-973.

■ 분석 자문
이영훈 서강대 경제학과 교수, 채진석 광운대 생활체육학과 외래교수
  • [데이터]① 프로야구 팀 전력 차 ‘16년 만에 최대’
    • 입력 2019.10.17 (14:58)
    • 수정 2019.10.17 (14:59)
    데이터룸
전력지수 산출…구단 전력 차 16년 만에 가장 커
시즌 70%나 남았는데 포스트 시즌 경쟁 끝나
KBO도 “위기 상황” 인정
[데이터]① 프로야구 팀 전력 차 ‘16년 만에 최대’
4년 연속 800만 관중 돌파는 낙관적이었습니다.

정규시즌 개막에 앞서 전략을 테스트하는 시범경기에도 1만 명이 넘는 유료 관중이 몰렸습니다. 정규리그가 개막한 날에는 5개 구장 중 4개 구장이 매진됐습니다. 개막 날과 이튿날 경기 모두 10만 이상의 관중이 모였습니다. 이틀 연속 10만 관중이 모인 건 프로야구 38년 사상 처음 있는 일이었습니다. NC가 기존 구장보다 관람석이 2배 많은 홈 구장(2만2,000석)을 새로 개장했다는 점을 감안해도 야구의 높은 인기를 실감할 수 있었습니다.

뜨거웠던 야구장의 열기는, 하지만 얼마 가지 않아 사그라들었습니다.

아래 그래프는 2017년부터 2019년 프로야구 정규시즌 경기별 관중 수를 누적해 만든 그래프입니다.


시즌 초반 관중 수는 3개년 모두 비슷한 흐름을 보입니다. 그러다가 시즌의 30% 정도를 소화했을 때부터 관중 누적 상승세에 차이가 나기 시작합니다. 2019년 프로야구가 개막한 지 두 달여 만에 야구장을 찾는 팬들의 발길이 과거에 비해 줄어든 겁니다. 러시아 월드컵이 열려 야구에 대한 관심이 줄어든 2018년보다도 야구장의 응원 소리는 작았습니다.

자랑스럽게 내세웠던 프로야구 800만 관중 시대는 그렇게 3년 만에 막을 내렸습니다.

관중 감소를 이끈 건 하위권 구단이었습니다.


최하위 롯데와 한화의 홈 관중은 지난해에 비해 각각 24.7%, 24.4%나 줄었습니다. kt와 KIA 전년 대비 각각 19.7%나 많은 좌석이 비었습니다.

승리와 패배라는 상대적인 결과가 존재하는 스포츠 리그에서 상위 팀과 하위 팀은 언제나 존재합니다. 그럼에도 2019년 시즌 특히 하위권의 관중 감소가 심했던 이유는 무엇일까요?

■ 싱거운 프로야구? 데이터로 따져보니…

프로야구 정규시즌의 묘미는 무엇보다도 포스트 시즌 진출권을 놓고 다투는 치열한 경쟁일 것입니다. 한국시리즈 직행 표를 따내는 정규시즌 1위만큼 포스트시즌 막차를 타는 5위 경쟁 역시 팬들의 주목을 끕니다. 이것은 정규시즌 막판 관중들을 모으는 대표적인 흥행 요소입니다.

이 같은 관점을 바탕으로 KBS 데이터저널리즘팀은 올 시즌 프로야구가 팽팽한 경쟁을 이어가며 팬들에게 재미를 줬는지 살펴봤습니다.

먼저 데이터저널리즘팀은 2019년 구단별 승률 데이터를 통해 승리가 전 구단에 골고루 퍼졌는지, 혹은 일부 팀에 몰렸는지 따졌습니다.

2019년 시즌 승률의 표준편차는 0.097로 계산됐습니다. 하지만 이것만 봐서는 애초 보고자 했던 승리의 쏠림 현상 여부를 파악하기 어렵습니다.

따라서 2001년부터 2019년까지 승률의 표준편차를 비교했습니다. 2001년은 프로야구 양대 리그(1999~2000년) 시행 중 나타난 리그 간 전력 불균형 등 문제를 해소하고자 단일리그로 환원된 첫해입니다.

그 결과, 2019년 시즌 값(0.097)은 2002년(0.113), 2003년(0.106)에 이어 세 번째로 높은 것으로 나타났습니다.


16년 만에 프로야구 승률의 편차가 가장 커진 겁니다. 승리의 쾌감은 특정 팀의 팬에 몰렸고, 나머지 팬은 패배로 인해 쓰라린 속을 거듭 달래야 했습니다.

그런데 승률 데이터가 갖는 한계가 있습니다. 승률은 승리와 패배, 즉 이분법적으로 나타난 결괏값만 내포하기 때문입니다. 쉽게 말해 0 대 10으로 일방적으로 진 팀과 7 대 8로 아슬하게 패배한 팀의 전력 차를 승률은 담아내지 못합니다. 따라서 구단별 전력을 보다 면밀히 따지기 위해서는 보다 많은 기록이 필요합니다.

■ 팀별 전력지수, 19년 치 산출하니…

KBS 데이터저널리즘팀은 한국야구위원회(KBO) 홈페이지를 통해 2001년부터 구단별로 타격·투수·주루·수비 등 4개 부문의 총 70여 개 세부 기록을 확보했습니다. 이 데이터를 합성·가공해 투수력, 타력, 득점력, 기동력, 수비력 등 부문별 전력지수를 산출했고, 이를 모두 합산해 종합전력지수를 매겼습니다.(전력지수의 자세한 내용은 기사 하단에 있습니다.)

그리고 종합전력지수의 표준편차를 시즌별로 따져보니 2019년 시즌 값(1.404)이 2003년(1.450)에 이어 두 번째로 높게 나타났습니다.


프로야구단 전력지수 편차는 단일리그로 환원된 시즌인 2001년(0.605) 가장 작았습니다. 그 후 2003년 최고점을 찍은 뒤 등락을 반복하다 2019년 다시 치솟았습니다.

야구 경기를 구성하는 상황과 변수들은 다른 스포츠와 비교해 매우 다양하고 복잡합니다. 그로 인해 야구 구단의 전력을 정확히 나타내기란 매우 어려운 일입니다. 따라서 데이터저널리즘팀은 한 가지 기준이 아닌 복수의 잣대로 2019년 프로야구 리그의 특징을 파악하고자 했습니다. 그 결과 승률로 보든, 전력지수를 기준으로 하든 2019년 시즌은 극심한 팀 간 전력 차이로 리그의 긴장감이 떨어진 이례적인 시즌이었습니다.

10개 구단이 모두 ‘프로’라는 이름으로 운동장에 나서지만, 거기서 보이는 능력의 차이는 매우 크다는 의미로 해석됩니다. 팬들이 일부 구단을 상대로 “고교 야구팀 수준”이라고 비난하는 배경으로도 읽힙니다.

아래는 2019년 구단 순위 변동 그래프입니다. 한국시리즈로 직행하는 1위 자리를 놓고 두산과 SK가 정규시즌 마지막 경기까지 치열하게 싸운 것을 볼 수 있습니다.

반면 포스트 시즌 막차 경쟁을 해야 할 5위와 6위 사이의 공백이 크게 자리하고 있습니다. 특히 4월 중순부터 8월 초순까지는 단 한 번도 6위 팀이 5위로 상승하지 못합니다. 마치 그 사이에 넘지 못할 벽이 있는 것처럼 포스트 시즌에 진출하는 상위 5개 구단은 좀체 바뀌지 않습니다. 앞서 프로야구의 흥행 요소로 꼽았던 시즌 막판 치열한 중위권 경쟁이 사라진 겁니다. 5강·5약 구단이 확연한 반쪽짜리 리그로 전락한 겁니다.


KBO 측은 이러한 상황을 엄중하게 받아들이고 있습니다. KBO 관계자는 “올 시즌 초반부터 팀 순위의 양극화가 굳어지면서 리그의 재미가 떨어져 관중 감소로 이어졌다”며 “KBO와 10개 구단은 현재 프로야구가 위기 상황이라는 것에 공감하며 이를 해결하기 위한 논의를 시작했다”고 밝혔습니다.

그렇다면 과연 극심한 전력 편차를 가져온 원인은 무엇일까요? 다음 기사에서는 프로야구의 전력 양극화가 발생한 배경에 대해 살펴보겠습니다.

데이터 수집·분석 : 김명윤, 윤지희
데이터 시각화 : 임유나

■ 전력지수 개요
- 종합전력지수 = 투수력 + 타력 + 득점력 + 기동력 + 수비력
- 투수력 구성 요인 : 평균자책점(ERA), 탈삼진, 세이브, 홀드, 피희생타, 피선구, 이닝당 출루허용율(WHIP), 완투완봉(완투+완봉), 피안타율, 피출루율, 범타처리능력(DER)
타력 구성 요인 : 출루율(OBP), 타율(AVE), 선구안(4구+고의4구+사구), 희생타(희타+희비), 삼진당볼넷, OPS(장타율+출루율), 장타율, 순장타율(ISOP), 호타준족(PSN)
- 득점력 구성 요인 : 타점율, 홈런, 추정득점(XR), 타득점
- 기동력 구성 요인 : 도루, 도루성공율
- 수비력 구성 요인 : 수비율(FPCT), 실책
- 범위와 의미가 동일하지 않은 야구 기록 데이터를 비교하기 위해 각 변수에 대해 정규화 진행.(요소값 – 동일 계열 최솟값 / 동일 계열 최댓값 – 동일 계열 최솟값). 이후 정규화한 변숫값에, 각 변인과 승률과의 상관계수를 가중치로 적용한 뒤 이를 합산해 전력지수 산출.

■ 전력지수 참고 문헌
채진석, 엄한주(2010). 프로야구 구단의 성적변화 추이와 상대적 전력 비교평가, 체육과학연구, 제21권, 956-973.

■ 분석 자문
이영훈 서강대 경제학과 교수, 채진석 광운대 생활체육학과 외래교수
KBS는 여러분과 함께 만들어갑니다.

kbs가 손수 골랐습니다. 네이버에서도 보세요.
기자 정보

    KBS사이트에서 소셜계정으로 로그인한 이용자는 댓글 이용시 KBS회원으로 표시되고
    댓글창을 통해 소셜계정으로 로그인한 이용자는 소셜회원으로 표시됩니다.