야구 분석/Tableau

간단한 투수 데이터 분석 및 시각화 (2.1)

sam_j_s 2024. 4. 10. 20:18
728x90
반응형

시각화 주제

저번 원태인 선수에 이어서 이번에는 '끝판대장' 삼성라이온즈의 마무리 오승환 선수의 기록을 가지고 간단한 시각화를 해보려고 합니다. 오승환 선수는 한국-일본-미국을 거치며 통산 525SV(24.4.10 기준)를 하며 KBO 최고의 마무리로 꼽히는 선수입니다.

 

원태인 선수는 구종을 살펴봤다면 오승환 선수는 KBO시즌 WAR과 ERA-의 상관관계를 분석해 보도록 하겠습니다. 시각화에 들어가기 전 WAR과 ERA-가 무엇인지 알려드리겠습니다.

 

WAR은 대체 수준 대비 승리 기여도의 약자로 선수가 팀 승리에 얼마나 공헌하였는가를 보여주는 기록입니다. 타격, 주루, 피칭, 수비 각각의 요소를 모두 계산한 스탯이기에 선수의 가치를 표현하는 궁극적인 방법이라고 할 수 있겠습니다.

 

ERA-는 조정 평균자책점으로 투수의 ERA값을 리그의 평균ERA로 나눈 것입니다. 100을 기준으로 얼마나 더 뛰어난지 보여주는 스탯으로 낮을수록 더 좋습니다. 예를 들어 ERA-가 75와 85인 투수가 있으면 75인 투수가 85인 투수보다 10% 더 좋다고 볼 수 있습니다.

 

그럼 WAR과 ERA-는 상관관계가 있는지 확인해 보겠습니다.

 

데이터 출처

현재 KBO선수들의 기록은 다양한 곳에서 찾아볼 수 있습니다. 그중 스탯티즈(https://statiz.sporki.com/)에서 원태인 선수의 기록을 가져왔습니다.

오승환_통산기록.xlsx
0.01MB

 

 

투수 데이터 시각화

WAR과 ERA-의 상관관계를 보기 전에 간단하게 몇 가지 시각화를 해보겠습니다.

통산 세이브

우선 열 선반에는 연도를 행 선반에는 세이브를 가져옵니다. 그 후 행 선반의 세이브를 한번 복제를 해 줍니다.

똑같은 걸 두번 가지고 왔지만 두 번째 값은 퀵테이블 계산을 누계로 바꿔줍니다. 그러면 상단은 연도별 세이브가 될 것이고 하단은 누계 세이브 즉 통산 세이브가 될 것입니다. 연도별 세이브와 통산 세이브가 따로 있는 것은 보기에 불편하므로 이중 축을 적용해 하나로 합쳐줍니다.

오승환 선수는 KBO에서 13 시즌동안 400세이브를 기록한 것을 볼 수 있었으며 2006년과 2011년에 47세이브 2021년에 44세이브로 40세이브 이상을 3번이나 기록한 선수라는 것을 알 수 있습니다.

 

연도별 세부 기록

열 선반에 연도와 나이를 가져와 주고 데이터에 있는 승, 패, 세이브, 삼진, 이닝, WAR, ERA, ERA-를 더블 클릭하여 가져와 주시면 됩니다.

여기다가 색상을 넣어주기 위해 마크에서 사각형으로 변경해 줍니다. 측정값을 ctrl+클릭으로 복사를 한 후 색상값에 넣어서 색상을 넣어주었습니다. 그러면 하나의 색상 범례가 나오는데 각각 분절하기 위해서는 색상역할을 하고 있는 측정값에서 별도의 범례 사용을 선택해 주었습니다.

 

승, 패, 세이브 같은 데이터는 주목도를 높이지 않기 위해 하얀색으로 바꿔주었고 나머지는 하얀색과 파란색으로 지정해 주었습니다.

실점, 이닝, WAR은 파란색에 가까울수록 좋지만 ERA와 ERA-는 하얀색에 가까울수록 좋은 것이기 때문에 위의 3개의 데이터와 아래 2개의 데이터가 반대되는 색을 띠는 것을 알 수 있습니다.

 

몇 가지 데이터를 비교해 보겠습니다. 이닝이 많다고 WAR이 놓은 건 아니라고 볼 수 있습니다. 23 시즌에 이닝은 높았지만 비슷한 이닝을 던진 21년보다 WAR이 3배 가까이 낮은 것을 볼 수 있습니다. 또한, 삼진을 많이 잡을수록 WAR이 높은 것을 볼 수 있었지만 09 시즌은 같은 삼진을 잡은 08 시즌과 비교했을 때 이닝도 적고 ERA도 높아서 WAR이 4배 정도 차이 나는 것을 볼 수 있습니다.

 

그럼 다음번에는 WAR과 ERA-의 상관관계를 알아보도록 하겠습니다.

 

 

반응형

'야구 분석/Tableau'의 다른글

  • 현재글 간단한 투수 데이터 분석 및 시각화 (2.1)

관련글