야구 분석/Tableau

간단한 투수 데이터 분석 및 시각화 (2.2)

sam_j_s 2024. 4. 13. 17:33
728x90
반응형
 

간단한 투수 데이터 분석 및 시각화 (2.1)

시각화 주제 저번 원태인 선수에 이어서 이번에는 '끝판대장' 삼성라이온즈의 마무리 오승환 선수의 기록을 가지고 간단한 시각화를 해보려고 합니다. 오승환 선수는 한국-일본-미국을 거치며

bbdiary03.tistory.com

이번에는 저번에 이어서 WAR과 ERA-의 상관관계에 대해서 보도록 하겠습니다.

WAR과 ERA- 상관관계

우선 WAR을 열에 ERA-를 행에 넣어줍니다. 하나로 뭉쳐져 있는데 연도를 세부 정보 마크로 가져와 줍니다.

그다음 분석 패널에서 평균 라인을 드래그해서 테이블로 추가해 줍니다. 또한, 추세선도  드래그 후 다항식으로 추가해 줍니다. 왼쪽에 있는 축은 마우스 오른쪽 클릭 후 0부터 시작이 아닌 최솟값부터 시작할 수 있도록 0 포함을 지워줍니다.

 

다시 한번 연도를 레이블 마크에 넣어주고 마크는 모양이 아닌 원으로 변경해 줍니다. 그런 다음 필요한 내용들을 주석처리해 주었습니다. 2005-6 시즌, 2011-13 시즌은 소속팀이 우승을 하였기 때문에 우승이라는 주석을 넣어주었습니다. 세이브왕을 했던 시즌인 2006-8 시즌, 2011-12 시즌, 2021 시즌 도 주석을 넣어주고 금메달을 목에 걸었던 베이징 올림픽도 추가해 줍니다.

 

이제 상관관계를 확인해 보겠습니다. 분석에서 새로운 필드 만들기를 누른 다음 아래와 같이 식을 써주면 됩니다.

 

새로운 필드를 마크에 텍스트로 가져오면 상관관계가 얼마인지 알 수 있는데 -0.8026으로 나옵니다. 상관계수의 절댓값이 0.8 이상이면 일반적으로 강한 상관계수로 분류됩니다. 그렇기 때문에  WAR과 ERA- 사이에 매우 강한 음의 상관관계가 있는 것을 알 수 있습니다. 이는 한 변수가 증가할 때 다른 변수가 감소하는 경향이 매우 뚜렷하다는 것을 나타냅니다. 

 

이제 새로운 대시보드를 만들어서 상관관계와 만들어준 그래프를 가져오면 끝입니다.

반응형

'야구 분석/Tableau'의 다른글

  • 현재글 간단한 투수 데이터 분석 및 시각화 (2.2)

관련글