MLB 12

야구 분석/R
메이저리그 선수들의 커리어 살펴보기

주제 미키 맨틀의 커리어 살펴보기주제R 시스템은 데이터에 통계 모델을 적용하는 데 매우 적합합니다. 세이버메트릭스에서 자주 다루는 주제 중 하나는 MLB 데뷔부터 은퇴까지의 선수 시즌 타격, 수비 또는 투구 통계의 상승과bbdiary03.tistory.com저번에 미키 맨틀 선수의 커리어를 확인해 보았습니다. 이번에는 미키 맨틀 선수와 다른 메이저리그 선수들의 커리어를 같이 살펴보겠습니다. 타구 궤도 비교사전 분석 작업선수들의 타구 궤적을 비교할 때, 관련 있는 변수 중 하나는 선수의 수비 위치입니다. 포수와 같은 중요한 수비 포지션의 타격 기대치는 1루수와는 다릅니다. 같은 포지션을 가진 선수들의  궤적을 비교하려면, 수비 위치가 데이터베이스에 기록되어야 합니다. 이미 타격 데이터 프레임(batting..

야구 분석/R
미키 맨틀의 커리어 살펴보기

주제R 시스템은 데이터에 통계 모델을 적용하는 데 매우 적합합니다. 세이버메트릭스에서 자주 다루는 주제 중 하나는 MLB 데뷔부터 은퇴까지의 선수 시즌 타격, 수비 또는 투구 통계의 상승과 하락입니다. 일반적으로 대부분의 선수들이 20대 후반에 전성기를 맞이한다고 믿어지지만, 일부 선수들은 더 늦은 나이에 전성기를 맞이하는 경향이 있습니다. 선수의 커리어 궤적을 모델링하는 간단한 방법은 이차 함수 또는 포물선 곡선을 사용하는 것입니다. R의 lm() (선형 모델) 함수를 사용하면, 선수의 나이와 OPS 통계를 통해 이 모델을 쉽게 적용할 수 있습니다. 유명한 선수의 커리어 궤적을 살펴보겠습니다. 미키 맨틀은 19세에 뉴욕 양키스에서 큰 영향을 미쳤고, 빠르게 성장하여 최고의 타자 중 한 명이 되었습니다...

야구 분석/R
포수 프레이밍이란?

주제이 번에서는 2022 시즌의 Statcast 데이터를 사용하여 포수의 프레이밍 능력에 대해 알아보겠습니다. 야구 분석에서 포수의 프레이밍 능력 이야기는 흥미롭습니다. 역사적으로 스카우트와 코치들은 특정 포수들이 심판을 위해 투구를 '프레임'하는 능력을 가지고 있다고 주장했습니다. 이는 글러브를 상대적으로 고정시켜 심판을 속여서 스트라이크 존 밖에 있는 투구도 스트라이크로 판정받게 할 수 있다는 아이디어입니다(Lindbergh(2013)의 훌륭한 시각적 설명 참조). 야구 분석가들은 이 능력의 존재와 영향에 대해 대체로 회의적이었습니다. 포수의 수비 능력의 영향을 연구한 대부분의 사람들은 스카우트와 코치들이 믿는 것만큼 가치가 크지 않다고 결론지었습니다. 문제의 일부는 2000년대 중반까지 투구 수준의..

야구 분석/R
안타와 도루의 가치

주제야구 경기는 다양한 타격과 주루 플레이를 통해 득점을 올리는 게임입니다. 안타, 홈런, 도루는 모두 팀의 득점에 기여할 수 있는 중요한 요소입니다. 하지만 각 플레이의 득점 가치는 상황에 따라 다르며, 이를 정량적으로 분석하는 것은 팀 전략 수립에 중요한 역할을 합니다. 이번 글에서는 안타, 홈런, 도루의 득점 가치를 심층적으로 분석하여, 이들이 경기에서 어떻게 활용될 수 있는지 알아보겠습니다. 다양한 안타의 득점 가치야구 분석에서 득점 가치(run values)는 다양한 응용 분야를 가지고 있습니다. 이번 글에서는 득점 창출 관점에서 홈런과 단타의 가치를 살펴보겠습니다. 타율(batting average)에 대한 한 가지 비판은 네 가지 가능한 안타(단타, 2루타, 3루타, 홈런)에 동일한 가치를 ..

야구 분석/R
메이저리그 타자들의 득점 기대치

득점 기대치를 사용한 플레이 가치를 평가해보기주제Analyzing Baseball Data with R의 5장인 'Value of Plays Using Run Expectancy'를 통해 야구 데이터를 분석하는 방법을 배우고자 합니다. 책의 내용을 살펴보면서 각 개념을 이해하고, 실제 데이터를 통해 공bbdiary03.tistory.com저번에는 호세 알투베를 기준으로 득점 기여도를 확인해 보았습니다. 이번에는 2016 시즌 메이저 리그의 모든 타자들과 호세 알투베를 비교해 보도록 하겠습니다. 모든 타자들의 기회와 성공득점 가치 추정치는 선수들의 타격 효율성을 비교하는데 사용될 수 있습니다. 우리는 타격 플레이에 집중하기 위해, 주 데이터 프레임 retro2016에서 bat_event_fl변수가 TRUE..

야구 분석/R
득점 기대치를 사용한 플레이 가치를 평가해보기

주제Analyzing Baseball Data with R의 5장인 'Value of Plays Using Run Expectancy'를 통해 야구 데이터를 분석하는 방법을 배우고자 합니다. 책의 내용을 살펴보면서 각 개념을 이해하고, 실제 데이터를 통해 공부해 볼 것입니다. 득점 기대 행렬세이버매트릭스에서 중요한 개념은 득점 기대 행렬입니다. 각 베이스(1루, 2루, 3루)에 주자가 있을 수도 있고 없을 수도 있기 때문에, 세 개의 베이스에 주자가 위치할 수 있는 가능한 배열은 8가지입니다. 아웃 수는 0, 1, 2로 세 가지 가능성이 있으므로, 주자와 아웃의 가능한 배열은 총 8 × 3 = 24가지입니다. 각 주자 배치와 아웃 수의 조합에 대해 우리는 이닝의 나머지 부분에서 평균 득점 수를 계산하는데..

야구 분석/Python
타율이 높은 선수는 홈런도 많이 칠까? 2023 시즌 데이터로 본 상관관계

시각화 주제KBO를 보다가 MLB를 보게 되면 신기한 장면들을 많이 볼 수 있습니다. 투수들은 100마일이 넘는 강속구를 던지고 타자들은 그 공을 잘 쳐내는 모습들을 볼 수 있습니다. 또한, 2할이 채 되지 않는 타자인데 출루율은 4할이 넘거나 홈런을 30개 이상씩 치며 KBO만 본 사람한테는 이해할 수 없는 지표를 기록하는 선수들이 많이 나옵니다. 그래서 한국 야구처럼 타율이 높은 선수는 홈런도 많이 치는지 궁금해져 23 시즌 메이저리그 선수들의 홈런과 타율의 상관관계를 보도록 하겠습니다.  데이터 출처메이저리그에서 제공하는 공식 API인 MLB Stats API를 이용하였습니다. 이 API를 통해 실시간 경기 결과, 선수 통계, 팀 정보, 시즌 데이터, 경기 일정 등 다양한 데이터를 가져올 수 있습니..

야구 분석/Python
히트 스프레이 차트에 야구장 사진 넣어보기

시각화 주제 히트 스프레이 차트 만들어보기시각화 주제KBO나 MLB의 선수 기록을 확인하는 사이트인 스탯티즈나 베이스볼 서번트에서 타자의 기록을 확인할 때마다 나오는 히트 스프레이 차트가 있습니다. 타자의 안타, 2루타, 3루타, 홈런bbdiary03.tistory.com 저번에 만들어 놓은 히트 스프레이 차트의 배경에 야구장 이미지를 넣어보겠습니다. 데이터 출처메이저리그 데이터를 분석하기 위해 개발된 오픈 소스 라이브러리인 pybaseball을 사용했습니다. 이 라이브러리는 주로 여러 공개 데이터 소스에서 정보를 수집하며, 이 데이터는 Retrosheet, Baseball Savant, Fangraphs 등과 같은 웹사이트에서 제공됩니다. 시각화패키지 임포트import base64from pathlib..

야구 분석/Python
히트 스프레이 차트 만들어보기

시각화 주제KBO나 MLB의 선수 기록을 확인하는 사이트인 스탯티즈나 베이스볼 서번트에서 타자의 기록을 확인할 때마다 나오는 히트 스프레이 차트가 있습니다. 타자의 안타, 2루타, 3루타, 홈런을 각각 다른 색의 점으로 표현해 공이 야구장의 어느 곳으로 떨어졌는지 알 수 있습니다. 그래서 이걸 직접 만들어 볼 수 있을까 궁금해서 한번 시도해 보았습니다.  데이터 출처메이저리그 데이터를 분석하기 위해 개발된 오픈 소스 라이브러리인 pybaseball을 사용했습니다. 이 라이브러리는 주로 여러 공개 데이터 소스에서 정보를 수집하며, 이 데이터는 Retrosheet, Baseball Savant, Fangraphs 등과 같은 웹사이트에서 제공됩니다. 데이터 시각화패키지 설치 및 임포트!pip install p..

야구 분석/Python
놀란 아레나도 수비 지표 분석

시각화 주제메이저리그에서는 매년 최고의 수비수에게 주어지는 상이 있습니다. 골드 글러브 입니다. 골드 글러브는 선수의 수비만 평가에 들어갑니다. 선수 전체 기록을 보는 KBO의 골든 글러브와 다르게 메이저리그는 수비만 보는 골드 글러브와 공격만 보는 실버 슬러거로 나누어져 있고 투구에 대한 평가는 사이 영 상으로 나누어져 있습니다. 메이저리그 최고의 수비수 한테 주는 이 상을 10년 연속으로 받은 선수가 있습니다. 바로 놀란 아레나도 인데요. 아레나도는 데뷔시즌인 2013년부터 2023년까지 10년 연속으로 3루수 골드글러브를 수상했습니다. 그럼 공수겸장 현 최고 3루수 중 한명인 놀란 아레나도의 수비 지표를 확인해보겠습니다. 아레나도 무릎쏴 미친수비  데이터 출처메이저리그에서 제공하는 공식 API인 M..

야구 분석/Python
24시즌 오타니와 베츠의 성적 비교

시각화 주제팀당 40경기정도 지난 지금 메이저리그에 미친 듀오가 있습니다. 바로 베츠와 오타니입니다. 다저스의 1번과 2번으로 나서면서 타격의 모든 지표에서 상위권을 달리고 있습니다. 이 폭격기 듀오가 시즌이 끝날 때는 어떤 성적을 기록할지 모르겠지만 우선 현재 타격지표로 비교해 보도록 하겠습니다.  데이터 출처이번 데이터는 따로 수집을 하지 않고 MLB Stats API를 사용했습니다.MLB stats API는 MLB서버에 직접 연결하여 필요한 데이터를 편리하게 수집할 수 있는 API입니다. 데이터 분석패키지 임포트필요한 패키지를 불러오고 오타니와 베츠선수의 id를 검색해보겠습니다.import statsapiimport pandas as pdimport plotly.offline as pyoimport..

야구 분석/Python
2023시즌 메이저리그 팀 순위 변화

시각화 주제여태까지 KBO 선수들의 기록들을 분석해 보았다면 이번에는 메이저리그로 옮겨보았습니다. 메이저리그는 내셔널 리그, 아메리칸 리그 2개로 나눠져 있고 각각 중부, 동부, 서부로 나누어져 있습니다. 이번에는 내셔널 중부리그의 순위 변화를 확인해 보겠습니다.  데이터 출처이번 데이터는 따로 수집을 하지 않고 MLB Stats API를 사용했습니다.MLB stats API는 MLB서버에 직접 연결하여 필요한 데이터를 편리하게 수집할 수 있는 API입니다. 데이터 분석패키지 설치 및 임포트필요한 패키지들을 가져와주도록 하겠습니다.!pip install plotly!pip install MLB-StatsAPIimport statsapiimport pandas as pd 팀 순위 정보 검색statsapi...