세이버 메트릭스 8

야구 분석/R
메이저리그 선수들의 커리어 살펴보기

주제 미키 맨틀의 커리어 살펴보기주제R 시스템은 데이터에 통계 모델을 적용하는 데 매우 적합합니다. 세이버메트릭스에서 자주 다루는 주제 중 하나는 MLB 데뷔부터 은퇴까지의 선수 시즌 타격, 수비 또는 투구 통계의 상승과bbdiary03.tistory.com저번에 미키 맨틀 선수의 커리어를 확인해 보았습니다. 이번에는 미키 맨틀 선수와 다른 메이저리그 선수들의 커리어를 같이 살펴보겠습니다. 타구 궤도 비교사전 분석 작업선수들의 타구 궤적을 비교할 때, 관련 있는 변수 중 하나는 선수의 수비 위치입니다. 포수와 같은 중요한 수비 포지션의 타격 기대치는 1루수와는 다릅니다. 같은 포지션을 가진 선수들의  궤적을 비교하려면, 수비 위치가 데이터베이스에 기록되어야 합니다. 이미 타격 데이터 프레임(batting..

야구 분석/R
미키 맨틀의 커리어 살펴보기

주제R 시스템은 데이터에 통계 모델을 적용하는 데 매우 적합합니다. 세이버메트릭스에서 자주 다루는 주제 중 하나는 MLB 데뷔부터 은퇴까지의 선수 시즌 타격, 수비 또는 투구 통계의 상승과 하락입니다. 일반적으로 대부분의 선수들이 20대 후반에 전성기를 맞이한다고 믿어지지만, 일부 선수들은 더 늦은 나이에 전성기를 맞이하는 경향이 있습니다. 선수의 커리어 궤적을 모델링하는 간단한 방법은 이차 함수 또는 포물선 곡선을 사용하는 것입니다. R의 lm() (선형 모델) 함수를 사용하면, 선수의 나이와 OPS 통계를 통해 이 모델을 쉽게 적용할 수 있습니다. 유명한 선수의 커리어 궤적을 살펴보겠습니다. 미키 맨틀은 19세에 뉴욕 양키스에서 큰 영향을 미쳤고, 빠르게 성장하여 최고의 타자 중 한 명이 되었습니다...

야구 분석/R
포수 프레이밍이란?

주제이 번에서는 2022 시즌의 Statcast 데이터를 사용하여 포수의 프레이밍 능력에 대해 알아보겠습니다. 야구 분석에서 포수의 프레이밍 능력 이야기는 흥미롭습니다. 역사적으로 스카우트와 코치들은 특정 포수들이 심판을 위해 투구를 '프레임'하는 능력을 가지고 있다고 주장했습니다. 이는 글러브를 상대적으로 고정시켜 심판을 속여서 스트라이크 존 밖에 있는 투구도 스트라이크로 판정받게 할 수 있다는 아이디어입니다(Lindbergh(2013)의 훌륭한 시각적 설명 참조). 야구 분석가들은 이 능력의 존재와 영향에 대해 대체로 회의적이었습니다. 포수의 수비 능력의 영향을 연구한 대부분의 사람들은 스카우트와 코치들이 믿는 것만큼 가치가 크지 않다고 결론지었습니다. 문제의 일부는 2000년대 중반까지 투구 수준의..

야구 분석/R
안타와 도루의 가치

주제야구 경기는 다양한 타격과 주루 플레이를 통해 득점을 올리는 게임입니다. 안타, 홈런, 도루는 모두 팀의 득점에 기여할 수 있는 중요한 요소입니다. 하지만 각 플레이의 득점 가치는 상황에 따라 다르며, 이를 정량적으로 분석하는 것은 팀 전략 수립에 중요한 역할을 합니다. 이번 글에서는 안타, 홈런, 도루의 득점 가치를 심층적으로 분석하여, 이들이 경기에서 어떻게 활용될 수 있는지 알아보겠습니다. 다양한 안타의 득점 가치야구 분석에서 득점 가치(run values)는 다양한 응용 분야를 가지고 있습니다. 이번 글에서는 득점 창출 관점에서 홈런과 단타의 가치를 살펴보겠습니다. 타율(batting average)에 대한 한 가지 비판은 네 가지 가능한 안타(단타, 2루타, 3루타, 홈런)에 동일한 가치를 ..

야구 분석/R
메이저리그 타자들의 득점 기대치

득점 기대치를 사용한 플레이 가치를 평가해보기주제Analyzing Baseball Data with R의 5장인 'Value of Plays Using Run Expectancy'를 통해 야구 데이터를 분석하는 방법을 배우고자 합니다. 책의 내용을 살펴보면서 각 개념을 이해하고, 실제 데이터를 통해 공bbdiary03.tistory.com저번에는 호세 알투베를 기준으로 득점 기여도를 확인해 보았습니다. 이번에는 2016 시즌 메이저 리그의 모든 타자들과 호세 알투베를 비교해 보도록 하겠습니다. 모든 타자들의 기회와 성공득점 가치 추정치는 선수들의 타격 효율성을 비교하는데 사용될 수 있습니다. 우리는 타격 플레이에 집중하기 위해, 주 데이터 프레임 retro2016에서 bat_event_fl변수가 TRUE..

야구 분석/R
득점 기대치를 사용한 플레이 가치를 평가해보기

주제Analyzing Baseball Data with R의 5장인 'Value of Plays Using Run Expectancy'를 통해 야구 데이터를 분석하는 방법을 배우고자 합니다. 책의 내용을 살펴보면서 각 개념을 이해하고, 실제 데이터를 통해 공부해 볼 것입니다. 득점 기대 행렬세이버매트릭스에서 중요한 개념은 득점 기대 행렬입니다. 각 베이스(1루, 2루, 3루)에 주자가 있을 수도 있고 없을 수도 있기 때문에, 세 개의 베이스에 주자가 위치할 수 있는 가능한 배열은 8가지입니다. 아웃 수는 0, 1, 2로 세 가지 가능성이 있으므로, 주자와 아웃의 가능한 배열은 총 8 × 3 = 24가지입니다. 각 주자 배치와 아웃 수의 조합에 대해 우리는 이닝의 나머지 부분에서 평균 득점 수를 계산하는데..

야구 분석/R
피타고리안 승률을 이용해보기

야구에서 득점과 승리의 관계주제Analyzing Baseball Data with R (3e)을 이용해서 R로 야구 데이터를 분석하는 것을 알아볼 것입니다. 책의 내용 중 4장 The Relation Between Runs and Wins를 따라 하며 야구 분석에 대해 배우고자 합니다. 야bbdiary03.tistory.com이번에는 피타고리안 승률을 이용해서 승률을 구해보겠습니다. 피타고리안 승률은 세이버매트릭스의 대부로 여겨지는 빌 제임스가 만든 것으로, 승률을 추정하기 위해 피타고리안 기대승률이라는 다음의 비선형 공식을 도출했습니다.$$\widehat{Wpct}=\frac{R^2 }{R^2+RA^2}$$이 공식을 이용하면 R에서 승률을 예측할 수 있습니다.my_teams mutate(Wpct_p..

야구 분석/R
야구에서 득점과 승리의 관계

주제Analyzing Baseball Data with R (3e)을 이용해서 R로 야구 데이터를 분석하는 것을 알아볼 것입니다. 책의 내용 중 4장 The Relation Between Runs and Wins를 따라 하며 야구 분석에 대해 배우고자 합니다. 야구팀의 목표는 다른 스포츠의 팀들과 마찬가지로 경기를 이기는 것입니다. 마찬가지로, 야구 분석가의 목표는 경기장에서 일어나는 일을 승리의 측면에서 측정할 수 있는 능력을 갖추는 것입니다.  승리는 상대팀보다 더 많은 득점을 함으로써 얻어지며, 따라서 한 시즌 동안 팀이 얻는 승리의 비율은 득점과 허용하는 점수의 수와 강한 상관관계를 가집니다. 이번에는 득점과 승리 사이의 관계를 탐구해 보겠습니다. Lahman 데이터베이스의 Teams 테이블lib..