2024/09 4

야구 분석/R
R을 이용한 하프 이닝 시뮬레이션 2

마르코프 체인 시뮬레이션마르코프 체인 모델을 여러 번 시뮬레이션하여 2016년 야구의 반 이닝 동안 득점 분포를 얻을 수 있습니다. 첫 번째 단계는 모든 가능한 상태 간 전이에서 득점된 점수를 나타내는 행렬을 구성하는 것입니다. 여기서 $ N_{runners}$는 상태의 주자 수를, $O$는 아웃 수를 나타냅니다. 이닝에서 이미 타석에 들어선 모든 선수는 베이스에 있거나, 아웃되었거나, 득점했기 때문에 타격 플레이에서 득점 수는 다음과 같습니다.$$runs = (N_{runners}^{(b)} + O^{(b)} + 1 ) - (N_{runners}^{(a)} + O^{(a)})$$요컨대, 득점은 플레이 전 주자와 아웃의 합에서 플레이 후 주자와 아웃의 합을 뺀 값에 1을 더한 것입니다. 예를 들어, 1루..

야구 분석/R
R을 이용한 하프 이닝 시뮬레이션 1

주제야구 시즌은 팀 간의 경기로 구성되며, 각 경기는  9이닝으로 이루어지고, 한 이닝의 절반은 일련의 타석으로 구성됩니다. 이러한 명확한 구조 덕분에 야구는 비교적 단순한 확률 모델로 표현될 수 있습니다. 이러한 모델을 통한 시뮬레이션은 경기의 다양한 특성을 이해하는 데 도움이 됩니다. R에서는 다양한 확률 분포에서 시뮬레이션을 할 수 있습니다. 이번에는 R 함수를 사용하여 다수의 타석으로 구성된 경기를 시뮬레이션하는 방법을 보여줍니다. 이번에는 마르코프 체인이라는 특별한 확률 모델을 사용하여 야구 이닝의 절반을 시뮬레이션하는 데 초점을 맞춥니다. 베이스의 주자와 아웃 수가 상태를 정의하며, 이 확률 모델은 3아웃에 도달할 때까지의 상태 간 이동을 설명합니다. 이동 또는 정이 확률은 2016 시즌의 실..

야구 분석/R
야구 선수들의 정점 나이: 시간에 따른 변화

주제우리는 다양한 선수들의 커리어를 비교함으로써, 그들이 어떻게 성장하고 변해왔는지를 살펴보았습니다. 이제 우리는 이러한 분석을 한 단계 더 발전시켜, ‘정점 나이’의 패턴을 집중적으로 살펴볼 것입니다. 정점 나이는 선수들의 커리어에서 가장 높은 성과를 기록하는 시점을 의미하며, 이는 선수의 경기력과 경과의 중요한 지표가 됩니다. 이번 글에서는 이러한 정점 나이가 시간에 따라 어떻게 변화해 왔는지, 그리고 이로부터 얻을 수 있는 중요한 통찰들을 분석해 보겠습니다 정점 나이의 일반적인 패턴모든 피팅 궤적 계산하기우리는 유사한 선수 그룹의 타격 커리어 궤적을 탐색했습니다. 이제 야구 역사에서 커리어 궤적이 어떻게 변화했는지 살펴보겠습니다. 선수의 정점 나이에 주목하고, 이것이 시간이 지남에 따라 어떻게 변화..

야구 분석/R
메이저리그 선수들의 커리어 살펴보기

주제 미키 맨틀의 커리어 살펴보기주제R 시스템은 데이터에 통계 모델을 적용하는 데 매우 적합합니다. 세이버메트릭스에서 자주 다루는 주제 중 하나는 MLB 데뷔부터 은퇴까지의 선수 시즌 타격, 수비 또는 투구 통계의 상승과bbdiary03.tistory.com저번에 미키 맨틀 선수의 커리어를 확인해 보았습니다. 이번에는 미키 맨틀 선수와 다른 메이저리그 선수들의 커리어를 같이 살펴보겠습니다. 타구 궤도 비교사전 분석 작업선수들의 타구 궤적을 비교할 때, 관련 있는 변수 중 하나는 선수의 수비 위치입니다. 포수와 같은 중요한 수비 포지션의 타격 기대치는 1루수와는 다릅니다. 같은 포지션을 가진 선수들의  궤적을 비교하려면, 수비 위치가 데이터베이스에 기록되어야 합니다. 이미 타격 데이터 프레임(batting..