데이터 분석 4

야구 분석/R
득점 기대치를 사용한 플레이 가치를 평가해보기

주제Analyzing Baseball Data with R의 5장인 'Value of Plays Using Run Expectancy'를 통해 야구 데이터를 분석하는 방법을 배우고자 합니다. 책의 내용을 살펴보면서 각 개념을 이해하고, 실제 데이터를 통해 공부해 볼 것입니다. 득점 기대 행렬세이버매트릭스에서 중요한 개념은 득점 기대 행렬입니다. 각 베이스(1루, 2루, 3루)에 주자가 있을 수도 있고 없을 수도 있기 때문에, 세 개의 베이스에 주자가 위치할 수 있는 가능한 배열은 8가지입니다. 아웃 수는 0, 1, 2로 세 가지 가능성이 있으므로, 주자와 아웃의 가능한 배열은 총 8 × 3 = 24가지입니다. 각 주자 배치와 아웃 수의 조합에 대해 우리는 이닝의 나머지 부분에서 평균 득점 수를 계산하는데..

야구 분석/R
야구에서 득점과 승리의 관계

주제Analyzing Baseball Data with R (3e)을 이용해서 R로 야구 데이터를 분석하는 것을 알아볼 것입니다. 책의 내용 중 4장 The Relation Between Runs and Wins를 따라 하며 야구 분석에 대해 배우고자 합니다. 야구팀의 목표는 다른 스포츠의 팀들과 마찬가지로 경기를 이기는 것입니다. 마찬가지로, 야구 분석가의 목표는 경기장에서 일어나는 일을 승리의 측면에서 측정할 수 있는 능력을 갖추는 것입니다.  승리는 상대팀보다 더 많은 득점을 함으로써 얻어지며, 따라서 한 시즌 동안 팀이 얻는 승리의 비율은 득점과 허용하는 점수의 수와 강한 상관관계를 가집니다. 이번에는 득점과 승리 사이의 관계를 탐구해 보겠습니다. Lahman 데이터베이스의 Teams 테이블lib..

이것저것
Formula 1 2024년 영국 GP 타이어 성능 분석

주제2024년 영국 그랑프리는 영국인 드라이버들이 처음으로 프런트 그리드를 차지한 역사적인 경기였습니다. 또한, 루이스 해밀턴은 이 경기에서 자신의 199번째 포디움이자 104번째 우승을 달성했습니다. 이번 그랑프리에서는 경기 전에 비가 오다 그치기도 했고, 경기 중에도 비가 내렸다가 그치는 등 날씨가 변덕스러웠습니다. 이러한 날씨 조건 때문에 언제 인터미디어 타이어로 바꾸고 언제 다시 슬릭 타이어로 교체할지에 대한 변수가 많았습니다.To Box, or not to Box? 따라서 이번 영국 그랑프리에서는 각 랩의 어느 부분에서 어떤 타이어가 더 나은 성능을 발휘했는지 살펴보겠습니다. 시각화필요한 패키지 임포트import fastf1 as ff1from fastf1 import plottingimport..

이것저것
르끌레르의 모나코 그링프리 간단한 시각화

주제F1의 주행 데이터를 가져올 수 있는 Fastf1을 이용해서 홈 그랑프리인 모나코 그랑프리에서 우승을 한 모나코 왕자님 샤를 르끌레르의 주행 데이터를 가지고 간단한 시각화를 해볼 것입니다.  시각화필요한 패키지 임포트import fastf1import matplotlib.pyplot as pltimport pandas as pd데이터 가져오기# 캐시 활성화fastf1.Cache.enable_cache('cache')  # 'cache' 폴더에 데이터 저장# 2024 모나코 그랑프리 데이터 로드race = fastf1.get_session(2024, 'Monaco', 'R')race.load()F1은 매주 주말마다 엄청난 양의 데이터가 생성되고 이를 가져오는 데 시간이 올래 걸립니다. Fastf1은 데..