전체보기 27

야구 분석/R
메이저리그 선수들의 커리어 살펴보기

주제 미키 맨틀의 커리어 살펴보기주제R 시스템은 데이터에 통계 모델을 적용하는 데 매우 적합합니다. 세이버메트릭스에서 자주 다루는 주제 중 하나는 MLB 데뷔부터 은퇴까지의 선수 시즌 타격, 수비 또는 투구 통계의 상승과bbdiary03.tistory.com저번에 미키 맨틀 선수의 커리어를 확인해 보았습니다. 이번에는 미키 맨틀 선수와 다른 메이저리그 선수들의 커리어를 같이 살펴보겠습니다. 타구 궤도 비교사전 분석 작업선수들의 타구 궤적을 비교할 때, 관련 있는 변수 중 하나는 선수의 수비 위치입니다. 포수와 같은 중요한 수비 포지션의 타격 기대치는 1루수와는 다릅니다. 같은 포지션을 가진 선수들의  궤적을 비교하려면, 수비 위치가 데이터베이스에 기록되어야 합니다. 이미 타격 데이터 프레임(batting..

야구 분석/R
미키 맨틀의 커리어 살펴보기

주제R 시스템은 데이터에 통계 모델을 적용하는 데 매우 적합합니다. 세이버메트릭스에서 자주 다루는 주제 중 하나는 MLB 데뷔부터 은퇴까지의 선수 시즌 타격, 수비 또는 투구 통계의 상승과 하락입니다. 일반적으로 대부분의 선수들이 20대 후반에 전성기를 맞이한다고 믿어지지만, 일부 선수들은 더 늦은 나이에 전성기를 맞이하는 경향이 있습니다. 선수의 커리어 궤적을 모델링하는 간단한 방법은 이차 함수 또는 포물선 곡선을 사용하는 것입니다. R의 lm() (선형 모델) 함수를 사용하면, 선수의 나이와 OPS 통계를 통해 이 모델을 쉽게 적용할 수 있습니다. 유명한 선수의 커리어 궤적을 살펴보겠습니다. 미키 맨틀은 19세에 뉴욕 양키스에서 큰 영향을 미쳤고, 빠르게 성장하여 최고의 타자 중 한 명이 되었습니다...

야구 분석/R
포수 프레이밍이란?

주제이 번에서는 2022 시즌의 Statcast 데이터를 사용하여 포수의 프레이밍 능력에 대해 알아보겠습니다. 야구 분석에서 포수의 프레이밍 능력 이야기는 흥미롭습니다. 역사적으로 스카우트와 코치들은 특정 포수들이 심판을 위해 투구를 '프레임'하는 능력을 가지고 있다고 주장했습니다. 이는 글러브를 상대적으로 고정시켜 심판을 속여서 스트라이크 존 밖에 있는 투구도 스트라이크로 판정받게 할 수 있다는 아이디어입니다(Lindbergh(2013)의 훌륭한 시각적 설명 참조). 야구 분석가들은 이 능력의 존재와 영향에 대해 대체로 회의적이었습니다. 포수의 수비 능력의 영향을 연구한 대부분의 사람들은 스카우트와 코치들이 믿는 것만큼 가치가 크지 않다고 결론지었습니다. 문제의 일부는 2000년대 중반까지 투구 수준의..

야구 분석/R
안타와 도루의 가치

주제야구 경기는 다양한 타격과 주루 플레이를 통해 득점을 올리는 게임입니다. 안타, 홈런, 도루는 모두 팀의 득점에 기여할 수 있는 중요한 요소입니다. 하지만 각 플레이의 득점 가치는 상황에 따라 다르며, 이를 정량적으로 분석하는 것은 팀 전략 수립에 중요한 역할을 합니다. 이번 글에서는 안타, 홈런, 도루의 득점 가치를 심층적으로 분석하여, 이들이 경기에서 어떻게 활용될 수 있는지 알아보겠습니다. 다양한 안타의 득점 가치야구 분석에서 득점 가치(run values)는 다양한 응용 분야를 가지고 있습니다. 이번 글에서는 득점 창출 관점에서 홈런과 단타의 가치를 살펴보겠습니다. 타율(batting average)에 대한 한 가지 비판은 네 가지 가능한 안타(단타, 2루타, 3루타, 홈런)에 동일한 가치를 ..

야구 분석/R
메이저리그 타자들의 득점 기대치

득점 기대치를 사용한 플레이 가치를 평가해보기주제Analyzing Baseball Data with R의 5장인 'Value of Plays Using Run Expectancy'를 통해 야구 데이터를 분석하는 방법을 배우고자 합니다. 책의 내용을 살펴보면서 각 개념을 이해하고, 실제 데이터를 통해 공bbdiary03.tistory.com저번에는 호세 알투베를 기준으로 득점 기여도를 확인해 보았습니다. 이번에는 2016 시즌 메이저 리그의 모든 타자들과 호세 알투베를 비교해 보도록 하겠습니다. 모든 타자들의 기회와 성공득점 가치 추정치는 선수들의 타격 효율성을 비교하는데 사용될 수 있습니다. 우리는 타격 플레이에 집중하기 위해, 주 데이터 프레임 retro2016에서 bat_event_fl변수가 TRUE..

야구 분석/R
득점 기대치를 사용한 플레이 가치를 평가해보기

주제Analyzing Baseball Data with R의 5장인 'Value of Plays Using Run Expectancy'를 통해 야구 데이터를 분석하는 방법을 배우고자 합니다. 책의 내용을 살펴보면서 각 개념을 이해하고, 실제 데이터를 통해 공부해 볼 것입니다. 득점 기대 행렬세이버매트릭스에서 중요한 개념은 득점 기대 행렬입니다. 각 베이스(1루, 2루, 3루)에 주자가 있을 수도 있고 없을 수도 있기 때문에, 세 개의 베이스에 주자가 위치할 수 있는 가능한 배열은 8가지입니다. 아웃 수는 0, 1, 2로 세 가지 가능성이 있으므로, 주자와 아웃의 가능한 배열은 총 8 × 3 = 24가지입니다. 각 주자 배치와 아웃 수의 조합에 대해 우리는 이닝의 나머지 부분에서 평균 득점 수를 계산하는데..

야구 분석/R
피타고리안 승률을 이용해보기

야구에서 득점과 승리의 관계주제Analyzing Baseball Data with R (3e)을 이용해서 R로 야구 데이터를 분석하는 것을 알아볼 것입니다. 책의 내용 중 4장 The Relation Between Runs and Wins를 따라 하며 야구 분석에 대해 배우고자 합니다. 야bbdiary03.tistory.com이번에는 피타고리안 승률을 이용해서 승률을 구해보겠습니다. 피타고리안 승률은 세이버매트릭스의 대부로 여겨지는 빌 제임스가 만든 것으로, 승률을 추정하기 위해 피타고리안 기대승률이라는 다음의 비선형 공식을 도출했습니다.$$\widehat{Wpct}=\frac{R^2 }{R^2+RA^2}$$이 공식을 이용하면 R에서 승률을 예측할 수 있습니다.my_teams mutate(Wpct_p..

야구 분석/R
야구에서 득점과 승리의 관계

주제Analyzing Baseball Data with R (3e)을 이용해서 R로 야구 데이터를 분석하는 것을 알아볼 것입니다. 책의 내용 중 4장 The Relation Between Runs and Wins를 따라 하며 야구 분석에 대해 배우고자 합니다. 야구팀의 목표는 다른 스포츠의 팀들과 마찬가지로 경기를 이기는 것입니다. 마찬가지로, 야구 분석가의 목표는 경기장에서 일어나는 일을 승리의 측면에서 측정할 수 있는 능력을 갖추는 것입니다.  승리는 상대팀보다 더 많은 득점을 함으로써 얻어지며, 따라서 한 시즌 동안 팀이 얻는 승리의 비율은 득점과 허용하는 점수의 수와 강한 상관관계를 가집니다. 이번에는 득점과 승리 사이의 관계를 탐구해 보겠습니다. Lahman 데이터베이스의 Teams 테이블lib..

이것저것
Formula 1 2024년 영국 GP 타이어 성능 분석

주제2024년 영국 그랑프리는 영국인 드라이버들이 처음으로 프런트 그리드를 차지한 역사적인 경기였습니다. 또한, 루이스 해밀턴은 이 경기에서 자신의 199번째 포디움이자 104번째 우승을 달성했습니다. 이번 그랑프리에서는 경기 전에 비가 오다 그치기도 했고, 경기 중에도 비가 내렸다가 그치는 등 날씨가 변덕스러웠습니다. 이러한 날씨 조건 때문에 언제 인터미디어 타이어로 바꾸고 언제 다시 슬릭 타이어로 교체할지에 대한 변수가 많았습니다.To Box, or not to Box? 따라서 이번 영국 그랑프리에서는 각 랩의 어느 부분에서 어떤 타이어가 더 나은 성능을 발휘했는지 살펴보겠습니다. 시각화필요한 패키지 임포트import fastf1 as ff1from fastf1 import plottingimport..

이것저것
르끌레르의 모나코 그링프리 간단한 시각화

주제F1의 주행 데이터를 가져올 수 있는 Fastf1을 이용해서 홈 그랑프리인 모나코 그랑프리에서 우승을 한 모나코 왕자님 샤를 르끌레르의 주행 데이터를 가지고 간단한 시각화를 해볼 것입니다.  시각화필요한 패키지 임포트import fastf1import matplotlib.pyplot as pltimport pandas as pd데이터 가져오기# 캐시 활성화fastf1.Cache.enable_cache('cache')  # 'cache' 폴더에 데이터 저장# 2024 모나코 그랑프리 데이터 로드race = fastf1.get_session(2024, 'Monaco', 'R')race.load()F1은 매주 주말마다 엄청난 양의 데이터가 생성되고 이를 가져오는 데 시간이 올래 걸립니다. Fastf1은 데..

야구 분석/Python
삼성 라이온즈 성적 크롤링하기

주제저번에 삼성 라이온즈의 관중 수를 크롤링해 보면서 관중수가 얼마나 많은지 알아보았습니다. 이번에는 삼성 라이온즈의 2022년부터 2024년 5월까지의 성적을 크롤링해 보겠습니다. 다음번에는 두 개를 합쳐서 연패중일 때는 관중 수가 어떻게 변하는 지를 확인 해 볼 것입니다. 성적 크롤링 하기삼성 라이온즈의 성적은 KBO 공식 사이트에서 확인할  수 있습니다. 공식 홈페이지를 들어가면 현재 날자의 팀 순위가 나옵니다. 2022 시즌 부터의 성적을 원하기 때문에 2022 시즌 시작일인 2022년 4월 2일로 이동을 해야 합니다.현재 날자 옆에 있는 달력을 눌러서 2022년 4월 2일로 이동을 하고 다음 날자 버튼을 눌러 다음 날로 이동을 해 삼성의 성적을 크롤링해 오면 됩니다. 사이트 구조 확인하기팀 순위..

야구 분석/Python
삼성 라이온즈 관중 수 시각화

주제 삼성 라이온즈 관중 수 크롤링주제저번에 KBO 공식 사이트에서 2024 시즌 관중 수 크롤링을 해 보았습니다.2024.05.29 - [취미] - 24시즌 KBO 관중 수 시각화 24시즌 KBO 관중 수 시각화시각화 주제2024 KBO 리그가 10개 구단 체재 출범 이bbdiary03.tistory.com저번에 삼성 라이온즈의 2022 시즌부터 2024 시즌 5월까지의 관중 수 데이터를 크롤링해 보았습니다. 이번에는 크롤링 한 데이터를 시각화해 보도록 하겠습니다. 시각화필요한 패키지 임포트import pandas as pdimport plotly.express as pximport plotly.graph_objects as go 데이터 불러오기# CSV 파일 불러오기data_2022 = pd.read..