프로 야구 데이터 | 프로야구 데이터팀장 “데이터분석가 역할 더 커진다\” 25772 좋은 평가 이 답변

당신은 주제를 찾고 있습니까 “프로 야구 데이터 – 프로야구 데이터팀장 “데이터분석가 역할 더 커진다\”“? 다음 카테고리의 웹사이트 you.maxfit.vn 에서 귀하의 모든 질문에 답변해 드립니다: you.maxfit.vn/blog. 바로 아래에서 답을 찾을 수 있습니다. 작성자 크레버스 주니어 이(가) 작성한 기사에는 조회수 1,413회 및 좋아요 25개 개의 좋아요가 있습니다.

프로 야구 데이터 주제에 대한 동영상 보기

여기에서 이 주제에 대한 비디오를 시청하십시오. 주의 깊게 살펴보고 읽고 있는 내용에 대한 피드백을 제공하세요!

d여기에서 프로야구 데이터팀장 “데이터분석가 역할 더 커진다\” – 프로 야구 데이터 주제에 대한 세부정보를 참조하세요

한국 프로야구에는 야구를 수학적, 통계학적으로 분석하고 투구를 추적하는 야구 데이터 분석 시스템에 대한 관심이 뜨겁습니다.
NC 다이노스는 모기업 엔씨소프트의 야구데이터팀에서 그 역햘을 수행하고 있는데요, 데이터팀의 임선남 팀장은 데이터도 결국 사람이 보는 것이기 때문에 좋은 데이터로 활용되기 위해 해석하고 전달하는 역할이 중요하다고 합니다.
청담러닝과 중앙일보 이노베이션랩이 함께 기획한
‘성공하는 학생을 위한 톡톡 한마디’.
열한번째로 NC 다이노스 임선남 스카우트팀 / 데이터팀 팀장을 만나 그 이야기를 들어보았습니다.
#야구데이터 #야구데이터분석 #세이버메트릭스 #nc다이노스 #엔씨소프트 #nc소프트 #투구추적시스템 #데이터분석 #미래인재 #톡톡에듀 #성공하는학생 #청담어학원 #에이프릴어학원 #청담러닝

프로 야구 데이터 주제에 대한 자세한 내용은 여기를 참조하세요.

KBReport : 한국 프로야구 통계 사이트

한국 프로야구 통계 사이트. 프로야구 관련 다양한 통계(세이버매트릭스)와 프로야구 칼럼 제공.

+ 여기에 자세히 보기

Source: www.kbreport.com

Date Published: 9/8/2022

View: 1759

2019 KBO Hitter EDA – 프로야구 타자 데이터 분석 – RPubs

수업 자료를 이용하였습니다. 출처 : 연합뉴스. 2019년 프로야구 신한은행 마이카 KBO리그 정규시즌에서 제공하는 정보 …

+ 여기를 클릭

Source: rpubs.com

Date Published: 7/14/2021

View: 9220

[논문]데이터 분석을 위한 프로 야구 기록 예측 모델 및 시각화 도구

본 논문에서는 R을 활용한 야구 통계 데이터 다차원 시각화 도구 구축과 HITS-BPP(Hyperlink-Induced Topic Search for Baseball Player Performance) 알고리즘을 …

+ 여기에 자세히 보기

Source: scienceon.kisti.re.kr

Date Published: 10/5/2022

View: 3026

[태블로 시각화 사례] 프로야구 색다르게 즐기기 – 투수 데이터 …

데이터 출처. 프로야구 데이터는 KBO 홈페이지를 비롯하여, 스탯티즈, KBreport 등 여러 플랫폼에 데이터가 모두 공개되어 있습니다. 이 포스팅에서는 …

+ 여기에 표시

Source: tableauwiki.com

Date Published: 1/22/2022

View: 7832

KBO 타자 OPS 예측 경진대회 – 데이콘

프로야구의 인기와 더불어 데이터 분석에 대한 인식이 높아짐에 따라 국내 여러 구단에서 데이터 사이언스 역할의 수요가 늘고 있습니다. 특히 야구에서는 특정 선수의 …

+ 여기를 클릭

Source: dacon.io

Date Published: 12/12/2022

View: 662

데이터 마이닝을 활용한 한국 프로야구 구단의 승패예측과 승률 …

본 연구에서는 데이터 마이닝 기법을 활용하여 한국 프로야구의 승패예측모형을 구축하는 실험을 진행하였다. 이를 위해, 2017년에 실시된 한국 프로야구 10개 구단의 …

+ 자세한 내용은 여기를 클릭하십시오

Source: www.dbpia.co.kr

Date Published: 8/11/2021

View: 8380

주제와 관련된 이미지 프로 야구 데이터

주제와 관련된 더 많은 사진을 참조하십시오 프로야구 데이터팀장 “데이터분석가 역할 더 커진다\”. 댓글에서 더 많은 관련 이미지를 보거나 필요한 경우 더 많은 관련 기사를 볼 수 있습니다.

프로야구 데이터팀장 “데이터분석가 역할 더 커진다\
프로야구 데이터팀장 “데이터분석가 역할 더 커진다\”

주제에 대한 기사 평가 프로 야구 데이터

  • Author: 크레버스 주니어
  • Views: 조회수 1,413회
  • Likes: 좋아요 25개
  • Date Published: 2019. 11. 11.
  • Video Url link: https://www.youtube.com/watch?v=RZXPJw2ltYk

(사)한국야구위원회 02) 3460-4600 서울시 강남구 강남대로 278

본 사이트는 스포츠투아이㈜가 KBO 리그 팬을 위해 운영하는 KBO 공식 사이트입니다.

Copyrightⓒ KBO, All Rights Reserved.

[논문]데이터 분석을 위한 프로 야구 기록 예측 모델 및 시각화 도구

초록

본 논문에서는 R을 활용한 야구 통계 데이터 다차원 시각화 도구 구축과 HITS-BPP(Hyperlink-Induced Topic Search for Baseball Player Performance) 알고리즘을 적용한 다년도 야구 선수 평가 기법을 제안하고, 마지막으로 프로 야구 선수의 향후 기록을 예측하는 모델을 제시한다.

제 3장에서는 MLB 선수의 시즌별 기록 데이터와 한국 프로야구 선수, 팀 시즌별 기록 데이터를 기반으로 구글에서 제공하는 R 패키지인 googleVis를 이용하여 시각화하는 웹페이지를 구축을 진행하였…

본 논문에서는 R을 활용한 야구 통계 데이터 다차원 시각화 도구 구축과 HITS-BPP(Hyperlink-Induced Topic Search for Baseball Player Performance) 알고리즘을 적용한 다년도 야구 선수 평가 기법을 제안하고, 마지막으로 프로 야구 선수의 향후 기록을 예측하는 모델을 제시한다.

제 3장에서는 MLB 선수의 시즌별 기록 데이터와 한국 프로야구 선수, 팀 시즌별 기록 데이터를 기반으로 구글에서 제공하는 R 패키지인 googleVis를 이용하여 시각화하는 웹페이지를 구축을 진행하였다. 데이터는 버블차트로 나타내며 버블의 사이즈, 버블의 색상, 좌표에서 기록의 속성들을 변경해가며 비교 및 분석이 가능하다. 웹페이지 기능 중 타임 슬립 애니메이션을 사용하여 KBO 타고투저 현상 분석, 객체 집단에서의 우수 선수 검출, 선수 간 비교 분석, 단일 선수 분석을 가능하도록 커스터마이징하였다. 해당 웹페이지를 통해 시간 순으로 기록의 변화를 관찰할 수 있고, 기록의 속성들을 바꿔가면서 다각도적으로 선수의 기록을 분석할 수 있음을 확인하였다.

제 4장에서는 HITS-BPP 알고리즘을 적용하여 타자의 투수 별 상대 타율을 사용하여 객관적으로 평가할 수 있는 평가 기법을 제안한다. 야구 기록 중 타자의 투수 별 상대 타율은 타자가 특정 투수를 상대로 낸 타율이기 때문에 그 당시 타자와 투수의 능력을 반영하고 있다고 할 수 있다. 각 타자와 투수를 이분 그래프 형태로 나타내고 서로 상대한 상대 타율 정보는 링크로 연결한다. 이 링크의 값은 타자의 투수 별 상대 타율이며, 이 값을 연구를 통해 도출한 기법에 대입하여 다년도 타자의 순위와 투수의 순위를 결정한다. 타자의 통합 타율 순위와 본 논문에서 제안한 기법으로 매긴 순위를 각각 통합 WAR 순위와 유사도를 비교하는 실험을 진행하였다. 그 결과 동일한 시즌에 활동하지 않은 선수간의 비교가 가능하다는 것을 실험을 통해 확인하였다.

제 5장에서는 프로 야구 선수들의 시계열 기록 데이터를 분석하여 향후 기록을 예측하는 모델을 제시한다. 프로 야구 선수의 시즌 기록들을 년차 단위로 나열한 시계열 기록 데이터를 사용하였다. 이 시계열 기록 데이터로 선수 간 Pearson Correlation Coefficient를 이용하여 이웃한 선수를 뽑는다. 이웃한 선수를 대상으로 가중 평균 보정을 계산하여 향후 기록을 예측하였다. 이를 통해 도출된 값과 Multiple Linear Regression을 이용하여 나온 예측 값을 비교하는 실험을 진행하였고, Pearson Correlation Coefficient 식에 벡터의 값을 대입하여 계산하는 Choi Correlation Coefficient 모델을 이용한 예측 값과 비교하는 실험을 진행하였다. 실험 결과 본 논문에서 제안한 모델로 프로 야구 선수의 향후 기록을 예측할 수 있다는 것을 확인하였다.

[태블로 시각화 사례] 프로야구 색다르게 즐기기

야구 좋아하시나요? ‘기록의 스포츠’라고 불리는 야구를 즐기는 또 하나의 색다른 방법, 바로 야구 데이터 분석 및 시각화 방법을 소개해드리고자 합니다!

시각화 주제

야구 경기는 크게 ‘투수’와 ‘타자’로 포지션이 나뉘는데, 이번 포스팅에서는 투수 포지션 기록에 대해 다뤄보려고 합니다. 수많은 투수 중에서, 2020년 상반기 최고의 시즌을 보낸 NC 다이노스 구창모 선수 기록을 토대로 분석해보겠습니다.

구창모 선수는 KBO 5월 MVP로 선정됨과 동시에, KBO 리그 나눔 올스타 선발투수 부문에 이름을 당당히 올렸는데요. 대한민국 차세대 좌완 에이스로 불리는 구창모 선수, 과연 올 시즌 얼마나 잘했을까요?

*이번 첫 포스팅은 태블로를 통한 데이터 시각화를 한 번도 해보지 않으신 분들의 눈높이에 맞추어, 쉽게 따라할 수 있도록 구성해두었으니 참고 부탁드립니다.

데이터 출처

프로야구 데이터는 KBO 홈페이지를 비롯하여, 스탯티즈, KBreport 등 여러 플랫폼에 데이터가 모두 공개되어 있습니다. 이 포스팅에서는 스탯티즈(http://www.statiz.co.kr)에서 구창모 선수 데이터를 가져왔고, Raw 데이터는 아래에서 다운로드 받으실 수 있습니다.

NC-다이노스-구창모-선수-기록_스탯티즈다운로드 HOW TO 1. 결합된 축 및 라인 경로 활용 먼저 선발투수 기록 중에 가장 주요하게 다뤄지는, 투구이닝 및 실점, 그리고 방어율(ERA) 기록을, 결합된 축 및 라인 경로를 활용하여 표현해보도록 하겠습니다. 새로운 워크시트 차원에서 ‘날짜’ 및 ‘상대’ 필드를 열 선반에 두고, 측정값 ‘이닝’ 필드를 행 선반으로 가져옵니다. 이후 측정값 ‘실점’ 필드를 드래그 하여, 아래 화면과 같이 축에서 ‘II’ 모양이 되었을 때 놓으면, 축이 결합되어 하나의 축에서 같이 표현됩니다 이후, 측정값 ‘이닝’ 및 ‘실점’ 필드를 각각 선택 후, 마우스 오른쪽 버튼을 눌러 집계 방식을 SUM(합계)이 아닌 AVG(평균)으로 변경해주어야 합니다. 각 경기당 평균 투구이닝 및 실점을 볼 것이기 때문입니다. 마크에서 막대를 라인으로 변경한 후, 행 선반에 있는 ‘측정값(Measure Values)’ 필드를 Ctrl키를 누른 채로 경로(Path)로 드래그 하여 가져옵니다. 아래 화면과 같이 경로 유형을 가운데에 위치한 ‘Step’을 클릭하면, ‘L’자형 모양이 나옵니다. 축 편집(Edit axis)을 눌러 축 제목을 지워주고, 열 선반에 있는 차원값(Measure Names)을 Ctrl 키를 누르고 드래그 하여 색상(Color)으로 가져옵니다. 색상을 Dark brown 및 Light brown으로 각각 설정하고, 평균자책점 (ERA) 필드를 마크 레이블 (Label)로 가져옵니다. *평균자책점이란, 투수가 한 게임(9이닝) 당 내준 평균(Average) 자책점(Earned Runs)을 의미합니다. 레이블(Label)에 있는 ‘ERA’ 필드를 마우스 오른쪽 버튼으로 클릭하여, 집계 방식을 SUM(합계)이 아닌 AVG(평균)으로 변경합니다. 이후, 레이블을 클릭하여 선택된 값만 표시되도록 설정을 합니다. 모든 경기의 ERA 값을 볼 필요가 없으므로, MVP를 확정짓는 5월 마지막 경기, 역 L자형을 보이는 경기, 그리고 가장 최근 경기 ERA만 표시하도록 하겠습니다. 완성된 그래프를 보면, 투구이닝 > 실점인 경우 L 모양을 보이지만, 투구이닝 < 실점인 경우 L이 뒤집힌 모양을 보입니다. 2020년 6월 25일 KT전에서만 모양이 다른데, 더블헤더 2차전에 선발 출장하여 야수들의 실책이 연달아 발생하면서 어려운 경기를 펼친 날입니다. 그 경기 기록이 아래와 같이 표현되고 있습니다. 2. 이중 축 및 막대차트 활용 다음으로 투수의 제구력을 가늠해볼 수 있는 지표인, 삼진 및 볼넷 갯수를 이중 축을 활용하여 표현하도록 하겠습니다. 앞서 소개한 결합된 축은 하나의 축을 공유하는 개념이지만, 이중 축은 양쪽으로 축을 이중으로 사용하는 개념으로 이해하시면 됩니다. 새로운 워크시트에서 ‘날짜’ 및 ‘상대’ 필드를 행 선반에 올린 후, 측정값 ‘삼진’ 및 ‘볼넷’ 필드를 열 선반으로 가져오겠습니다. 우선 열 선반에 있는 측정값 ‘삼진’ 및 ‘볼넷’ 필드를 마우스 오른쪽 버튼으로 누른 후, 집계 방식을 SUM(합계)이 아닌 AVG(평균)으로 변경해주겠습니다. 이후 측정값 볼넷 필드 오른쪽 버튼을 클릭한 후, 이중 축(Dual Axis) 부분을 클릭합니다. 이중 축으로 결합되면 마크(Mark)에서 자동완성 기능에 따라 원(Circle) 모양으로 변하게 됩니다. 태블로가 인식하기에 가장 적합한 형태로 보여주는 방식으로 변하는 것이죠. 하지만 원 모양으로는 삼진과 볼넷의 상관관계를 명확히 알기 어려운 듯하여, 마크에서 모두 막대(Bar)로 변경해주겠습니다. 아래 화면과 같이, 축 동기화(Synchronize Axis)를 해주고, 위쪽 축은 머릿말 표시(Show header)를 해제하여 숨겨줍니다. 아래쪽 축 편집(Edit Axis)를 통해, 축 이름을 ‘삼진 및 볼넷 갯수’로 바꿔주고, 형식(Format)을 클릭하여 소수점을 제외하고 정수로 만들어 줍니다. 아래 화면과 같이, 마크에서 볼넷 부분을 선택한 후, 막대 크기를 작게 조절해줍니다. 색상을 Dark blue 및 Light blue로 변경하고, 열 방향의 라인을 없애기 위해 뷰 마우스 우클릭 -> 화면 좌측의 서식 메뉴에서 라인 서식을 선택하여, 열 탭에서 격자선 ‘없음’을 선택하여 깔끔하게 정리합니다.

마지막으로 삼진 필드를 레이블(Label) 마크로 가져온 후, 맞춤(Alignment)을 클릭하여, 막대 가운데 부분에 텍스트가 표현되도록 아래 이미지와 같이 설정하면, 완성입니다!

전반적으로 볼넷 보다 삼진 갯수가 월등히 많은 모습을 보이고 있습니다. 리그 최고 수준의 닥터K임을 볼 수 있는 대목이네요.

3. 구종별 HOT & COLD Zone 만들기

이번에는 각 구종별 구사율을 시각적으로 보여주려고 합니다. 구창모 선수는 총 4가지 구종 (직구, 커브, 슬라이더, 스플리터)을 구사하고 있는데요. 구종 필드를 따로 가져오기 위해, 데이터 원본 페이지로 이동하여 아래와 같이 피벗(Pivot) 작업을 별도로 해주어야 합니다. 피벗 작업 실행 후, 새로 생긴 필드명을 ‘구종’ 및 ‘구종별 투구 수’로 변경해주겠습니다.

새로운 워크시트에서 ‘날짜’ 및 ‘상대’ 필드를 행 선반으로, ‘구종’ 필드를 열 선반으로 가져옵니다. 이후 계산된 필드 만들기를 활용하여, 아래 수식과 같이 ‘구종별 구사율’ 필드를 만들어줍니다.

IF [구종]=’직구’ THEN [직구 구사율]

ELSEIF [구종]=’커브’ THEN [커브 구사율]

ELSEIF [구종]=’슬라이더’ THEN [슬라이더 구사율]

ELSEIF [구종]=’스플리터’ THEN [스플리터 구사율]

END

이후 마크에서 사각형(Square)를 선택하고, ‘구종별 구사율’ 필드를 색상(Color)으로 가져온 후, 크기(Size)를 조절하면 아래와 같이 됩니다. ‘구종별 투구수’ 및 ‘구종별 구사율’ 필드를 레이블로 가져온 후, 분석 탭 > 총계에서 행 선반 Total 표시를 추가해주면 완료!

4. 구종별 평균 구속 만들기 (파이 차트 활용)

구종별 구사율에 이어, 구종별 평균 구속을 알아보고자 합니다. 행 선반에 ‘날짜’ 필드를 올리고, ‘구종’ 필드를 열 선반에 올립니다. 이후 마크에서 파이(Pie)를 선택하고, ‘구종’ 필드를 Ctrl 키 누른 채로 색상(Color)으로 가져옵니다.

‘구종별 평균 구속’ 필드를 레이블(Label)로 가져온 후, 정렬을 가운데로 맞춰주면 파이 안에 평균 구속 숫자가 잘 들어갈 것입니다.

위에서 만든 구종별 HOT & COLD ZONE 및 구종별 평균 구속을 대시보드에 표현하면 아래와 같습니다.

2020시즌 구창모 선수는 전반적으로 직구 구사율이 높았는데, 이는 직구 구위가 워낙 좋기 때문에 자신있게 던졌으리라 추정이 됩니다. 직구에 이어 Blue 계열을 띄는 구종은 슬라이더 인데요. 헛스윙을 유도하는 명품 슬라이더 덕분에, 리그 최고의 탈삼진율을 보여주었다는 생각도 듭니다.

마지막으로 스플리터 구사율도 눈에 띄는데요. 엠엘비닷컴(MLB.com)의 데이비드 애들러는 구창모의 스플리터 영상을 공유하며 “메이저리그에는 거의 없는 좌완 투수의 스플리터를 보게 돼 멋지다”라고 말한 적이 있습니다. 스플리터 구위 또한 좋기 때문에, 구창모 선수가 올해 최고의 퍼포먼스를 보여준 게 아닐까 싶습니다.

비록 불의의 부상으로 마운드에 오르지 못하고 있지만, 구창모 선수가 빠른 시일 내에 회복되어 다시 멋지게 투구하는 모습을 볼 수 있으면 좋겠습니다.

마무리 하며

야구는 종목 특성상 모든 데이터가 기록되고 모두 공개됩니다. 따라서 데이터를 수집하고, 전처리 및 시각화를 하면, 굉장히 다채로운 방식으로 야구 기록을 살펴볼 수 있습니다.

이번 포스팅은 첫 포스팅이기에, 전통적인 투수 기록을 바탕으로, 초보자들도 쉽게 따라할 수 있는 수준으로 시각화를 해보았습니다.

다만 최근 야구 분석 트랜드만 봐도, 전통적인 기록 보다는 세이버매트릭스(Sabermetrics) 지표 (WHIP, FIP, WAR 등)를 기반으로 살펴보는 트랜드에 있습니다.

아울러, 이번 포스팅에서는 특정 선수의 한 시즌 기록만을 대상으로 분석했지만, 역대 시즌별 기록 분석, 특정 선수들 간의 비교, 리그 전체 투수별 기록 분석, 나아가 투수가 아닌 타자 포지션 분석까지 그 분석의 범위가 무궁무진 합니다.

다음 포스팅에서는 기본편에서 나아가 중급편으로 찾아뵈려고 하니, 많은 기대 부탁드립니다. 혹여나 원하시는 팀 / 포지션 / 선수 분석이 있으시면 댓글 남겨주세요!

KBO 타자 OPS 예측 경진대회

1. 배경

안녕하세요 여러분!🙌 KBO 타자 OPS 예측 경진대회에 오신 것을 환영합니다.

2016년 관중수가 800만명을 돌파한 프로야구는, 명실공히 한국 프로스포츠 최고의 인기 종목입니다.

프로야구의 인기와 더불어 데이터 분석에 대한 인식이 높아짐에 따라 국내 여러 구단에서 데이터 사이언스 역할의 수요가 늘고 있습니다.

특히 야구에서는 특정 선수의 성적 변동성이 해마다 매우 크기 때문에 내년 성적을 예측하기 까다로운 부분이 많습니다.

정말 못할 것이라고 생각했던 선수도 막상 내년에는 잘하고,

많은 지표가 리그 상위권이었던 선수가 내년에는 그렇지 않은 경우가 많습니다.

본 대회는 야구 데이터로 불확실성 문제를 해결하기 위해 2019년 타자들의 상반기 성적 예측을 목표로 합니다.

2019년 타자들의 상반기 OPS를 예측하는 모델을 만들어 주세요!

2010년부터 1군 엔트리에 1번 이상 포함 되었던 타자들의 역대 정규시즌,

시범경기 성적 정보를 제공합니다(후반기 OPS 예측 대회는 전반기 종료 한 달 전 따로 오픈할 예정입니다)

2. 목적

2019년 타자들의 상반기 OPS를 예측하는 모델 개발

3. 주최 / 주관

①데이콘

②서울대학교 통계연구소

③수원대 DS&ML 센터

④한국야구학회

⑤기타 미정

데이터 마이닝을 활용한 한국 프로야구 구단의 승패예측과 승률 향상을 위한 전략 도출 연구

(이)가 구독하지 않는 논문으로 ‘미리보기’만 가능합니다.

도서관의 ‘원문복사 서비스’를 통해 원문을 이용하실 수 있습니다. 원문복사 서비스 이용방법은 도서관 사이트를 확인해 주세요.

키워드에 대한 정보 프로 야구 데이터

다음은 Bing에서 프로 야구 데이터 주제에 대한 검색 결과입니다. 필요한 경우 더 읽을 수 있습니다.

이 기사는 인터넷의 다양한 출처에서 편집되었습니다. 이 기사가 유용했기를 바랍니다. 이 기사가 유용하다고 생각되면 공유하십시오. 매우 감사합니다!

사람들이 주제에 대해 자주 검색하는 키워드 프로야구 데이터팀장 “데이터분석가 역할 더 커진다\”

  • 야구데이터
  • 야구데이터분석
  • 세이버메트릭스
  • nc다이노스
  • 엔씨소프트
  • nc소프트
  • 투구추적시스템
  • 데이터분석
  • 미래인재
  • 톡톡에듀
  • 성공하는학생
  • 초등영어
  • 중등영어
  • 청담어학원
  • 에이프릴어학원
  • 청담러닝

프로야구 #데이터팀장 #“데이터분석가 #역할 #더 #커진다\”


YouTube에서 프로 야구 데이터 주제의 다른 동영상 보기

주제에 대한 기사를 시청해 주셔서 감사합니다 프로야구 데이터팀장 “데이터분석가 역할 더 커진다\” | 프로 야구 데이터, 이 기사가 유용하다고 생각되면 공유하십시오, 매우 감사합니다.

Leave a Comment