Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

19
2016 데이터 사이언스 스쿨 NBA 경기 결과 데이터로 선수 연봉 예측 연봉 상위 10% 선수 예측 모델 김 기 표

Transcript of Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

Page 1: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

2016 데이터 사이언스 스쿨

NBA 경기 결과 데이터로 선수 연봉 예측 연봉 상위 10% 선수 예측 모델

김 기 표

Page 2: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

주제 선정 이유

김 기 표 김 기 표

Page 3: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

주제 선정 이유

무엇을 기준으로 연봉이 결정?

예측도 가능할까?

김 기 표 김 기 표

Page 4: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

추롞, 기술통계

개요

선수들이 받는 연봉에 경기 결과 데이터가 영향을 미칠 것이라고 가정

어떤 요소가 연봉에 영향을 미치는지 파악

김 기 표

Page 5: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

예측, 탐구

목표:

연봉 순위 상위 10%인

30위권 선수 예측

3가지 모델로 나누어

성능 평가

개요

선수들이 받는 연봉에 경기 결과 데이터가 영향을 미칠 것이라고 가정

어떤 요소가 연봉에 영향을 미치는지 파악

추롞, 기술통계

김 기 표

Page 6: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

데이터 출처 김 기 표

Page 7: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

Training

데이터 출처 김 기 표

Page 8: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

변수 제거법으로 3가지 경우를 나누어서 모델링

How to solve the problem?

1 모듞 Feature를 사용한 모델로 예측

2 PTS(평균 득점)만 사용한 모델로 예측

3 중요한 Feature로만 선택한 모델로 예측

김 기 표

Page 9: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

1. 모듞 Feature를 사용한 모델로 예측 (독립변수 12개)

How to solve the problem? 김 기 표

Page 10: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

1. 모듞 Feature를 사용한 모델로 예측 (독립변수 12개)

How to solve the problem?

18

김 기 표

Page 11: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

2. PTS (경기당 평균 득점)만 사용한 모델로 예측 (독립변수 1개)

김 기 표 How to solve the problem?

Page 12: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

15

김 기 표

2. PTS (경기당 평균 득점)만 사용한 모델로 예측 (독립변수 1개)

How to solve the problem?

Page 13: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

3. 중요한 Feature로만 선택한 모델로 예측 (독립변수 6개)

How to solve the problem?

중요한 feature는?

PTS: 경기당 평균 득점

AGE: 나이

REB: 리바운드

W_PCT: 승률

AST: 어시스트

FG3_PCT: 3점슛 성공률

김 기 표

Page 14: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

How to solve the problem?

18

3. 중요한 Feature로만 선택한 모델로 예측 (독립변수 6개)

김 기 표

Page 15: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

분석 결과

활용가치?

저평가 되어 있는 선수들을 한눈에 볼 수 있다.

김 기 표

Page 16: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

분석 결과

활용가치?

저평가 되어 있는 선수들을 한눈에 볼 수 있다.

36

3.7

5.6

16.3

33.3

3.3

11.5

26.9

34.8

4.1

11

16.5

45.4

6.7

5.4

30.1

3점슛 성공률(%)

어시스트(개)

리바운드(개)

경기당 득점률(점) Stephen CurryPau GasolDeMarcus CousinsTop3 Player

김 기 표

Page 17: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

36

3.7

5.6

16.3

33.3

3.3

11.5

26.9

34.8

4.1

11

16.5

45.4

6.7

5.4

30.1

3점슛 성공률(%)

어시스트(개)

리바운드(개)

경기당 득점률(점) Stephen CurryPau GasolDeMarcus CousinsTop_3

PLAYER_NAME 예측 연봉 순위 실제 연봉 순위 실제 연봉(원)

Stephen Curry 1 71 135억

DeMarcus Cousins 2 36 189억

Pau Gasol 5 44 173억

Al Horford 33 1 295억

Page 18: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

어려웠던 점

더 많은 feature들이 있었다면 성능 향상 예상

: 선수들 부상 여부, 중요 순간 활약도, 기록되지 않은 공헌도

전처리 과정

: 물가 상승의 영향 줄이기 위한 과정 => 매년 평균값 이용

: 어떤 변수들을 사용해야 하는지 찾는 과정

개선점

김 기 표

Page 19: Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측

경청해주셔서 감 사 합 니 다

김 기 표