INTROD. A LA ESTADÍSTICA TRABAJO DE BASES DE DATOS
description
Transcript of INTROD. A LA ESTADÍSTICA TRABAJO DE BASES DE DATOS
INTROD. A LA ESTADÍSTICA
TRABAJO DE BASES DE DATOS
Este trabajo se realizó por:
LUIS ALBERTO FERNÁNDEZLARA LUCAS ZAZO
RUBÉN LOZANO ÁLVAREZ
MEJORES PILOTOS DE F-1• NOMBRE DEL PILOTO Nº POLES Nº VICTORIAS ERRORES
• MSCHUMACHER 68 91 21.2612
• ASENNA 65 41 18.691• JCLARK 33 25 -25.5306• APROST 33 51 -0.23958• NMANSELL 32 31 11.8018• JMFANGIO 29 24 -7.309• MHAKKINEN 26 20 2.31581• NLAUDA 24 25 -4.0131• NPIQUET 24 23 0.3158• DHILL 20 22 3.5935• MANDRETTI 18 12 -4.820• RARNOUX 18 7 3.80177• JSTEWART 17 27 1.87119• FALONSO 17 19 3.01004• SMOSS 16 16 3.07946• RPETERSON 14 10 3.07946• AASCARI 14 13 1.01004• JHUNT 14 10 3.1418• KRAIKKONEN 14 15 -4.2676• GHILL 13 14 -1.98996• RBARRICHELLO 13 9 -1.98996• JICKX 13 8 0.14887• JVILLENEUVE 13 6 -1.92054• JPMONTOYA 13 7 2.92054• JBRABHAM 13 14 -9.26765• GBERGER 12 10 -3.92054• DCOULTHARD 12 13 -4.92054• JRINDT 10 6 -1.7122• FMASSA 10 5 -0.42658• RPATRESE 8 6 -2.71227
RESUMEN ESTADISTICASVARIABLE POLES VICTORIAS ERRORES
MEDIA 20,8667 19,3333 X
MODA 13 NO EXISTE NO EXISTE
MEDIANA 15 14 -0.0453
VARIANZA 203,085 298,989 66.7271
DESVIACIÓN TÍPICA 14,25 17,29 8.16867
MÍNIMO 8 5 -25.5306
MÁXIMO 68 91 21.2612
RANGO 60 86 46.7918
CUARTIL 1 13 9 -3.92054
CUARTIL 3 24 24 3.07946
RANGO INTERCUARTÍLICO 11 15 7
CURTOSIS 5,8099 9,88874 4.12994
COEFICIENTE DE VARIACIÓN 68,2945 % 89,4377 % -1.63%
POBLACIÓN TOTAL 30 30 30
GRÁFICOS
POLES POSITION
Scatterplot for POLES
0 20 40 60 80
POLES
Se observa que la mayoría de los 30 mejores pilotos están en un intervalo de [10,35], y existen 2 puntos que no se encuentran en ese intervalo.
Diagrama de caja
POLES0 20 40 60 80
En este caso, se demuestra que la mayor parte de los pilotos se encuentran muy cerca de la media, pero siempre por detrás, excepto 2 de ellos (M. Schumacher y A.
Senna) que son los “datos atípicos” que se salen de dicho promedio.
MSCHUMACHER 68ASENNA 65JCLARK 33APROST 33NMANSELL 32JMFANGIO 29MHAKKINEN 26NLAUDA 24NPIQUET 24DHILL 20MANDRETTI 18RARNOUX 18JSTEWART 17FALONSO 17SMOSS 16RPETERSON 14AASCARI 14JHUNT 14KRAIKKONEN 14GHILL 13RBARRICHELLO 13JICKX 13JVILLENEUVE 13JPMONTOYA 13JBRABHAM 13GBERGER 12DCOULTHARD 12JRINDT 10FMASSA 10RPATRESE 8
Histograma
Poles
Frec
uenc
ia
0 10 20 30 40 50 60 70 800
24
6
8
10
1214
16
Se corrobora que la mayoría de pilotos se encuentran en un intervalo de [0,35] y que se
encuentran 2 atípicos.
GRÁFICOS
VICTORIAS
Diagrama de caja
VICTORIAS0 20 40 60 80 100
En este caso, se demuestra que la mayor parte de los pilotos se encuentran muy cerca de la media, pero siempre por detrás, excepto 2 de ellos (M. Schumacher y A.
Prost) que son los “datos atípicos” que se salen de dicho promedio.
Histograma
Victorias
Frec
uenc
ia
0 10 20 30 40 50 60 70 80 9010002468
1012141618
MSCHUMACHER APROST ASENNA NMANSELL JSTEWART JCLARK NLAUDA JMFANGIO NPIQUET DHILL MHAKKINEN FALONSO SMOSS KRAIKKONEN GHILL JBRABHAM AASCARI DCOULTHARD MANDRETTI RPETERSON JHUNT GBERGER RBARRICHELLO JICKX RARNOUX JPMONTOYA JVILLENEUVE JRINDT RPATRESE FMASSA
9151413127252524232220191615141413131210101098776665
Se confirma que la mayoría de pilotos se encuentran en un intervalo de [0,30] y que se
encuentran 2 atípicos.
COMPARACIÓN
GRÁFICOS
VICTORIAS-POLES
Poles
Victorias
Fre
cuen
cia
0 20 40 60 80 10020
10
0
10
20
Se observa que existe una clara relación entre el número de poles obtenidas y el número de victorias obtenidas, ya que este deporte no permite muchos adelantamientos que provoquen cambios de posición. Por ello, lo normal es
que el piloto que sale primero, termine ganando la carrera.
Component+Residual Plot for VICTORIAS
0 20 40 60 80
POLES
-15
5
25
45
65
85co
mpo
nen
t ef
fect
Después de analizar los datos con “Statgraphics Plus” existe una relación entre el número de victorias conseguidas en función del número de pole positions que consiguiera cada piloto.
Nº VICTORIAS = 1,06942 X Nº POLES - 2,19897
Plot of Fitted Model
POLES
VIC
TO
RIA
S
0 20 40 60 800
20
40
60
80
100
En esta gráfica se observan 3 líneas que ajustan los datos de las 2 variables a una regresión.
La línea azul es la regresión ajustada.
Las 2 naranjas son bandas de fluctuación.
Las 2 líneas moradas marcan una barrera en la que fuera de ella existen “atípicos” en la relación poles-victorias.
Como conclusión, se demuestra que la mayoría de pilotos que consiguen la pole en la clasificación y
por lo tanto salen en la primera posición en la parrilla (con todas las ventajas que eso conlleva en este deporte), consiguen ganar la carrera con una
mayor probabilidad que otro que salga en una posición más retrasada (siempre y cuando las
condiciones sean normales).