Curso de Estadística Básica

25
Estadística Básica Curso de Estadística Básica MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez SESION 7 REGRESIÓN LINEAL

description

Curso de Estadística Básica. SESION 7 REGRESIÓN LINEAL. MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez. Objetivo. - PowerPoint PPT Presentation

Transcript of Curso de Estadística Básica

Page 1: Curso de Estadística Básica

Estadística Básica

Curso de Estadística Básica

MCC. Manuel Uribe SaldañaMCC. José Gonzalo Lugo Pérez

SESION 7REGRESIÓN LINEAL

Page 2: Curso de Estadística Básica

Estadística Básica

Objetivo

Representar datos de dos variables de forma tabular y gráfica. Comprender la distinción entre los propósitos básicos del análisis de correlación y regresión lineal. (Sesión 6 y 7)

Page 3: Curso de Estadística Básica

Estadística Básica

Agenda Sesión 7

• Datos de dos variables

• Correlación lineal (Sesión 6)

• Regresión lineal (Sesión 7)

• Evaluación (Sesión 7)

Page 4: Curso de Estadística Básica

Estadística Básica

Problema

Page 5: Curso de Estadística Básica

Estadística Básica

Tabla de extensionesNo. Incremento en horas (x) Incremento en Ventas (y) x2 y2 xy

1 40 500.00$ 1600 250000 200002 65 1,000.00$ 4225 1000000 650003 84 500.00$ 7056 250000 420004 40 4,000.00$ 1600 16000000 1600005 70 2,000.00$ 4900 4000000 1400006 68 5,000.00$ 4624 25000000 3400007 110 2,000.00$ 12100 4000000 2200008 90 4,000.00$ 8100 16000000 3600009 65 1,000.00$ 4225 1000000 65000

10 35 10,000.00$ 1225 100000000 35000011 30 8,500.00$ 900 72250000 25500012 85 2,000.00$ 7225 4000000 17000013 90 3,500.00$ 8100 12250000 31500014 90 1,000.00$ 8100 1000000 9000015 50 2,500.00$ 2500 6250000 12500016 75 5,000.00$ 5625 25000000 37500017 90 9,000.00$ 8100 81000000 81000018 70 3,000.00$ 4900 9000000 21000019 70 4,000.00$ 4900 16000000 28000020 40 500.00$ 1600 250000 20000

Suma 1357 69,000.00$ 101605 394500000 4412000

Page 6: Curso de Estadística Básica

Estadística Básica

Cálculos

55.9532

2)( 2

n

xxxSC

156450000

2)( 2

n

yyySC

269650)(n

yxxyxySC

22080459.0)()(

)( ySCxSC

xySCr

Page 7: Curso de Estadística Básica

Estadística Básica

Conclusiones

No están correlacionadas las variables “incremento en horas” e “incremento en ventas” ya que el coeficiente de correlación r = -0.22, lo que indica una correlación muy débil o nula.

Page 8: Curso de Estadística Básica

Estadística Básica

Regresión Lineal

• El análisis de regresión lineal encuentra la ecuación de la recta que describe mejor la relación entre las dos variables. Una aplicación de esta ecuación es hacer predicciones.

Page 9: Curso de Estadística Básica

Estadística Básica

Ejemplos

• El éxito que tendrá un estudiante en la universidad con base en los resultados que obtuvo en el bachillerato.

• Averiguar la distancia necesaria para detener un automóvil conociendo su velocidad.

• El peso que debe tener un niño con base en la estatura.

• El número de sentadillas que realizará un estudiante con base en el número de lagartijas que realizó

Page 10: Curso de Estadística Básica

Estadística Básica

Modelos o ecuaciones de predicción

La relación entre estas dos variables es una expresión algebraica que describe la relación matemática entre x y y. A continuación se presentan algunos ejemplos de varias relaciones posibles:

xbby 10ˆ 2ˆ cxbxay

)(ˆ xbay

xay blogˆ

Lineal:

Cuadrática:

Exponencial:

Logarítmica:

Page 11: Curso de Estadística Básica

Estadística Básica

Patrones de datos de dos variables

Page 12: Curso de Estadística Básica

Estadística Básica

Método de mínimos cuadrados

Si un modelo de línea recta parece idóneo, la recta del mejor ajuste se encuentra aplicando el método de mínimos cuadrados. Suponga que es la ecuación de una recta, donde representa el valor estimado de que corresponde a un valor particular de

El método de mínimos cuadrados requiere encontrar las constantes y tales que la sumatoria sea lo más pequeña posible.

xbby 10ˆ y

xy

0b 1b 2yy

Page 13: Curso de Estadística Básica

Estadística Básica

Método de mínimos cuadrados

xbby 10ˆ

)ˆ,( yx

),( yxyy ˆ

yy

x

y

Page 14: Curso de Estadística Básica

Estadística Básica

Recta del mejor ajuste

La ecuación de la recta del mejor ajuste es determinada por su pendiente y su ordenada al origen . Los valores de las constantes, pendiente y ordenada al origen, que satisfacen el criterio de mínimos cuadrados se encuentran aplicando las siguientes fórmulas:

1b0b

21 )(

))((

xx

yyxxb

n

xbyb

)( 1

0

Page 15: Curso de Estadística Básica

Estadística Básica

Recta del mejor ajuste

Para encontrar la pendiente se usará una equivalencia matemática que utilice la suma de los cuadrados determinados en los cálculos preliminares de correlación:

1b

)()(

1 xSCxySC

b

Page 16: Curso de Estadística Básica

Estadística Básica

Clase de educación física del Sr. Torres

Tomando en cuenta el ejemplo de la sesión 6 sobre los 10 estudiantes que realizaron pruebas de condición física, ahora el objetivo es predecir las “sentadillas” efectuadas por un estudiante con base en el número de “lagartijas” hechas. Se quiere encontrar la recta del mejor ajuste,

De esta manera se realizan los cálculos tomando los datos correspondientes de la tabla de extensiones generada:

xbby 10ˆ

Page 17: Curso de Estadística Básica

Estadística Básica

Tabla de extensiones

Estudiante Lagartijas (x) x2 Sentadillas (y) y2 xy1 27 729 30 900 8102 22 484 26 676 5723 15 225 25 625 3754 35 1225 42 1764 14705 30 900 38 1444 11406 52 2704 40 1600 20807 35 1225 32 1024 11208 55 3025 54 2916 29709 40 1600 50 2500 200010 40 1600 43 1849 1720

Sumatoria 351 13717 380 15298 14257

Page 18: Curso de Estadística Básica

Estadística Básica

Cálculos

Se toman los cálculos correspondientes a SC(x) y SC(xy) y se calcula la pendiente:

9.1396

10)351(

137172

)(2

2

n

xxxSC

0.91910

)380)(351(14257)(

n

yxxyxySC

66.06579.09.13960.919

)()(

1 xSCxySC

b

Page 19: Curso de Estadística Básica

Estadística Básica

Cálculos

Se calcula la ordenada al origen, con los datos de la tabla de extensiones:

0b

9.149077.1410

)351)(6579.0(380)( 10

n

xbyb

Page 20: Curso de Estadística Básica

Estadística Básica

Ecuación del mejor ajuste

xbby 10ˆ

9.140 b 66.01 b

xy 66.09.14ˆ

Notas1. Recuerde mantener por lo menos tres cifras decimales

extra al efectuar los cálculos para asegurar una respuesta exacta.

2. Al redondear los valores calculados de bo y b1, preserve por lo menos dos cifras significativas en la respuesta final

Page 21: Curso de Estadística Básica

Estadística Básica

Cálculo de los puntos de la recta

Se eligen dos valores convenientes de x, cada uno cerca de cada extremo del dominio (x=10 y x=60) y se encuentran sus valores y correspondientes.

5.21)10(66.09.1466.09.14ˆ xy

5.54)60(66.09.1466.09.14ˆ xy

)5.21,10(

)5.54,60(

Page 22: Curso de Estadística Básica

Estadística Básica

Trazado de la recta

0 10 20 30 40 50 600

10

20

30

40

50

60

Clase de educación física del señor Torres

Lagartijas

Sen

tad

illa

s

)5.21,10(

)5.54,60(

Page 23: Curso de Estadística Básica

Estadística Básica

Ejercicio

A ocho estudiantes universitarias, elegidas de forma aleatoria, se les preguntó su estatura (cerrada a la pulgada más próxima) y su peso (cerrado a las cinco libras más próximas). Calcule el coeficiente de correlación lineal r, y la ecuación para predecir el peso de una universitaria con base en su estatura y trácela sobre un diagrama de dispersión.

1 2 3 4 5 6 7 8Estatura (x) 65 65 62 67 69 65 61 67Peso (y) 105 125 110 120 140 135 95 130

Datos de las estaturas y pesos de las estudiantes universitarias

Page 24: Curso de Estadística Básica

Estadística Básica

Respuestas

875.48)( xSC

0.230)( xySC

71.4706.41 b

5.186478.1860 b

xy 71.45.186ˆ

80.07979.0 r

Page 25: Curso de Estadística Básica

Estadística Básica

Observaciones en la elaboración de predicciones

1. La ecuación debe usarse para hacer predicciones sólo acerca de la población de la cuál se extrajo la muestra. Por ejemplo, sería cuestionable usar la relación entre la estatura y el peso de las estudiantes universitarias para predecir el peso de atletas profesionales, dadas sus estaturas.

2. La ecuación debe usarse sólo dentro del dominio muestral de la variable de entrada. Por ejemplo, la predicción de que una universitaria de estatura cero pesa -186.5 libras no tiene sentido. Tal vez, y de manera ocasional, se quiera usar la recta del mejor ajuste para estimar valores que están fuera del intervalo del dominio de la muestra. Esto es posible, pero debe hacerse con precaución y sólo para valores cercanos al intervalo del dominio.

3. Si la muestra fue tomada en 1994, no espere que los resultados sean válidos para 1929 o 2010. Las mujeres actuales pueden ser diferentes a las de 1929 y a las de 2010.