Análisis de Regresión
-
Upload
kepler37 -
Category
Data & Analytics
-
view
114 -
download
8
Transcript of Análisis de Regresión
Escuela de Psicología
Elaborado por Lic. Omar Alcalá. 2011. Actualizado 2013
Descripción Bivariante de datos cuantitativos
REGRESIÓNExpresión cuantitativa que describe lanaturaleza básica de la relación entre lasvariables dependientes y las independientes
EXPRESIÓN CUANTITATIVA MODELO
MODELO
1. SI LAS VARIABLES TIENDEN A DESPLAZARSE EN AL MISMA DIRECCIÓN
2. SI LAS VARIABLES TIENDEN A DESPLAZARSE EN
SENTIDOS OPUESTOS
3. LA CANTIDAD EN QUE VARÍA V.D. CUANDO
LA IND. VARÍA EN UNA UNIDAD
Para profundizar: Tópicos de estadística, páginas 179 en adelante. Capítulo IV.
REGRESIÓN
SimpleDos variable. Una dependiente. Una independiente
Múltiple
Más de dos variables. Una
dependiente. Dos o más independientes
,x y
, , ,...,x z t y
REGRESIÓNREGRESIÓN
PASOS PARA EL AJUSTE DE REGRESIÓN
1. RECOLECCIÓN DE DATOS
2. DIAGRAMA DE DISPERSIÓN
3. REALIZAR EL AJUSTE SEGÚN EL DIAGRAMA DE DISPERSIÓN
Para profundizar: Tópicos de estadística, páginas 179 en adelante. Capítulo IV.
3. … EL AJUSTE SEGÚN EL DIAGRAMA DE DISPERSIÓN
RECTA DE REGRESIÓN
Modelo que describe la relación Lineal (variación) entre dos variables
ε Y 10 X
DETERMINISTA ALEATORIOCausas:
Error de medición
Error estocástico
POBLACIONAL
3. … EL AJUSTE SEGÚN EL DIAGRAMA DE DISPERSIÓN
RECTA DE REGRESIÓN
ebxay ˆ
MUESTRAL
Coeficiente
de regresión
(Pendiente)
Constante
de regresión
Componente de error
bxay ˆ
3. … EL AJUSTE SEGÚN EL DIAGRAMA DE DISPERSIÓN
RECTA DE AJUSTE ÓPTIMO
MÉTODO DE LOS MÍNIMOS CUADRADOSLa recta que genera es tal que hace mínimos los cuadrados de las distancia verticales desde cada punto de observación a dicha recta
Aplicación
1. Con base en los datos 10 alumnos que tomaron la prueba, si unestudiante obtuvo 30 puntos en la primera administración, ¿qué valorpodría predecir el modelo para su segunda administración?
138,30338,130960,030ˆ y
2. Si un estudiante obtuvo 50 puntos en la primera administración, ¿quévalor podría predecir el modelo para su segunda administración?
La recta no aplica en este caso por que el valor seencuentra fuera del rango de la variable x.
Ejemplo 2
Número de horas de estudio fuera de clase (durante un
período de tres semanas) de alumnos de un curso de
estadística y sus calificaciones en el examen final de ese
período
Horas 20 16 34 23 27 32 18 22
Calificación 64 61 84 70 88 92 72 77
rxy= 0,86
Para profundizar: Tópicos de estadística, páginas 179 en adelante. Capítulo IV.
Ejemplo 2
Si un estudiante se dedicó 18 horas de estudio (fuera de clase
durante esas tres semanas), ¿cuánto se espera sea su calificación?
bxay ˆ
Se monta el modelo para predecir la calificación (Y) a partir de las
horas de estudio (X).
a=40,08
b= 1,496
Entonces, y=40,08+1,496x18=67.
Un estudiante que dedicó 18 horas de estudio fuera de clase en
esas tres semanas se espera tenga una calificación de 67 puntos.
Ejemplo 2
Si un estudiante obtuvo 85 puntos en el examen, ¿cuántas horas
podemos decir que ha dedicado ese estudiante para prepararse
para la evaluación?
bxay ˆ
Se monta el modelo para predecir las horas de estudio (Y) a partir
de la calificación en el examen (X). Nótese que cambia el
modelo respecto al anterior, en este caso las horas de estudio
pasó a ser la variable predicha y la calificación la variable
predictora.a=-13,74
b= 0,496Entonces, y=-13,74+0,496x85= 28,42
Un estudiante que obtuvo una puntuación de 85 puntos, se puede
inferir que estudió 28 horas durante esas tres semanas para dicha
evaluación
4. Error de estimación en la predicción
ERROR TÍPICO DE ESTIMACIÓN
Medida de la cantidad media en que las observaciones reales de y varían en torno a los predichos por el modelo.
Donde:
Se= error de estimación
Sy= desviación típica de la variable dependiente
1-rxy2= coeficiente de no determinación
21 xyye rSS
3. Error de estimación en la predicción
Si la correlación entre dos variables es perfecta, es decir 1 o -1, el
error de estimación será cero (0).
Si no existe correlación entre dos variables, el error de estimación
será igual a la desviación típica de la variable predicha.
21 xyye rSS
4. Error de estimación en la predicción
Número de horas de estudio fuera de clase (durante un período de tres
semanas) de alumnos de un curso de estadística y sus calificaciones en
el examen final de ese períodoSi un estudiante se dedicó 18 horas a
estudiar (fuera de clase durante esas tres semanas), ¿cuánto se espera
sea su calificación? (con un 95% de confianza)
Horas 20 16 34 23 27 32 18 22
Calificación 64 61 84 70 88 92 72 77
rxy= 0,86
Modelo para predecir la
calificación (Y) a partir de las
horas de estudio (X). bxay ˆa=40,08
b= 1,496
Si un estudiante se dedicó 18 horas a estudiar (fuera de clase
durante esas tres semanas), ¿cuánto se espera sea su calificación?
(con un 95% de confianza)
bxay ˆ a=40,08 b= 1,496
Entonces, y=40,08+1,496(18)=67puntos.
Un estudiante que dedicó 18 horas de estudio fuera de clase en
esas tres semanas se espera tenga una calificación de 67 puntos.
OJO: esto como predicción puntual, pero piden la estimación con el
95% de confianza.
Es decir, se deben encontrar los límites entre los cuales se
encuentra el valor de Y. Dado que los errores de estimación son
aleatorios, su distribución es normal, por ende se puede utilizar la
curva Z para estimar el área.
4. Error de estimación en la predicción
Si un estudiante se dedicó 18 horas a estudiar (fuera de clase
durante esas tres semanas), ¿cuánto se espera sea su calificación?
(con un 95% de confianza)
y´=40,08+1,496(18)=67puntos.
4. Error de estimación en la predicción
Para este modelo el Se es:
𝑆𝑒 = 𝑆𝑦 1 − 𝑟𝑥𝑦2
Se=11,25 √(1-,862)= 5,74
0,0250,025
6778,25 Xi=67+(1,96*5,74)55,75Xi=67+(-1,96*5,74)
Si el estudiante se
dedicó 18 horas a
estudiar, lo más
probable es que
obtenga 67 puntos y,
con un 95% de
confianza se
encontrará entre
55,75 y 78,25 puntos.
4. Error de estimación en la predicción
0,0250,025
6778,25 Xi=67+(1,96*5,74)55,75Xi=67+(-1,96*5,74)
Nótese que:
El error de estimación es la desviación típica de la distribución de
posibles valores obtenidos en torno al valor predicho.
La media de la distribución de errores es el valor predicho, ya que, es el
valor más probable.
X xz
s
Se=Sy√(1-rxy2)
Se=11,25 √(1-,862)= 5,74
Gráfica de la estimación puntual.
60
65
70
75
80
85
90
95
15 20 25 30 35
Cali
fic
ació
n
Horas de estudio
Media=24
Desviación=6,48
Me
dia
=7
6
De
svia
ció
n=
11
,25
y´=40,08+1,496(18)=67puntos.
Gráfica de la estimación con intervalos de confianza. En este caso 95%.
60
65
70
75
80
85
90
95
15 20 25 30 35
Cali
fic
ació
n
Horas de estudio
Media=24
Desviación=6,48
Media
=76
Desvia
ció
n=
11,2
5
67
55,75
78,25
Error de estimación en la predicción
60
65
70
75
80
85
90
95
15 20 25 30 35
Cali
fic
ació
n
Horas de estudio
Media=24
Desviación=6,48
Media
=76
Desvia
ció
n=
11,2
5
Ejercicios
Número de horas de estudio fuera de clase (durante un período de
tres semanas) de alumnos de un curso de estadística y sus
calificaciones en el examen final de ese período
Horas 20 16 34 23 27 32 18 22
Calificación 64 61 84 70 88 92 72 77
-Si un alumno estudió 25 horas, ¿cuánto se espera sea su
calificación con un 90% de confianza?.
-Si un alumno estudió 36 horas, ¿cuánto se espera sea su
calificación con un 85% de confianza?
-Si un alumno estudió 17 horas, cuál es la probabilidad de obtener
más de 50 puntos.
-Si un alumno estudió 28 horas, ¿cuál es la probabilidad de obtener
entre 70 y 90 puntos?