M.Sc. J. FELIX ZULOETA SALAZAR
1J. Felix Zuloeta Salazar
REGRESIÓN LINEAL
• Es la técnica matemático – estadística que analiza ladependencia entre dos o más variables.
• Observa si las variaciones de una característicaprovocan variaciones en la magnitud de otracaracterística.
• Es la función matemática que, para un valor dadode una variable, da el valor esperado de una
característica, con la cual está ligada.2J. Felix Zuloeta Salazar
EJEMPLOS• El precio de venta (VD; Y) depende del precio de costo de un artículo (VI;
X).
• El costo total (VD; Y) depende de la producción total (VD; X).
• El tiempo de servicios (VD; Y) de un trabajador depende de su edad (VD;X).
• El consumo familiar (VD; Y) está en función del ingreso familiar VD; X).
Donde:
VD; Y = variable dependiente, predictando, explicativa.
VI; X = variable independiente; predictor, explicativa.
Esta relación se expresa: Y = f(X), “Y depende de X”3J. Felix Zuloeta Salazar
DIAGRAMA DE DISPERSIÓN O NUBE DE PUNTOS
••••
•
•••
•
•• •
• •
• •
•
•
•
•
•• •••
••
•
•
••
•
••
• •••
•
• •
•
•
•
••
••
•
•
••
•
•
•• •
•• •
•• ••••
•••
•••
(a) Lineal directa (b) Lineal inversa (c) Curvilínea directa
(d) Curvilínea inversa (e) Lineal inversacon más dispersión
(d) Ninguna relación
Y
X
Y
X
Y
X
Y
X
Y
X
Y
X
4J. Felix Zuloeta Salazar
MÉTODO DE LOS MÍNIMOS CUADRADOSRECTA DE LOS MÍNIMOS CUADRADOS:
Si el diagrama de dispersión muestra que los puntos se disponen
siguiendo el lugar geométrico de una recta:
Donde:
X = Variable independiente (estímulo, de influencia, causa).
Y = Variable dependiente (respuesta, criterio, efecto).Ŷ
b0 = Coeficiente autónomo (cantidad media).
b1 = Coeficiente de regresión (pendiente, proporción de cambio).
El modelo de estimación matemática, permite predecir, que valor asume
probablemente Y, cuando la variable X toma un valor determinado,
entonces la ecuación de estimación estará definida por:
, donde Ŷ es un Y estimado, esperado o calculado.
i 0 1 iY = b + b X
i 0 1 i= b + b XY
5J. Felix Zuloeta Salazar
d1 = Y1 - Ŷ1
P1 (X1; Y1)
P1 (X1; Ŷ 1)
X1 X2
Y2
Ŷ 2
Y1
Ŷ 2
P1 (X2; Ŷ 2)
P1 (X2; Y2)
d2 = Y2 - Ŷ2
Ŷ = b0 +b1
0
6J. Felix Zuloeta Salazar
CONDICIONES DEL MÉTODO
1. di = ei = (Yi – Ŷi) = dispersión o error.
2. Σdi = Σei = Σ (Yi – Ŷi) = 0
3.
4. Para estimar los coeficientes b0 y b1, en la expresión
sustituimos Ŷi = b0 + b1Xi; obteniendo Σ (Yi – b0 – b1 Xi)2; diferenciando
parcialmente con respecto al intercepto b0 y a la pendiente b1 e igualando a
cero se obtienen las ECUACIONES NORMALES:
De su solución se obtienen los parámetros b0 y b1
2ii(Y - )
0 1
2
0 1
Y = n b +b X
XY = b X+ b X
2
0 2 2
1 2 2
X Y - X XYb =
n X - ( X)
n XY - X Yb
n X - ( X)
2
0 2 2
1 2 2
X Y - X XYb =
n X - ( X)
n XY - X Yb
n X - ( X)
Y
Y
7J. Felix Zuloeta Salazar
APLICACIÓN• A continuación se muestran los datos observados correspondiente a la
función costo total (C = Yi) medida en millones de soles, con respecto a la
producción total (Q = Xi) medida en miles de soles.
PRODUCCIÓN (Xi) COSTO TOTAL (Yi)
10 30
20 36
30 40
40 48
50 54
60 58
70 66
80 68
8J. Felix Zuloeta Salazar
1. DIAGRAMA DE DISPERSIÓN
REGRESIÓN LINEAL ENTRE LA PRODUCCIÓN
TOTAL Y EL COSTO TOTAL
0
10
20
30
40
50
60
70
80
0 20 40 60 80 100
PRODUCCIÓN
COST
O T
OTA
L
9J. Felix Zuloeta Salazar
2.CÁLCULO DE LOS PARÁMETROS b0 y b1
PRODUCCIÓN (X) COSTO (Y) X2 Y2 XY
10 30 100 900 300
20 36 400 1296 720
30 40 900 1600 1200
40 48 1600 2304 1920
50 54 2500 2916 2700
60 58 3600 2916 3240
70 66 4900 4356 4620
80 68 6400 4624 5440
ΣX ΣY ΣX2 ΣY2 ΣXY
360 400 20400 21360 20380
POR FAVOR CALCULE USTED b0 y b110J. Felix Zuloeta Salazar
3. PLANTEAR LA ECUACIÓN DE ESTIMACIÓN DE REGRESIÓN
LINEAL
Ŷi = 24,5 + 0,5666667Xi
COSTO TOTAL ESTIMADO = 24,5 + 0,5666667 * PRODUCCIÓN TOTAL
4. INTERPRETAR b0.
Por cada mil unidades que se incremente la producción, el costo
total se incrementará en 566 666,67 soles.
5. ESTIMAR O PREDECIR CUÁNTO SERÁ EL COSTO TOTAL SI SE
QUIERE PRODUCIR 85 000 ARTÍCULOS.
Ŷi = 24,5 + 0,5666667 * 85
Ŷi = 72,66666667 * 1 000 000
Ŷi = 72 666 666,95 SOLES.
i 0 1 i= b + b XY
11J. Felix Zuloeta Salazar
6. GRAFICAR LA RECTA DE REGRESIÓN LINEAL ESTIMADA
REGRESIÓN LINEAL ENTRE LA PRODUCCIÓN
TOTAL Y EL COSTO TOTAL
y = 0,5667x + 24,5
0
10
20
30
40
50
60
70
80
0 20 40 60 80 100
PRODUCCIÓN
CO
ST
O T
OT
AL
12J. Felix Zuloeta Salazar
13J. Felix Zuloeta Salazar
El análisis de correlación es la técnica estadística que permite describir el
grado hasta el cual una variable está linealmente relacionada o asociada
con otra.
El coeficiente de correlación (r) mide el grado de afinidad o asociación entre
dos variables.
Coeficiente de Pearson:
Coeficiente de Determinación: CD = r2 * 100
Propiedades de r: -1 ≤ r ≤ +1
a) Si r > 0, existe “correlación directa positiva”.
b) Si r < 0, existe una “correlación inversa negativa”.
c) Si r2 = 1, los datos forman una línea recta.
d) Si r = +1, entonce hay una correlación perfecta positiva.
e) Si r = -1, Existe una correlación perfecta negativa.
f) Si r = 0, las variables son independientes; no están correlacionadas.
2 2 2 2
n XY - X Yr =
[n X - ( X) ] [n Y - ( Y) ]
14J. Felix Zuloeta Salazar
GRADO DE ASOCIACIÓN O INTERRELACIÓN
COEFICIENTE r GRADO DE ASOCIACIÓN
0,0 ± 0,2 NULA
± 0,2 ± 0,4 POCA SIGNIFICATIVA
±0,4 ± 0,7 SIGNIFICATIVA
± 0,7 ± 0,9BASTANTE
SIGNIFICATIVA
± 0,9 ± 1,0 MUY SIGNIFICATIVA
15J. Felix Zuloeta Salazar
APLICACIÓN
Calcule el coeficiente de correlación y el coeficiente
de determinación del ejemplo anterior e interprete.
r = 0,9958246
Interpretación: Entre la producción total y el costo
total existe una correlación o grado de asociación
muy significativa, es decir se acepta que el costo
total esta influenciado por la producción total.
CD =99,17%
Interpretación: El 99,17% de la variación del costo es
explicada por la variación en la producción.
16J. Felix Zuloeta Salazar
Top Related