COSTI. QUANTITÀ INPUT X PREZZO INPUT Costo = INDIPENDENTI DALLA QUANTITÀ PRODOTTA Costi fissi:
Patrones de datos y elección de técnica de pronóstico...Relación Costo de Mantenimiento -...
Transcript of Patrones de datos y elección de técnica de pronóstico...Relación Costo de Mantenimiento -...
Patrones de datos y elección de técnica de pronóstico
Curso de Econometría de Series de Tiempo
Facultad de Economía
Universidad Nacional Autónoma de México
Profesor: Juan Francisco Islas
Adjunto: Miguel Heras
Ciudad Universitaria, Agosto 2012
http://www.pearsoneducacion.net/hanke/hankedata_set.zip* Material de apoyo para desarrollar el capítulo 3 de Hanke, et. al. 8ª. ed.
Las bases de datos están en:
200
300
400
500
600
700
800
900
1000
1100
Cos
to
0 1 2 3 4 5 6 7 8 9 10 11 12Antigüedad
Datos de nueve autobuses de la STA
Spokane Transit AuthorityRelación Costo de Mantenimiento - Antigüedad
Diagrama de Dispersión
clearinput costo edad859 8682 5471 3708 91094 11224 2320 1651 81049 12endscatter costo edad, xlabel(0(1)12,grid) ylabel(200(100)1100,grid labsize(vsmall) angle(horizontal)) title("Relación Costo de Mantenimiento - Antigüedad") subtitle("Spokane Transit Authority") note("Datos de nueve autobuses de la STA") xtitle("Antigüedad") ytitle("Costo")
Fuente: John Hanke y Dean Wichern (2006) Pronósticos en los Negocios 8ª.ed. pág. 58, Fig. 3.1
Componentes de tendencia y ciclo de una serie de tiempo
1015
2025
Cos
to
0 5 10 15 20Tiempo
clearinput tiempo costo 1 102 143 134 155 176 167 188 199 2010 1711 1412 1313 1614 1715 1916 2017 2118 2219 2220 24end graph twoway (line costo tiempo, lpattern(dot) lwidth(medthick)) (lfit costo tiempo), legend(off) xtitle("Tiempo") ytitle("Costo")
Línea de tendencia
Pico del ciclo
Valle del ciclo
Fuente: John Hanke y Dean Wichern (2006) Pronósticos en los Negocios 8ª.ed. pág. 59, Fig. 3.2
500
600
700
800
900
1000
1100
Kilo
wat
ts
1980
q119
80q2
1980
q319
80q4
1981
q119
81q2
1981
q319
81q4
1982
q119
82q2
1982
q319
82q4
1983
q119
83q2
1983
q319
83q4
1984
q119
84q2
1984
q319
84q4
1985
q119
85q2
1985
q319
85q4
1986
q119
86q2
1986
q319
86q4
1987
q119
87q2
1987
q319
87q4
1988
q119
88q2
1988
q319
88q4
1989
q119
89q2
1989
q319
89q4
1990
q119
90q2
1990
q319
90q4
1991
q119
91q2
1991
q319
91q4
TrimestreWashington Water Power
1980-1991Consumo de Electricidad
Patrones de datos en series de tiempo: estacionalidad
Fuente: John Hanke y Dean Wichern (2006) Pronósticos en los Negocios 8ª.ed. pág. 60, Fig. 3.3
clearinput kw107164848074696566150176810656674867809266184837571047667495794106862549985097562349672893358249070895360450875810546355387529696555687521085692568783end
gen t=.replace t=yq(1980,1) in 1for num 2/48: replace t=t[X-1]+1 in Xformat t %tqlabel var t "Trimestre"tsset ttwoway (scatter kw t, mcolor(red) msize(vsmall)) (tsline kw, lcolor(yellow) tlabel(1980q1(1)1991q4, grid labsize(vsmall) angle(vertical)) ylabel(500(100)1100,grid angle(horizontal)) ytitle("Kilowatts") legend(off) title("Consumo de Electricidad") subtitle("1980-1991") note("Washington Water Power"))
Exploración de patrones de datos con análisis de autocorrelación
120
130
140
150
160
vcr
120 130 140 150 160lvcr
120
130
140
150
160
vcr
120 130 140 150 160llvcr
k=1
1−tY
tY
5719.01474843
1 ==r
k=2
tY
2−tY
4627.01474682
2 ==rAutocorrelación de orden k
( )( )
( )2
1
2
1
Y
kT
tt
T
ktktt
k Sc
YY
YYYYr =
−
−−=
∑
∑
=
+=−
L,2,1,0=k
Fuente: John Hanke y Dean Wichern (2006) Pronósticos en los Negocios 8ª.ed. Ejemplo 3.1, pág. 61 y 62, Tablas 3.1 y 3.2, Fig. 3.4
clearinput vcr123130125138145142141146147157150160endgen t=_ntsset t label define mes 1 "Enero" 2 "Febrero" 3 "Marzo" 4 "Abril" 5 "Mayo" 6 "Junio" 7 "Julio" 8 "Agosto" 9 "Septiembre" 10 "Octubre" 11 "Noviembre" 12 "Diciembre"label values t mesgen lvcr=l.vcrgen llvcr=ll.vcrlist t vcr lvcr llvcrscatter vcr lvcr, saving("C:\DATA\g1.gph",replace)scatter vcr llvcr, saving("C:\DATA\g2.gph",replace)sum vcrgen d=vcr-r(mean)gen dl=lvcr-r(mean)gen d2=d*dgen ddl=d*dlgen dll=llvcr-r(mean)gen ddll=d*dlllist t vcr lvcr llvcr d dl d2 ddl dll ddll, sum meangraph combine "C:\DATA\g1.gph" "C:\DATA\g2.gph", saving("C:\DATA\gc.gph",replace)
Exploración de patrones de datos con análisis de autocorrelación
Fuente: John Hanke y Dean Wichern (2006) Pronósticos en los Negocios 8ª.ed. Ejemplo 3.1, pág. 61 y 62, Tablas 3.1 y 3.2, Fig. 3.4
0.2
.4.6
.81
0 3.842 4.995
-1.0
0-0
.50
0.00
0.50
1.00
Aut
ocor
rela
tions
of v
cr
0 5 10Lag
Bartlett's formula for MA(q) 95% confidence bands
Exploración de patrones de datos con análisis de autocorrelación
corrgram vcr, lags(11)ac vcr, lags(11)twoway (function y=1-chi2(1,x), range(0 10) color(blue) recast(area)) (function y=1-chi2(1,x), range(0 4.995) color(white) recast(area)) (function y=1-chi2(1,x), lcolor(blue) range(0 10)) , legend(off) plotregion(margin(zero)) xtitle(" ") xlabel(0 3.842 4.995) ytitle(" ")
Un correlograma o función de autocorrelación es una gráfica de autocorrelaciones para varios rezagos (retrasos) de una serie de tiempo.
( ) 2
1
2
~2 m
m
k
k
knrnnQ χ∑
= −+=
Q de Ljung-Box
9955.411
)1474/843(14122
=××=Q
para k=1
592.810
)1474/682(11
)1474/843(141222
=⎥⎦
⎤⎢⎣
⎡+××=Q
para k=2
valor p
( )21χf
=205.0,1χ
2,1 valuep−= χ
dis 1-chi2(2,4.9955) dis 1-chi2(2,8.592)
Fuente: John Hanke y Dean Wichern (2006) Pronósticos en los Negocios 8ª.ed. Ejemplo 3.1, pág. 61, 62 y 63, Fig. 3.5
-2.2 2.20.0
5.1
.15
.2.2
5.3
.35
.4f(t
)
-3.5 1.25 1.980 3.5t
Prueba de Autocorrelación
ttt YY ερ += −11 tttt YYY ερρ ++= −− 2211
0: 10 =ρH0: 1 ≠ρaH
0: 20 =ρH0: 2 ≠ρaH
bajo 0H
( )1
11
rsert ρ−
= ( )2
22
rsert ρ−
=
bajo 0H
nr
n
rtcalc 11
. 1 ==
1221 2
1
2.
rrtcalc+
=
98.1289.05719.0
121
5719.0. ===calct ( )
25.1371.0
4627.0
125719.021
4627.02. ==
+=calct
( )n
rrse
k
ii
k
∑−
=
+=
1
1
221
ruido blanco
111 ttn =−
025.02=
α025.02=
α
95.01 =−α
No autocorrelación de orden 2No autocorrelación de orden 1
Fuente: J.Hanke y D.Wichern (2006) Pronósticos en los Negocios 8ª.ed. Ejemplo 3.2, pág. 65 y 66
Intervalos de Confianza
display "P[",0-invttail(11,0.025)*(1/sqrt(12))," < rho 1 <",0+invttail(11,0.025)*(1/sqrt(12)),"] = 0.95"
display "P[",0-invttail(11,0.025)*sqrt((1+2*0.5719^2)/12)," < rho 2 <",0+invttail(11,0.025)*sqrt((1+2*0.5719^2)/12),"] = 0.95"
( ) ( ) 371.012
5719.021 2
2 =+
=rse
( ) ( ) αρ αα −=⎥⎦
⎤⎢⎣
⎡+≤≤−
−−100
2,1
2,1 knkkn
rsetrsetP
025.02=α
95.01 =−α2.2025.0,11 =t ( ) 289.0121
1 ==rse12=n
[ ] 95.0289.02.2289.02.2 1 =×≤≤×− ρPPara k=1
[ ] 95.0636.0636.0 1 =≤≤− ρP
[ ] 95.0371.02.2371.02.2 2 =×≤≤×− ρP
Para k=2
[ ] 95.0816.0816.0 2 =≤≤− ρPUna autocorrelación significativamente distinta de cero se indica siempre y cuando el valor dese encuentre fuera de los límites de confianza correspondientes.
kr
( )n
rrse
k
ii
k
∑−
=
+=
1
1
221con
Fuente: J.Hanke y D.Wichern (2006) Pronósticos en los Negocios 8ª.ed. Ejemplo 3.2, pág. 65 y 66
020
040
060
080
010
00Y
0 10 20 30 40Tiempo
clearinput y34357487972837227613157571729461424774527271471997446271227042914311868257783498126342455547661257451829697020461697endgen t=_nlabel variable t "Tiempo"label variable y "Y"tsset tgraph twoway (scatter y t, mcolor(green)) (tsline y,legend(off) lcolor(yellow))corrgram y
Datos aleatorios
Ruido blanco tt cY ε+=
no correlacionado
ctε
( ) 0, =−kttCOV εε
nivel generalerror aleatorio
( ) 2
1
2
~2 m
m
k
k
knrnnQ χ∑
= −+=
Q de Ljung-Box
para k=10
valor p
( ) 210
10
1
2
~40
24040 χ∑= −
+=k
k
krQ
( ) ( ) ( ) ( ) ( ) ( )⎢⎣
⎡−
0.2538−+
−0.1045
+−
0.1452−+
−0.0063−
+−
0.1912−+=
22222
54044034024014024040Q
( ) ( ) ( ) ( ) ( ) 75.71040940840740640
=⎥⎦
⎤−
0.0215+
−0.0326−
+−
0.0274−+
−0.1691
+−
0.0286+
22222210~ χ
dis 1-chi2(10,7.75)
dis invchi2(10,0.95)
0: 100 =ρH0: 10 ≠ρaH
210χ>QSi rechazar 0H
No autocorrelación orden 10
∴< 31.1875.7 No se rechaza 0H
Fuente: J.Hanke y D.Wichern (2006) Pronósticos en los Negocios 8ª.ed. Ejemplo 3.3, Tabla 3.3 y Figs. 3.6 y 3.7 págs. 66-68
120
125
130
135
140
145
150
155
160
Y
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Mes
-10
-50
510
15D
ifere
ncia
s
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Mes
clearinput vcr123130125138145142141146147157150160endgen t=_ntsset t label define mes 1 "Enero" 2 "Febrero" 3 "Marzo" 4 "Abril" 5 "Mayo" 6 "Junio" 7 "Julio" 8 "Agosto" 9 "Septiembre" 10 "Octubre" 11 "Noviembre" 12 "Diciembre"label values t mesgen dvcr=d.vcrlist t vcr dvcrtsset ttsline vcr, xtitle("Mes") ytitle("Y") xlabel(0(1)15,grid) ylabel(120(5)160,grid) saving("C:\data\g1.gph", replace)tsline dvcr, xtitle("Mes") ytitle("Diferencias") xlabel(0(1)15,grid) ylabel(-10(5)15,grid) saving("C:\data\g2.gph", replace)graph combine "C:\data\g1.gph" "C:\data\g2.gph", saving("C:\data\g3.gph")
Estacionariedad• Una serie de tiempo estacionaria es aquella cuyas
propiedades estadísticas, como la media y la varianza, permanecen constantes en el tiempo.
• Serie con tendencia : no estacionaria• Para eliminar tendencia se utiliza el método de
diferencias.
Fuente: J.Hanke y D.Wichern (2006) Pronósticos en los Negocios 8ª.ed. Figs. 3.8 y 3.9 y págs. 68 y 70
-200
00-1
0000
010
000
Die
fere
ncia
Ingr
eso
Ope
rativ
o
1955 1960 1965 1970 1975 1980 1985 1990 1995 2000Año
Serie en Primera Diferencia Ingreso operativo anualSears 1955-2000
1000
020
000
3000
040
000
5000
060
000
Ingr
esos
Ope
rativ
os
1955 1960 1965 1970 1975 1980 1985 1990 1995 2000Año
Ingreso operativo anualSears 1955-2000
Serie de Tiempo en Niveles y Primera Diferenciaclearinput io3307355636013721403641344268457850935716635767697296817888449251100061099112306131011363914950172241794617514251952735730020358833882840715442824844050251537945597257242523455083854559349253823641296413224107140937end
gen t=_n+1954tsset t graph twoway (scatter io t) (tsline io, title("Sears 1955-2000") subtitle("Ingreso operativo anual") ylabel(10000(10000)60000,grid) tlabel(1955(5)2000) ytitle("Ingresos Operativos") xtitle("Año") legend(off))corrgram iogen dio=d.iograph twoway (scatter dio t) (tsline dio, title("Sears 1955-2000") subtitle("Serie en Primera Diferencia Ingreso operativo anual") ylabel(-20000(10000)10000,grid) tlabel(1955(5)2000) ytitle("Dieferencia Ingreso Operativo") xtitle("Año") legend(off))corrgram dio
dis invchi2(10,0.95)
Serie con tendencia Autocorrelación
Serie con tendencia eliminada No autocorrelación
display "P[",0-invnormal(0.975)*(1/sqrt(46))," < rho 1 <",0+invnormal(0.975)*(1/sqrt(46)),"] = 0.95"
Fuente: J.Hanke y D.Wichern (2006) Pronósticos en los Negocios 8ª.ed. Ejemplo 3.4, Tabla 3.4 Fig. 3.10, 3.11, 3.12 y 3.13; págs. 68-72
100
200
300
400
500
Ven
tas
trim
estra
les
(mile
s de
$)
1984
q119
84q2
1984
q319
84q4
1985
q119
85q2
1985
q319
85q4
1986
q119
86q2
1986
q319
86q4
1987
q119
87q2
1987
q319
87q4
1988
q119
88q2
1988
q319
88q4
1989
q119
89q2
1989
q319
89q4
1990
q119
90q2
1990
q319
90q4
1991
q119
91q2
1991
q319
91q4
1992
q119
92q2
1992
q319
92q4
1993
q119
93q2
1993
q319
93q4
1994
q119
94q2
1994
q319
94q4
1995
q119
95q2
1995
q319
95q4
1996
q119
96q2
1996
q319
96q4
Trimestre
Outboard Marine 1984-1996
Estacionalidad
• Estacionariedad se refiere a aquellas propiedades estadísticas, como la media y la varianza, que permanecen constantes en el tiempo.
• Estacionalidad se refiere a patrones que se repiten año con año por situaciones que tienen que ver con el clima, vacaciones, horarios, fechas del calendario, etc.
Fuente: J.Hanke y D.Wichern (2006) Pronósticos en los Negocios 8ª.ed. Ejemplo 3.5, Tabla 3.5 Fig. 3.14; págs. 69 y 73
Estacionalidadclearinput ventas147.6251.8273.1249.1139.3221.2260.2259.5140.5245.5298.8287168.8322.6393.5404.3259.7401.1464.6479.7264.4402.6411.3385.9232.7309.2310.7293205.1234.4285.4258.7193.2263.7292.5315.2178.3274.5295.4286.4190.8263.5318.8305.5242.6318.8329.6338.2232.1285.6291281.4end
gen t=.replace t=yq(1984,1) in 1for num 2/52: replace t=t[X-1]+1 in Xformat t %tqlabel var t "Trimestre"tsset tgraph twoway (scatter ventas t) (tsline ventas, title("Outboard Marine 1984-1996") tlabel(1984q1(1)1996q4, grid labsize(vsmall) angle(vertical)) ytitle("Ventas trimestrales (miles de $)") xtitle("Trimestre") legend(off))corrgram ventas
Fuente: J.Hanke y D.Wichern (2006) Pronósticos en los Negocios 8ª.ed. Ejemplo 3.5 Fig. 3.15 pág. 69, 73-74
Intervalos de Confianza
( ) ( ) ( ) ( ) 17.052
2221 222
4 =0.29+0.15+0.39+
=rse
( ) ( ) αρ αα −=⎥⎦
⎤⎢⎣
⎡+≤≤−
−−100
2,1
2,1 knkkn
rsetrsetP
025.02=
α95.01 =−α96.1975.0
205.01
21
===−−
zzz α ( ) 1387.0521
1 ==rse52=n
[ ] 95.01387.096.11387.096.1 1 =×≤≤×− ρPPara k=1
[ ] 95.0272.0272.0 1 =≤≤− ρP
[ ] 95.017.096.117.096.1 4 =×≤≤×− ρP
Para k=4
[ ] 95.0333.0333.0 4 =≤≤− ρP
Una autocorrelación significativamente distinta de cero se indica siempre y cuando el valor dese encuentre fuera de los límites de confianza correspondientes.
kr
display "P[",0-invnormal(0.975)*(1/sqrt(52))," < rho 1 <",0+invnormal(0.975)*(1/sqrt(52)),"] = 0.95"display "P[",0-invnormal(0.975)*sqrt((1+2*0.39^2)/52)," < rho 2 <",0+invnormal(0.975)*sqrt((1+2*0.39^2)/52),"] = 0.95"display "P[",0-invnormal(0.975)*sqrt((1+2*0.39^2+2*0.15^2)/52)," < rho 3 <",0+invnormal(0.975)*sqrt((1+2*0.39^2+2*0.15^2)/52),"] = 0.95"display "P[",0-invnormal(0.975)*sqrt((1+2*0.39^2+2*0.15^2+2*0.29^2)/52)," < rho 4 <",0+invnormal(0.975)*sqrt((1+2*0.39^2+2*0.15^2+2*0.29^2)/52),"] = 0.95”
( )n
rrse
k
ii
k
∑−
=
+=
1
1
221con
r1=0.3928 queda fuera del intervalo para ρ1r2=0.1539 queda dentro del intervalo para ρ2
r3=0.2937 queda dentro del intervalo para ρ3r4=0.7435 queda fuera del intervalo para ρ4
Fuente: J.Hanke y D.Wichern (2006) Pronósticos en los Negocios 8ª.ed. Ejemplo 3.5 Fig. 3.15 pág. 69, 73-74
-1.0
0-0
.50
0.00
0.50
1.00
Auto
corre
latio
ns o
f ven
tas
0 5 10 15 20 25Lag
Bartlett's formula for MA(q) 95% confidence bands
Función de Autocorrelación. Ventas de Outboard Marine
Estacionalidad y Función de Autocorrelación de Bartlett
Conclusión: Ventas de Outboard Marine estacionales en forma trimestral.ac ventas, title("Función de Autocorrelación. Ventas de Outboard Marine") saving("C:\data\ac.gph",replace)
Patrón estacional
Fuente: J.Hanke y D.Wichern (2006) Pronósticos en los Negocios 8ª.ed. Ejemplo 3.5 Fig. 3.15 pág. 69, 73-74
Medición del Error de Pronóstico
Estadístico Fórmula
Error
Error Medio
Desviación Absoluta Media
Error Cuadrático Medio
Error Porcentual Absoluto Medio
Error Porcentual Medio
ttt YYe ˆ−=
( ) ∑∑==
=−=n
tt
n
ttt e
nYY
nME
11
1ˆ1
∑∑==
=−=n
tt
n
ttt e
nYY
nMAD
11
1ˆ1
( ) ∑∑==
=−=n
tt
n
ttt e
nYY
nMSE
1
2
1
2 1ˆ1
100ˆ1
1×
−= ∑
=
n
t t
tt
YYY
nMPE
100ˆ1
1×
−= ∑
=
n
t t
tt
YYY
nMAPE
Fuente: J.Hanke y D.Wichern (2006) Pronósticos en los Negocios 8ª.ed. Ecuaciones 3.6 a 3.10 pág. 79-80
Medición del Error de Pronóstico
clearinput clientes 585460556262656370endgen t=_ntsset tgen yhat=l.clientesgen error=clientes-yhatgen ad=abs(error)gen se=error^2gen ape=abs(error)/clientesgen pe=error/clienteslist t clientes l.clientes error ad se ape pe, sum mean
Fuente: J.Hanke y D.Wichern (2006) Pronósticos en los Negocios 8ª.ed. Ejemplo 3.6 Tabla 3.7 pág. 80-81
Medición del Error de Pronóstico
Estadístico Fórmula Resultado
Error----
Error Medio1.5
Desviación Absoluta Media4.3
Error Cuadrático Medio23.5
Error Porcentual Absoluto Medio0.0695=6.95%
Error Porcentual Medio0.0203=2.03%
ttt YYe ˆ−=
( ) ∑∑==
=−=n
tt
n
ttt e
nYY
nME
11
1ˆ1
∑∑==
=−=n
tt
n
ttt e
nYY
nMAD
11
1ˆ1
( ) ∑∑==
=−=n
tt
n
ttt e
nYY
nMSE
1
2
1
2 1ˆ1
100ˆ1
1×
−= ∑
=
n
t t
tt
YYY
nMPE
100ˆ1
1×
−= ∑
=
n
t t
tt
YYY
nMAPE
• A partir de la MAD calculada se interpreta que cada pronóstico se desvía en promedio 4.3 clientes.• MSE y MAPE deben compararse con los correspondientes a otra(s) alternativa(s) de pronóstico, a
fin de decidir cuál es el mejor pronóstico.• Un valor de Error Porcentual Medio (MPE) cercano a cero revela que la técnica de pronóstico
empleada no tiene sesgo, no incurre en sobre-estimación o sub-estimación de clientes atendidos diario.
Fuente: J.Hanke y D.Wichern (2006) Pronósticos en los Negocios 8ª.ed. Ejemplo 3.6 Tabla 3.7 pág. 80-81
Elección de técnica de Pronóstico
Fuente: J.Hanke y D.Wichern (2006) Pronósticos en los Negocios 8ª.ed. Tabla 3.6 pág. 78