Heteroscedasticity Models and their Forecasting...

42
U.U.D.M. Project Report 2015:32 Examensarbete i matematik, 15 hp Handledare och examinator: Rolf Larsson September 2015 Department of Mathematics Uppsala University Heteroscedasticity Models and their Forecasting Performance Sebastian Sjöholm

Transcript of Heteroscedasticity Models and their Forecasting...

Page 1: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

U.U.D.M. Project Report 2015:32

Examensarbete i matematik, 15 hpHandledare och examinator: Rolf LarssonSeptember 2015

Department of MathematicsUppsala University

Heteroscedasticity Models and their Forecasting Performance

Sebastian Sjöholm

Page 2: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!
Page 3: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

Abstract    In  this  paper  the  aim  is  to  fit  and  compare  six  different  heteroscedasticity  models  for  which  has  the  best  forecast  accuracy  in  two  different  markets:  equity  and  exchange  rates.  I  will  compare  ARCH  (q),  GARCH  (1,1),  GARCH  (1,1)  with  student  t  distribution,  the  Integrated  GARCH,  the  Exponential  GARCH  and  the  Threshold  GARCH  model.  The  forecast  will  be  made  for  100  days  ahead  and  the  results  of  the  models  are  measured  by  the  MSE,  mean  squared  error,  for  which  the  least  value  gives  the  best  performance  for  the  given  stock  or  exchange  rate.  It  should  be  mentioned  that  the  results  do  not  differ  much  between  the  chosen  models  compared.                                      

               

Page 4: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

Table  of  Contents  1  Introduction  ..................................................................................................................................  4  1.1  Background  ..........................................................................................................................................  4  1.2  Previous  studies  .................................................................................................................................  5  1.3  Aim  ..........................................................................................................................................................  6  

2  Heteroscedasticity  models  .......................................................................................................  7  2.1  Autoregressive  Heteroscedasticity  model  .................................................................................  7  2.2  GARCH  (p,q)  model  ............................................................................................................................  8  2.3  GARCH  (p,q)  with  student-­‐t  distribution  ....................................................................................  9  2.4  Integrated  GARCH  model  (IGARCH)  .............................................................................................  9  2.5  Asymmetry  in  volatility  ................................................................................................................  10  2.6  Exponential  GARCH  model  (EGARCH)  ......................................................................................  10  2.7  TGARCH  ..............................................................................................................................................  12  

3  Data  ................................................................................................................................................  13  4  Building  an  ARCH  (p)  model  ...........................................................................................................  22  4.1  Determining  the  order  for  an  ARCH  (p)  model  .....................................................................  22  4.1.1  Akaike´s  Information  Criteria  (AIC)  ....................................................................................................  22  4.1.2  Bayesian  Information  Criteria  (BIC)  ...................................................................................................  23  4.1.3  Hannan-­‐Quinn  Information  Criteria  (HQIC)  ...................................................................................  23  

4.2  Mean  Square  Error  (MSE)  .............................................................................................................  24  4.3  Why  use  GARCH  (1,1)?  ...................................................................................................................  24  4.4  Why  use  Student-­‐t  distribution?  ................................................................................................  25  

5  Method  ..........................................................................................................................................  26  

6  Results  and  Analysis  .................................................................................................................  27  

7  Discussion  and  conclusion  .....................................................................................................  30  8  References  ...................................................................................................................................  33  

9  Appendix  ......................................................................................................................................  35    

               

Page 5: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

1  Introduction  

 1.1  Background  

   Market  risks  associated  with  high  volatility  are  catastrophic  for  all  investors.  For  an  average  investor,  the  performance  of  a  portfolio  usually  depends  on  a  few  trading  days  during  which  extreme  returns  occur.    During  these  days  the  bad  outcomes  can  completely  reverse  the  good  outcomes  accumulated  during  the  previous  period.  So  investors  are  primarily  concerned  with  the  extreme  risks  that  make  the  most  impact  on  their  portfolios  performance.  Therefore  forecasting  volatility  plays  one  of  the  most  important  parts  in  portfolio  allocation.        The  three  main  purposes  of  forecasting  volatility  are  for  risk  management,  portfolio  allocation  and  for  taking  bets  on  future  volatility.  Risk  management  includes  measuring  the  future  potential  losses  of  a  portfolio  asset,  and  this  includes  that  estimates  have  to  be  done  about  future  volatilities  and  correlation.  In  asset  allocation,  minimizing  the  risk  for  a  given  level  of  expected  return  is  a  standard  approach.  The  volatility  of  an  asset,  the  risk,  can  also  be  seen  as  the  movement  of  a  financial  asset,  and  the  more  the  asset  moves,  the  more  likely  its  value  will  decrease.      The  first  model  that  emerged  for  modeling  changing  variance  in  time  series  is  the  Autoregressive  Conditional  Heteroscedasticity  (ARCH)  model,  as  a  function  of  passed  residuals,  by  Engle  (1982)  and  its  various  extension.  For  this  he  later  came  to  receive  the  Swedish  central  bank  Prize  in  Economic  Sciences  in  Memory  of  Alfred  Nobel  in  2003.      Since  the  introduction  of  the  ARCH  model  several  more  sophisticated  models  have  appeared.  One  of  them  is  the  Generalized  ARCH  model  by  Bollerslev  (1986),  which  is  a  generalization  of  the  ARCH  process  and  also  allows  for  past  conditional  variances  in  the  current  conditional  variance  equation.        Many  of  the  different  models  have  different  features,  which  makes  the  forecast  accuracy  better.  Both  the  ARCH  and  GARCH  models  capture  volatility  clustering,  which  means  that  periods  with  high  volatility  tend  to  be  followed  by  periods  of  high  volatility,  and  leptokurtosis,  when  the  kurtosis  value  is  largely  positive.    But  as  their  distribution  is  symmetric,  they  fail  to  model  the  leverage  effect.  To  address  this  problem,  many  nonlinear  GARCH  models  have  been  proposed,  such  as  the  Exponential  GARCH  (EGARCH)  model  by  Nelson  (1991),  where  volatility  can  react  asymmetrically  to  the  good  or  bad  news.  It  is  also  proposed  in  the  analysis  of  empirical  data  that  sometimes  the  model  fits  better  when  relaxing  the  Gaussian  assumption  in  the  previous  models  and  supposing  instead  

Page 6: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

that  the  distribution  follows  a  heavier  tailed  zero-­‐mean  distribution  such  as  the  Student’s  t-­‐distribution.  So,  the  question  is:  do  the  more  sophisticated  models  capture  the  volatility  better?  And  which  model  has  the  best  forecast  accuracy?      There  are  some  studies  that  have  been  made  about  the  forecast  accuracy  of  the  different  models  on  different  securities.        

1.2  Previous  studies      Hansen  and  Lunde  (2005)  compared  330  different  ARCH-­‐type  models  in  terms  of  their  ability  to  describe  conditional  variance.  They  used  out-­‐of-­‐sample  data  using  DM-­‐US  exchange  rate  data  and  IBM  return  data,  where  IBM  return  data  where  based  on  a  new  data  set  of  realized  variance.  They  found  no  evidence  that  a  GARCH  (1,1)  model  is  outperformed  by  more  sophisticated  models  in  their  analysis  of  exchange  rates.  But  the  GARCH  (1,1)  model  was  poor  in  comparison  to  models  with  a  leverage  effect  in  their  analysis  of  IBM  returns.        Marucci  (2005)  compared  different  standard  GARCH  models  with  more  complex  models  like  Markov  Regime-­‐Switching  GARCH  (MRS-­‐GARCH)  in  their  ability  to  forecast  the  U.S.  stock  market  volatility  at  horizons  that  range  from  one  day  to  one  month.  He  found  that  MRS-­‐GARCH  was  better  than  all  standard  GARCH  models  in  forecasting  volatility  at  horizons  shorter  than  one  week.  However,  at  forecasts  longer  than  one  week,  standard  asymmetric  GARCH  models  tend  to  be  better.      Alberg,  Shalit  and  Yosef  (2008)  compared  the  forecast  performance  of  several  GARCH  models  with  different  distributions  for  two  Tel  Aviv  stock  index  returns.  Their  results  showed  that,  among  the  forecast  tested,  the  EGARCH  skewed  Student-­‐t  model  outperformed  GARCH,  TGARCH  and  APARCH  models  in  forecasting  the  Tel  Aviv  stock  index  returns.  The  result  also  showed  that  the  asymmetric  models,  such  as  the  EGARCH,  improve  the  forecasting  performance.      Zhang  and  Yu  (2009)  used  the  Shanghai  Stock  Exchange  Composite  Index  data  to  construct  ARCH-­‐type  models  under  the  assumptions  of  normal  residuals  and  non-­‐normal  residuals  and  compared  the  forecast  performance  of  volatility  for  normal  and  non-­‐normal  ARCH  models  and  the  performance  of  VaR  measure  to  demonstrate  the  effect  of  the  distribution  assumptions  on  GARCH  model’s  forecasting  ability.  Their  results  showed  that  the  forecast  performances  of  volatility  for  GARCH  with  assumptions  of  a  student’s-­‐t  distribution  for  the  residual  terms  are  superior  to  the  assumption  of  a  normal  distribution.        

Page 7: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

Laurent,  Rombouts  and  Violante  (2012)  used  10  assets  from  the  New  York  Stock  Exchange  and  compared  125  different  multivariate  GARCH  models  on  their  1-­‐,  5-­‐,  and  20-­‐day-­‐ahead  forecast  performance  of  the  conditional  variance  over  a  period  of  10  years.  The  results  show  that  in  unstable  markets  the  multivariate  GARCH  models  perform  poorly.      Ramasamy  and  Munisamy  (2012)  compared  three  simulated  exchange  rates  of  the  Malaysian  Ringgit  with  actual  exchange  rates  using  GARCH,  T-­‐GARCH  and  EGARCH  models.  The  forecasted  rates  are  compared  with  the  actual  daily  exchange  rates  for  four  different  currencies,  the  Australian  dollar,  Singapore  dollar,  Thailand  Bath  and  Philippine  Peso  in  2011.  The  results  show  that  these  GARCH  models  perform  better  predicting  the  more  volatile  exchange  rates  than  predicting  the  exchange  rates  that  are  less  volatile.  The  results  also  show  that  the  leverage  effect  incorporated  in  the  TGARCH  and  EGARCH  models  do  not  improve  the  results  much.      

1.3  Aim      The  aim  of  this  paper  is  to  examine  six  different  heteroscedasticity  models  ARCH,  GARCH,  IGARCH,  TGARCH  and  EGARCH.  And  for  the  GARCH  model,  a  different  distribution  will  also  be  considered,  i.e.  student-­‐t  distribution.  The  main  goal  is  to  examine  if  one  of  these  models  outperform  the  other  models  significantly  in  forecasting  the  conditional  volatility  for  different  securities.  I  will  therefore  not  only  focus  on  the  stock  market  but  also  on  exchange  rates.  I  have  chosen  three  different  stocks  Apple,  Coca-­‐Cola  and  Google  and  three  different  currencies  United  States  Dollars  (USD),  Great  Britain  Pound  (GBP)  and  the  Swedish  Krown  (SEK).  For  all  six  data  sets  I  have  excluded  the  last  100  observations  when  I  modeled  the  volatility.  This  is  because  I  used  the  last  100  observations  in  purpose  of  comparing  the  models  forecasting  accuracy  of  the  conditional  variances  to  the  real  observations.  The  result  was  measured  using  the  Mean  Squared  Error,  MSE,  which  is  the  squared  sum  of  the  difference  between  the  observed  squared  residuals  and  the  forecasted  conditional  variance.        I  chose  to  examine  the  ARCH  model  because  it  is  the  first  heteroscedasticity  model,  by  Engle  (1982),  and  my  purpose  of  this  choice  is  to  compare  this  model  with  the  more  sophisticated  models.  The  GARCH  (1,1)  model  is  suggested  to  be  enough  to  capture  the  volatility,  and  according  to  Hansen  and  Lunde  (2005)  there  is  no  evidence  that  the  more  sophisticated  models  outperform  the  GARCH  (1,1)  model  in  modeling  exchange  rates.    The  EGARCH  and  IGARCH  model  are  more  sophisticated  models  compared  to  the  others.  For  example  one  purpose  of  the  development  of  the  EGARCH  model  is  because  when  studying  empirical  data  in  different  markets,  the  impact  of  negative  price  moves  are  bigger  on  future  volatility  that  of  positive  price  moves,  which  is  called  asymmetric  volatility.          

Page 8: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

For  the  stock  data  I  have  collected  2025  observations  for  Apple  and  2024  for  Coca-­‐Cola  and  Google.  For  the  exchange  rates  I  have  396  observations  for  GBP/SEK  and  364  for  SEK/USD  and  GBP/USD,  so  there  is  a  quite  a  big  difference  in  the  sample  size  between  the  stock  and  exchange  rates.  The  difference  in  sample  size  is  also  very  interesting  because  the  models  forecast  accuracy  might  perform  worse  when  the  sample  size  is  smaller  or  bigger.  For  example  Ng  and  Lam  (2006)  investigated  how  the  size  of  the  sample  size  affected  the  GARCH  model  and  found  that  1000  or  more  observations  are  recommended  for  the  conventional  GARCH  model.  We  might  therefore  expect  better  performance  in  forecasting  accuracy  from  the  original  GARCH  model  for  the  stocks  than  for  the  exchange  rates.    

2  Heteroscedasticity  models    

2.1  Autoregressive  Heteroscedasticity  model      The  Autoregressive  Heteroscedasticity  models  are  built  to  capture  time  varying  volatility  in  time  series.  The  first  heteroscedasticity  model  introduced  by  Engle  (1982)  used  this  model  to  estimate  the  means  and  variances  of  inflation  in  the  U.K.  (Engle,  1982).    The  basic  idea  behind  the  ARCH  model  in  modeling  financial  data  is  that  (1)  the  change  of  an  asset  return,  𝑎! ,  is  serially  uncorrelated,  but  dependent  because  of  the  assumption  that  high  volatility  appears  in  clusters,  and  (2)  the  dependence  of  𝑎! ,  can  be  described  by  a  quadratic  function  of  its  lagged  values.    The  model  is  built  on  the  information  set  at  time  t-­‐1.  The  conditional  variance  function  depends  on  p-­‐lagged  observations:        

𝜎!! = 𝛼! + 𝛼!𝑎!!!! +⋯+ 𝛼!𝑎!!!!          (1)      In  equation  (1)  it  can  be  seen  that  for  larger  values  of  previous  observations  of  asset  returns  the  forecast  of  the  volatility  will  be  bigger,  and  the  squared  values  will  cause  them  to  be  even  bigger.  This  means  that  a  shock  which  causes  big  changes  in  asset  return,  𝑎! ,  the  model  will  automatically  forecast  large  values  for  the  future  volatility  which  is  the  same  behavior  as  the  clusters  of  the  volatility  (Tsay  2005:102).          Consider  the  asset  return  function  as        

𝑎! = 𝜎!𝜀!          (2)      Where  [𝜀!]  is  a  sequence  of  independent  identically  distributed  (iid)  random  variables  with  mean  zero  and  variance  1.  

Page 9: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

   𝜎!  Is  the  positive  ARCH  (p)  function,  as  described  above,      

𝜎!! = 𝛼! + 𝛼!𝑎!!!! +⋯+ 𝛼!𝑎!!!!          (3)      Where  𝛼! > 0  and  𝛼! ≥ 0  for  𝑗 > 0.        One  weakness  of  the  ARCH  (p)  model  is  that  the  model  assumes  that  positive  and  negative  shocks  have  the  same  effect  on  volatility  because  it  depends  on  the  square  of  the  previous  returns.  In  practice  it  is  well  known  that  the  price  of  a  financial  asset  responds  differently  to  positive  and  negative  shocks  (Tsay  2005:106).    How  to  select  the  order  p  of  an  ARCH  model  is  debatable  and  the  required  number  of  p  might  be  very  large,  which  makes  this  model  unattractive  (Brooks  2008:391).  In  this  paper  we  will  use  the  Akaike´s  information  criteria,  AIC,  the  Bayesian  Information  Criteria,  BIC,  and  the  Hannan-­‐Quinn  Information  Criteria,  HQIC,  to  decide  wich  order  that  best  describes  the  conditional  variance.        

2.2  GARCH  (p,q)  model      Although  the  ARCH  model  is  simple,  it  often  requires  a  lot  of  parameters  to  describe  the  conditional  variances.  The  General  Autoregressive  Heteroscedasticity  model    (GARCH  (p,q))  introduced  by  Bollerslev  (1986)  is  a  generalization  of  the  ARCH  process.  To  illustrate  the  GARCH  (p,q)  model,  consider  the  log  return  of  an  asset,  𝑟! ,  and  let  𝑎! = 𝑟! − 𝜇!  be  the  innovations  at  time  t.  Then  we  define  GARCH  (p,q)  models  as:      

𝑎! = 𝜎!𝜀!          (4)      Where  again  [𝜀!]  is  a  sequence  of  iid  random  variables  with  mean  zero  and  variance  1,  𝜎!  is  the  positive  function:      

𝜎!! = 𝛼! + (!!!! 𝛼!𝑎!!!! )+ (!

!!! 𝛽!𝜎!!!! )          (5)      Where  𝛼! > 0,  𝛼! ≥ 0  and  𝛽! ≥ 0  for  i,  j>0  and   (𝛼! + 𝛽!) < 1!"#  (!,!)

!!! .  We  also  assume  that  𝛼! = 0  for  j>p  and    𝛽! = 0  for  i>q.  The  constraint  𝛼! + 𝛽!  implies  that  the  unconditional  variance  is  finite,  and  the  conditional  variance,  𝜎!,  varies  over  time.  If  in  the  equation  (3)  q=0  the  parameters  𝛽!  in  the  equation  will  vanish  and  the    

Page 10: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

GARCH  (p,q)  model  will  be  reduced  to  an  ARCH(p)  model.  The  parameters  p  and  q  are  referred  to  as  ARCH  and  GARCH  parameters  respectively.        The  GARCH  (1,1)  model  can  be  written  as      

𝜎!! = 𝛼! + 𝛼!𝑎!!!! + 𝛽!𝜎!!!!          (6)      Where  𝛼! > 0  and  𝛼!,𝛽! ≥ 0,  also  (𝛼! + 𝛽!) < 1.      If  we  look  at  the  equation  (5)  above  we  notice  that  large  values  for  lagged  variance  and  returns  we  will  have  a  bigger  variance,  again  the  well-­‐known  behavior  of  volatility  clustering  in  financial  time  series(Tsay  2005:114)  The  GARCH  (p,q)  model  also  responses  equally  to  positive  and  negative  shocks  as  the  ARCH  (p)  model  (Tsay  2005:116).        

2.3  GARCH  (p,q)  with  student-­‐t  distribution      When  we  defined  the  GARCH  (p,q)  model  we  assumed  that  𝜀!  was  iid  N(0,1).  So  here,  instead,  we  assume  that  𝜀!  follows  a  student-­‐t  distribution  with  v  degrees  of  freedom,  t(v).  In  the  analysis  of  empirical  financial  data  it  is  found  that  sometimes  it  is  better  to  assume  that  the  distribution  of  𝑎!  better  suits  a  student’s-­‐t  distribution  (Brockwell  and  Davis  2002:352).          

2.4  Integrated  GARCH  model  (IGARCH)      

In  1986  Engle  and  Bollerslev  introduced  a  new  model  called  the  integrated  GARCH  model  (IGARCH)  that  is  persistent  in  variance  because  todays  information  remains  important  for  forecasts  on  all  horizons.  First  we  consider  the  lag  operator  𝐿!𝑎! = 𝑎!!!  and  the  lag  polynomials  𝛼 𝐿 = 𝛼!𝐿 +⋯+ 𝛼!𝐿!  and  𝛽 𝐿 = 𝛽!𝐿 +⋯+ 𝛽!𝐿!.  Then  the  GARCH  models  can  be  written  as:      

𝜎!! = 𝛼! + 𝛼 𝐿 𝑎!! + 𝛽(𝐿)𝜎!!          (7)      and  in  the  case  when  𝛼 𝐿 + 𝛽 𝐿 = 1  we  may  represent  the  GARCH  model  as  an    ARMA  (m,p)  model  where  m=max  (p,q),      

Page 11: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

1− 𝛼 𝐿 − 𝛽 𝐿 𝑎!! = 𝛼! + (1− 𝛽 𝐿 )𝜈!            (8)      where  𝜈! = 𝑎!! − 𝜎!!.  If  we  look  at  equation  (8)  and  consider  the  autoregressive  polynomial   1− 𝛼 𝐿 − 𝛽 𝐿 ,  Engle  and  Bollerslev  said  that  when  this  polynomial  had  𝑑 > 0  unit  roots,  and  𝑚 − 𝑑  roots  outside  the  unit  circle,  the  GARCH  model  is  integrated  in  variance  of  order  𝑑  (IGARCH  (p,d,q)).        With  some  modifications  equation  (6)  may  be  written  as:      

𝜎!! = 𝛼! + 𝛼 𝐿 𝑎!! + 𝛽(𝐿)𝜎!!          (9)      which  is  the  Integrated  GARCH  model  by  Engle  and  Bollerslev  (1986)  (Hafner  1998:103).  Notice  that  Integrated  GARCH  model  is  the  GARCH  model  where    𝛼 𝐿 + 𝛽 𝐿 = 1  (Reider  2009:11).    The  IGARCH  (1,1)  model  may  be  written  as:      

𝑎!! = 𝜎!𝜖!          (2),                    𝜎!! = 𝛼! + (1− 𝛽!)𝑎!! + 𝛽!𝜎!!          (10)      where  𝜖!  is  iid  N  (0,1)  and  we  have  replaced  𝛼!  by  1− 𝛽!.          

2.5  Asymmetry  in  volatility      The  heteroscedasticity  models  that  assume  symmetry  in  volatility,  some  of  them  presented  above,  are  models  that  assume  that  negative  and  positive  innovations  have  the  same  impact  when  forecasting  the  conditional  variance.  But  in  many  financial  markets  this  is  not  the  case.  In  fact,  in  many  markets  negative  shocks  are  assumed  to  have  bigger  impact  on  volatility  than  positive  shocks,  which  is  known  as  the  leverage  effect.  For  example  Ferreira,  Menezes  and  Mendes  (2007)  investigated  the  hypothesis  that  the  conditional  variance  of  stock  return  is  an  asymmetric  functions  of  past  information  on  seven  different  stock  market  indices.  Their  results  show  that  the  conditional  variance  is  in  fact  asymmetric,  and  that  negative  shocks  have  bigger  impact  on  the  variance  than  positive  shocks.    

   

2.6  Exponential  GARCH  model  (EGARCH)      While  the  GARCH  (p,q)  model  captures  the  short  run  temporal  dependencies  in  magnitude  for  a  variety  of  speculative  assets,  the  model  does  not  capture  the  leverage  

Page 12: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

effect  in  stock  returns  (Bollerslev  and  Mikkelsen  1996:159).  In  the  GARCH  models,  the  conditional  variances  are  functions  of  magnitude  of  the  lagged  residuals  and  do  not  consider  if  they  are  positive  or  negative.  To  capture  this,  inclusion  of  different  asymmetric  terms  in  the  conditional  variance  equation  has  been  suggested.  One  of  these  models  is  the  Exponential  GARCH  (EGARCH)  model  proposed  by  Nelson  (1991).  The  EGARCH  model  may  be  written  as  follows      

ln  (𝜎!!) = 𝛼! + 𝑔! 𝜀!!! + 𝛽!ln  (𝜎!!!! )!!!!

!!!!        (11)  

   The  conditional  variance  is  constrained  to  be  non-­‐negative  by  the  assumption  that  the  logarithm  of  𝜎!  is  a  function  of  passed  𝜀!’s.    We  define  𝑔!(𝜀!!!)  as  the  weighted  innovation:        

𝑔! 𝜀!!! = 𝜃!𝜀!!! + 𝛾! 𝜀!!! − 𝐸 𝜀! , 𝑗 = 1,… , 𝑞 (12)    Where  𝜃  and  𝛾  are  real  constants.  Both  𝜀!  and   𝜀! − 𝐸( 𝜀! )  are  zero-­‐mean  iid  sequences  with  continuous  distributions.  Therefore  𝐸 𝑔! = 0  (Tsay  2005:124).    In  equation  (10)  the  term  of  the  function  𝛾! 𝜀! − 𝐸 𝜀!  represents  the  magnitude  effect  as  in  the  GARCH  (p,q)  model.  Suppose  for  example  𝜃 = 0  and  𝛾 > 0,  then  ln(𝜎!!!! )  will  be  positive  when  the  magnitude  of  change  in  𝜀!  is  larger  that  the  expected  value  of  𝜀! .  Also  notice  that  if  𝜃 < 0  and  the  magnitude  of  change  in  𝜀!  is  smaller  than  the  expected  value  of  𝜀! ,  the  negative  effect  will  be  larger  than  if   𝜀!!! − 𝐸 𝜀! .  Therefore  the  conditional  variances  will  response  different  in  magnitude  to  positive  and  negative  shocks  (Nelson  1991:351).  Equation  (11)  and  (12)  together  form  Nelsons  EGARCH  model  (1991),  and  the  most  popular  EGARCH  model  is  the  EGARCH  (1,1)  model  with  p  and  q  equal  to  1.        The  EGARCH  (1,1)  model  may  then  be  written  as  a  combination  of  (11)  and  (12),  where  (12)  becomes      

𝑔 𝜀!!! = 𝜃!𝜀!!! + 𝛾![ 𝜀!!! − 𝐸 𝜀! ]          (13)      

which  we  insert  to  equation  (11)  for  p,  q=1,      

ln  (𝜎!!) = 𝛼! + 𝜃!𝜀!!! + 𝛾! 𝜀!!! − 𝐸 𝜀! + 𝛽! ln 𝜎!!!!          (14)      

It  should  also  be  mentioned  that  when  the  EGARCH  model  assumes  Gaussian  distribution,  the  error  term  𝐸 𝜀! = 2/𝜋,  so  we  will  get  the  equation:    

Page 13: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 

ln 𝜎!! = 𝛼! + 𝜃!𝜀!!! + 𝛾! 𝜀!!! − !!   + 𝛽!ln  (𝜎!!!! )          (15)  

   Here  it  should  be  mentioned  that  because  of  the  property  that  negative  shocks  of  the  volatility  tend  to  have  bigger  impact,  𝜃  is  often  assumed  to  be  negative  (Tsay  2005:124).    

 

2.7  TGARCH      Another  model  within  the  asymmetric  GARCH  family  is  the  Threshold  GARCH    (T-­‐GARCH)  model  by  Rebemanajara  and  Zakoian  (1993),  which  is  an  extension  of  the  Threshold  ARCH  model  by  including  the  lagged  conditional  standard  deviations  as  a  regressor  (Miron  and  Tudor  2010).  The  TGARCH  model  can  be  written  as        

𝜎!! = 𝛼! + 𝛼!!!!! 𝑎!!!! + 𝛾!

!!!! 𝑆!!!𝑎!!!! + 𝛽!

!!!! 𝜎!!!!          (16)  

   where:      

𝑆!!! =1      𝑖𝑓  𝑎!!! < 00      𝑖𝑓  𝑎!!! ≥ 0          (17)  

   So,  by  examining  the  equations  (16)  and  (17)  we  see  that  negative  changes  will  have  bigger  effect  than  the  positive  changes;  they  capture  the  leverage  effects,  which  is  the  purpose  of  the  asymmetric  GARCH  models.  Notice  that  𝛾!  is  expected  to  be  positive  otherwise  the  positive  effects  would  be  greater  than  the  negative  effects.                              

Page 14: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

3  Data      The  data  that  has  been  used  in  my  study  is  the  daily  closing  prices  from  three  different  stocks  Apple,  Coca-­‐Cola  and  Google.  I  have  also  compared  the  result  of  forecasting  three  different  exchange  rates,  Great  Britain  Pound  (GBP),  United  States  Dollars  (USD)  and  the  Swedish  Krown  (SEK).  All  the  data  was  downloaded  from  Google  Finance  and  the  stock  data  are  dated  from  2007-­‐01-­‐03  to  2015-­‐06-­‐15,  and  contains  2025  observations  for  Apple  and  2024  observations  for  Coca-­‐Cola  and  Google.  The  last  100  observations  where  left  out  in  order  to  evaluate  the  forecasting  results.  The  exchange  rates  are  dated  from  2014-­‐02-­‐04  to  2015-­‐03-­‐10  each  containing  396  observations  for  GBP/SEK  and  SEK/USD  and  398  observations  GBP/USD.  Also  here  the  last  100  observations  where  left  out  to  evaluate  the  forecast  accuracy.  All  calculations  were  done  in  R  using  the  rugarch  package.        

 Graph  1  (left)  Daily  closing  price  (USD)  for  Coca-­‐Cola  (Black)  and  Apple  (Red)  from  2007-­‐01-­‐03.  (Right)  Daily  closing  price  (USD)  for  Google  from  2007-­‐01-­‐03  to  2015-­‐01-­‐21.  

       

Page 15: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 Graph  2  (Top)  Daily  closing  price  (SEK)  for  GBP/SEK  from  2014-­‐02-­‐04  to  2015-­‐03-­‐10.  (Middle)  Daily  closing  price  (USD)  for  SEK/USD  from  2014-­‐02-­‐04  to  2015-­‐03-­‐10.  (Bottom)  Daily  closing  price  (USD)  for  GBP/SEK  from  2014-­‐02-­‐04  to  2015-­‐03-­‐10.      

   To  be  able  to  model  the  volatility  of  the  financial  data  the  trend  must  be  removed  from  each  data  set.  We  do  this  by  differentiating  the  time  series  one  by  one.      The  stock  data  were  differentiated  with  the  log  returns:  𝑎! = ln 𝑦! − ln  (𝑦!!!),  where  𝑦!  is  the  observed  closing  price  at  time  t.  And  the  exchange  rates  were  differentiated  with  the  somewhat  modified  log  returns:    𝑎! = 100 ∗ (ln 𝑦! − ln  (𝑦!!!)),  here  𝑦!  is  the  exchange  rate  at  time  t.        A  sample  Autocorrelation  function,  sample  ACF,  and  the  sample  Partial  Autocorrelation  function,  PACF,  was  plotted  for  all  stationary  data  sets.  The  sample  ACF  is  a  tool  for  estimating  the  dependence  in  the  data.  For  example,  if  the  sample  ACF  is  close  to  zero  we  might  suggest  that  it  is  iid  noise  (Brockwell  and  Davis  2002:18).  Also,  the  PACF  could  be  used  in  order  to  determine  the  order  of  the  ARCH  (p)  model  (Tsay  2005:119).      The  Lagrange  multiplier  test  for  the  Autoregressive  heteroscedasticity  (ARCH)  effect  was  done  for  all  residuals  up  to  lag  30  and  is  represented  in  Appendix  1-­‐6.    If  the  LM  test  is  not  rejected,  i.e.  p-­‐value  exceeds  5%,  then  the  null  hypothesis  that  all  coefficients  in  the  ARCH  model  are  zero,  cannot  be  rejected  and  we  say  there  is  no  ARCH  effect  (Engle  1982)    

Page 16: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 

 Graph  3  Daily  log  returns  (USD)  from  Apple  (top),  Coca-­‐Cola  (middle)  and  Google  (bottom).  

   Graph  3  shows  the  log  returns  from  the  three  equities  from  2007-­‐01-­‐03  to    2015-­‐01-­‐21.  The  top  graph  represent  Apple,  the  middle  graph  represents  Coca-­‐Cola  and  the  bottom  graph  Google.  As  we  can  see  in  the  graph,  all  series  show  a  significant  increase  in  volatility  during  the  financial  crisis  in  2007  to  2009.  It  can  also  be  seen  that  volatility  seems  to  appear  in  clusters,  which  is  a  sign  of  ARCH  effect,  and  there  are  periods  with  high  volatility  and  periods  with  low  volatility.            

Page 17: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 Graph  4  ACF  function  for  Apple  (top),  Coca-­‐Cola  (middle)  and  Google  (bottom).  

   Graph  4  shows  the  sample  ACF  function  for  the  three  equities  Apple  (top),  Coca-­‐Cola  (middle)  and  Google  (bottom).  Notice  that  lag  zero  is  always  one.  By  examining  the  graphs  we  see  that  there  exist  no  correlations  between  one  lag  to  another.  It  also  seems  to  be  equally  likely  to  be  positive  or  negative  from  one  lag  to  another.  But,  there  might  still  be  some  correlation  in  magnitude.  If  we  square  the  residuals  and  plot  the  graphs  again  we  can  see  that  there  still  exists  some  correlation  in  magnitude  from  one  lag  to  another  (Graph  5).  LM  tests  for  the  ARCH  effect  was  carried  out  on  the  three  stocks  (see  Appendix  (1-­‐3))  and  all  p-­‐values  are  less  than  0.05,  so  we  have  ARCH  effect.        

 

Page 18: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 Graph  5  The  ACF  function  of  squared  residuals  for  Apple  (top),  Coca-­‐Cola  (middle)  and  Google  (bottom).  

   Graph  6  shows  the  partial  ACF  of  the  squared  residuals  for  all  tree  equities.  The  PACF  shows  significant  lags  up  to  lag  10  and  then  cuts  off.  The  PACF  cuts  off  at  lag  3  for  Coca-­‐Cola  and  at  lag  12  for  Google.  

Page 19: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 

 Graph  6  The  PACF  function  of  squared  residuals  for  Apple  (top),  Coca-­‐Cola  (middle)  and  Google  (bottom).  

   

 Graph  7  Log  returns  for  GBP/USD  (top),  SEK/USD  (middle)  and  GBP/SEK  (bottom).  

   Graph  7  shows  the  differentiated  series  for  the  exchange  rates.  Notice  also  here  that  the  volatility  appears  in  clusters  and  that  there  are  periods  with  high  volatility  and  periods  with  low  volatility.  If  we  look  at  the  sample  ACF  function  for  the  exchange  rates,  Graph  8,  we  notice  that  there  seems  to  be  no  correlation  between  different  lags  for  all  three  exchange  rates  passed  lag  1.  If  we  look  back  in  Graph  4  we  notice  that  there  is  no  significance  in  lag  1  for  the  stock  data,  but  there  is  for  all  three  exchange  rates.  This  means  that  the  degree  of  dependence  is  higher  for  the  exchange  rates  than  for  the  stocks.    

Page 20: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 Although,  as  in  the  case  for  the  three  stocks  we  also  check  the  squared  residuals  to  see  if  there  exists  some  correlation  in  the  magnitude  of  change  from  one  lag  to  another.  And  if  we  examine  Graph  (1.9)  we  notice  that  there  might  still  be  some  correlation  of  the  change  in  magnitude.          

 Graph  8  ACF  functions  for  GBP/USD  (top),  SEK/USD  (middle)  and  GBP/SEK  (bottom).  

Page 21: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 Graph  9  The  ACF  function  of  squared  residuals  for  GBP/USD  (top),  SEK/USD  (middle)  and  SEK/USD  (bottom).  

In  Graph  10  below,  the  PACF  for  the  exchange  rates  shows  that  for  all  tree  exchange  rates  the  squared  sample  PACF  cuts  off  at  lag  one.  If  we  compare  the  ACF  and  PACF  on  the  squared  residuals  for  the  stock  and  the  exchange  rates  it  can  be  seen  that  the  correlation  is  greater  for  the  tree  stocks  than  for  the  exchange  rates.  And  that  the  correlation  for  the  tree  exchange  rates  seems  weak  according  to  the  sample  ACF  and  PACF.      

Page 22: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 Graph  10  The  PACF  function  of  squared  residuals  for  GBP/SEK  (top),  SEK/USD  (middle)  and  GBP/SEK  (bottom).  

 The  LM  test  on  the  residuals  was  done  for  the  exchange  rates,  as  in  the  case  for  the  stocks,  and  it  was  found  that  for  GBP/SEK  the  null  hypothesis  is  rejected  for  all  lags  except  at  lag  27  and  30.    For  the  exchange  rate  SEK/USD  there  is  an  interval  between  3  and  13  where  the  p-­‐value  for  the  LM  test  exceeds  0.05  and  we  do  not  reject  the  null  hypothesis  for  these  lags,  although  the  remaining  lags  have  a  p-­‐value  less  than  0.05.  For  GBP/USD  the  p-­‐value  for  lags  7,  9-­‐13  and  17-­‐19  exceeds  0.05  and  we  do  not  include  them  in  our  modeling.  The  remaining  lags  for  GBP/USD  are  less  than  0.05  and  therefore  included.  These  results  can  be  found  in  Appendix  1-­‐6.      Stock/ER   MEAN   MAXIMUM   MINIMUM   Std.  Dev.   Skewness   Kurtosis  Apple   0.001093   0.132172   -­‐0.197280   0.021843   -­‐0.467878   6.758486  Coca-­‐Cola   0.000379   0.1822549   -­‐0.123424   0.019373   0.437862   10.65368  Google   0.000395   0.1823549   -­‐0.122429   0.019382   0.436909   10.62484  GBP/USD   -­‐0.021365   0.82305   -­‐0.99099   0.252954   -­‐0.454664   2.212875  SEK/USD   -­‐0.067910   0.97372   -­‐1.25158   0.332382   -­‐0.418516   1.145960    GBP/SEK   0.046572   1.30594   -­‐1.00965   0.312067   0.421306   1.286480  Table  1  Statistics  about  the  log  return  series.  

 Table  1  shows  some  statistical  information  about  the  logarithmic  return  series.  The  kurtosis  for  normal  distribution  is  3  (Shumway  and  Stoffer  2006:282)  and  as  we  can  see  

Page 23: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

in  Table  1,  the  kurtosis  for  the  three  stocks  exceeds  3.  The  kurtosis  for  all  the  exchange  rates  is  below  3.  So  none  of  the  time  series  seems  to  be  normally  distributed.    

4  Building  an  ARCH  (p)  model      In  order  to  build  an  ARCH  (p)  model  it  is  important  to  determine  the  correct  number  of  lags.  There  are  many  ways  of  determining  the  order  and  below  you  will  find  three  different  information  criteria  that  will  be  used  in  order  to  determine  the  best  order  for  the  ARCH  (p)  models.        

4.1  Determining  the  order  for  an  ARCH  (p)  model      

The  methods  used  to  compare  the  considered  models  are  Akaike´s,  Bayesian  and  Hannan-­‐Quinn  information  criteria.  Note  that  these  criteria  only  compare  considered  models  and  selects  the  model  that  best  fit  the  given  data.  Also,  because  this  selection  is  based  on  information  criteria  no  p-­‐values  for  the  different  variables  are  necessary,  only  those  coefficients  which  equal  zero  we  will  consider  as  insignificant.          

4.1.1  Akaike´s  Information  Criteria  (AIC)    

 The  first  method  used  to  compare  the  considered  ARCH  models  to  determine  which  model  that  best  fits  the  given  data  is  Akaike´s  Information  Criteria  (AIC)  (Javed  and  Mantalos  2013).  The  idea  is  that  you  first  fit  an  ARCH  (p)  model  with  lag  p  to  the  data.  Maximizing  the  conditional  maximum  likelihood  function  with  respect  to  the  data,  which  also  determines  the  estimation  of  the  parameters.  The  maximum  likelihood  function  for  an  ARCH  model  is  given  by:      

𝐿 𝛼!,𝛼!. . 𝑎!, . . = 𝑓!!!!..(𝑎!|𝑎!!!)!!!!          (16)  

   where  the  density  function  f,  is  the  density  function  for  the  specified  distribution  of  the  model,  e.g.  normal  or  student-­‐t  distribution.    When  we  have  maximized  the  likelihood  function  we  will  use  it  for  the  minimization  of  the  AIC  function,  which  in  R  is  given  by:      

𝐴𝐼𝐶 = −2 ln 𝐿 /𝑁 + 2 𝑘 /𝑁          (17)    

Page 24: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

where  N  is  the  number  of  observations  in  our  data  after  differentiation,  k  is  the  number  of  parameters  in  the  ARCH  and  GARCH  models,  respectively  (Ghalanos  2013:26),  and  L  is  the  value  of  the  maximum  Likelihood.        

4.1.2  Bayesian  Information  Criteria  (BIC)      The  Bayesian  Information  Criteria  (BIC)  is  another  way  to  determine  the  number  of  lags  to  include  for  the  best  fit  of  ARCH/GARCH  models  given  a  number  of  models  (Javed  and  Mantalos  2013).    Many  studies  suggest  that  when  the  sample  size  is  large,  the  BIC  performs  better  in  selecting  the  correct  order  of  lags  in  your  model  (McQuarrie  and  Tsai,  1998).  The  BIC  function  for  an  ARCH  (p)  model  in  R  is  given  by:      

𝐵𝐼𝐶 = (−2) ln 𝐿 /𝑁 + 𝑘 ln 𝑁 /𝑁          (18)      Notice  that,  compared  to  AIC,  the  BIC  criterion  penalizes  more  complex  models,  i.e.  models  with  more  parameters,  relative  to  models  with  fewer  parameters.  Also  here,  the  BIC  function  selects  the  model  that  minimizes  the  value  of  the  function.        

4.1.3  Hannan-­‐Quinn  Information  Criteria  (HQIC)      Hannan  and  Quinn  (1979)  introduced  another  information  criterion  in  order  to  compare  models  for  model  selection  (Javed  and  Mantalos  2013).  The  HQIC  function  in  R  is  calculated  as:      

𝐻𝑄𝐼𝐶 = !! !" !!

+ (!!"# !" !!

)          (19)      and  also  here  N  is  the  number  of  observations,  ln(L)  is  the  logarithm  of  the  maximum  likelihood  function  and  k  is  the  number  of    parameters  in  the  model  (Ghalanos  2013:26).        The  results  from  the  information  criteria  applied  on  the  six  data  sets  can  be  seen  in  appendix  1-­‐6  along  with  the  Lagrange  multiplier  test  results.  Appendix  1  shows  that  for  the  Apple  stock  the  criteria  select  ARCH  (16),  ARCH  (8)  and  ARCH  (11)  for  the  AIC,  BIC  and  HQIC  respectively.  For  the  Coca-­‐Cola  stock  in  Appendix  2  all  three  information  criteria  select  ARCH  (19).  Although  AIC  gives  the  same  value  for  ARCH  (19)  and  ARCH  (23)  we  will  choose  ARCH  (19)  because  it  is  preferable  to  have  less  parameters  in  our  models.  In  appendix  3  we  also  see  that  the  three  information  criteria  selects  the  same  number  of  lags,  namely  ARCH  (19).    

Page 25: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

For  the  exchange  rate  GBP/USD  there  is  a  big  difference  of  the  preferable  model.  Both  the  AIC  and  the  HQIC  function  select  ARCH  (28),  and  the  BIC  function  selects  ARCH  (1).  This  may  be  because  as  mentioned  in  section  3.2.2  the  BIC  function  penalizes  models  with  more  parameters.  For  the  SEK/USD  exchange  rate  in  Appendix  5  both  the  HQIC  and  the  BIC  function  select  ARCH  (1)  and  AIC  selects  ARCH  (15).  And  in  Appendix  6  all  tree  information  criteria  select  ARCH  (1)  for  the  GBP/USD  exchange  rate.        

4.2  Mean  Square  Error  (MSE)      When  we  have  selected  number  of  lags  for  the  best-­‐fitted  model  of  each  of  the  three  criteria  we  use  the  MSE  function  to  determine  which  model  to  choose.  This  result  is  then  compared  with  the  MSE  result  for  all  models,  and  the  model  with  the  lowest  MSE  value  will  be  the  best  forecasting  model  for  the  given  data.  To  evaluate  the  MSE  function  we  need  to  forecast  the  future  conditional  variances  using  the  selected  models.  These  forecasts  will  then  be  compared  with  the  future  values  of  the  squared  log  return  for  the  stocks  and  exchange  rates.  The  models  with  the  least  MSE  values  will  then  be  the  selected  models.  The  MSE  function  can  be  described  as:      

𝑀𝑆𝐸 = !!""

(𝑎!! − 𝜎!!)!!""!!!          (20)  

 where  𝜎!  represents  the  estimated  conditional  variance  and  𝑎!  is  the  squared  log  returns  (Hansen  and  Lunde  2005).  Notice  that  this  function  forecasts  the  next  100  daily  observations.  This  is  why  these  observations  were  excluded  when  determined  the  best  fit  of  the  models  so  they  could  be  used  as  a  measurement  for  the  best  forecast.  Also  remember  that  this  MSE  function  is  the  function  used  to  compare  and  evaluate  the  different  heteroscedasticity  models.        

4.3  Why  use  GARCH  (1,1)?      Hansen  and  Lunde  published  a  study  in  2005  where  they  compared  different  GARCH  models  to  see  if  anything  beats  the  GARCH  (1,1)  model.  Their  aim  was  to  determine  if  the  improvement  of  the  GARCH  models  after  Bollerslev’s  introduction  of  the  first  GARCH  model  in  1986  has  led  to  better  forecast  ability.  They  found  that  the  forecast  ability  of  ARCH  (1)  model  is  outperformed  by  other  models.  This  is  because  the  ARCH  (1)  model  does  not  capture  the  persistence  in  volatility  as  the  other  models.  When  they  compared  different  GARCH  models  to  the  GARCH  (1,1)  model  they  found  no  evidence  to  reject  the  standard  GARCH  (1,1)  model  in  favor  of  other  GARCH  models.  They  found  this  somewhat  surprising  because  the  GARCH  (1,1)  model  do  not  capture  the  leverage  effect  like  the  more  sophisticated  models  like  EGARCH  and  TGARCH.    To  be  able  to  compare  the  results  of  different  GARCH  models,  I  chose  to  evaluate  all  models  using  order  (1,1).    

Page 26: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 

4.4  Why  use  Student-­‐t  distribution?   Bollerslev  suggested  that  the  GARCH  model  𝑎! = 𝜎!𝜀!  with  assumed  conditionally  normal  distribution  might  not  sufficiently  cover  the  leptokurtosis  in  financial  time  series.  He  suggested  that  sometimes  the  model  𝑎! = 𝜎!𝜀!  has  thicker  tails  and  is  better  described  by  a  student-­‐t  distribution.  He  therefore  introduced  the  GARCH-­‐t  model  which  assumes  a  student-­‐t  distribution  instead  of  the  normal  distribution,  (Bollerslev  1987).              

                             

Page 27: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 

     

 5  Method      The  steps  used  on  the  following  models  ARCH,  GARCH,  GARCH  with  student-­‐t  innovations,  IGARCH,  EGARCH  and  TGARCH  to  find  the  best  forecast  accuracy  for  the  conditional  variance  are  explained  below.  The  models  were  estimated  for  the  three  stocks  Apple,  Coca-­‐Cola  and  Google  and  the  three  exchange  rates  USD/SEK,  GBP/USD  and  GBP/SEK.  Remember  that  the  last  100  observations  where  excluded  in  order  to  evaluate  the  forecasting  accuracy  of  the  models.  All  calculations  have  been  done  using  the  rugarch  package  in  R.    

1) First  differentiate  the  time  series  using  the  logarithmic  returns  to  turn  the  series  into  a  stationary  time  series.      

2) The  ACF/PACF  function  and  the  Lagrange  multiplier  test  were  applied  to  the  residuals  to  examine  if  there  were  any  ARCH  effect.    

3)  Then  the  maximum  likelihood  function  was  estimated  for  different  lags  of  the  ARCH  (p)  models,  and  the  logarithmic  value  of  the  result  was  calculated.      

4) With  different  log  likelihood  values  the  AIC,  HQIC  and  the  BIC  function  where  evaluated  to  find  the  value  that  minimizes  the  functions.  The  selected  value  then  represented  the  number  of  lags  to  choose  for  the  ARCH  (p)  model.      

5) Then  the  coefficients  for  all  models  where  estimated  by  maximizing  the  likelihood  function  for  the  chosen  number  of  lags.      

6) Then  I  estimated  the  conditional  variance.      

7) Then  I  calculated  the  log  returns  for  the  remaining  100  observations  for  each  data  set.    

   

8) And  last,  I  evaluated  the  forecasting  accuracy  using  the  MSE  function.  The  MSE  function,  as  described  in  section  3.3,  is:  

   

𝑀𝑆𝐸 = !!""

(𝑎!! − 𝜎!!)!!""!!!          (21)  

 

Page 28: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 Here  t  represents  the  last  100  observations,  𝜎!  represent  the  estimated  conditional  variances  and  𝑎!  is  the  squared  log  returns  for  the  last  100  observations  of  the  data  sets  (Hansen  and  Lunde  2005).  

6  Results  and  Analysis      In  section  2.1  we  presented  the  ARCH  (p)  models  that  where  chosen  by  the  tree  information  criteria.  The  MSE  results  of  these  models  are  compared  in  Table  2  below.        

Stock   AIC   BIC   HQIC  Apple   ARCH  (16)  

(2.04048e-­‐07)  ARCH  (8)  (2.120849e-­‐07)  

ARCH  (11)  (2.022712e-­‐07)  

Coca-­‐Cola   ARCH  (19)  (1.805097e-­‐08)  

ARCH  (19)  (1.805097e-­‐08)  

ARCH  (19)  (1.805097e-­‐08)  

Google   ARCH  (19)  (1.456835e-­‐07)  

ARCH  (19)  (1.456835e-­‐07)  

ARCH  (19)  (1.456835e-­‐07)  

GBP/USD   ARCH  (28)  (0.07269577)  

ARCH  (1)  (0.08574544)  

ARCH  (28)  (0.07269577)  

SEK/USD   ARCH  (15)  (0.2564599)  

ARCH  (1)  (0.2606198)  

ARCH  (1)  (0.2606198)  

GBP/SEK   ARCH  (1)  (0.1762153)  

ARCH  (1)  (0.1762153)  

ARCH  (1)  (0.1762153)  

Table  2  

 The  MSE  results  presented  in  Table  2  tell  us  which  one  of  these  models  to  use.  As  mentioned  earlier  the  MSE  result  is  a  measure  of  the  performance  accuracy,  and  here  the  forecast  contains  100  observations.    For  the  Apple  stock  all  information  criteria  chose  different  lags  for  ARCH.  And,  according  to  the  MSE  result,  the  most  accurate  model  in  this  measurement  is  the  ARCH  (11)  model  chosen  by  the  Hannan-­‐Quinn  criteria.    For  the  Coca-­‐Cola  stock  all  three  criteria  choose  the  same  model,  namely  ARCH  (19).  This  is  also  the  case  for  the  Google  stock  where  all  three  criteria  chose  the  same  model,  namely  ARCH  (19).    For  the  exchange  rates,  AIC  and  HQIC  chose  the  best  model,  ARCH  (28),  for  the  GBP/USD  exchange  rate  but  as  we  can  see  the  constant  equals  zero,  which  contravenes  the  criteria  for  ARCH  (p)  models.  Therefore  ARCH  (1)  is  chosen  instead.    For  the  SEK/USD  exchange  rate  AIC  chose  the  most  accurate  model,  which  is  ARCH  (15).  And  last,  for  the  GBP/SEK  exchange  rate  all  three  criteria  chose  the  same  model  to  be  ARCH  (1).      In  Appendix  7  the  chosen  ARCH  models  and  coefficients  are  presented  for  all  six  data  sets  and  it  can  be  seen  that  ARCH  (28)  has  a  zero  constant.    

Page 29: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

Notice  that  the  coefficients  resulting  in  zero  coefficients  are  because  of  their  given  p-­‐values.  The  p-­‐values  for  each  coefficient  represent  the  likelihood  that  the  given  coefficient  is  equal  to  0.  So,  for  the  zero  coefficients,  this  means  that  the  p-­‐values  equal  1.  Resulting  in  100  per  cent  chance  to  equal  0.  And  as  was  mentioned  earlier  in  section  3.2,  because  information  criteria  are  used  to  decide  which  model  that  best  describes  the  given  data  we  will  oversee  the  remaining  p-­‐values  which  do  not  gives  us  zero  coefficients  and  count  them  as  significant.        In  Table  3  below  the  models  from  the  GARCH  family  is  presented  with  their  corresponding  coefficients  and  MSE  values.  The  first  tree  models  for  each  stock  and  exchange  rate  presents  the  values  from  the  GARCH,  GARCH-­‐t  and  IGARCH  model,  i.e.  assuming  no  leverage  effect.  And  the  remaining  two  are  the  EGARCH  and  TGARCH  models  that  assumes  asymmetric  volatility,  i.e.  captures  the  leverage  effect.            

Constant   ARCH  (𝛼!)  

GARCH  (𝛽!)  

GAMMA  (𝛾!)  

Shape   MSE  

GARCH  (Apple)  

0.000011  (0.000)  

0.076626  (0.000)  

0.899028  (0.000)  

    1.866175e-­‐07  

GARCH-­‐t  (Apple)  

0.000005  (0.220)  

0.057392  (0.000)  

0.932311  (0.000)  

  5.454   1.786797e-­‐07  

IGARCH  (APPLE)  

0.000005  (0.764)  

0.090506  (0.317)  

0.909494  (0.000)  

    3.814921e-­‐07  

EGARCH  (Apple)  

-­‐0.31817  (0.000)  

-­‐0.09496  (0.000)  

0.957930  (0.000)  

0.177636  (0.000)  

  2.283712e-­‐07  

TGARCH  (Apple)  

0.000018  (0.000)  

0.027382  (0.016)  

0.863471  (0.000)  

0.149288  (0.000)  

  2.304021e-­‐07  

GARCH  (Coca-­‐Cola)  

0.000006  (0.000)  

0.034501  (0.000)  

0.947920  (0.000)  

    1.793278e-­‐08  

GARCH-­‐t  (Coca-­‐Cola)  

0.000003  (0.666)  

0.031386  (0.054)  

0.959933  (0.000)  

  3.966   1.978401e-­‐08  

IGARCH  (Coca-­‐Cola)  

0.000002  (0.283)  

0.119603  (0.000)  

0.880397  (0.000)  

    4.482323e-­‐08  

EGARCH  (Coca-­‐Cola)  

-­‐0.11243  (0.000)  

-­‐0.04598  (0.000)  

0.985098  (0.000)  

0.072033  (0.000)  

  1.933541e-­‐08  

TGARCH  (Coca-­‐Cola)  

0.000005  (0.000)  

0.023722  (0.000)  

0.879101  (0.000)  

0.129965  (0.000)  

  1.849458e-­‐08  

GARCH  (Google)  

0.000006  (0.000)  

0.034562  (0.000)  

0.947720  (0.000)  

    9.584096e-­‐08  

GARCH-­‐t  (Google)  

0.000003  (0.487)  

0.031464  (0.000)  

0.959603  (0.000)  

  3.989   8.469671e-­‐08  

IGARCH  (Google)  

0.000006  (0.000)  

0.080210  (0.000)  

0.919790  (0.000)  

    2.433799e-­‐07  

EGARCH  (Google)  

-­‐0.11179  (0.000)  

-­‐0.04641  (0.000)  

0.985187  (0.000)  

0.071036  (0.000)  

  1.292212e-­‐07  

TGARCH  (Google)  

0.000004  (0.000)  

0.000000  (1.000)  

0.966376  (0.000)  

0.044666  (0.000)  

  9.524865e-­‐08  

GARCH   0.001145   0.051536   0.933443       0.0794951

Page 30: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

(GBP/USD)   (0.188)   (0.012)   (0.000)   2  GARCH-­‐t  (GBP/USD)  

0.000900  (0.676)  

0.054131  (0.218)  

0.944869  (0.000)  

  3.081   0.07822006  

IGARCH  (GBP/USD)  

0.000513  (0.133)  

0.053896  (0.017)  

0.946104  (0.000)  

    0.07662651  

EGARCH  (GBP/USD)  

-­‐0.04735  (0.000)  

-­‐0.05076  (0.000)  

0.987190  (0.000)  

-­‐0.09245  (0.000)  

  0.09453938  

TGARCH  (GBP/USD)  

0.000560  (0.069)  

0.000000  (1.000)  

0.957280  (0.000)  

0.061374  (0.000)  

  0.0815352  

GARCH  (SEK/USD)  

0.003760  (0.171)  

0.038996  (0.033)  

0.929172  (0.000)  

    0.2576359  

GARCH-­‐t  (SEK/USD)  

0.004313  (0.379)  

0.044591  (0.127)  

0.923270  (0.000)  

  4.756   0.2505652  

IGARCH  (SEK/USD)  

0.000328  (0.289)  

0.026133  (0.132)  

0.973867  (0.000)  

    0.2391529  

EGARCH  (SEK/USD)  

-­‐0.05933  (0.362)  

0.049055  (0.218)  

0.963512  (0.000)  

0.144471  (0.012)  

  0.2379482  

TGARCH  (SEK/USD)  

0.007937  (0.0649)  

0.264915  (0.0239)  

0.846886  (0.000)  

-­‐0.23972  (0.049)  

  0.2600683  

GARCH  (GBP/SEK)  

0.077638  (0.000)  

0.236057  (0.015)  

0.000000  (1.000)  

    0.1762153  

GARCH-­‐t  (GBP/SEK)  

0.002108  (0.723)  

0.013146  (0.301)  

0.966904  (0.000)  

  5.535   0.1699616  

IGARCH  (GBP/SEK)  

0.000101  (0.441)  

0.005212  (0.679)  

0.994788  (0.000)  

    0.1714533  

EGARCH  (GBP/SEK)  

-­‐0.07977  (0.000)  

0.026624  (0.182)  

0.966739  (0.000)  

0.020526  (0.000)  

  0.1782087  

TGARCH  (GBP/SEK)  

0.000290  (0.610)  

0.002922  (0.673)  

0.993054  (0.000)  

0.006048  (0.724)  

  0.1717041  

Table  3  

   For  the  Apple  stock  in  Table  3  both  the  GARCH-­‐t  and  IGARCH  models  contain  some  insignificant  coefficients  which  means  that  they  contribute  for  forecasting  in  an  negligible  way.  The  model  with  best  forecast  accuracy  in  this  case  is  the  GARCH-­‐t  (1,1)  model.      If  we  look  at  the  Coca-­‐Cola  stock  in  Table  3  we  notice  that  also  here  the  IGARCH  and  GARCH  with  student  t  distribution  contains  insignificant  coefficients.  The  model  with  the  best  MSE  value  for  the  Coca-­‐Cola  stock  is  the  standard  GARCH  (1,1)  model.        The  TGARCH  and  the  GARCH-­‐t  model  for  the  Google  stock  contain  some  insignificant  coefficients.  Notice  here  that  the  GARCH  parameter  in  the  Threshold  GARCH  has  a    p-­‐value  of  1,  resulting  in  a  coefficient  value  of  0.  The  model  with  best  MSE  value  for  the  Google  stock  is  the  GARCH-­‐t  (1,1)  model.    

Page 31: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 If  we  look  at  the  GBP/USD  exchange  rate  in  Table  3  we  notice  that  all  models  contains  some  insignificant  coefficients  except  the  EGARCH  model.  The  model  with  the  best  forecast  accuracy  is  the  IGARCH  (1,1)  model.        For  the  SEK/USD  exchange  rate  in  Table  3,  all  models  contain  some  insignificant  coefficients.  For  this  exchange  rate  the  EGARCH  (1,1)  model  provides  the  best  forecast  accuracy.        The  last  exchange  rate  in  Table  3  is  the  GBP/SEK  exchange  rate  and  also  here  all  models  contain  some  negligible  coefficients.  The  model  with  the  best  forecast  accuracy  is  the  GARCH  (1,1)  model  with  student  t  distribution.        If  we  compare  the  model  with  the  best  forecast  accuracy  from  the  ARCH  (p)  models  and  the  different  models  from  the  GARCH  (1,1)  family.  It  is  found  that  the  models  from  the  GARCH  (1,1)  family  provide  better  forecast  accuracy  for  all  tree  stock  and  all  tree  exchange  rates.  Notice  that  this  is  true  even  though  the  ARCH  (p)  models  contain  a  lot  more  parameters  than  the  GARCH  (1,1)  models.    

7  Discussion  and  conclusion      The  purpose  of  this  paper  was  to  compare  the  forecast  accuracy  of  six  different  heteroscedasticity  models.  The  ARCH  (p)  model  was  built  with  the  use  of  tree  different  information  criteria  that  determined  the  number  of  lags  that  best  described  the  data.  For  some  of  the  data  these  criteria  showed  different  results  and  therefore  the  model  with  the  lowest  MSE  value  was  chosen.  All  five  models  from  the  GARCH  family  were  pre  determined  to  be  order  (1,1)  to  give  a  fair  result  and  because  its  been  showed  to  be  enough.  The  MSE  results  show  that  for  different  stocks  or  exchange  rates,  different  models  have  the  best  forecast  accuracy.  There  was  no  model  that  overall  outperformed  the  others.  Also,  as  can  be  seen  in  Appendix  7  and  Table  3,  the  difference  in  the  models  forecast  accuracy  didn’t  differ  much.          The  Apple  stock  shows  a  very  large  dependence  on  previous  lags  when  the  ACF  function  of  the  squared  logarithmic  values  is  examined.  The  LM  test  also  shows  strong  evidence  of  ARCH  effect  for  all  lags.  The  partial  ACF  also  shows  strong  ARCH  effect  and  cuts  off  after  10  lags.  The  best  forecaster  evaluated  with  the  MSE  was  the  GARCH  model  with  student  t  distribution.        The  Coca-­‐Cola  stock  also  shows  very  strong  evidence  of  ARCH  effect  and  the  ACF  of  the  squared  residuals  shows  strong  correlation  between  one  lag  to  another.  The  partial  ACF  cuts  off  after  3  lags.  The  standard  GARCH  (1,1)  model  shows  the  best  performance.      

Page 32: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 The  Google  stock  shows  less  ARCH  effect  than  the  first  two  stocks  in  the  first  ten  lags,  even  though  there  is  still  a  strong  ARCH  effect.  The  ACF  also  shows  less  correlation  in  the  first  ten  lags  than  the  other  two  stocks,  though  the  partial  ACF  cuts  off  at  lag  12.  The  model  with  the  lowest  MSE  value  is  the  GARCH  with  student  t  distribution.        The  ARCH  LM  test  for  the  GBP/USD  exchange  rate  shows  significant  ARCH  effect  for  all  lags  except  at  lag  8,  10-­‐12  and  18.  The  ACF  and  the  PACF  show  significant  result  at  lag  1  but  then  cut  off.  The  best  forecast  performance  was  shown  by  the  IGARCH  model.          The  LM  test  for  the  SEK/USD  exchange  rate  shows  insignificant  results  at  lags  3-­‐13,  and  the  remaining  stay  significant.  The  ACF  and  the  PACF  cut  off  at  lag  1  and  the  EGARCH  models  did  the  best  performance.        And  last,  the  GBP/SEK  exchange  rate  shows  significant  ARCH  effect  for  all  lags  except  lag  27  and  30.  The  model  with  the  best  forecast  accuracy  was  the  GARCH  model  with  student  t  distribution.      The  result  of  this  study  in  Appendix  7  and  Table  3  indicates  there  is  a  difference  in  forecasting  performance  between  the  different  models.  There  is  no  evidence  that  one  model  outperforms  the  others.  For  the  stock  data  the  ordinary  GARCH  model  with  Gaussian  and  student  t  distribution  performed  better  in  forecasting  the  conditional  volatility.  So,  here  was  no  evidence  that  models  that  captures  the  leverage  effect,  i.e.  EGARCH  and  TGARCH,  performs  better.  This  contradicts  the  results  of  Hansen  and  Lunde  (2005)  when  they  compared  different  GARCH  models  on  IBM  data.  Their  study  showed  that  models  that  capture  leverage  effect  performed  better  than  the  GARCH  (1,1)  model.  However,  in  their  comparison  Hansen  and  Lunde  used  seven  different  criteria  where  one  of  them  was  the  Mean  squared  Error  which  was  also  used  in  this  paper.  They  also  compared  their  models  using  intra-­‐day  estimate  measures  of  realizes  volatility.        The  forecasting  performance  between  the  stock  data  and  the  exchange  rates  differ  in  their  MSE  result.  The  forecasting  performance  for  the  stock  data  was  better.  This  could  obviously  be  an  effect  of  the  given  observations  used  when  fitting  the  considered  models  to  the  data.  For  example  Ng  and  Lam  (2006)  wrote  a  paper  examining  how  the  sample  size  affects  the  GARCH  models  and  one  of  their  conclusions  was  that  at  least  1000  observations  was  recommended  for  the  model  estimation  of  the  conventional  GARCH  model.  They  also  concluded  that  the  sample  size  requirement  for  the  MEM-­‐GARCH  model  is  700,  which  is  less  than  that  of  the  conditional  GARCH  model.  It  should  also  be  mentioned  that  the  ACF  and  the  PACF  of  the  squared  residuals  showed  less  correlation  between  one  lag  to  another  for  the  exchange  rates.  The  PACF  cuts  off  at  lag  one  for  all  exchange  rates  which  also  is  the  case  for  ACF,  indicating  less  correlation  in  magnitude  between  one  lag  to  another.  Also,  as  mentioned  in  section  3,  the  ACF  function  for  the  differentiated  data  sets  showed  significant  values  at  lag  1  for  all  exchange  rates.  This  was  not  the  case  for  the  stock  data.  So,  there  might  still  be  some  correlation  left  in  the  differentiated  data,  which  might  have  affected  the  forecast  performance.    

Page 33: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

   Zhang  and  Yu  (2009)  concluded  in  their  study  that  the  assumption  of  the  student  t  distribution  was  superior  to  the  assumption  of  the  Gaussian  normal  distribution.  By  examining  Table  3  it  can  be  seen  that  the  GARCH  (1,1)  model  with  student  t  distribution  outperformed  the  GARCH  (1,1)  model  with  normal  distribution  for  all  data  sets  except  for  one,  the  Coca-­‐Cola  stock.        One  other  observation  of  this  study  shows  that  the  long  ARCH  (p)  models  for  the  tree  stocks  with  lags  11,19  and  19  were  outperformed  by  the  smaller  estimated  GARCH  (1,1)  models.  Even  though  the  ARCH  models  have  more  parameters  does  not  indicate  more  accuracy  in  forecasting  the  future  values  of  the  conditional  variance.  For  the  exchange  rates  the  result  was  reversed,  the  GBP/USD  and  SEK/USD  favored  the  bigger  ARCH  models  while  the  beta  coefficient  in  the  GARCH  model  for  the  GBP/SEK  was  0  resulting  in  the  same  ARCH  (1)  model  as  in  Table  2.  Even  though,  the  ARCH  models  where  still  outperformed  by  other  models  from  the  GARCH  (1,1)  family,  indicating  that  the  GARCH    (1,1)  family  outperforms  the  standard  ARCH  model  on  every  dataset  and  therefore  are  in  favor.        The  results  in  this  paper  do  not  tell  us  whether  there  exists  a  heteroscedasticity  model  that  outperforms  all  other  models  when  forecasting  the  conditional  volatility.  On  the  other  hand  they  tell  us  that  there  is  a  difference  in  the  models  and  that  they  perform  differently  to  different  data  sets.  The  in-­‐sample  data  is  also  a  good  comparison  of  the  models  because  the  different  sample  sizes  might  affect  some  models  more  than  others.  To  be  more  accurate  in  the  comparison  one  might  use  more  data  sets  and  evaluate  all  models’  performance  on  different  in-­‐sample  sizes  and  the  out-­‐sample  size  should  also  differ,  determining  the  best  forecast  range  for  the  different  models.      

 

 

 

     

Page 34: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

8  References      Alberg,  D.  Shalit,  H.  Yosef,  R.  (2008).    Estimating  stock  market  volatility  using  asymmetric  GARCH  models.  Applied  Financial  Economics  18,  page  1201-­‐1208.      Bollerslev,  T.  (1987).  A  Conditional  Heteroskedastic  Time  Series  Model  for  Speculative  Prices  and  Rates  of  Return.  Review  of  Economics  and  Statistics.  69,  page  542-­‐547.        Bollerslev.  T.  Mikkelsen,  H.O.  (1996).  Modeling  and  pricing  long  memory  in  stock  market  volatility.  Journal  of  Econometrics  73,  page  151-­‐184.      Bollerslev,  T.  (1986).  Generalized  Autoregressive  Conditional  Heteroskedacity.  Journal  of  Econometrics.  31,  page  307-­‐327.      Brockwell,  P.J.  Davis,  R.A.  (2002).  Introduction  to  Time  Series  and  Forecasting.  2nd  edition.  New  York.  NY:  Springer  Science+Business  Media.      Brooks,  C.  (2008).  Introductory  Econometrics  for  Finance.  1st  edition.  Cambridge  University  Press.      Engle,  F.R.  (1982).  Autoregressive  Conditional  Heteroskedacity  with  Estimates  of  the  Variance  of  the  United  Kingdom  Inflation.  Econometrica.  50(4),  page  987-­‐1007.      Ferreira,  N.  B.  Menezes,  R.  Mendes,  D.  A.  (2007)  Physica  A:  Statistical  Mechanics  and  Its  Applications  382(1),  page  73-­‐80.      Ghalanos,  A.  (2013).  Title=((rugarch):  Univariate  GARCH  models.).  Note=(R  package  version  1.3-­‐1).    Google  Finance-­‐  A  list  of  all  Stock  Exchange,  Mutual  Funds,  Indexes  and  other  financial  data  available  in  Google  products.  https://www.google.com/finance.      Hansen,  R.  P.  and  Lunde,  A.  (2005).  A  forecast  comparison  of  volatility  models:  Does  anything  beat  a  GARCH  (1,1)?  Journal  of  Applied  Econometrics  20(7),  page  873-­‐889.      Hefner,  C.  (2013).  Nonlinear  Time  Series  Analysis  with  Applications  to  Foreign  Exchange  Rate  Volatility.  Contribution  to  Econometrics.  Physica,  1998,  page  103.  

Page 35: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

   Javed,  F.  Mantalos,  P.  (2013).  GARCH-­‐type  models  and  performance  of  information  criteria.  Communications  in  Statistics:  Simulation  and  Computation  42(8),  page  1917-­‐1933.    Laurent,  S.  Rombouts,  J.V.K.  Violante,  F.  (2011).  On  the  forecasting  accuracy  of  multivariate  GARCH  models.  Journal  of  Applied  Econometrics  27(6),  page  934-­‐955.      Marcucci,  J.  (2005).  Forecasting  Stock  Market  Volatility  with  Regime-­‐Switching  GARCH  models.  Department  of  Economics,  University  of  California.  San  Diego.      Miron,  D.  Tudor,  C.  (2010).  Asymmetric  Conditional  Volatility  Models:  Empirical  Estimation  and  Comparsion  of  Forecasting  Accuracy.  Romainian  Journal  of  Economic  Forecasting,  issue  3,  page  74-­‐90.        Nelson,  D.  B.  (1991).  Conditional  Heteroskedacity  in  Asset  Returns:  A  New  Approach.  Econometrica  59(2),  page  347-­‐370.      Ng.  H.S.  Lam.  K.P.  (2006).  How  Does  the  Sample  Size  Affect  GARCH  Model?  JCIS-­‐2006  Proceedings.    Rabemananjara,  R.  Zakoian,  J.M.  (1993).  Threshold  ARCH  models  and  asymmetriers  in  volatility.  Journal  of  Applied  Econometrics  8(1),  page  31-­‐49.      Ramasamy,  R.  Munisamy,  S.  (2012).    Predictive  Accuracy  of  GARCH,  GJR  and  EGARCH  Models  Select  Exchange  Rates  Application.  Global  journal  of  Management  and  Business  Research  12(15)1.      Reider,  R.  (2009).  Volatility  forecasting  I:  GARCH  models.  New  York.    Shumway,  R.H.  Stoffer,  D.  S.  (2006).  Time  Series  and  Its  Applications:  With  R  Examples.  3rd  edition.  New  York.  NY.  Springer-­‐Verlag  New  York.      Tsay,  R.  S.  (2005).  Analysis  of  Financial  Time  Series.  2nd  ed.  New  Jersey.    John  Wiley  &  Sons.      Zhang,  X.  Yu,  M.  (2009).  A  Research  in  Performances  of  Non-­‐normal  ARCH  Type  Models  and  VaR  Measure.  International  Joint  Conference  on  Computational  Science  and  Optimization,  CSO  2009,  page  582-­‐586.  

Page 36: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

9  Appendix    APPENDIX  1.  APPLE  STOCK    Results  on  information  criteria  and  Lagrange  multiplier  test.  

LAG   AIC   BIC   HQIC   ARCH  LM  TEST  1   -­‐4.9006   -­‐4.8951   -­‐4.8986   7.772e-­‐16  2   -­‐4.9278   -­‐4.9194   -­‐4.9247   2.2e-­‐16  3   -­‐4.9558   -­‐4.9448   -­‐4.9518   2.2e-­‐16  4   -­‐4.9701   -­‐4.9563   -­‐4.9650   2.2e-­‐16  5   -­‐4.9939   -­‐4.9773   4.9878   2.2e-­‐16  6   -­‐4.9971   -­‐4.9777   -­‐4.9899   2.2e-­‐16  7   -­‐5.0164   -­‐4.9942   -­‐5.0082   2.2e-­‐16  8   -­‐5.0240   -­‐4.9991   -­‐5.0149   2.2e-­‐16  9   -­‐5.0231   -­‐4.9954   -­‐5.0130   2.2e-­‐16  10   -­‐5.0265   -­‐4.9960   -­‐5.0153   2.2e-­‐16  11   -­‐5.0313   -­‐4.9980   -­‐5.0190   2.2e-­‐16  12   -­‐5.0308   -­‐4.9948   -­‐5.0176   2.2e-­‐16  13   -­‐5.0313   -­‐4.9925   -­‐5.0171   2.2e-­‐16  14   -­‐5.0304   -­‐4.9889   -­‐5.0152   2.2e-­‐16  15   -­‐5.0298   -­‐4.9855   -­‐5.0136   2.2e-­‐16  16   -­‐5.0345   -­‐4.9874   -­‐5.0172   2.2e-­‐16  17   -­‐5.0338   -­‐4.9839   -­‐5.0155   2.2e-­‐16  18   -­‐5.0341   -­‐4.9815   -­‐5.0148   2.2e-­‐16  19   -­‐5.0329   -­‐4.9774   -­‐5.0125   2.2e-­‐16  20   -­‐5.0321   -­‐4.9739   -­‐5.0108   2.2e-­‐16  21   -­‐5.0313   -­‐4.9703   -­‐5.0089   2.2e-­‐16  22   -­‐5.0303   -­‐4.9665   -­‐5.0069   2.2e-­‐16  23   -­‐5.0302   -­‐4.9637   -­‐5.0058   2.2e-­‐16  24   -­‐5.0295   -­‐4.9602   -­‐5.0040   2.2e-­‐16  25   -­‐5.0282   -­‐4.9561   -­‐5.0018   2.2e-­‐16  26   -­‐5.0274   -­‐4.9525   -­‐4.9999   2.2e-­‐16  27   -­‐5.0272   -­‐4.9496   -­‐4.9987   2.2e-­‐16  28   -­‐5.0265   -­‐4.9461   -­‐4.9970   2.2e-­‐16  29   -­‐5.0256   -­‐4.9424   -­‐4.9951   2.2e-­‐16  30   -­‐5.0243   -­‐4.9384   -­‐4.9928   2.2e-­‐16  

                     

Page 37: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 APPENDIX  2.  Coca-­‐Cola  Stock  Results  on  information  criteria  and  Lagrange  multiplier  test.  

LAG   AIC   BIC   HQIC   ARCH  LM  TEST  1   -­‐5.0900   -­‐5.0844   -­‐5.0879   2.2e-­‐16  2   -­‐5.1227   -­‐5.1144   -­‐5.1196   2.2e-­‐16  3   -­‐5.1403   -­‐5.1292   -­‐5.1362   2.2e-­‐16  4   -­‐5.1589   -­‐5.1450   -­‐5.1538   2.2e-­‐16  5   -­‐5.1999   -­‐5.1833   -­‐5.1938   2.2e-­‐16  6   -­‐5.2029   -­‐5.1835   -­‐5.1958   2.2e-­‐16  7   -­‐5.2061   -­‐5.1839   -­‐5.1979   2.2e-­‐16  8   -­‐5.2488   -­‐5.2238   -­‐5.2396   2.2e-­‐16  9   -­‐5.2488   -­‐5.2210   -­‐5.2386   2.2e-­‐16  10   -­‐5.2546   -­‐5.2241   -­‐5.2434   2.2e-­‐16  11   -­‐5.2593   -­‐5.2261   -­‐5.2471   2.2e-­‐16  12   -­‐5.2619   -­‐5.2258   -­‐5.2487   2.2e-­‐16  13   -­‐5.2643   -­‐5.2255   -­‐5.2501   2.2e-­‐16  14   -­‐5.2641   -­‐5.2225   -­‐5.2488   2.2e-­‐16  15   -­‐5.2630   -­‐5.2187   -­‐5.2468   2.2e-­‐16  16   -­‐5.2625   -­‐5.2153   -­‐5.2452   2.2e-­‐16  17   -­‐5.2616   -­‐5.2117   -­‐5.2433   2.2e-­‐16  18   -­‐5.2606   -­‐5.2079   -­‐5.2412   2.2e-­‐16  19   -­‐5.2831   -­‐5.2276   -­‐5.2627   2.2e-­‐16  20   -­‐5.2818   -­‐5.2236   -­‐5.2605   2.2e-­‐16  21   -­‐5.2807   -­‐5.2197   -­‐5.2583   2.2e-­‐16  22   -­‐5.2826   -­‐5.2188   -­‐5.2592   2.2e-­‐16  23   -­‐5.2831   -­‐5.2165   -­‐5.2586   2.2e-­‐16  24   -­‐5.2821   -­‐5.2128   -­‐5.2567   2.2e-­‐16  25   -­‐5.2824   -­‐5.2103   -­‐5.2559   2.2e-­‐16  26   -­‐5.2813   -­‐5.2064   -­‐5.2538   2.2e-­‐16  27   -­‐5.2804   -­‐5.2027   -­‐5.2519   2.2e-­‐16  28   -­‐5.2793   -­‐5.1989   -­‐5.2498   2.2e-­‐16  29   -­‐5.2783   -­‐5.1951   -­‐5.2478   2.2e-­‐16  30   -­‐5.2786   -­‐5.1927   -­‐5.2471   2.2e-­‐16  

                         

Page 38: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 APPENDIX  3.  Google  Stock  Results  on  information  criteria  and  Lagrange  multiplier  test.  

LAG   AIC   BIC   HQIC   ARCH  LM  TEST  1   -­‐5.0889   -­‐5.0833   -­‐5.0868   0.001979  2   -­‐5.1216   -­‐5.1132   -­‐5.1185   0.0003426  3   -­‐5.1393   -­‐5.1282   -­‐5.1352   2e-­‐05  4   -­‐5.1579   -­‐5.1440   -­‐5.1528   2.119e-­‐06  5   -­‐5.1989   -­‐5.1823   -­‐5.1928   5.947e-­‐08  6   -­‐5.2019   -­‐5.1825   -­‐5.1948   7.156e-­‐10  7   -­‐5.2051   -­‐5.1830   -­‐5.1970   2.727e-­‐10  8   -­‐5.2476   -­‐5.2227   -­‐5.2385   3.074e-­‐11  9   -­‐5.2477   -­‐5.2199   -­‐5.2375   1.221e-­‐11  10   -­‐5.2537   -­‐5.2232   -­‐5.2425   1.532e-­‐14  11   -­‐5.2583   -­‐5.2250   -­‐5.2461   2.2e-­‐16  12   -­‐5.2611   -­‐5.2250   -­‐5.2478   2.2e-­‐16  13   -­‐5.2633   -­‐5.2245   -­‐5.2491   2.2e-­‐16  14   -­‐5.2628   -­‐5.2212   -­‐5.2476   2.2e-­‐16  15   -­‐5.2620   -­‐5.2177   -­‐5.2458   2.2e-­‐16  16   -­‐5.2615   -­‐5.2143   -­‐5.2442   2.2e-­‐16  17   -­‐5.2605   -­‐5.2106   -­‐5.2421   2.2e-­‐16  18   -­‐5.2596   -­‐5.2069   -­‐5.2402   2.2e-­‐16  19   -­‐5.2824   -­‐5.2270   -­‐5.2621   2.2e-­‐16  20   -­‐5.2811   -­‐5.2228   -­‐5.2597   2.2e-­‐16  21   -­‐5.2798   -­‐5.2188   -­‐5.2574   2.2e-­‐16  22   -­‐5.2815   -­‐5.2178   -­‐5.2581   2.2e-­‐16  23   -­‐5.2821   -­‐5.2156   -­‐5.2577   2.2e-­‐16  24   -­‐5.2811   -­‐5.2118   -­‐5.2556   2.2e-­‐16  25   -­‐5.2813   -­‐5.2092   -­‐5.2549   2.2e-­‐16  26   -­‐5.2803   -­‐5.2055   -­‐5.2529   2.2e-­‐16  27   -­‐5.2792   -­‐5.2016   -­‐5.2508   2.2e-­‐16  28   -­‐5.2783   -­‐5.1979   -­‐5.2488   2.2e-­‐16  29   -­‐5.2773   -­‐5.1941   -­‐5.2468   2.2e-­‐16  30   -­‐5.2776   -­‐5.1917   -­‐5.2461   2.2e-­‐16  

                         

Page 39: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 APPENDIX  4.  GBP/USD  EXCHANGE  RATE.  Results  on  information  criteria  and  Lagrange  multiplier  test.  

LAG   AIC   BIC   HQIC   ARCH  LM  TEST  1   0.035163   0.055942   0.043409   0.002718  2   0.040314   0.071482   0.052683   0.01005  3   0.036138   0.077695   0.052630   0.01965  4   0.042305   0.094252   0.062920   0.03189  5   0.043088   0.105424   0.067826   0.02601  6   0.017285   0.090010   0.046145   0.04299  7   0.013434   0.096548   0.046417   0.04894  8   -­‐0.0091437   0.0843598   0.0279626   0.06908  9   -­‐0.0051983   0.0986945   0.0360309   0.04818  10   0.00016574   0.11444780   0.04551792   0.07977  11   0.0056364   0.1303077   0.0551115   0.08752  12   0.0114636   0.1465243   0.0650617   0.102  13   0.014526   0.159976   0.072247   0.03689  14   -­‐0.032461   0.123378   0.029383   0.04304  15   -­‐0.028498   0.137731   0.037469   0.04554  16   -­‐0.024116   0.152501   0.045973   0.04737  17   -­‐0.018610   0.168397   0.055603   0.04779  18   -­‐0.015221   0.182175   0.063114   0.05764  19   -­‐0.031553   0.176233   0.050906   0.01354  20   -­‐0.0787120   0.1394628   0.0078694   0.01748  21   -­‐0.071300   0.157264   0.019404   0.02258  22   -­‐0.063746   0.175207   0.031081   0.02258  23   -­‐0.057438   0.191905   0.041512   0.03493  24   -­‐0.051002   0.208730   0.052071   0.02751  25   -­‐0.055038   0.215084   0.052158   0.03533  26   -­‐0.050205   0.230305   0.061114   0.0497  27   -­‐0.042538   0.248362   0.072904   0.04707  28   -­‐0.120887   0.180402   -­‐0.001322   0.03875  29   -­‐0.113321   0.198357   0.010366   0.04244  30   -­‐0.106903   0.215164   0.020908    

                         

Page 40: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

 APPENDIX  5.  SEK/USD  EXCHANGE  RATE.  Results  on  information  criteria  and  Lagrange  multiplier  test.  

LAG   AIC   BIC   HQIC   ARCH  LM  TEST  1   0.66553   0.68579   0.67356   0.01131  2   0.67046   0.70085   0.68251   0.0412  3   0.67169      0.71221   0.68775   0.05347  4   0.67698      0.72763   0.69706   0.07607  5      0.68233   0.74312   0.70642   0.1339  6   0.67548   0.74640   0.70359   0.08219  7   0.68065   0.76170   0.71277   0.1319  8   0.67149   0.76267   0.70763   0.1328  9   0.67543   0.77674   0.71558   0.174  10   0.67967   0.79111   0.72384   0.1913  11   0.68473   0.80630   0.73291   0.2577  12   0.68451   0.81621   0.73671   0.2044  13   0.66747   0.80930   0.72368   0.2022  14   0.65092   0.80288   0.71114   0.04113  15   0.64690   0.80900   0.71114   0.01068  16   0.65213   0.82436   0.72039   0.01424  17   0.65753   0.83989   0.72980   0.01147  18   0.65322   0.84571   0.72951   0.01664  19   0.66119   0.86381   0.74150   0.02479  20   0.64943   0.86218   0.73375   0.005399  21   0.65416   0.87704   0.74249   0.008027  22   0.65925   0.89226   0.75160   0.01091  23   0.66436   0.90750   0.76073   0.01057  24   0.66937   0.92263   0.76974   0.01499  25   0.67534   0.93874   0.77973   0.00866  26   0.67971   0.95324   0.78812   0.01128  27   0.68189   0.96556   0.79432   0.01553  28   0.67920   0.97299   0.79564   0.01173  29   0.68500   0.98892   0.80545   0.005149  30   0.68960   1.00365   0.81407   0.007456  

         APPENDIX  6.  GBP/SEK  EXCHANGE  RATE.  Results  on  information  criteria  and  Lagrange  multiplier  test.  

LAG   AIC   BIC   HQIC   ARCH  LM  TEST  1   0.49868   0.51946   0.50693   0.0004779  2   0.50457   0.53574   0.51694   0.001257  3   0.51045   0.55201   0.52694   0.002102  4   0.51609   0.56803   0.53670   0.001898  

Page 41: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

5   0.50796   0.57029   0.53269   0.002539  6   0.50258   0.57531   0.53144   0.003725  7   0.50375   0.58686   0.53673   0.002982  8   0.50762   0.60112   0.54473   0.006055  9   0.51323   0.61713   0.55446   0.003267  10   0.51925   0.63353   0.56460   0.001846  11   0.52442   0.64909   0.57389   0.003362  12   0.52994   0.66501   0.58354   0.004352  13   0.52535   0.67080   0.58307   0.003729  14   0.51617   0.67201   0.57801   0.001372  15   0.52230   0.68853   0.58827   0.001795  16   0.52439   0.70101   0.59448   0.002883  17   0.52981   0.71682   0.60403   0.003979  18   0.53595   0.73334   0.61428   0.006588  19   0.54075   0.74853   0.62321   0.01031  20   0.54408   0.76225   0.63066   0.01483  21   0.53931   0.76787   0.63001   0.01373  22   0.54519   0.78414   0.64002   0.01139  23   0.54590   0.79524   0.64485   0.02054  24   0.55119   0.81092   0.65426   0.02874  25   0.54663   0.81675   0.65382   0.03812  26   0.55080   0.83131   0.66212   0.04881  27   0.55610   0.84700   0.67154   0.06136  28   0.55645   0.85774   0.67602   0.03761  29   0.56173   0.87341   0.68541   0.04821  30   0.56674   0.88880   0.69455   0.0617  

       Appendix  7.  Estimated  Coefficients  for  ARCH  models.  Lag   Apple  

ARCH  (11)  Coca-­‐Cola  ARCH  (19)  

Google  ARCH  (19)  

GBP/USD  ARCH  (28)  

GBP/USD  ARCH  (1)  

SEK/USD  ARCH  (15)  

GBP/SEK  ARCH  (1)  

C   0.000140   0.000039   0.000093   0.000000   0.047509   0.032473   0.077638  1   0.133162   0.095434   0.026134   0.143636   0.331858   0.102759   0.236057  2   0.102376   0.142251   0.030077   0.000000     0.000000    3   0.059559   0.068490   0.065327   0.036198     0.073380    4   0.000276   0.002754   0.077527   0.000001     0.000000    5   0.074678   0.036928   0.019386   0.000000     0.000000    6   0.021827   0.032347   0.006612   0.056098     0.038057    7   0.107097   0.065189   0.004047   0.093733     0.057688    8   0.079423   0.046092   0.179556   0.003059     0.072000    9   0.000000   0.005719   0.000053   0.000000     0.000000    10   0.048286   0.028167   0.033559   0.000000     0.000000    11   0.068634   0.028412   0.068363   0.000000     0.000000    12     0.028412   0.066749   0.000000     0.037860    13     0.041094   0.000002   0.013755     0.102572    

Page 42: Heteroscedasticity Models and their Forecasting …uu.diva-portal.org/smash/get/diva2:852876/FULLTEXT01.pdf · better.!Both!the!ARCH!and!GARCH!models!capture!volatility!clustering,!which!means!

 

14     0.028236   0.001028   0.136450     0.110457    15     0.018312   0.000002   0.000001     0.135732    16     0.001472   0.018619   0.000000        17     0.001326   0.000003   0.000000        18     0.024915   0.001318   0.019327        19     0.000007   0.242439   0.000000        20         0.122459        21         0.000003        22         0.000000        23         0.000000        24         0.000000        25         0.000000        26         0.000000        27         0.000001        28         0.374276