Sevilla Estacionalidad Demanda Agua

10
LA DEMANDA DE AGUA EN ZONAS URBANAS: MÉTODOS ALTERNATIVOS DE PREDICCIÓN A CORTO PLAZO José Mª Caridad y Ocerin* Inés Moreno Campos** * Universidad de Córdoba .Dpto. Estadística, Econometría y Empresa. **Universidad de Sevilla. Departamento de Contabilidad y Economía Financiera. Resumen La predicción del consumo de agua en un área urbana es necesaria no solo para la planificación de la red de abastecimiento y depuración, sino también para los estudios de revisión de precios autorizados y para la gestión operativa. Se revisan varios métodos de predicción utilizables en una empresa suministradora, y se propone un método híbrido, basado en la aplicación de redes neuronales en combinación con modelos Arima, obteniéndose mejoras en la predicción del consumo y compensando, en parte, los posibles errores de especificación de modelos temporales. Finalmente se describe una aplicación informática desarrollada específicamente para realizar predicciones de consumo y facturación en una empresa suministradora de agua, a distintos niveles de agregación, en función del tipo de usuario, zona geográfica, bloques de consumo, y otros. En este paquete se incorpora una base de datos de modelos con objeto de poder ser utilizada sin necesidad de personal especializado, durante el ejercicio. 1 Introducción El suministro de agua a las ciudades es un servicio público que se presta en régimen de monopolio local, generalmente a través de una sociedad concesionaria, cuyas acciones son de propiedad municipal o privada. El sistema de precios está sujeto a una regulación para la actualización de las tarifas de servicio y suministro en el que intervienen las administraciones municipal y regional. La predicción de la demanda a corto plazo (generalmente no superior a 18 meses) es un dato fundamental para el expediente administrativo de análisis y aprobación de nuevas estructuras tarifarias, y es este problema el que se aborda aquí, con distintos niveles de sofisticación, para proponer métodos de predicción que a la vez sean realistas para su uso a nivel empresarial, y precisos para la planificación a corto plazo. La empresa EMACSA, suministradora en el área urbana de Córdoba, viene realizando desde hace varios años diversos estudios en colaboración con la Universidad, en los que se han empleado métodos usuales de predicción, y que han originado nuevos desarrollos teóricos que suponen alternativas útiles en los procesos de predicción para la planificación operativa y el estudio de las tarifas. La experiencia acumulada permite formular diversas estrategias para abordar la predicción de series agregadas y de sus componentes desagregadas, con requerimientos variables de personal especializado. Algunos sistemas clásicos son fácilmente abordables en las empresas sin disponer de personal especializado; otros métodos más complejos, basados en métodos híbridos generalmente requieren un soporte externo. Ambos se describen en este trabajo, así como una propuesta intermedia operativa con un logicial que incorpora una base de datos de conocimiento experto.

Transcript of Sevilla Estacionalidad Demanda Agua

Page 1: Sevilla Estacionalidad Demanda Agua

LA DEMANDA DE AGUA EN ZONAS URBANAS: MÉTODOS ALTERNATIVOS DE PREDICCIÓN A CORTO PLAZO

José Mª Caridad y Ocerin*

Inés Moreno Campos**

* Universidad de Córdoba .Dpto. Estadística, Econometría y Empresa. **Universidad de Sevilla. Departamento de Contabilidad y Economía Financiera.

Resumen La predicción del consumo de agua en un área urbana es necesaria no solo para la planificación de la red de abastecimiento y depuración, sino también para los estudios de revisión de precios autorizados y para la gestión operativa. Se revisan varios métodos de predicción utilizables en una empresa suministradora, y se propone un método híbrido, basado en la aplicación de redes neuronales en combinación con modelos Arima, obteniéndose mejoras en la predicción del consumo y compensando, en parte, los posibles errores de especificación de modelos temporales. Finalmente se describe una aplicación informática desarrollada específicamente para realizar predicciones de consumo y facturación en una empresa suministradora de agua, a distintos niveles de agregación, en función del tipo de usuario, zona geográfica, bloques de consumo, y otros. En este paquete se incorpora una base de datos de modelos con objeto de poder ser utilizada sin necesidad de personal especializado, durante el ejercicio.

1 Introducción El suministro de agua a las ciudades es un servicio público que se presta en régimen de monopolio local, generalmente a través de una sociedad concesionaria, cuyas acciones son de propiedad municipal o privada. El sistema de precios está sujeto a una regulación para la actualización de las tarifas de servicio y suministro en el que intervienen las administraciones municipal y regional. La predicción de la demanda a corto plazo (generalmente no superior a 18 meses) es un dato fundamental para el expediente administrativo de análisis y aprobación de nuevas estructuras tarifarias, y es este problema el que se aborda aquí, con distintos niveles de sofisticación, para proponer métodos de predicción que a la vez sean realistas para su uso a nivel empresarial, y precisos para la planificación a corto plazo. La empresa EMACSA, suministradora en el área urbana de Córdoba, viene realizando desde hace varios años diversos estudios en colaboración con la Universidad, en los que se han empleado métodos usuales de predicción, y que han originado nuevos desarrollos teóricos que suponen alternativas útiles en los procesos de predicción para la planificación operativa y el estudio de las tarifas. La experiencia acumulada permite formular diversas estrategias para abordar la predicción de series agregadas y de sus componentes desagregadas, con requerimientos variables de personal especializado. Algunos sistemas clásicos son fácilmente abordables en las empresas sin disponer de personal especializado; otros métodos más complejos, basados en métodos híbridos generalmente requieren un soporte externo. Ambos se describen en este trabajo, así como una propuesta intermedia operativa con un logicial que incorpora una base de datos de conocimiento experto.

Page 2: Sevilla Estacionalidad Demanda Agua

Además, estos procesos de modelización del consumo urbano, con distintos niveles de agregación, permiten la evaluación de las campañas de concienciación en el uso racional del agua, así como la respuesta de los consumidores en épocas de sequía, las diferencias en la demanda en función del tipo de sistema de medida, individual o colectivo, y la estacionalidad en el suministro. También se evalúan las influencias de los factores climáticos. En la primera parte se propone una metodología para conciliar predicciones realizadas con diversas componentes de una serie agregada (por ejemplo, el consumo doméstico y las componentes en bloques de tarifas o según el tipo de contador empleado). Finalmente se desarrollan unos nuevos métodos de predicción combinando técnicas de inteligencia artificial con modelos de análisis de series temporales, mostrando con un caso real, como se pueden disminuir los errores de predicción del consumo urbano de agua. En la segunda parte se presenta un logicial de ordenador, SPC, desarrollado específicamente para la gestión de las predicciones de consumo de agua en una ciudad, con distintos niveles de desagregación tarifaria y geográfica. Este paquete informático puede ser una alternativa interesante, no solo para realizar predicciones de cara a la planificación operativa y tarifaria, sino que permite realizar el seguimiento durante el ejercicio, actualizar las predicciones, sin necesitar personal especializado, y realizar el seguimiento con las desviaciones y su repercusión financiera. Permite además investigar las influencias de factores climáticos en distintos tipos de abonados, así como los efectos de campañas de concienciación en el uso racional del agua, y las desviaciones anormales.

2 Métodos de predicción con datos temporales Los métodos de predicción se han empleado desde la Edad Media, inicialmente en problemas de cálculo de primas de seguros. En la actualidad existen numerosos procedimientos alternativos para realizar predicciones en la empresa, siendo los más utilizados, los basados en la modelización de series temporales, así como los modelos econométricos, siendo estos últimos más complejos de elaborar. Los métodos mas usados se basan en la elaboración de modelos Arima, reg-Arima, alisados exponenciales, Holt-Winter, etc. Menos frecuentemente se emplean modelos VAR, funciones de transferencia, Marma, filtrados de Kalman, y otros. Eurostat propone los programas Tramo/Seats para la modelización, como una alternativa a los basados en los programas X12 de la oficina del censo de los Estados Unidos. Algunos paquetes informáticos, como Forecast Pro o Autobox tratan de facilitar el proceso de predicción incorporando herramientas de especificación de modelos. Una empresa o institución que va a poner en marcha un sistema de predicción para sus operaciones habituales, debe tener en cuenta diversos factores: la disponibilidad de personal especializado, los resultados deseados, la precisión con la que se desean las predicciones y sus ventajas respecto a las predicciones opináticas; en definitiva, los costes y beneficios implicados. Si los procedimientos van a basarse en análisis de series temporales hay que tener en cuenta las ventajas e inconvenientes de los distintos métodos. Algunos de éstos son mas prácticos en determinadas circunstancias. El uso de diversos modelos, combinando adecuadamente las respectivas predicciones, suele tener ventajas en términos de precisión, si bien aumenta el tiempo de producción de las predicciones. Algunos criterios de tipo estadístico son aceptados generalmente para juzgar la eficiencia del proceso de selección de un modelo: alguna medida general del grado de ajuste, otras basadas

Page 3: Sevilla Estacionalidad Demanda Agua

en la teoría de la Información, etc. La medida BIC es empleada por algunos paquetes como criterio de selección automática de modelos. Incluso, el deseo de obtener modelos simples, o escuetos; es decir, con pocos parámetros. La estrategia que se propone contradice este último punto. El modelo debe ser estable en el tiempo (en la práctica, es bastante frecuente cambios no desdeñables en la especificación, al añadir nuevos datos), y debe ser capaz de detectar cambios estructurales, lo antes posible. Finalmente, aunque obviamente no en último lugar, las predicciones deben ser lo mas próximas posibles a los valores verdaderos. S. Makridakis viene desarrollando diversos ensayos de predicción desde 1982, con datos reales, llegando a realizar diversas propuestas o recomendaciones para implementar sistemas de predicción. En primer lugar, se ha observado que modelos complejos a menudo proporcionan peores resultados que los más simples. Ningún tipo de modelo es mejor que otros en todas las circunstancias y para todos los horizontes de predicción. El criterio empleado para valorar la bondad de las predicciones también afecta a la selección del modelo. Algunos modelos son mejores respecto a un criterio y peores si se usa otro. Las componentes estocásticas son mas frecuentes en series económicas, que las tendencias y ciclos deterministas, pero para algunas series con alguna de estas componentes muy estable, como la estacionalidad del consumo de agua, las predicciones que se obtienen sufren menos desviaciones que con modelos basados en componentes estocásticas. Para las primeras seis predicciones, las componentes aleatoria y estacional son mas relevantes en la obtención de buenas predicciones, mientras, que entre siete y dieciocho valores hacia el futuro, es la tendencia y la estacionalidad las que condicionan la precisión. En una empresa o institución pública, es muy frecuente manejar datos mensuales, y realizar predicciones para el año siguiente, es decir, hay que usar horizontes de predicción que a veces incluso superan el año y medio. En una compañía de agua, si se prepara un informe de autorización de revisión de precios, es este horizonte el que hay que tener en cuenta. Esto implica que es importante modelizar adecuadamente la tendencia y estacionalidad, para evitar desviaciones sistemáticas, que es frecuente que se produzcan. Además se plantean diversos problemas aquí tratados: la necesidad de manejar series agregadas y sus componentes desagregadas, con la correspondiente consolidación de las predicciones, y la necesidad de tomar decisiones sobre cuál es el nivel de agregación que se considera mas preciso, para condicionar las restantes predicciones a éste. Al comparar diversos métodos de predicción, las medias móviles no son recomendables, pues en el medio plazo no se comportan con precisión, y no detectan con rapidez los cambios estructurales. Los métodos de alisado exponencial, útiles en el corto plazo, se comportan peor al incrementar el horizonte de predicción. Granger y Newbold consideran que el alisado de Holt-Winters suele ser el más adecuado. El método Theta de Assimokopoulos, combinando la tendencia y media móvil también es recomendable. Los modelos Arima suelen ser adecuados para las primeras doce predicciones, si bien pierden precisión al incrementar el horizonte de predicción. Si se conocen sucesos que afectan a las predicciones, deben usarse variables de intervención. Los modelos que requieren variables exógenas, como los de regresión dinámica o función de transferencia, son mas complejos para usar, y sobre todo, implica la necesidad de disponer de datos. Una dificultad adicional que surje con frecuencia en la práctica, es la necesidad de modelizar un número elevado de series y producir los correspondientes informes. Algunos paquetes

Page 4: Sevilla Estacionalidad Demanda Agua
Page 5: Sevilla Estacionalidad Demanda Agua

f

Page 6: Sevilla Estacionalidad Demanda Agua

Figura 1: Consumo mensual 1984-2002.

1200000

1600000

2000000

2400000

2800000

3200000

84 86 88 90 92 94 96 98 00 02

Consumo mensual

Tabla 1. Residos del modelo ARIMA.

1985 57813.70 149064.4 -26180.54 69365.00 -35501.01 152167.3 70152.06 94859.18 47370.77 -128522.9

1986 226460.0 -28648.46 -168411.9 -9703.716 55213.49 217818.0 257174.6 73870.56 -348713.4 163793.5 -87270.53 104396.7

1987 21379.27 -109836.5 -82293.15 20217.77 214548.7 58367.76 -100531.6 25207.66 232304.2 46816.50 -355858.7 78333.09

1988 156430.5 -94548.90 30114.30 388323.0 -202094.4 25645.25 -500565.5 586849.2 355865.4 -243505.8 2224.517 174627.9

1989 -851841.3 -87431.66 232078.3 1802.522 225396.4 -17954.69 246156.5 -129917.7 -197900.2 -154739.1 236021.1 -75830.20

1990 53470.88 31801.26 10100.22 -67683.15 52750.96 -104612.8 138724.9 -204726.7 90029.51 48688.91 311765.0 93043.45

1991 21095.20 7304.252 91972.36 -76260.66 -4085.987 -67385.20 89258.99 -130806.0 172618.9 100822.5 288933.8 -124570.9

1992 88609.32 153102.2 -18871.79 -253074.0 -31386.38 -74934.20 -256740.5 -165093.1 63198.22 -49717.35 59768.62 -109842.1

1993 22768.01 -2615.293 -191781.1 -231085.3 -158224.6 -336505.1 -184145.9 25645.86 -210304.1 37372.70 7737.767 34764.18

1994 117867.4 18495.92 24396.41 18868.60 38152.62 -41224.37 55276.95 100264.8 -67260.43 -81532.75 156881.8 101031.6

1995 106938.3 31683.62 -153.1765 -153987.6 -231355.8 -17960.12 -70968.75 -135628.9 -405730.1 -220794.3 100876.1 -10321.26

1996 -92910.47 83083.69 93423.62 -23812.72 140434.7 -13023.46 -23153.45 -59494.02 -169110.2 30702.80 152230.0 136358.8

1997 109471.6 199871.4 14640.62 116932.7 219377.3 110.3699 -222404.7 -17926.02 -169544.7 72993.01 165624.7 137302.6

1998 124452.8 161633.3 76302.98 -140721.1 209049.8 -265585.4 66184.71 -89804.72 78924.67 -38739.27 217944.0 -93373.57

Una red neuronal MLP (14x4x1) es usada, con cuatro variables no observables en la única capa oculta. Las variables de entrada son los residuos anteriores con la siguiente estructura de retardos: at-1, at-2, at-3, at-4, at-5, at-6, at-12, at-13 y at-14. Esta estructura, así como la topología de la red puede cambiarse con facilidad.

1.1.1 Capa oculta

Page 7: Sevilla Estacionalidad Demanda Agua
Page 8: Sevilla Estacionalidad Demanda Agua

La predicción con el modelo Arima es 23510127 m3, con una subestimación de la demanda, mientras que la cifra prevista con el modelo híbrido reduce el error de predicción en mas de 320000 m3, esto es, en un 39.2%. Para horizontes temporales menores, también se obtiene una mejora en las predicciones. Así para los diez primeros meses del período de predicción, el consumo alcanzó los 20320686 m3, y las predicciones con el modelo híbrido, 19929268 m3, mas próximas al valor obtenido a partir del modelo Arima, 19449139 m3, o con un modelo reg-arima, 19453222 m3.

Figura 2: Predicciones mensuales: arima vs. modelo híbrido.

1600

1800

2000

2200

2400

2600

1600 1800 2000 2200 2400 2600

7 9

8

11 10 5

12 6 2

4 3 1

Arima

Arima-NN

5 El paquete de predicción SPC La idea básica para el desarrollo de este logicial informático es proporcionar una herramienta fácil de manejar, sin necesidad de personal especializado en técnicas econométricas, y que permitan realizar predicciones anuales para la memoria de propuesta y modificación de las tarifas, su actualización mensual, el análisis de las desviaciones, y otros informes útiles para el departamento comercial y para la gerencia de la empresa. La predicción en el ámbito empresarial requiere disponer de personal especializado, además de instrumentos informáticos específicos. Esto supone un coste que solo está justificado, si las mejoras en las previsiones suponen un beneficio superior para la empresa. El paquete SPC incorpora diversos métodos de predicción para el consumo de agua en una zona urbana con distintos niveles de agregación y diversos tipos de abonados, así como para otras series, como las de vertidos o facturación. Incorpora un sistema potenciado para la especificación de modelos y una base de datos de conocimiento con los modelos especificados para cada año. Las actualizaciones de las predicciones se realizan automáticamente con los modelos especificados, que son estimados de nuevo cada vez que se incorporan datos al sistema. Incluye una serie de facilidades para consolidar series desagregadas, y permite realizar informes de seguimiento de las predicciones, que se mantienen, por un lado, sobre una base anual fijas, y por otro, actualizadas cada vez que se dispone un nuevo dato. Incorpora modelos clásicos de análisis de series, incluyendo modelos Arima, regresión dinámica, variables de

Page 9: Sevilla Estacionalidad Demanda Agua

intervención, y posibilidad de incorporar variables exógenas. El usuario final solo requiere un conocimiento mínimo de técnicas econométricas, por lo que puede adaptarse con facilidad a su manejo y mantenimiento. Las estructuras de datos se centran en un fichero maestro formado por distintas series de consumo con varios grados de desagregación: tipos de usuarios, estructura del consumo por bloques para los usuarios que correspondan a estas tarifas, y las correspondientes desagregaciones por zonas geográficas. Además incluyen series de depuración de aguas residuales, series de facturación con idénticas desagregaciones, series relativas a la estructura de los abonados y viviendas a las que se suministra, y, finalmente, series exógenas, como son las relativas a la climatología o a factores socio-económicos. Esta base de datos es abierta, y se pueden incorporar nuevas series en cualquier momento; también incluye las predicciones realizadas con las series. Asociada es esta base de datos existen varios ficheros básicos: el primero contiene la meta información de cada serie, esto es, la información relevante para obtener los informes y la especificación de uno o varios modelos de predicción, así como el control de las predicciones, incluyendo la posibilidad de establecer intervalos de crecimiento, criterios de consolidación de predicciones desagregadas con las agregadas y de refundición de resultados obtenidos con varios modelos. El fichero de meta información se actualiza automáticamente al incorporar nuevos datos reales, en principio con periodicidad mensual, y puede ser editado. La especificación de modelos puede realizarse por el usuario, o dentro de un proceso de mantenimiento anual. Otros ficheros sirven para mantener el control del proceso. En un momento del ejercicio, si se preparan predicciones para el ejercicio siguiente, y se definen como objetivos estables, la información se mantiene estable, y sirve para comparar las predicciones actualizadas con las definidas como objetivo (por ejemplo, las consideradas en el informe para la propuesta de tarifas). La incorporación mensual de nuevos datos actualiza las predicciones mediante la meta información acumulada, estimando de nuevo los distintos modelos, sin necesidad de personal especializado. Además se generan diversos informes de predicción y de análisis de desviaciones. El programa permite además el tratamiento individualizado de series e incorpora un módulo de gráficos. También proporciona diversos informes de gestión comercial, útiles en los procesos administrativos. Los procedimientos econométricos para estimar modelos se basan en modelos de regresión, regresión dinámica, alisados exponenciales de diversos tipos, modelos arima con transformaciones estabilizadoras de la varianza. En versiones posteriores se incorporarán como opciones, los métodos híbridos aquí presentados y otros procesos econométricos, entre los que se encuentran los de selección automática de modelos.

6 Referencias bibliográficas.

Box, G.E.P., Jenkins, G.M., and Reinsel, G.C. (1994) Time Series Analysis, Forecasting and Control, 3rd edit. Engglewood Cliffs, NJ, Prentice Hall

Caridad y Ocerin, J.M. (1998). Econometría: Modelos Econométricos y Series Temporales (2 tomos) Editorial Reverté. Barcelona. Caridad y Ocerin, J.M. (2000). El consumo de agua en Córdoba. B.R.A.C. LXXVIII, 138, 257-267. Gómez, V., and Maravall, A. (1996). Programs TRAMO and SEATS. Documento de trabajo nº 9628. Banco de España.

Page 10: Sevilla Estacionalidad Demanda Agua

Gómez, V. and Maravall, A. (1998). Automatic modelling methods for univariate series. Documento de trabajo nº 9808. Banco de España. Goodrich, R. (2000) Forecast Pro Version 4.1 www.forecastpro.com

Granger, C.W.J. and Newbold, P. (1986) Forecasting Economic Time Series 2nd ed. San Diego. Academic Press.

Hibon, M. and Makridakis, S. (1999) M3-competition. 19th International Symposium on Forecasting. Washington D.C.

Masters, T. (1995) Neural, novel and hybrid algorithms for time series prediction. J. Wiley & sons.

Reilly, D.P. (1999) Autobox. www.autobox.com