La Información Mutua Como Medida de Asociación de La Variable Macroclimática ONI Con Los Caudales...
-
Upload
uberkmilo6878 -
Category
Documents
-
view
27 -
download
0
Transcript of La Información Mutua Como Medida de Asociación de La Variable Macroclimática ONI Con Los Caudales...
La información mutua como medida de asociación de la variable
macroclimática ONI con los caudales medios en el departamento de Antioquia.
Uber Camilo Agudelo Atehortúa
Profesor: German Poveda Jaramillo
RESUMEN
El presente estudio tuvo como objetivo analizar la información mutua como una medida de asociación
entre el índice ONI que caracteriza el ciclo ENSO (El Niño Oscilación del Sur), y los caudales medios
mensuales en el departamento de Antioquia, se estima la información mutua y se escala para así
compararla con los resultados obtenidos calculando la correlación de Pearson y su significancia estadística.
Los cálculos se efectuaron con una muestra de 15 series de caudales de resolución diaria, con un
porcentaje de datos faltantes inferior al 15% y longitud efectiva de registros mínima de 30 años, las cuales
se obtuvieron de la red de estaciones limnigráficas y limnimétricas del Instituto de Hidrología,
Meteorología y Estudios Ambientales de Colombia (IDEAM). En general se observa dependencia
estadística significativa de correlación (-0.5 y -0.6) de los caudales con el índice del ENSO estudiado. La
estimación de la información mutua se acerca al estudio del comportamiento no lineal de los fenómenos
físicos. Sin embargo no es posible asociarla con fenómenos físicos con mayor claridad según la
metodología empleada.
Para dar solución a la iniciativa planteada, fue necesario implementar un programa de computador,
lenguaje Python. Igualmente, se elaboraron códigos en lenguaje Visual Basic para la lectura, clasificación
y selección de la información facilitada por el IDEAM.
1. INTRODUCCIÓN
El fenómeno El Niño-Oscilación del Sur (ENSO) es el conjunto más poderoso de variaciones atmosféricas y
oceánicas en la región del océano Pacífico ecuatorial. Se manifiesta con variaciones anómalas de la presión
atmosférica (Oscilación del Sur) y de la temperatura en la superficie del mar (El Niño - fase cálida o La Niña-
fase fría) en el océano Pacífico [1]. En sus fases extremas provoca alteraciones en la circulación oceánica y
atmosférica a escala global [2], en los cinturones tropicales y subtropicales de la tierra que favorecen e
intensifican el desarrollo de precipitaciones torrenciales, lo cual produce crecidas, inundaciones,
avalanchas, tormentas, así como sequías, con efectos catastróficos en más de la mitad de la circunferencia
terrestre[3].
Sin embargo, el entendimiento de los caudales en los ríos sobre el departamento de Antioquia es un poco
complejo debido a que son menos intermitentes por lo que reúnen todo lo que la cuenca les aporta. A lo
que se suma el efecto de fenómenos de gran escala, como el mencionado anteriormente, El Niño-
Oscilación del Sur [4]. En este sentido, se evaluó la asociación de las series de caudales en 15 estaciones
limnigráficas y limnimétricas del IDEAM ubicadas en el departamento de Antioquia y la variabilidad del
índice ONI de gran escala asociado al ciclo ENSO utilizado como predictor. Dada la gran diversidad de
índices utilizados para realizar estudios sobre el efecto en el clima derivada de los fenómenos del ciclo
ENSO en Colombia, se hace énfasis en el índice ONI ya que es el más utilizado por la comunidad científica,
a nivel mundial. Cabe recordar que la medida de asociación se realiza a través del uso de la metodología
de la información mutua descrita por Poveda [5].
2. METODOLOGÍA
Si bien es del conocimiento de todos de la influencia del ENSO sobre las componentes meteorológicas en
una región. Dicha influencia no se comporta de manera lineal ni homogénea en todas partes, razón por la
cual se hace particularmente complicado hacer predicciones climáticas a partir de un índice de predicción
ENSO en particular. En este sentido, se evaluó la información mutua y el coeficiente de correlación de
Pearson, las cuales cuantifican la dependencia no lineal y lineal, respectivamente entre dos variables.
2.1 Información mutua
La información mutua (IM) es un parámetro estadístico que cuantifica la dependencia global entre dos
variables aleatorias, es una medida de dependencia no lineal que cuantifica la reducción en la
incertidumbre de una variable aleatoria por el conocimiento de otra [5]. En teoría de la información la
incertidumbre o entropía (H) de una variable aleatoria se cuantifica con base en su función de densidad
de probabilidad, esta se estima como (Shannon, 1948) con el siguiente estimador [6]
𝐻(𝑝) = − ∑ 𝑝𝑖𝑙𝑜𝑔𝑏(𝑝𝑖)
𝑘
𝑖=1
(1)
Donde 𝑝1, 𝑝2, … , 𝑝𝑘 representa la función de densidad de probabilidades, que satisface ∑ 𝑝𝑖 = 1𝑘𝑖=1 , y 𝑝𝑖 ≥
0, ∀𝑖 para una variable aleatoria. La base b en la que se evalúa el logaritmo define las unidades de la
entropía; siendo el “bit” la unidad asociada a la base 2. El valor de (IM) entre las dos variables aleatorias
en función del tiempo de rezago 𝜏.
𝐼𝑀𝑖𝑗(𝜏) = ∑ 𝑝𝑖𝑗𝜏
𝑖𝑗
𝑙𝑜𝑔2 (𝑝𝑖𝑗
𝜏
𝑝𝑖𝜏𝑝𝑗
𝜏) (2)
En donde,
𝑝𝑖𝑗𝜏 = 𝑝(𝑋𝑡 = 𝑥𝑖 , 𝑌𝑡 + 𝜏 = 𝑦𝑖), 𝑝𝑗 = ∑ 𝑝𝑖𝑗 𝑦 𝑖 𝑝𝑖 = ∑ 𝑝𝑖𝑗 𝑗
Cuando 𝑖 = 𝑗, la ecuación anterior (2) define la función de auto información de la serie (Chapeau-
Blondeau, 2007; [5].
El valor de (IM) es una medida general de asociación entre variables que detecta tanto relaciones lineales
como no lineales, por lo que se considera un estadístico más robusto frente a los coeficientes de
correlación de Pearson o Spearman los cuales solo encuentran dependencias lineales.
Para el caso general en el que 𝑖 ≠ 𝑗, es posible definir la función de información mutua normalizada (IMN)
mediante el siguiente estimador,
𝐼𝑀𝑁𝑖𝑗(𝜏) =𝐼𝑀𝑖𝑗(𝜏)
√𝐻𝑖√𝐻𝑗
(3)
El valor de (IMN) es siempre positivo y toma valores entre [0,1], se hace nulo únicamente cuando las
variables aleatorias son independientes y 1 cuando existe asociación, el conocimiento de una de las
variables en esta caso el índice ONI nos aporta información para la otra.
Ahora bien, para cuantificar la memoria del proceso no lineal se hace necesario estimar la escala de
información normalizada descrita por Poveda [5] mediante la siguiente ecuación,
𝜑∗ = 1 + 2 ∑ 𝐼𝑀𝑁𝑖𝑗(𝜏)
𝑘
𝜏=1
(4)
2.2 Coeficiente de correlación
El coeficiente de correlación (ρ) proporciona una medida de dependencia lineal entre dos variables
aleatorias, que puede ser de tres tipos: directa, cuando los incrementos en una de las variables se
encuentran asociados con incrementos en la otra; inversa, cuando los decrementos en una de las variables
se encuentran asociados con incrementos en la otra; y nula, cuando los cambios en una de las variables
no se asocian con los cambios en la otra. El valor de (ρ) fluctúa en el intervalo [-1,1] y sus óptimos de
dependencia directa e inversa se relacionan, respectivamente, con el extremo inferior y el extremo
superior de este último. Cuando existe dependencia nula entre las variables aleatorias, el valor de es igual
a cero. El valor de entre las series de tiempo del índice ONI y las series de caudales es estimado como [5].
𝜌𝑖𝑗(𝜏) =∑ (𝑋𝑖
𝑖 − 𝜇𝑡𝑖 )(𝑋𝑡+𝜏
𝑗− 𝜇𝑡+𝜏
𝑗)𝑛−𝜏
𝑡=1
[∑ (𝑋𝑖𝑖 − 𝜇𝑡
𝑖 )2 ∑ (𝑋𝑡+𝜏𝑗
− 𝜇𝑡+𝜏𝑗
)2 𝑛−𝜏𝑡=1 𝑛−𝜏
𝑡=1 ] (5)
Donde, 𝑋𝑖𝑖 , 𝜇𝑡
𝑖 , 𝑋𝑡+𝜏𝑗
, 𝜇𝑡+𝜏𝑗
son la serie del parámetro predictor 𝑖, su valor promedio, la serie de tiempo
rezagada un valor 𝜏 en la estación 𝑗 y su promedio respectivamente.
3. DATOS Y MÉTODOS
Sobre el territorio antioqueño se ubican un total de 75 estaciones limnigráficas y limnimétricas
administradas por el Instituto de Hidrología, Meteorología y Estudios Ambientales de Colombia (IDEAM),
las cuales se han representado con triángulos color marrón en la Figura 1. Estas cuentan con registros de
caudal total diario entre los años 1966 y 2013, se conformaron las bases de datos climáticas a escala
temporal mensual, donde se efectuó la identificación de datos faltantes, para esto se tuvo como
parámetro un porcentaje de datos faltantes menor al 15% y un registro efectivo de datos de mínimo 30
años, del total de datos por estación climática; como resultado correspondieron a 15 (11.25%) del total de
las estaciones. El grupo de 15 estaciones, representadas con círculos color marrón en la Figura 1, fueron
utilizadas en este trabajo.
El índice oceánico del Niño (ONI), es calculado como la media móvil de tres puntos de la serie mensual de
anomalías de la temperatura de la superficie del océano en la Región Niño 3-4. Los valores fueron tomados
de la página web: http://www.cpc.ncep.noaa.gov/data/indices/ Cabe recordar que los valores positivos
del ONI, mayores o iguales a 0,5 por 5 meses consecutivos o más indican la ocurrencia de un evento El
NIÑO. Valores negativos del ONI, inferiores o iguales a -0,5 por 5 meses consecutivos o más indican la
ocurrencia de un evento La NIÑA [5] tomado de pal trabajo.
3.1 Correlación, y la información mutua
Para efectos del cálculo de la información mutua es necesario determinar la función de densidad de
probabilidad de los caudales, la cual se estima con su histograma de frecuencias relativas. El procedimiento
para la construcción de histogramas de frecuencias relativas requiere la agrupación de los registros de
tiempo en clases; para propósitos de cálculo, en este trabajo, se utilizaron 10 clases de igual ancho,
distribuidas entre el valor mínimo y el valor máximo de los datos. Con ello se procedió al cálculo de la
entropía, usando la Ecuación (1), para cada estación limnigráfica y limnimétrica.
El comportamiento estadístico de dependencia de ρ e IMN con respecto al vector de desplazamiento fue
cuantificado usando rezagos temporales = 1, 2, 3, 4, 5, 6, 7, 8, 9 y 10 meses.
Tabla 1. Estaciones limnigráficas Y limnimétricas utilizadas para el análisis de datos.
ID Estación
(Código IDEAM) Cota
(msnm) Variable climática
*R Año
inicial Año final
*AR *%F *%D *Ae
0 PTE REAL
[23087150] 2083 Caudal 480 1974 2013 40 9.12 90.88 36.35
1 EL REMOLINO
[26197030] 678 Caudal 504 1972 2013 42 10.04 89.96 37.78
2 PUEBLO NUEVO
[12027050] 78 Caudal 432 1978 2013 36 11.09 88.91 32.01
3 LA GALERA [26217010]
662 Caudal 444 1977 2013 37 15.00 85.00 31.39
4 LA BODEGA [23107020]
120 Caudal 444 1976 2012 37 11.92 88.08 32.59
5 VEGACHI
[23107040] 929 Caudal 468 1975 2013 39 12.05 87.95 34.30
6 CAMPAMENTO
[26197010] 1080 Caudal 504 1972 2013 42 12.24 87.76 36.86
7 PTE IGLESIAS [26207030]
583 Caudal 408 1979 2012 34 12.54 87.46 29.74
8 APAVI
[26247030] 106 Caudal 504 1972 2013 42 12.57 87.43 36.72
9 BRISAS DEL
NECHI [27027060]
1880 Caudal 468 1975 2013 39 12.59 87.41 34.09
10 PAILANIA
[23087200] 980 Caudal 492 1973 2013 41 12.79 87.21 35.76
11 LA MASCOTA [23107030]
970 Caudal 468 1975 2013 39 13.02 86.98 33.92
12 BARRANQUILLIT
A [12017020] 33 Caudal 444 1977 2013 37 14.80 85.20 31.52
13 SONSON
[26187030] 2282 Caudal 528 1970 2013 44 14.82 85.18 37.48
14 DABEIBA 2 [11117050]
650 Caudal 456 1976 2013 38 14.86 85.14 32.35
donde, *R= Registro de datos; *AR= Años de registro; *%F= Porcentaje de datos faltantes; %D= Porcentaje
de datos disponibles; Ae= Años efectivos de registros.
Figura 1. Localización de la zona de estudio y de la red de estaciones limnigráficas y limnimétricas
administradas por el IDEAM, utilizadas en el presente trabajo.
4. Resultados
A continuación se presentas los resultados obtenidos para los parámetros estadísticos de información
mutua normalizada (IMN), correlación de Pearson (ρ) y escala de información normalizada 𝜑∗, los cuales
son representados por las figuras 2, 3 y 4 respectivamente. Es necesario resaltar que el eje Y de las gráficas
fue modificado de tal manera que se pudiese observar algún patrón, de tal manera que en el eje Y no se
representará los valores máximos y mínimos entre los cuales se mueven los parámetros estadísticos
trabajados.
La Figura 2 muestra la asociación entre los caudales en Antioquia y el índice ONI en términos de la
información mutua normalizada, como una función del vector de desplazamiento, para los rezagos
temporales = 1, 2, 3, 4, 5, 6, 7, 8, 9, y 10 meses. De acuerdo al valor de comparación definido anteriormente
para IMN se puede inferir que las magnitudes encontradas son bajas. Es decir existe una asociación baja
entre el índice oceánico del Niño (ONI), y los caudales medios en el departamento de Antioquia, lo cual
contrasta con el estudio realizado por Poveda et, al 2002 [8]. Por lo cual se intuiría que la información
mutua, no permite definir tan claramente una dirección de máxima continuidad, como en el caso de
aquella puesta en términos de la correlación; lo que se concluye al comparar la Figura 2 con la Figura 3.
A medida que crece el intervalo de agregación, el estadístico de información mutua, comienza a capturar
relaciones no lineales, que no aparecen tan claras en los campos de correlación. Sin embargo surge una
inquietud al ver que por ejemplo para los primeros tiempos de rezago el coeficiente de Pearson (ρ) el cual
captura una dependencia lineal significativa [-0.5 y -0.6] para las estaciones Apavi (ID=8) y Puente Iglesias
(ID=7). Los valores de IMN a pesar de que captura tanto relaciones lineales como no lineales no indican
una buena asociación entre las variables de las series analizadas.
Figura 2. Información mutua normalizada entre las series de caudal y las series del índice ONI para un
rezago 𝜏
Por su parte la Figura 3 muestra la relación entre los caudales en Antioquia y el índice ONI, en términos
del coeficiente de correlación, como una función del vector de desplazamiento, para los rezagos
temporales = 1, 2, 3, 4, 5, 6, 7, 8, 9, y 10 meses. Los valores presentan una correlación negativa significativa
para los primeros 3 meses de rezago, lo que indica que el aumento o disminución en el índice evaluado
está estrechamente relacionado a disminuciones o aumentos en los caudales. Lo cual se podría dar un
indicio de una especie de periodo de reacción o de afectación en el caudal después de presentarse la
anomalía en el océano pacifico representada por el índice ONI.
0.200.210.220.230.240.250.260.270.280.290.300.310.320.330.340.350.360.370.380.390.40
0 1 2 3 4 5 6 7 8 9 1 0
𝐼𝑀N𝑖𝑗
(𝜏)
𝜏 (MES)
INFORMACIÓN MUTUA ( IMN ) ENTRE REGISTROS DE CAUDALES E ÍNDICE ONI
8 12 4 9 6 14 3 11
10 7 0 2 1 13 5
ID ESTACIONES
Figura 3. Correlación lineal de Pearson (ρ) entre las series de caudal y las series del índice ONI para un
rezago 𝜏
La Figura 4 representa la escala de información normalizada (𝜑∗) con 10 intervalos de clase usados para
la estimación de la distribución de probabilidades de las variables estudiadas. De forma general la 𝜑∗ toma
valores entre 1.5 y 1.6 meses para los rezagos temporales = 1, 2, 3, 4, 5, 6, 7, 8, 9, y 10 meses; lo cual es
posible observar que cada uno de dichos intervalos miden aproximadamente los mismo. Se puede
interpretar esta escala característica como la longitud necesaria del índice ONI para desarrollar un efecto
sobre los caudales en el departamento de Antioquia. En este sentido los valores de escala de información
normalizada dan cuenta de la existencia de la relación entre el índice ONI y los caudales debido a que la
escala de información normalizada permanece de manera aproximada invariable en el tiempo.
-1.00
-0.90
-0.80
-0.70
-0.60
-0.50
-0.40
-0.30
-0.20
-0.10
0.00
0.10
0.20
0.30
0 1 2 3 4 5 6 7 8 9 1 0
Ρ𝑖𝑗
(𝜏)
𝜏 (MES)
CORRELACIÓN DE PEARSON (Ρ ) ENTRE SERIES DE CAUDALES E ÍNDICE ONI
8 12 4 9 6 14 3 11
10 7 0 2 1 13 5
ID ESTACIONES
Figura 4. Escala de información normalizada entre los registros de caudales e índice ONI para un rezago 𝜏
5. Conclusiones
Los resultado de la información mutua no sólo encuentra asociaciones no lineales no detectadas por
Pearson (𝜌), pero surge un interrogante grande y es que no capte todas las asociaciones lineales captadas
por (𝜌), debido a los valores bajos observados de IMN, lo cual no daría validez al método presentado, sin
embargo esto se pude atribuir un error de cálculo a la hora de realizar los cálculos respectivos con la
formula empleada.
En términos de la información mutua, no permite definir tan claramente una dirección, como en el caso
de aquella puesta en términos de la correlación; lo que se concluye al comparar las figuras 2 y 3 mostradas
anteriormente.
Los resultados de las correlaciones, dan pie para mejorar el ajuste y la predicción del caudal mensual en
los ríos del departamento de Antioquia, ya que los valores presentados en rezagos diferentes a cero
pueden ser usados como variables predictores, lo cual podría ser una herramienta de gran importancia
para la planificación del recurso hídrico de la región.
La investigación sobre la existencia o no, de relaciones claras que permitan caracterizar la dependencia
temporal y su posible uso con propósitos de estimación y pronóstico, mediante el uso de teorías no lineales
(información mutua) a las escalas temporales adecuadas, constituye una posible línea de trabajo futuro.
1.00
1.05
1.10
1.15
1.20
1.25
1.30
1.35
1.40
1.45
1.50
1.55
1.60
1.65
1.70
1.75
1.80
1 2 3 4 5 6 7 8 9 1 0
𝜑∗ 𝑖𝑗
(𝜏)
𝜏 (MES)
ESCALA DE INFORMACIÓN NORMALIZADA ENTRE REGISTROS DE CAUDALES E ÍNDICE ONI
8 12 4 9 6 14 3 11
10 7 0 2 1 13 5
Agradecimiento
Al profesor German Poveda por despertar el interés por las ciencias de la estadística y ocurrencia de
fenómenos climáticos, por el apoyo durante el semestre 2015-2 y por sus clases magistrales que dieron pie
a entender fenómenos que eran ajenos al conocimiento de quien realiza este trabajo académico.
6. Referencias bibliográficas
[1] S.R. Kovatz, El Niño and human health. Bulletin of the World Health Organization, 2000, vol. 78, 9, 1127-
1135.
[2] C. Wang, Atmospheric circulation cells associated with the El Niño-Southern Oscillation, J. Climate,
2002, vol. 15, 399–419.
[3] OPS- Oganización panamericana de la salud. Crónicas de Desastres Fenómeno el Niño, 1997-1998.
Programa de preparativos para situaciones de emergencias y coordinación del socorro en casos de
desastre. Serie: Crónicas de Desastres, 2000, vol. 8, pp. 294.
[4] G. Poveda, J. Vélez, O. Mesa, A. Cuartas, J. Barco, R. Mantilla, J. Mejía, C. Hoyos, J. Ramírez, L. Ceballos,
M. Zuluaga, P. Arias, B. Botero, M. Montoya, J. Giraldo y D. Quevedo, «Linking Long-Term Water Balances
and Statistical Scaling to Estimate River Flows along the Drainage Networks of Colombia,» J. Hydrol. Eng.,
vol. 12, nº 1, pp. 4-13, 2007.
[5] G. Poveda, Escala de información, escala de fluctuación y entropía de las lluvias en el valle de aburrá,
Colombia, Revista de la academia Colombiana de ciencias exactas, físicas y naturales, vol. XXXIII, pp. 4-7,
2009.
[6] C. Shannon, «A mathematical theory of communication,» Bell Syst. Tech. J., vol. 27, pp. 379-423, 1948.
[7] G. Guarín and A. Ochoa, “Impacto de la Variabilidad Climática en la Producción de Banano en el Urabá
Antioqueño”. Numeral 10: Índices macroclimáticos, precipitación y producción en Urabá. M.S. thesis,
Ingeniería de Recursos Hídricos, Universidad Nacional de Colombia, 2011.
[8] Poveda et, al, 2002. Influencia De Fenómenos Macroclimáticos Sobre El Ciclo Anual De La Hidrología
Colombiana: Cuantificación Lineal, No Lineal Y Percentiles Probabilísticos.