Post on 16-Mar-2020
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
LATTICE DATA: PLUGIN DE QGIS QUE IMPLEMENTA ANÁLISIS ESTADÍSTICO
EXPLORATORIO DE DATOS LATTICE PARA LA IDENTIFICACIÓN DE
CORRELACIÓN ESPACIAL
Andrea Carolina Castillo Giraldo
Ingeniera Catastral y Geodesta, Candidata a Especialista SIG. Estudiante de la Universidad
Distrital Francisco José de Caldas. Bogotá, Colombia. Contacto: angicaro23@gmail.com
Diego Armando Rodríguez Álvarez
Ingeniero Civil, Candidato a Especialista SIG. Estudiante de la Universidad Distrital Francisco
José de Caldas. Bogotá, Colombia. Contacto: darodriguezalv@unal.edu.co
Juan Manuel Carrillo García
Ingeniero Catastral y Geodesta, Candidato a Especialista SIG. Estudiante de la Universidad
Distrital Francisco José de Caldas. Bogotá, Colombia. Contacto:
jmcarrillog@correo.udistrital.edu.co
ESPECIALIZACIÓN EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA
FACULTAD DE INGENIERÍA
UNIVERSIDAD DISTRITAL FRANCISCO JOSE DE CALDAS
2015
LATTICEDATA 2015
Página 2 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
TABLA DE CONTENIDO
RESUMEN .................................................................................................................................. 3
INTRODUCCIÓN ....................................................................................................................... 4
MARCO CONCEPTUAL ........................................................................................................... 6
Criterios de vencindad y matriz de pesos ................................................................................ 6
Medida de autocorrelación espacial – Índice I de Morán ........................................................ 7
Diagrama de dispersión de Morán ........................................................................................... 7
METODOLOGÍA ........................................................................................................................ 8
Descripción general ................................................................................................................. 8
Requerimientos funcionales ..................................................................................................... 9
Requerimientos no funcionales ................................................................................................ 9
Análisis del sistema ................................................................................................................. 9
Software de despliegue....................................................................................................... 10
Integración de componentes ............................................................................................... 10
Sistema de evaluación de calidad del producto de software .................................................. 11
RESULTADOS ......................................................................................................................... 12
Diseño del plugin ................................................................................................................... 12
Casos de uso ....................................................................................................................... 12
Actividad e interacción con el usuario ............................................................................... 13
Componentes integrados en el plugin ................................................................................ 13
Interfaz del plugin .............................................................................................................. 15
Evaluación de calidad del producto de software generado .................................................... 16
EJEMPLO: HOGARES CON VIVIENDA PROPIA EN MUNICIPIOS DE ANTIOQUIA ... 19
TRABAJO FUTURO ................................................................................................................ 20
CONCLUSIONES ..................................................................................................................... 21
BIBLIOGRAFÍA ....................................................................................................................... 22
LATTICEDATA 2015
Página 3 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
RESUMEN
El objetivo de este trabajo es realizar un análisis exploratorio de datos espaciales (AEDE) de
tipo polígono, comúnmente denominados lattice, para estimar, visualizar e interpretar de
manera sencilla el grado de autocorrelación espacial (AE) que estos datos presentan en el área
de estudio comúnmente analizada mediante herramientas de sistemas de información
geográfica. Para la determinación de la AE se usó el índice estadístico I. de Morán Global, a
partir de un análisis de vecindad o contigüidad, el cual ofrece medidas resumen que indican la
intensidad y el tipo de la relación espacial presente en los datos. Al evaluar la existencia o no
de AE en las variables o atributos observados, es posible también realizar un análisis de los
posibles aspectos que originan o explican dicha autocorrelación, así como predecir el
comportamiento de dicha variable en diferentes zonas de características similares.
El análisis e interpretación de este tipo de índices estadísticos normalmente requiere la
experticia de un especialista, limitando la cantidad de usuarios que pueden evaluar de manera
adecuada la autocorrelación espacial dentro de sus estudios. Para facilitar la implementación
de este análisis por parte de un mayor número de usuarios SIG que posean información
agregada en áreas discretas, se desarrolló un aplicativo de software de tipo plugin que se
integra al software para gestión de Sistemas de información Geográfica QGIS, dado que esta
es una herramienta multiplataforma, robusta, y de código abierto para el manejo de
información con componente geográfico.
Palabras clave: Análisis exploratorio de datos espaciales, lattice, autocorrelación espacial, I.
de Morán, plugin, Python, QGIS.
LATTICEDATA 2015
Página 4 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
INTRODUCCIÓN
Uno de los recursos de mayor implementación para la evaluación del comportamiento de
diferentes variables en el territorio son los mapas temáticos, que proveen una visión regional
sobre la distribución territorial de dichas variables. Estas variables al ser mapeadas para
propósitos comparativos, no permiten evaluar fácilmente si la distribución espacial de una
variable responde a un patrón aleatorio o agregado en la zona de estudio y qué factores
explican dicha distribución (Cepal – Naciones Unidas, 2014).
Considerar la distribución y autocorrelación espacial de las variables resulta fundamental, ya
que permite la identificación, caracterización y predicción de diferentes fenómenos de
importante interés regional, tal como la tasa de nacimientos por departamento y por municipio,
el número de accidentes ocurridos en una zona específica, entre otros. Además constituye un
elemento de análisis dado que permite entender la relación entre los fenómenos y el territorio.
La implementación de modelos estadísticos tiene gran importancia en el estudio de fenómenos
actuales, además debe ir de la mano con su integración en herramientas tecnológicas que
faciliten el proceso de análisis y de interpretación de fenómenos espaciales (Ordóñez Galán,
2010).
Se citan algunos ejemplos donde la comprensión de un fenómeno mejora significativamente al
involucrar el análisis mediante estadística espacial. En estudios urbanos se encuentra el
análisis de clústers espaciales en ciudades, interacción entre regiones y patrones de similitud
en construcciones urbanas. (Zechun Cao, 2013). En estudios poblacionales como el análisis de
comportamientos cooperativos en poblaciones de individuos con características heterogéneas
dispuestos en patrones agregados espacialmente (Shaolin Tan, 2013). Inclusive en la detección
de clúster espaciales en accidentes de tránsito, correlacionando localización con otras variables
no espaciales involucradas en el análisis (Dapeng Li, 2013). Finalmente en la identificación de
la distribución espacial de la mortalidad por enfermedad cardiaca en el estado Rio Grande do
Sul de Brasil (De Andrade L., 2013), y análisis de la correlación espacial con otras variables
socioeconómicas y geográficas mediante el cálculo de la matriz de pesos espaciales y el índice
I de Morán con los software QGIS y Geoda.
Al estudiar los ejemplos presentados se compueba la importante utilidad que tiene el análisis
espacial en la detección de correlación espacial e interacción entre variables geográficas,
demograficas, socioeconómicas, entre otras. Varios de los hallazgos encontrados en los
LATTICEDATA 2015
Página 5 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
ejemplos presentados no se hubiesen detectado con facilidad sin la aplicación de técnicas de
estadística espacial mediante completas herramientas de software.
Para analizar este tipo de relaciones espaciales se han formulado diferentes modelos
estadísticos que involucran el estudio de eventos estadístico-regionales (Cepal – Naciones
Unidas, 2014) en los que las variables son estudiadas con respecto al territorio. El análisis de
este tipo de datos permite identificar la distribución de los eventos, regular o irregularmente
espaciada, conocer cuales presentan autocorrelación espacial y la intensidad de esta,
entendiendo como correlación espacial la característica según la cual la presencia de una
determinada cantidad o calidad de la variable estudiada en una zona o región hace más o
menos probable su presencia en las zonas o regiones vecinas (Cliff, 1973), es decir, evidencia
el grado de similaridad entre entidades geográficas con proximidad espacial.
Recientes desarrollos de funciones estadísticas que incluyen la dimensión geográfica
en software facilitan modelar dichos efectos estadísticos-territoriales y han permitido analizar
los patrones de relación entre unidades territoriales vecinas planteando asi preguntas acerca de
la dimensión territorial y su efecto sobre los diferentes fenómenos de estudio (Cepal –
Naciones Unidas, 2014).
El estudio de la autocorrelación espacial permite mapear cómo se distribuye la variable de
estudio en la zona evaluada e identifica la presencia de agregaciones de la misma, es decir, es
posible identificar zonas donde se agrupan unidades territoriales con valores similares para
una misma variable observada (Cepal – Naciones Unidas, 2014). La identificación de estas
relaciones espaciales se hace por medio de distintos análisis estadísticos, entre los cuales se
destaca por su facilidad de implementación e interpretación el índice I. de Moran global.
El objetivo de este documento es realizar un análisis exploratorio de datos espaciales (AEDE)
de tipo polígono, comúnmente denominados lattice, para estimar, visualizar e interpretar de
manera sencilla el grado de autocorrelación espacial (AE), mediante el cálculo de la matriz de
pesos, el uso del índice estadístico I. de Morán Global, su significancia y el diagrama de
dispersión asociado, todo esto integrado directamente en la herramienta SIG facilitando el
estudio del analista como base para la determinación de la distribución y/o agregación espacial
del fenómeno en el territorio. Esta herramienta de tipo plugin ofrece información cuantitativa
y cualitativa que le permite al usuario interpretar de manera sencilla la presencia de
autocorrelación espacial, así como las principales cartacterísticas de la misma. Se emplea el
lenguaje de programación python, lenguaje interpretado integrado al software geográfico
LATTICEDATA 2015
Página 6 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
QGIS definido como PyQGIS ya que esta intregracion permite el uso de metodos propios que
facilitan el desarrollo y la implementación.
MARCO CONCEPTUAL
El análisis de vecindad y autocorrelación espacial en conjuntos de datos de tipo lattice o
polígonos, inicia con el cálculo de la matriz de vecindad obtenida al evaluar un criterio de
vecindad para todos los elementos. Posteriormente se estima el índice I de Morán Global, al
cual se le hace un test estadístico para determinar su significancia. En este test la hipótesis
nula es la completa aleatoriedad espacial pero que al ser rechazada, es decir, al existir
posiblemente autocorrelacion, esta puede ser positiva o negativa.
Criterios de vencindad y matriz de pesos
Los criterios de vecindad o contigüidad en que se basan los índices están referidos a fronteras
comunes entre las áreas. Los criterios basados en contiguidad se asemejan a la localización de
las piezas de un tablero de ajedrez y relacionadas con sus movimientos: reina, torre, alfil.
Existen además otros criterios relacionados con rangos de distancia, o k-vecinos (Sánchez,
2004). Dos áreas serán o no vecinas según el criterio seleccionado. Los criterios utilizados
son:
1. Reina (queen): Considera vecinas a aquellas unidades espaciales que comparten un
vértice o arista.
2. Torre (rook): Es más restrictivo, considera vecinas a aquellas unidades espaciales que
comparten una arista.
3. Alfil (bishop): Este considera como vecinos a aquellas unidades espaciales con las que
únicamente se comparte un vértice.
4. k-vecinos: Considera vecinas a un número k de unidades, que son las más cercanas.
5. Intervalo de distancia: Considera vecinas a las áreas que se encuentren a una distancia
comprendida dentro de un intervalo dado. Además se da la posibilidad de considerar
una vecindad simétrica, es decir, que no se consideren influencias no recíprocas.
LATTICEDATA 2015
Página 7 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
También se han empleado criterios de pesos que vienen dados por la importancia y/o
ponderación de acuerdo a la intensidad de las variables seleccionadas (Bivand R., 2008). Si
además se tiene en cuenta la distancia, se calculan los pesos según un criterio de proximidad
física. Con base en el criterio de vecindad seleccionado, se obtiene entonces la matriz de pesos
espaciales que proporciona información acerca de cuáles son los que elementos manifiestan
proximidad espacial entre ellos.
Medida de autocorrelación espacial – Índice I de Morán
El índice I. de Morán global es un índice de co-variación entre diferentes zonas, que varía en
el intervalo (-1 , 1). Un valor de 0 indica que no existe autocorrelación entre los datos
estudiados. Si es diferente a 0, habría autocorrelación. Si el valor es positivo y cercano a 1
indica que hay autocorrelación espacial positiva y que podría existir agregación espacial,
mientras que un valor negativo, cercano a -1, indica que existe correlación negativa, lo que se
interpreta como una dispersión superior a la que resultaría si se distribuyeran aleatoriamente
(Ordóñez Galán, 2010). La expresión matemática del Índice I. de Moran global es la siguiente
(Rogerson, 2001)
∑ ∑ ̅ ̅
∑ ∑ ∑ ̅
Donde N es el numero de casos, xi es el valor de la variable en un lugar determinado y xj el
valor de la variable en otro lugar (donde i ≠ j), x es la media de la variable y Wij es un peso
aplicado a la comparación entre la localización i y la localización j.
El índice I. de Morán va acompañado de una prueba de hipótesis, bajo el supuesto de
normalidad. La hipótesis nula (H0) establece que no hay autocorrelación espacial. La
interpretación del índice I de Morán es fundamental para comprender la interacción de los
elementos espaciales cuando se involucra en el análisis una variable espacial o no observada
en cada uno de ellos.
Diagrama de dispersión de Morán
Este diagrama de dispersión dispone en el eje de las abscisas todos los valores observados para
la variable de estudio, y en el eje de las ordenadas el promedio ponderado de la variable
observada en los elementos considerados como vecinos del elemento de interés. Cada uno de
LATTICEDATA 2015
Página 8 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
los puntos formados en el diagrama de dispersión se ubica en uno de los cuatro cuadrantes del
plano cartesiano, evidenciando elementos presentes en relaciones espaciales alto-alto, alto-
bajo, bajo-alto y bajo-bajo con sus vecinos
METODOLOGÍA
La metodología presentada a continuación considera la descripción general del sistema en
donde se presentan las funcionalidades implementadas, los requerimientos funcionales y no
funcionales y finalmente el análisis del sistema en cuanto a los componenetes del mismo.
Descripción general
Se propone el diseño y construcción de un plugin para el análisis exploratorio de datos
espaciales (AEDE) y del grado de autocorrelación espacial (AE) de datos lattice a partir del
índice I. de Morán global. Este plugin implementaría en términos generales las siguientes
funcionalidades:
a) Análisis de contiguidad: Selección del criterio de vecindad con sus respectivos
parámetros para evaluar la adyacencia o contiguidad entre elementos del conjunto de
datos.
b) Generación de matriz de pesos: El usuario puede seleccionar el método para la
generación de la matriz de pesos, por adyacencia, distancias o por los k vecinos más
cercanos. Luego de seleccionar el método el usuario puede almacenar la matriz
generada en formato .gal o .dbf.
c) Cálculo y análisis de I. de Morán: Una vez generada la matriz se procede a evaluar el
índice I. de Morán para analizar la autocorrelación espacial. Para ello el usuario
selecciona el campo relacionado con la descripción regional del área de estudio, dato
con el cuál el plugin implementa el cálculo e interpretación del índice. La herramienta
muestra el valor del índice en el intervalo (-1,1), el p-valor del test estadístico al 95%
de significancia sobre una distribución de probabilidad normal estándar, la
interpretación del grado y tipo de autocorrelación espacial que caracteriza a los datos.
d) Diagrama de dispersión de Morán: Con base en los valores observados por cada
elemento y el promedio ponderados de sus vecinos inmediatos se genera un diagrama
de dispersión que permite la identificación de elementos que evidencian
autocorrelación espacial nula, positiva y/o negativa.
LATTICEDATA 2015
Página 9 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
Requerimientos funcionales
a) Selección de la capa de información: Ofrecer un menú del tipo “combo-box” que
permita al usuario seleccionar la capa de datos de tipo polígono, con al menos un
campo numérico para el análisis de contiguidad.
b) Generación de matriz de pesos: Mostrar las alternativas de criterios de vecindad y sus
parámetros para la generación de una matriz de pesos. Debe proporcionar al usuario la
posibilidad de explorar las carpetas para seleccionar una matriz existente o definir el
directorio para almacenar una nueva.
c) Cálculo y análisis de I. de Morán: Selección de una matriz creada o existente y
posterior cálculo del índice. El usuario debe seleccionar el campo numérico asociado a
la capa de tipo lattice. Se realizará el cálculo del índice y el p-valor, luego se mostrará
la interpretación que se hace de este índice con base en el p-valor y la significacncia
del test.
d) Generación del diagrama de dispersión: El usuario debe seleccionar la opción de
“Scatter Plot” para visualizar la gráfica del diagrama de dispersión de Morán.
Requerimientos no funcionales
El plugin desarrollado debe cumplir con las siguientes características:
a) La herramienta contará con interfaz integrada al software QGIS, aprovechando la
posibilidad de despliegue de las capas geográficas en este.
b) El plugin debe contar con una interfaz amigable que le permita al usuario adelantar el
análisis cualtitativo y gráfico del índice de correlación espacial.
c) La herramienta requiere que el usuario cuente con conocimientos básicos en estadística
espacial que le permitan comprender el resultado proporcionado por el plugin.
d) El sistema debe responder rápidamente a la solicitud del usuario.
Análisis del sistema
Para el análisis de la autocorrelación espacial de datos Lattice a partir del índice estadístico I.
de Morán Global fue desarrollado un plugin con el objetivo de optimizar el proceso e incluir la
interpretacion de resultados, ofreciéndole al usuario datos cuantitativos y cualitativos para
identificar la existencia y grado de autocorrelación espacial presente en los datos de estudio.
Para la creación de esta herramienta se definen los siguientes aspectos:
LATTICEDATA 2015
Página 10 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
Software de despliegue
Para el análisis de datos espaciales, integrando variables espacio-temporales, el usuario SIG
cuenta con múltiples plataformas tecnológicas robustas, que le ofrecen diferentes opciones
para la integración, despliegue y análsis de información geográfica. Para el desarrollo del
presente estudio fue seleccionado el software QGIS, dado que es una plataforma tecnológica
libre y de código abierto, que le ofrece al usuario la libertad de usar y modificar las
herramientas disponibles. Se cuenta con el entorno para el diseño de interfaz gráfica Qt (The
Qt Company, 2015), y específicamente el plugin PyQT (Riverbank Computing, n.d.), que se
integra con el lenguaje de programación Python permitiendo la rápida creación de interfaces
con una variedad de widgets evitando el analisis de informacion mediante la escritura de
código como lo puede ofrecer el software R, logrando generar la interfaz gráfica de
aplicaciones tan robustas como Dropbox o QGIS.
Al comparar con software como ArcGIS (Environmental Systems Research Institute ESRI,
n.d.) y gvSIG (Asociación gvSIG, 2015) se destaca que QGIS dispone de varios entornos de
desarrollo para la generación de herramientas personalizadas, con funciones definidas por el
usuario. También, al ser un software libre y multiplataforma, permite que el desarrollo
abordado por el presente estudio sea usado por una mayor cantidad de usuarios.
Integración de componentes
Para la implementación de los procesos de análisis de datos lattice se utilizó principalmente la
librería PySAL (Sergio J. Rey, 2015). En la integración de las funcionalidades se utilizó el
lenguaje de programación Python ( Python Software Foundation, 2015), entre otras cosas por
su versatilidad e interoperabilidad, permitiendo realizar códigos en sintaxis limpia y legible.
Es además uno de los principales lenguajes de desarrollo implementados para la realización de
funciones estadísticas para su aplicación en software geográfico, como ArcGIs y QGIS. Este
lenguaje es uno de los más usados para la generación de herramientas y scripts dentro del
software seleccionado para este estudio, QGIS, a través de la herramienta PyQGIS, usando un
intérprete de código funcional.
Pysal (PySAL Developers; 2009-13 Sergio Rey. , 2015) es una biblioteca de código abierto
que contiene funciones de análisis espacial, construidas usando el lenguaje de programación
Python, las cuales son base para el desarrollo de aplicaciones y herramientas automatizadas de
procesos matemáticos y estadísticos. Al ser libre, permite la integración y uso de múltiples
LATTICEDATA 2015
Página 11 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
funciones dentro de software geográfico y su despliegue en herramientas automatizadas, caso
del presente estudio.
Sistema de evaluación de calidad del producto de software
El plugin desarrollado, denominado Lattice Data, será evaluado bajo tres métodos diferentes,
definidos a continuación:
a) Evaluación por parte del usuario: El usuario, actor final de la implementación del
desarrollo elaborado a partir de este estudio, será el principal veedor de la
funcionalidad del mismo. El usuario permitirá identificar parámetros de usabilidad,
fiabilidad y portabilidad a partir del uso. La distribución del sistema de evaluación por
parte de usuarios finales se compone de:
i. Selección de muestra de población: De acuerdo con los requerimientos
funcionales definidos en secciones anteriores, el usuario de este plugin debe
tener relación laboral o académica con trabajos que involucren estadística
espacial. Para el estudio inicial, se seleccionó como población objetivo
estudiantes de Especialización en Sistemas de Información geográfica, quienes
tienen conocimientos del procesamiento e interpretación de información lattice.
ii. Notificación: A la población objeto se le envío un correo electrónico con los
archivos que integran el plugin y una guía de instalación y uso del mismo.
iii. Recepción de comentarios: A través del correo electrónico usado para la
notificación de los estudiantes, se reciben todos los comentarios derivados del
uso del plugin. Esta información es almacenada en un repositorio con el
objetivos de su posterior evaluación, del cuál se identificarán aciertos, errores y
posibles mejoras.
b) Evaluación por comunidad desarrolladora: El plugin fue almacenado en el repositorio
de software oficial de QGIS (https://plugins.qgis.org/plugins/LatticeData/) cuyo
repositorio de código esta soportado en GitHub (GitHub, Inc, 2015) al cual se puede
acceder mediente el enlace https://github.com/darodriguezalv/LatticeData, donde la
comunidad de desarrollo evalúa cada funcionalidad integrada, la interfaz gráfica, el
despliegue y respuesta de la herramienta. Cada especialista y desarrollador involucrado
emite conceptos técnicos y metodológicos para notificar errores y opciones de mejora
del plugin creado. Estas observaciones son almacenadas dentro de la cuenta de
LATTICEDATA 2015
Página 12 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
desarrollo creada para almacenar la herramienta en dicho repositorio y evaluadas por
parte del equipo de trabajo involucrado en el proceso.
c) Evaluación por parte del grupo de trabajo: Para este proceso, el equipo de trabajo
involucrado en las tareas de formulación, diseño e implementación del software
realizará una evaluación de la calidad mediante el uso de la norma ISO 9126.
RESULTADOS
Los resultados presentados obedecen a dos componentes principales, el primero de ellos sobre
el desarrollo del plugin y el segundo de ellos sobre la evaluación de calidad considerando la
metodología presentada.
Diseño del plugin
La metodología de diseño involucra inicialmente la definición de los casos de uso, luego los
diagramas de actividad, el diagrama de componentes y finalmente el diagrama de clases.
Casos de uso
De acuerdo con la metodología implementada se definen para el diseño del plugin dos casos
de uso (Figura 1). El primero involucra el cálculo de la matriz de pesos y el índice I de Morán
Global, el segundo caso de uso difiere en que se utiliza una matriz de pesos existente en vez de
calcularla. Para aplicar este análisis es necesario que el usuario seleccione una capa de tipo
polígono, con al menos un campo numérico de información.
Figura 1. Diagrama de casos de uso
Fuente: elaboración propia
LATTICEDATA 2015
Página 13 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
Actividad e interacción con el usuario
La interacción del usuario con el plugin desarrollado debe contemplar la menor complejidad
posible, permitiendo una mejor experiencia en cuanto a la usabilidad y rendimiento de la
misma. Tanto en el caso de uso 001 (Figura 2¡Error! No se encuentra el origen de la
referencia. - izquierda), como en el caso de uso 002 (Figura 2- derecha), el número de pasos
que el usuario debe invertir para obtener el resultado esperado debe ser el menor posible,
permitiendo ahorrar tiempo y trabajo en el uso de la herramienta.
Figura 2. Diagrama de secuencias Caso de uso 001 (izquierda) y caso de uso 002 (derecha)
Fuente: elaboración propia
Componentes integrados en el plugin
Los componentes y lógica del plugin desarrollado son modelados a partir del diagrama de
componentes (Figura 3), el cual permite identificar el diseño abordado para la ejecución de
mismo.
LATTICEDATA 2015
Página 14 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
Figura 3. Diagrama de componentes
Fuente: elaboración propia
Los componentes integrados para conformar el plugin se implementaron por separado en la
parte lógica (Tabla 1) y de presentación (Tabla 2) que lo componen.
Tabla 1. Lógica – Back End
Componente Descripción
SciPy Se utiliza la librería para obtener las distancias entre las posibles parejas de
polígonos del conjunto de datos.
NumPy
Se utiliza para el almacenamiento, manipulación y consulta de arreglos de valores.
Adicionalmente para obtener un modelo lineal ajustado de los puntos presentes en el
diagrama de dispersión y para la transformación de las variables a una distribución
normal estándar para su presentación en el diagrama de dispersión.
QGIS Core Utilizada para acceder a las capas de información espacial de tipo polígono y para la
consulta de los atributos asociados a cada elemento de la capa.
PySal
Utilizada para la generación y consulta de matrices de vecindad según el criterio de
vecindad seleccionado, definiendo los parámetros correspondientes a cada criterio.
Adicionalmente para calcular los índices I de Morán global.
LatticeData
Clase en lenguaje Python, creada con el objetivo de integrar las funcionalidades de
los demás componentes de la parte lógica. Es el componente de procesamiento
principal del plugin LatticeData.
Fuente: elaboración propia
LATTICEDATA 2015
Página 15 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
Tabla 2. Presentación - FrontEnd
Componente Descripción
QGIS Canvas Es el componente de QGIS que proporciona el lienzo de trabajo donde se visualiza
la capa de tipo polígono a la que se hace el análisis Lattice.
MatPlotLib Se utiliza para crear la gráfica donde se presenta el diagrama de dispersión,
también permite editar sus rótulos, colores y presentación.
QGIS GUI Este componente es el entorno gráfico de QGIS, con este se carga la capa de
información geográfica y se activa el plugin para su ejecución.
Qt4-PyQt4
Con este componente se crea la interfaz gráfica para el plugin de QGIS y se
determina el comportamiento que tiene cada uno de los controles gráficos con los
que interactúa el usuario cuando está utilizando el plugin.
LatticeData-
Dialog
Este componente es el que interactúa directamente con el usuario. Cuenta con
varios controles gráficos con los que el usuario parametriza la generación de la
matriz de vecindad y el cálculo de los índices I de Morán global con base en una
capa de información geográfica.
Fuente: elaboración propia
Interfaz del plugin
Se presenta la interfaz gráfica (Figura 4) del plugin LatticeData, que cuenta con dos paneles
principales. El del lado izquierdo donde se define el criterio de vecindad y sus respectivos
parámetros para la creación de una matriz de pesos. El panel derecho permite obtener el índice
I de Morán Global con su p-valor, así como una breve interpretación del valor obtenido y la
posibilidad de visualizar el diagrama de dispersión de Morán.
LATTICEDATA 2015
Página 16 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
Figura 4. Interfaz gráfica de usuario del plugin LatticeData
Fuente: elaboración propia
Evaluación de calidad del producto de software generado
El resultado de la implementación del plugin Lattice Data es:
a) Matriz de pesos para el análisis de vecindad y contigüidad, base para el cálculo de la
correlación espacial.
b) Índice I. de Morán, con el análisis de correlación espacial. Se obtiene el valor de índice
y el p-valor junto con una interpretación que índica la presencia y el tipo de
autocorrelación espacial. Se presenta como opción la posibilidad de visualizar en
términos generales las tendencias de agregación y/o autocorrelación espacial de valores
altos o bajos de la variable mediante el diagrama de dispersión de Morán.
Con base en la evaluación de calidad del software por parte del equipo de trabajo mediante el
uso de la norma ISO 9126 (Rüdiger L., 2007), se presenta a continuación la matriz que
involucra las seis características principales evaluadas (Duran G., n.d.). Cada característica se
compone de varias subcaracterísticas que a su vez se evalúan en una escala de 1 a 5, siendo 5
la calificación para aquellas subcaracterísticas que presentan condiciones óptimas en el
LATTICEDATA 2015
Página 17 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
software y 1 la calificación que representa una gran deficiencia en la subcaracterística
correspondiente.
Tabla 3. Matriz de evaluación
Característica Subcaracterística Descripción Calificación
Funcionalidad
Adecuación
Distinción entre los diagramas de
secuencia y el registro de control de
los procesos y procedimientos del
sistema de forma que estos sean
correctos y funcionales.
4
Exactitud Identificación de los componentes con
sus respectivas funciones. 4
Interoperabilidad Capacidad para trabajar con
plataformas estándar. 5
Seguridad
Mecanismos para garantizar la
seguridad en el acceso a la
información y a la integridad del
software.
3
Confiabilidad
Recuperabilidad
Mecanismo para reestablecer el nivel
de desempeño y recuperar datos.
Utilidad de backup y restore.
4
Tolerancia a fallas Mecanismos o componentes del
software para manejo de excepciones. 4
Eficiencia
Desempeño
Funcionamiento correcto de los
componentes involucrados en la
ejecución de las funcionalidades
principales.
5
Utilización de los
recursos
Relación de los componentes respecto
al uso de almacenamiento y tiempo de
ejecución, así como al uso de recursos
de hardware.
5
Mantenibilidad
Acoplamiento Interacción correcta entre los
componentes del software. 5
Modularidad Relación del número de componentes
que dependen de otro componente del 4
LATTICEDATA 2015
Página 18 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
Característica Subcaracterística Descripción Calificación
sistema.
Portabilidad
Adaptabilidad El software cuenta con mecanismos de
adaptación a diferentes entornos. 4
Instalabilidad Facilidad para el proceso de
instalación, pocos pasos. 3
Coexistencia Posibilidad de operar junto con otros
software ya instalados. 5
Reemplazabilidad
Proporción de componentes
reemplazables y capacidad de ser
utilizado por otro software en un
entorno diferente.
4
Usabilidad
Comprensibilidad
Determina que tan fácil es que el
usuario comprenda el funcionamiento
del software, con base en el modelo
mental que él tiene y los mecanismos
de interacción que ofrece el sistema.
5
Aprendizaje
Corresponde al esfuerzo que deben
hacer los nuevos usuarios para
aprender a utilizar el software. Varía
según el conocimiento que el usuario
tenga acerca del contexto técnico y el
objetivo del software.
4
Operabilidad
Facilidad que presenta el software para
ser operado por un usuario dado en
algún contexto específico.
4
Promedio 4.23
Fuente: elaboración propia
Con base en la calificación asignada a cada una de las características y subcaracterísticas se
calcula luego el promedio aritmético, obteniendo una calificación de 4.23. El equipo de trabajo
que desarrolló el plugin considera que el software es de buena calidad y logra cumplir con los
requerimientos y las expectativas inicialmente planteadas.
LATTICEDATA 2015
Página 19 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
EJEMPLO: HOGARES CON VIVIENDA PROPIA EN MUNICIPIOS DE
ANTIOQUIA
Como ejemplo de aplicación del plugin se analiza una capa de datos tipo lattice, en la que la
variable de interés es el porcentaje de hogares con vivienda propia en el Departamento de
Antioquia. Con uso del plugin LatticeData hace el estudio para los años 1993 (Figura 5) y
2005 (Figura 6).
Figura 5. Porcentaje de hogares con vivienda en Antioquia año 1993
Figura 6. Porcentaje de hogares con vivienda en Antioquia año 2005
LATTICEDATA 2015
Página 20 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
Se evidencia que del año 1993 al año 2005 disminuyó considerablemente el número de
municipios en los que la cantidad de hogares con vivienda propia es mayor al 50%. Las
condiciones socioeconómicas de la población parecen estar desmejorando, o podría deberse a
un incremento rápido de población que no ha sido acompañado con un desarrollo económico
integral de los hogares.
Se calcula para cada año la matriz de pesos con el criterio de k-vecinos más cercanos,
definiendo el número de vecinos igual a cuatro para los dos casos.
Tabla 4. Índices I de Morán para los años 1993 y 2005
Capa/año Índice I de
Morán Global p-valor Interpretación
1993 0.42424 0.0 P-valor significativo (confianza 95%): posible
autocorrelación espacial débil.
2005 0.39511 0.0 P-valor significativo (confianza 95%): posible
autocorrelación espacial débil.
Fuente: elaboración propia
Se evidencia en la Tabla 4 que en los dos casos el p-valor es muy cercano a cero, por lo cual se
rechaza la hipótesis nula de no autocorrelación espacial. Por otro lado, se observa también que
en los dos casos hay una autocorrelación espacial positiva, lo que indica que los municipios
con necesidades similares de vivienda se localizan de forma agregada en el espacio. Sin
embargo, el grado de autocorrelación y agregación disminuyó para el año 2005, lo cual
significa que además de incrementar el déficit de vivienda para los hogares antioqueños (como
se evidencia en la Figura 5 y Figura 6) también se diseminó esta situación en el departamento
y ya no se concentra en algunas regiones específicas.
TRABAJO FUTURO
El plugin desarrollado permite realizar un análisis inicial de datos tipo lattice identificando la
existencia y tipo de autocorrelación espacial para las variables de estudio. Sin embargo, los
análisis que pueden surgir a partir de su implementación tienen un carácter descriptivo, por lo
cual se requiere de una continua evolución que integre el uso de mayor cantidad de
herramientas que no solo determinen la existencia de autocorrelación espacial, sino que
además permita identificar el grado de autocorrelación espacial, la distribución regional de la
variable de estudio y la presencia de valores altos y bajos de la variable (Hot Spots). Este tipo
LATTICEDATA 2015
Página 21 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
de información es de gran utilidad para determinar la relación espacial de la variable y la
región donde se presenta, permitiendo caracterizar posibles fuentes y consecuencias de su
patrón de ocurrencia.
Para el mejoramiento y evolución de la herramienta es importante agregar ítems para el
cálculo del índice de I. de Morán local y C. de Geary, los cuales permiten identificar unidades
territoriales donde valores de análisis altos o bajos se agrupan espacialmente, así como
también unidades territoriales con valores muy distintos a los de las áreas circundantes (Cepal
– Naciones Unidas, 2014).
Involucrar este tipo de herramientas dentro del plugin permitirá realizar un análisis minucioso
de variables espacio temporales desde la perspectiva de la estadística especial, constituyendo
un referente para identificar la relación de las variables con entornos regionales. Hasta el
momento el software geográfico QGIS no contempla herramientas de este tipo, por lo que es
un buen inicio para la realización y aplicación de las mismas cuya ventaja será la integración
dentro del mismo SIG.
Este plugin también puede ser mejorado a partir del estudio y comparación con herramientas
existentes en otros software para manejo de información geográfica, los cuales aportarán a la
evolución del mismo.
Por último el plugin podría extender su funcionalidad mediante la implementación de análisis
sobre otro tipo de datos espaciales en múltiples formatos.
CONCLUSIONES
Se logró el desarrollo integrado al software QGIS para realizar el análisis exploratorio de datos
espaciales (AEDE) de tipo lattice, que adicional a la estimación del grado de autocorrelación
de una variable espacial mediante el índice estadístico de I. de Morán Global facilita la
interpretación de los valores obtenidos de manera concreta.
El plugin proporciona el índice I de Morán Global y el p-valor resultante del test para evaluar
su significancia estadística, el mensaje de interpretación del resultado y el diagrama de
dispersión, información necesaria en la aplicación de conceptos de estadística espacial para
lograr el fin de los sistemas de información geográfica consistente en la caracterización de
fenómenos con componente espacial para entender y orientar la solución de problemáticas.
LATTICEDATA 2015
Página 22 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
La integración con el software QGIS para manejo de sistemas de información geográfica,
posibilita el uso del plugin a un importante número de usuarios SIG dado que es una
herramienta robusta, de código abierto y multiplataforma para el manejo de información
geográfica.
El proceso de evaluación de la calidad del software mediante el diseño e implementación de
varias estrategias, destacando la publicación del software en el repositorio de colaboradores
GitHub permitió la depuración y validación de errores así como la optimización de flujos de
trabajo y orientando las actividades sugeridas para el trabajo futuro en virtud de las
contribuciones recibidas.
BIBLIOGRAFÍA
Python Software Foundation. (2015). Python Developer’s Guide. Obtenido de
https://docs.python.org/devguide/
Anselin, L. (1988). Spatial Econometrics: Methods and Models. Kluwer Academic Publishers,
The Netherlands.
Anselin, L. y. (1992). Spatial econometrics in practice. A review of software options. Regional
Science and Urban Economics, 22(3): 509-536.
Asociación gvSIG. (2015). gvSIG Desktop. Obtenido de
http://www.gvsig.com/es/productos/gvsig-desktop
Bivand R., P. E. (2008). Applied Spatial Data Analysis with R. Springer. 21-268. .
Cepal – Naciones Unidas. (2014). Guía para estimar la pobreza infantil. Información para
avanzar en el ejercicio de los derechos de los niños, niñas y adolecentes.
Cliff, A. y. (1973). Spatial Autocorrelation.
Dapeng Li, J. S.-W. (2013). Discovering Spatial Co-Clustering Patterns in Traffic Collision
Data. ACM SIGSPATIAL IWCTS’13. ACM ISBN 978-1-4503-2527-1/12/11.
De Andrade L., C. L. (2013). Spatial distribution of ischemic heart disease mortality in Rio
Grande do Sul, Brazil. HealthGIS '13. ACM ISBN 978-1-4503-2529 5/13/11.
LATTICEDATA 2015
Página 23 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
Duran G., R. I. (s.f.). Matriz de evaluación de software según modelo ISO/IEC 9126. Obtenido
de https://microevolution.wikispaces.com/2.-
+%C2%BFQu%C3%A9+es+una+Matriz+de+Evaluaci%C3%B3n+de+Software%3F
Environmental Systems Research Institute ESRI. (s.f.). ArcGIS. Obtenido de
https://www.arcgis.com/features/
GitHub, Inc. (2015). GitHub. Obtenido de https://github.com/darodriguezalv/LatticeData
Martori, J. C. (2008). Nuevas técnicas de estadística espacial para la detección de clusters
residenciales de población inmigrante. Revista Electrónica de Geografía y Ciencias
Sociales. Universidad de Barcelona, Vol. XII, número 263.
Moreno, R. V. (2002). Nuevas técnicas para el análisis regional: Una aplicación a las regiones
europeas. . Investigaciones regionales: Asociación española de Ciencia Regional.
Ordóñez Galán, C. V. (2010). Desarrollo de un SIG para el análisis de patrones espaciales de
incendios en viviendas. Departamento de Ingeniería de los Recursos Naturales y Medio
Ambiente (IRNMA), Escuela Universitaria de Ingeniería Técnica Industrial, Rúa
Torrecedeira, 86, 36208 Vigo (España).
P., R. (2001). Statistical methods for geography. SAGE Publications.
PySAL Developers; 2009-13 Sergio Rey. . (2015). PySAL — Python Spatial Analysis Library.
Developers Guide. Obtenido de
https://pysal.readthedocs.org/en/latest/developers/index.html
R., P. (2001). Ingeniería del software:un enfoque práctico. Quinta Edición. McGRAW-
HILL/Interamericana de España. Aravaca, España.
Riverbank Computing. (s.f.). What is PyQt? Obtenido de
https://riverbankcomputing.com/software/pyqt/intro
Rogerson. (2001). Statistical methods for geography. SAGE Publications.
Rüdiger L., W. L. (2007). Software Quality ISO Standards. ARiSA Applied Research in System
Analysis. Obtenido de http://www.arisa.se/compendium/node6.html
LATTICEDATA 2015
Página 24 de 24
Lattice Data: Plugin de QGIS que implementa análisis estadístico
exploratorio de datos lattice para la identificación de correlación
espacial
Sánchez, S. (2004). El estudio econométrico de la concentración espacial de la industria:
Ejemplo de aplicación en Madrid, Toledo y Guadalajara. Anales de Geografía, número
24 207-227. ISSN: 0211-9803. .
Sergio J. Rey, P. D. (2015). Python Spatial Analysis Library - PySAL Documentation,
Developer Guide. Obtenido de
https://pysal.readthedocs.org/en/latest/developers/index.html
Shaolin Tan, J. L. (2013). Inheritance of spatial neighbourhood- A feasible mechanism for
evolution and maintenance of cooperation. Proceeding of the 32nd Chinese Control
Conference.
The National Institute of Justice Washington. (2009). CrimeStat Manual.
The Qt Company. (2015). Qt Documentation. Obtenido de http://doc.qt.io/
Zechun Cao, S. W. (2013). Analyzing the Composition of Cities Using Spatial Clustering.
ACM 978-1-4503-2331-4/13/08.