Capitulo3_2013

38
Análises Estatísticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha Página 3-1 3 ANÁLISES EXPLORATÓRIAS NÃO-ESPACIAL E ESPACIAL 3.1 Introdução De modo semelhante à estatística clássica, antes de proceder a qualquer modelagem estatística, é preciso fazer uma análise exploratória dos dados. A análise exploratória de dados é o processo que utiliza tabelas, gráficos e medidas de representatividade (também chamadas medidas de tendência central) e de variabilidade para investigar um conjunto de dados e compreender suas características mais importantes, tudo direcionado para identificar padrões relacionamentos nos dados. Divide-se em Análise Exploratória Não-espacial de Dados ou, simplesmente, Análise Exploratória de Dados (Exploratory Data Analysis EDA) e, no campo do espaço, em: a) Análise Exploratória de Dados Espaciais ( Exploratory Spatial Data Analysis ESDA), e b) Análise Espaço-Temporal de Dados Espaciais ( Exploratory Spatio-temporal Data Analysis ESTDA). A Análise Exploratória Não-espacial de Dados é a clássica Estatística Descritiva que inclui, por exemplo, a média, a moda, a mediana e o desvio-padrão. Estes, no contexto de dados espaciais, representam resumos estatísticos de tabelas de atributos e valores de grade ( grid), bem como gráficos como os histogramas e os diagramas de caixa. A Análise Exploratória de Dados Espaciais aplica técnicas para descrever e visualizar distribuições espaciais, identificar situações atípicas e descobrir padrões de associação espacial, conglomerados (clusters) e sugerir regimes espaciais ou formas de heterogeneidade espacial empregando representações específicas que consideram a localização dos dados, tais como Box Maps e mapas de Moran (a serem vistos no parágrafo 3.6). Essa análise de dados espaciais é feita quando for preciso considerar a importância da disposição espacial dos fenômenos que originaram esses dados. Na análise espaço-temporal, considera-se, agora, o tempo como um dos enfoques complementares dos mesmos dados, o que conduz à necessidade de se realizar uma análise sistemática da evolução de padrões espaciais no tempo, além da distribuição do comportamento temporal no espaço. Entretanto, devido às bases de dados espaço-temporais serem complexas e, muitas vezes, incompletas ou inconsistentes, usualmente os dados são divididos e explorados em estratos. Por exemplo, classificar pessoas por idade, sexo ou nacionalidade ao longo do tempo.

description

Análises exploratorias espacial e não espacial.

Transcript of Capitulo3_2013

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-1

    3

    ANLISES EXPLORATRIAS

    NO-ESPACIAL E ESPACIAL

    3.1 Introduo

    De modo semelhante estatstica clssica, antes de proceder a qualquer modelagem estatstica,

    preciso fazer uma anlise exploratria dos dados. A anlise exploratria de dados o processo que

    utiliza tabelas, grficos e medidas de representatividade (tambm chamadas medidas de tendncia

    central) e de variabilidade para investigar um conjunto de dados e compreender suas caractersticas

    mais importantes, tudo direcionado para identificar padres relacionamentos nos dados.

    Divide-se em Anlise Exploratria No-espacial de Dados ou, simplesmente, Anlise Exploratria de

    Dados (Exploratory Data Analysis EDA) e, no campo do espao, em:

    a) Anlise Exploratria de Dados Espaciais ( Exploratory Spatial Data Analysis ESDA), e

    b) Anlise Espao-Temporal de Dados Espaciais ( Exploratory Spatio-temporal Data

    Analysis ESTDA).

    A Anlise Exploratria No-espacial de Dados a clssica Estatstica Descritiva que inclui, por

    exemplo, a mdia, a moda, a mediana e o desvio-padro. Estes, no contexto de dados espaciais,

    representam resumos estatsticos de tabelas de atributos e valores de grade (grid), bem como

    grficos como os histogramas e os diagramas de caixa.

    A Anlise Exploratria de Dados Espaciais aplica tcnicas para descrever e visualizar distribuies

    espaciais, identificar situaes atpicas e descobrir padres de associao espacial, conglomerados

    (clusters) e sugerir regimes espaciais ou formas de heterogeneidade espacial empregando

    representaes especficas que consideram a localizao dos dados, tais como Box Maps e mapas

    de Moran (a serem vistos no pargrafo 3.6). Essa anlise de dados espaciais feita quando for

    preciso considerar a importncia da disposio espacial dos fenmenos que originaram esses dados.

    Na anlise espao-temporal, considera-se, agora, o tempo como um dos enfoques complementares

    dos mesmos dados, o que conduz necessidade de se realizar uma anlise sistemtica da evoluo

    de padres espaciais no tempo, alm da distribuio do comportamento temporal no espao.

    Entretanto, devido s bases de dados espao-temporais serem complexas e, muitas vezes,

    incompletas ou inconsistentes, usualmente os dados so divididos e explorados em estratos. Por

    exemplo, classificar pessoas por idade, sexo ou nacionalidade ao longo do tempo.

    IsabellaRealceIsabellaRealceIsabellaRealce
  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-2

    Como exemplo simples para distinguir estatstica no espacial da estatstica espacial, considere duas

    amostras, A e B, obtidas em regies diferentes, conforme a Tabela 3.1:

    Tabela 3.1 Dados de amostras obtidas em regies diferentes

    Para a Estatstica Clssica, a mdia e o desvio-padro amostral so iguais para as duas amostras.

    Entretanto, considerando a distribuio dos valores amostrais, a primeira amostra tem um

    comportamento errtico, enquanto a segunda apresenta um comportamento regular (Figura 3.1)

    Figura 3.1 Conjunto de valores iguais e representaes diferentes

    Desse modo, os mtodos clssicos da Estatstica no conseguem reconhecer a diferena existente

    entre as duas sries em estudo porque considera apenas os valores, sem considerar a posio

    espacial relativa de cada um deles.

    Os objetivos da anlise estatstica espacial so:

    1. compreender a disposio dos dados, verificando se podem ser considerados aleatrios ou

    tm um padro espacial nos locais observados;

    2. testar hipteses relacionadas a essa disposio dos dados, e

    3. estimar valores onde no h observaes.

    Em resumo, nada mais do que a aplicao, no espao, dos conceitos de estimao de parmetros

    e testes de hipteses da estatstica clssica. Para tanto, utilizam-se mtodos entre os quais se podem

    citar os essencialmente voltados visualizao dos dados espaciais, mtodos exploratrios na busca

    e no resumo das relaes e de padres e mtodos especificadores do modelo estatstico para a

    estimao de parmetros.

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-3

    Ateno especial deve ser dada a padres inesperados de comportamento e aos valores

    discrepantes (denominados outliers a serem vistos no pargrafo 3.6).

    Inicialmente, ver-se- a fase de anlise exploratria, associada apresentao visual de dados (sob

    forma de grficos e mapas) e a identificao de padres de dependncia espacial no fenmeno em

    estudo. Nos captulos 4 a 7, sero vistos o processo de modelagem desses fenmenos.

    3.2 Anlise exploratria no-espacial

    3.2.1 Grficos

    A visualizao grfica uma etapa importante da anlise espacial, porque ajuda a identificar padres

    e relacionamentos espaciais nos dados e permite determinar as respostas para perguntas como as

    seguintes:

    h valores discrepantes em relao ao conjunto de dados?

    as observaes podem ser classificadas em grupos distintos?

    h relacionamento entre as variveis?

    Entre os grficos mais utilizados na Cartografia destacam-se:

    a) Histograma, tambm chamado histograma de freqncias;

    b) Diagrama de caixa (conhecido tambm por grfico de caixa e boxplot), e

    c) Diagrama de disperso (scatter plot).

    3.2.1.1 Histograma:

    Grfico composto por retngulos justapostos em que a base de cada um deles, no eixo das

    abscissas, corresponde aos intervalos de classe e as suas alturas (no eixo das ordenadas)

    representa, usualmente, a frequncia dos dados no respectivo intervalo de classe ou, ento, essa

    frequncia de dados dividida pela amplitude do respectivo intervalo de classe (Figura 3.2).

    Figura 3.2 Histograma

    IsabellaRealce
  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-4

    3.2.1.2 Diagrama de Caixa (grfico de caixa ou boxplot):

    Possibilita representar a distribuio de um conjunto de dados com base nos seguintes parmetros

    descritivos:

    valor mnimo

    1. Quartil (Q1)

    Mediana (Q2)

    3.. Quartil (Q3)

    valor mximo.

    Com os valores de Q1 e Q3, calcula-se o chamado intervalo quartlico, IQR, (hinge em ingls), uma

    medida de disperso.

    IQR = Q3 - Q1

    Os valores de (Q1 - 1.5IQR) e (Q3 + 1.5IQR) so os limites alm dos quais os dados so

    considerados discrepantes (outliers, conceito a ser visto em no pargrafo 3.2.2).

    O grfico tem o seguinte aspecto: a parte central um retngulo, em cujo interior h uma linha

    horizontal que mediana. O limite inferior do retngulo indica o valor do 1. Quartil e o limite superior

    o 3. Quartil.

    A partir do limite inferior, traa-se uma haste que se estende do 1. Quartil at o menor valor maior

    que (Q1 - 1.5IQR), onde se traa outra linha horizontal.

    A partir do limite superior, traa-se uma haste que se estende do 3. Quartil at o maior valor menor

    que (Q3 + 1.5IQR), onde se traa outra linha horizontal.

    Os dados com valores inferiores a (Q1 - 1.5IQR) e superiores a (Q3 + 1.5IQR) so representados

    individualmente e considerados discrepantes (outliers) (Figura 3.3). Dependendo de quem analisa o

    problema, o valor do intervalo interquartlico pode ser multiplicado por 3, conforme ocorre no

    programa GeoDa.

    IsabellaRealce
  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-5

    Figura 3.3. Diagrama de caixa

    3.2.1.3 Diagrama de disperso (scatter plot)

    O diagrama de disperso cartesianos, ou seja, os conhecidos diagramas x-y (Figura 3.4)

    um grfico onde pontos no espao cartesiano XY so usados para representar

    simultaneamente os valores de duas variveis quantitativas medidas em cada elemento do

    conjunto de dados. Este o melhor mtodo de examinar os dados no que se refere

    ocorrncia de tendncias (lineares ou no), agrupamentos de uma ou mais variveis,

    mudanas de espalhamento de uma varivel em relao outra e verificar a ocorrncia dos

    chamados outliers. O Moran scatterplot um exemplo deste tipo de diagrama e ser visto

    em outro captulo.

    Tabela 3.2 Dados

    Observao Varivel X Varivel Y

    1 2 3

    2 4 3

    3 4 5

    4 8 7

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-6

    Figura 26: Esquema do diagrama de disperso.

    Figura 3.4 Diagrama de disperso

    EXERCCIO 3.1

    1. Construir, no programa GeoDa, um diagrama de caixa dos dados do PIB dos estados brasileiros.

    Dica: File Open Project. Varivel-chave: OBJECTID. Explore Box Plot.

    2. Indicar o que representa o nmero 27 no diagrama de caixa.

    3. Indicar o que representa a linha vermelha no interior do diagrama.

    4. Identificar os estados brasileiros que podem ser considerados outliers superiores.

    Dica: Para visualizar os estados, selecione o asterisco correspondente e observe no mapa e

    na tabela os estados selecionados.

    5. Clicar, com o boto direito, em qualquer local da janela do diagrama de caixa e selecionar a opo

    hinge 3.0. Justificar as mudanas ocorridas, se houverem.

    EXERCCIO 3.2

    Repetir, no ArcGIS, o Exerccio 3.1

    Dica: Tool Graphs Create.

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-7

    EXERCCIO 3.3

    1. Construir, no GeoDa, o Box Map do PIB dos estados brasileiros.

    Dica: Map Box Map Hinge = 1.5.

    2. Comparar o Box Map com o diagrama de caixa.

    Cuidado: Verificar se o Box Map e o diagrama de caixa esto com o mesmo valor de hinge.

    3. Construir, no Geoda, e interpretar o diagrama de disperso.

    Dica: Explore scatterplot.

    4. Construir, no Geoda, o Box Map dos PIB dos estados brasileiros.

    Dica: Map Box Map.

    DESAFIO!

    Descobrir a origem dos valores constantes nos eixo X e Y do diagrama de disperso no Geoda.

    3.2.2 Incio do relacionamento com o espao a partir do diagrama de caixas (boxplot): o Box Map

    Os valores situados entre Q1 e Q2, Q2 e Q3, Q1 e intervalo quartlico inferior, Q3 e intervalo quartlico

    superior, bem como os outliers inferiores e superiores podem ser visualizados por meio do chamado

    Box Map, que apresenta, espacialmente, os valores do diagrama de caixa.

    A Figura 3.5 apresenta, pelo programa GeoDa, o Box Map dos Estados Brasileiros. Verifique que,

    comparando-se com o respectivo diagrama de caixa, pode-se verificar que os valores situados abaixo

    da barra horizontal inferior denominam-se lower outliers e aqueles situados acima da barra horizontal

    superior denominam-se upper outliers. Observe tambm que os estados com o PIB entre 25% e os

    75% encontram-se na caixa central e que valores menores que 25% encontram-se entre a parte

    inferior da caixa central e a barra horizontal inferior. Situao similar pode ser observada com os

    valores maiores que 75%, os quais se encontram entre a parte superior da caixa central e a barra

    horizontal superior.

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-8

    Figura 3.5. Box Map do PIB dos Estados brasileiros no ano de 2002.

    3.3 Anlise exploratria espacial

    Na Anlise Exploratria de Dados Espaciais (ESDA (Exploratory Spatial Data Analysis) est sendo

    visto o conjunto de ferramentas estatsticas descritivas e grficas com o objetivo de descobrir padres

    nesses dados, considerando, explicitamente, a importncia do arranjo espacial dos fenmenos,

    anlise que pode ser classificada em univariada ou multivariada, dependendo do nmero de

    variveis. Dentre as tcnicas univariadas, destacam-se os histogramas, mapas temticos, diagramas

    de caixa (boxplots) e determinados ndices, enquanto entre as tcnicas multivariadas tem-se as

    matrizes de proximidade.

    Desse modo, a ESDA constitui-se em uma coleo de tcnicas para descrever e visualizar

    distribuies espaciais, identificar situaes atpicas, descobrir padres de associao espacial e

    tambm conglomerados (clusters).

    Os objetivos da anlise espacial so compreender melhor as observaes espalhadas pelas reas,

    avaliar hipteses a elas relacionadas, ou ainda prever valores em locais onde observaes no esto

    disponveis. Em resumo, as anlises podem ser:

    para visualizar os dados espaciais;

    para explorar, conhecer, investigando e resumindo relaes e padres em mapas;

    para identificar um modelo estatstico e estimar parmetros

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-9

    Um processo espacial chamado estacionrio se a dependncia entre as medidas da mesma

    varivel no espao a mesma para todos os locais na rea. Se a dependncia de um processo

    estacionrio influenciada pela distncia, mas a mesma em todas as direes, o processo

    considerado isotrpico.

    Os efeitos de primeira ordem descrevem variaes em larga escala na mdia do resultado de

    interesse, devido localizao ou a outras variveis explicativas, enquanto os efeitos de segunda

    ordem descrevem a variao em pequena escala devido s interaes entre vizinhos.

    3.3.1 Efeitos de 1. Ordem

    A anlise dos efeitos de primeira ordem busca identificar os padres de distribuio espacial

    de uma determinada varivel. Nesse sentido, importante definir qual a regio em torno de

    cada ponto ou rea que ser considerada para efeito de determinao de um valor numrico

    que represente o padro da varivel em torno daquele ponto ou rea. Ser visto a seguir as

    diferentes formas de definir essa regio em torno de cada ponto ou rea, representada por

    matriz denominada de matriz de proximidade ou pela determinao de um vizinho mais

    prximo.

    Efeitos de primeira ordem incluem etapas como a determinao da regio de vizinhana e o

    valor mdio da varivel nessa regio

    A existncia de uma grande quantidade de reas de trabalho faz com que haja diferentes

    tipos de relacionamento entre elas. Para que se possa identificar os padres espaciais

    existentes, necessita-se inicialmente estabelecer o conceito de vizinhana, materializado por

    meio das chamadas matrizes de proximidade espacial ou matrizes de vizinhana.

    3.3.1.1 Matriz de proximidade

    A construo de ua matriz de proximidade necessita, primeiro, da definio do que seja uma

    proximidade espacial.

    3.3.1.1-1 Proximidade Espacial

    No que se refere ao conceito de Proximidade espacial, temos, usualmente, a

    distncia euclideana. A principal diferena para objetos em reas reside na

    formalizao da proximidade espacial. Por exemplo, qual a distncia entre a

    cidade do Rio de janeiro e a cidade de Nova Iguau? 29 mim, 35 km ou so

    juntas. Claro que a resposta depende de inmeros fatores.

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-10

    Distncia euclideana dada pela separao entre dois pontos quaisquer no

    espao. Pode ser calculada a partir das coordenadas dos pontos. Se (x1, y1) e

    (x2, y2) so dois pontos no plano, ento a distncia dada por:

    e se (x1, y1, z1) e (x2, y2, z2) forem as coordenadas de dois pontos no espao,

    a distncia dada por:

    A proximidade wi,j de uma regio Ai em relao a outra Aj pode

    tambm ser definida de diversas maneiras, entre as quais:

    a) existncia de uma fronteira comum, a mais imediata e fcil de

    determinar, considerar como fator de deciso wi,j = 1 se a regio

    i faz fronteira com a regio j e wi,j = 0, caso contrrio.

    Por exemplo, considere a Figura 3.6

    Figura 3.6 Bairro da Urca (Rio de Janeiro, RJ) e bairros vizinhos

    Fonte:

    http://www.armazemdedados.rio.rj.gov.br/arquivos/1314_bairros%20-

    %202004.JPG

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-11

    No caso do bairro da Urca (nmero 22), w22,j = 1 com os bairros de

    Botafogo (nmero 20) e Leme (nmero 23), ou seja, w 22,20 = w 22,23=1

    e w 22, j

    b) distncia linear entre os centrides de cada rea, Figura 3.7

    Figura 3.7 Distncia entre centrides de duas reas

    Neste caso, se a distncia entre o centride de Ai e o centride de Aj

    for menor ou igual a um determinado valor d, denominado limiar, w i,j =

    1; se maior que esse limiar, w i,j = 0.

    Por exemplo, pode-se definir um raio mximo de 7,3 km em torno do

    centride do bairro do Alto da Boa Vista (Rio de Janeiro, RJ), Figura

    3.8

    Figura 3.8 Raio de 7,3 km, escolhido para definir a proximidade do

    bairro do Alto da Boa Vista em relao aos demais bairros da cidade do Rio

    de Janeiro, RJ.

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-12

    Fonte: http://www.cederj.edu.br/atlas/rio_janeiro_tab4.htm

    O valor de w i,j (onde i o bairro do Alto da Boa Vista e j so os demais

    bairros) igual a 1 para os bairros cujas distncias de seus centrides ao

    centride do Alto so menores ou iguais que 7,3 km e igual a zero para os

    demais.

    c) relao entre os comprimentos da interseo das reas e o

    permetro da regio.

    w i,j = lij/li, onde lij o comprimento da fronteira entre Ai e Aj e li o

    permetro da rea Ai.

    Figura 3.9 Proximidade pelos comprimentos

    Para a Figura 3.9,

    LLLL

    Lw

    4321

    2

    14

    onde L2 o comprimento da interseco entre P1 e P4 e (L1 + L2 + L3 +

    L4 ) o permetro de P1. Observe que w i,j w j,i

    d) o inverso da distncia linear entre os centrides:

    dw ji

    1,

    3.3.1.1-2 Determinao da Matriz de proximidade Espacial ou

    Matriz de Vizinhana

    Na anlise exploratria espacial, fazem-se as anlises considerando os

    efeitos de uma varivel em toda a regio de trabalho globalmente ou em

    sub-regies localmente em torno de alguma caracterstica.

    IsabellaNotaW14= L2/(L1+L2+L3+L4)
  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-13

    Cada uma dessas sub-regies delimita a vizinhana de um polgono,

    representada matematicamente pelas chamadas matrizes de proximidade

    espacial, de vizinhana ou de contiguidade.

    Dado um conjunto de n polgonos {A1, An}, a matriz de vizinhana a matriz

    W(1)

    (n x n), onde cada um dos elementos wij representa uma medida de

    proximidade entre Ai e Aj. equivale ao relacionamento entre cada um dos

    polgonos da regio de trabalho. Nessa matriz, os relacionamentos entre os

    polgonos no vizinhos apresentam valor zero (wij = 0).

    Figura 3.10 Estrutura (grid) de 3 x 3 clulas

    Os critrios de contiguidade para a determinao dessa matriz de

    proximidade para os elementos contguos so os seguintes:

    1) Distncia da Torre (Rook distance) considera-se como vizinhas

    as regies que apresentam lados em comum. Por esse critrio, em

    um grid, as vizinhas de uma clula so aquelas ao norte, sul, leste e

    oeste.

    Exemplo 3.1 Em um grid de 3 x 3 clulas (Figura 3.10), as

    clulas vizinhas da clula 1 pela distncia da Torre com

    contiguidade 1 so as 2 e 4; da clula 2, clulas 1, 3 e 5; da

    clula 5 so as clulas 2, 4, 6 e 8, e assim sucessivamente.

    Exemplo 3.2 Em um grid de 3 x 3 clulas (Figura 3.10), as

    clulas vizinhas da clula 1 pela distncia da Torre com

    contiguidade 2 so 3, 5 e 7; da clula 2, clulas 4, 6 e 8; da

    clula 5 so as clulas 1, 3, 7 e 9, e assim sucessivamente.

    2) Distncia da Rainha (Queen distance) - considera-se como

    vizinhas as regies que apresentam tanto bordas como vrtices em

    comum. Em um grid, as clulas vizinhas so aquelas que esto ao

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-14

    norte, sul, leste e oeste, e mais as das direes nordeste, sudeste,

    sudoeste e noroeste.

    Quando a ordem de contiguidade igual a 2, as clulas vizinhas da

    clula de referncia so aquelas vizinhas das de primeira ordem dela.

    Exemplo 3.3 No grid da Figura 3.10, as clulas vizinhas da

    clula 1 pela distncia da Rainha so as clulas 2, 4 e 5; da

    clula 2, as 1, 3, 4, 5 e 6; da clula 5 so as clulas 1, 2, 3, 4,

    6, 7, 8 e 9, e assim sucessivamente.

    3) Distncia simples considera-se como vizinhas as regies cujos

    centrides encontram-se a menos de uma dada distncia da regio

    de referncia; pode-se, neste caso, associar um peso para cada um

    desses vizinhos.

    Exemplo 3.4 No grid da Figura 3.10, se clula mede 5km x

    5km e definindo-se que clulas vizinhas so aquelas situadas

    a menos de 6km, as clulas vizinhas da clula 1 so as 2 e 4;

    da clula 2, as clulas 1, 3 e 5; da clula 5, as clulas 2, 4, 6

    e 8, e assim sucessivamente.

    4) Nmero de vizinhos mais prximos selecionam-se os k

    vizinhos mais prximos como critrio de vizinhana.

    Exemplo 3.5 No grid da Figura 3.10, as duas clulas vizinhas

    da clula 1 so as clulas 2 e 4; da clula 2, as 1 e 3, ou 1 e 5

    ou 3 e 5, considerando-se que todas as clulas so de igual

    tamanho.

    Pode-se adotar, tambm, como critrios a serem

    considerados, o comprimento da interseo entre os

    contornos de reas adjacentes em funo ou no do

    permetro das reas. Estas condies podem ser

    consideradas de modo isolado ou de modo hbrido.

    comum normalizar as linhas da matriz para que a soma dos seus pesos

    seja igual a 1.

    A idia de matriz de vizinhana pode ser estendida para vizinhos de maior

    ordem. Essas matrizes so representadas por W(2)

    ,, W(n)

    . Os coeficientes

    das matrizes de ordem 1 so designados por wij e os de ordem n por wij(n)

    .

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-15

    Para n regies {A1, An}, a partir das proximidades entre duas delas,

    constri-se a matriz de vizinhana Wnxn, onde cada um dos elementos w i,j a

    medida de proximidade entre Ai e Aj. . Considera-se que uma rea vizinha

    a outra se houver uma fronteira comum.

    W =

    2,11,1 2,11,1

    2,11,1 2,11,1

    2,11,1 2,11,1

    2,11,1 2,11,1

    wwww

    wwww

    wwww

    wwww

    Por exemplo, a matriz de vizinhana para os bairros da cidade do Rio de

    Janeiro, 1-Sade, 2-Gamboa, 3-Santo Cristo, 5-Centro e 8-Cidade Nova

    (Figura 3.11), a da Tabela 3.3.

    Figura 3.11 Bairro do Centro (Rio de Janeiro, RJ) e bairros vizinhos

    Fonte:

    http://www.armazemdedados.rio.rj.gov.br/arquivos/1314_bairros%20-

    %202004.JPG

    Tabela 3.3 Matriz de vizinhana do bairro do Centro do Rio de Janeiro, RJ

    Sade Gamboa Santo Cristo Centro Cidade Nova

    Sade 0 1 0 1 0

    Gamboa 1 0 1 1 0

    Santo Cristo 0 1 0 1 1

    Centro 1 1 1 0 1

    Cidade Nova 0 0 1 1 0

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-16

    Pode-se normalizar as linhas da matriz para que a soma de cada linha seja igual a 1. Por

    exemplo, a partir da matriz da Tabela 3.3 gera-se a matriz da Tabela 3.4

    Tabela 3.4 Matriz normalizada de vizinhana do bairro do Centro do Rio de Janeiro, RJ

    Sade Gamboa Santo Cristo Centro Cidade Nova

    Sade 0 1/2 0 1/2 0

    Gamboa 1/3 0 1/3 1/3 0

    Santo Cristo 0 1/3 0 1/3 1/3

    Centro 1/4 1/4 1/4 0 1/4

    Cidade Nova 0 0 1/2 1/2 0

    EXERCCIO 3.4

    1. Determinar a matriz de proximidade do arquivo grid_teste_extrato no GeoDa, empregando a

    distncia de Torre, contiguidade 1.

    Dica: File Open Project. Varivel-chave: ORDEM. Tool Weights Create. Selecionar como

    arquivo de entrada o grid_teste_extrato. Salvar o arquivo de sada no diretrio Exercicio_cap3 com o

    nome torre_1 e, em seguida selecionar a opo desejada.

    2. A partir do arquivo torre_1 (no bloco de notas):

    a) Identificar o significado do nmero 9 na primeira linha do arquivo.

    b) Determinar a lgica da construo do arquivo.

    Dicas: Cada dupla de linhas subsequentes (linhas 2 e 3, 4 e 5, etc.) apresentam a

    informao-chave.

    EXERCCIO 3.5

    Repetir o Exerccio 3.4 com a distncia da Torre, contiguidade 2, e comentar as diferenas, se

    houverem.

    EXERCCIO 3.6

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-17

    Repetir o Exerccio 3.4 com a distncia da Rainha, contiguidade 1, distncia mxima de 15 km e 3

    vizinhos mais prximos.

    EXERCCIO 3.7

    1. Determinar a matriz de proximidade no programa TerraView.

    Dica: Aps abrir o arquivo, selecionar Anlise Matriz de Proximidade Criar Matriz de

    Proximidade. Selecionar a opo Contiguidade e salvar no diretrio Exerccio_cap3 o arquivo como o

    nome contiguidade_terraview.

    2. Comparar, no bloco de notas, os arquivos obtidos com o GeoDa com o do TerraView. Verificar os

    relacionamentos e diferenas, se houverem.

    3.3.1.2 Vizinho mais prximo

    Esta estatstica apresenta a distncia, em mdia, de um ponto at o que considera seu

    vizinho mais prximo.

    O clculo dessa distncia feito para aqueles pontos potencialmente mais prximos da

    vizinhana. Um ponto pode ser o vizinho mais prximo a vrios pontos, ou a nenhum ponto

    absolutamente. Um modo de explorar a variao da tendncia espacial dos dados

    calculando a mdia dos valores vizinhos e determinando-se distncia mdia, d-barra.

    Nota: O fato de que A o vizinho mais prximo de B no quer dizer que B sempre ser o

    vizinho mais prximo a A.

    3.3.1.3 Determinao da aleatoriedade de distribuio de pontos no

    espao

    Um procedimento utilizado para determinar o padro de distribuio de pontos no espao

    calcular o indicador denominado R, smbolo para a estatstica do vizinho mais prximo, que

    mede o desvio entre o afastamento real dos pontos e o que ocorreria se os mesmos

    estivessem posicionados de modo aleatrio.

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-18

    Figura 3.12 - Padres de distribuio de pontos

    Pelo Clculo das Probabilidades, a distncia aleatria entre os pontos, r(E), calculada pela

    expresso

    onde p a densidade dos n pontos em determinada rea, ou seja, p = n/rea.

    A distncia entre os pontos na distribuio observada baseia-se nos vizinhos mais prximos

    de cada ponto, indicada por uma mdia, r(A).

    Na Figura 3.13, as setas indicam o vizinho mais prximo de cada um dos pontos na rea

    considerada.

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-19

    Figura 3.13 Vizinhos mais prximos

    A distncia, em quilmetros, entre cada ponto e seu vizinho mais prximo, indicada por d,

    est na tabela 3.5. Quando houver mais de um vizinho mais prximo, optar por um deles, j

    que as distncias so iguais. O ponto mais prximo do ponto 2 o ponto 4, do 9 a 10 e

    assim sucessivamente, conforme a Tabela 3.5.

    Tabela 3.5 Pontos e seus vizinhos mais prximos

    Ponto Vizinho mais prximo Distncia (km)

    1 2 12

    2 1 12

    3 2 e 8 20

    4 5 10

    5 4 10

    6 7 7

    7 6 7

    8 4 16

    9 10 20

    10 18 18

    11 11 11

    12 13 13

    13 12 12

    14 15 15

    15 14 14

    16 15 e 17 15 e 17

    17 18 18

    18 17 17

    Os pontos 6 e 7 so, reciprocamente, os mais prximos, enquanto o ponto 3 igualmente

    prximo dos pontos 2 e 8. Visualmente, uma concluso preliminar que os contatos na rea

    so realizados por quatro grupos de pontos, relativamente isolados entre si.

    A mdia das distncias entre os vizinhos mais prximos expressa por

    ou seja, para ir de um ponto a outro, o deslocamento , em mdia, 11,9km para ir para um

    ponto mais prximo ao original.

    Aps essa determinao, compara-se a distncia real obtida com a terica, que ocorreria

    caso a distribuio fosse aleatria. Supondo uma rea de 9.000km2, a densidade p de pontos

    de 0,002 pontos/km2. A distncia entre os pontos, em quilmetros, caso a distribuio fosse

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-20

    aleatria seria:

    O valor de R obtido, dividindo-se r(A) por r(E), ou seja:

    Interpretao:

    a) em uma distribuio aleatria, R=1.

    b) sob condies de agregao mxima, R=0, uma vez que todos os pontos ocupam o mesmo local e a distncia ao vizinho mais prximo , portanto, 0.

    c) sob condies de espaamento mximo, os pontos sero distribudas em um padro hexagonal, e cada ponto (exceto os da periferia) sero equidistantes de seis outros pontos. Neste caso, a distncia mdia ao vizinho mais prximo ser maximizada e R = 2,1491.

    Desse modo, quanto mais prximo R for de 1, maior a tendncia aleatoriedade.

    Pelo resultado obtido, a distribuio de pontos da Figura 3.13 pode ser considerada aleatria.

    EXERCCIO 3.8

    Determinar, no programa GeoDa, a distncia ao vizinho mais prximo das capitais brasileiras.

    Dicas:

    1) Selecionar o arquivo Capitais e criar um arquivo de matriz de proximidade com a opo k-

    Nearest Neighbor com o valor 1.

    2) Exportar como Near1.

    3) Abrir o arquivo Near1 no bloco de notas e verificar os resultados, identificando os valores

    direita de cada linha da tabela e concluindo sobre a coerncias deles.

    4) Repetir o procedimento no ArcGIS e conferir os resultados.

    Dica: No ArcGIS, selecione no Toolbox Analysis Tools Proximity Near.

    4) Concluir sobre a distribuio das cidades: agrupada, regular ou aleatria? Justificar.

    3.3.1.4 Mdia mvel espacial

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-21

    Um modo de estudar a variao da tendncia espacial dos dados calculando o valor de

    cada atributo em relao aos atributos das regies vizinhas, valor chamado de Mdia

    Espacial Mvel (conceito diferente da mdia mvel da estatstica clssica). Este mdia

    espacial mvel nada mais do que uma mdia ponderada do atributo de cada regio em

    relao aos seus vizinhos, que resulta no novo valor do atributo. Regies onde existe

    disparidade entre o valor original do atributo e o valor da mdia espacial mvel indicam

    pontos de transio entre padres espaciais.

    A Mdia Espacial Mvel para cada regio i calculada pela seguinte expresso:

    n

    =jji

    n

    =jjji

    i

    w

    yw=

    1,

    1,

    para i=1, 2, ..., n

    onde Wi,j o elemento da matriz de vizinhana. yi o valor do atributo na rea i e n o

    nmero de reas.

    Exemplo 3.6 Determinar a mdia espacial mvel para a rea A, Figura 3.14. considerando a

    proximidade pela relao de fronteiras.

    Figura 3.14 Regio de estudo com 4 reas A, B, C e D e seus atributos

    A matriz de vizinhana a da Tabela 3.6.

    Tabela 3.6 Matriz de vizinhana das reas A, B, C e D

    A B C D

    A 0 1 1 0

    B 1 0 1 1

    C 1 1 0 1

    D 0 1 1 0

    A mdia espacial mvel para a regio A a seguinte:

    AA BB

    CC DD55

    2424

    15152020

    AA BB

    CC DD55

    2424

    15152020

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-22

    0110

    50241151200 4

    1

    ,,,A xxxx

    WWWW

    yWyWyWyW

    W

    yw=

    ADACABAA

    DADCACBABAAA

    =jAj

    DCB=jjAj

    A

    2

    024150

    0110

    50241151200

    0110

    50241151200 xxxxxxxx

    = 19,5

    O valor do atributo da regio A em relao aos valores dos atributos das regies

    vizinhas est na Figura 3.15

    Figura 3.15 Novo valor do atributo da regio A

    EXERCCIO 3.9

    Determinar as mdias mveis para as regies B, C e D da Figura 3.14.

    EXERCCIO 3.10

    Representar, matricialmente, o clculo das mdias mveis

    para as regies A, B, C e D da Figura 3.14.

    EXERCCIO 3.11

    1. Determinar, no TerraView, a mdia mvel espacial dos dados do arquivo grid_teste, considerando

    a contiguidade como critrio para a matriz de vizinhana.

    AA BB

    CC DD

    19,519,5

    AA BB

    CC DD

    19,519,5

    IsabellaNota(0x20+1x12+1x24+0x5)/(0+1+1+0)= (0+15+24)/2=19,5
  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-23

    Dica: Criar primeiramente a matriz de vizinhana e depois em Anlise Estatstica Espacial,

    selecionar a coluna VALOR1 - Mdia Mvel - prefixo cont e salvar com o nome grid_cont no diretrio

    Exercicio_cap3.

    2. Verificar a criao da coluna com o nome contLocalMean.

    Cuidado: A numerao das clulas dada pelos valores da coluna object_id_ e no pelo

    valor do registro da linha na tabela. Notar que, assim como no GeoDa, os arquivos com a extenso

    GAL e txt da matriz de vizinhana fazem referncia ao valor do registro na tabela.

    3. Selecionar as clulas de nmeros 25 e 32 (em relao coluna object_id_ ) e calcular o valor

    da mdia mvel espacial e conferir o resultado na coluna contLocalMean.

    Dica: Clicar na clula que se deseja calcular a mdia da vizinhana na tabela e, depois, sobre

    o grid, clique sobre as clulas que se deseja calcular a mdia. Verificar que ocorre uma seleo

    cumulativa. Para retirar essa seleo, clicar novamente sobre a clula.

    Cuidado: A mdia mvel ocorre somente entre os vizinhos e NO inclui o valor da clula em torno da

    qual se determina a mdia mvel.

    4. Criar uma simbologia cuja legenda seja dividida em 5 classes pelo critrio dos quartis.

    Dica: Clicar com o boto direito sobre o tema grid_teste e selecionar a opo Editar Legenda.

    3.3.2 Efeitos de 2. Ordem

    Nos efeitos de segunda ordem, busca-se determinar os relacionamentos entre variveis.

    Sero abordados diversos tipos de ndices que de alguma forma empregam diferentes

    abordagens do conceito de correlao aplicados ao caso de dados geogrficos.

    Os efeitos de segunda ordem, no contexto de uma anlise exploratria espacial, empregam o

    conceito de autocorrelao espacial e descreve a variao em pequena escala devido s

    interaes entre vizinhos.

    No lugar de verificar o relacionamento de duas variveis no-espaciais ou de uma mesma

    varivel em instantes de tempo diferentes, representa o relacionamento de uma mesma

    varivel em posies geogrficas diferentes. A autocorrelao pode ser calculada tanto em

    uma regio de estudo (global) como em uma vizinhana (local).

    3.3.2.1 O conceito de covarincia e correlao

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-24

    Quando h duas sries de dados, ou seja, duas variveis X e Y, as medidas estatsticas mais

    comuns que podem ser usadas para indicar como essas duas sries se relacionam so a

    covarincia e a correlao.

    Para duas sries de dados, X (X1, X2,.) e Y(Y1,Y2... ), a covarincia fornece uma medida

    absoluta do seu grau do relacionamento, sendo calculada pelo produto dos desvios para cada

    varivel em relao sua mdia, ou seja, COV (X,Y) =

    Se X e Y so independentes, ento a sua covarincia zero. O inverso, no entanto, no

    verdadeiro: possvel que X e Y no sejam independentes e terem no entanto covarincia

    zero.

    O sinal da covarincia indica o tipo de relacionamento entre as duas variveis. Se positivo,

    indica que elas movem no mesmo sentido; se negativo, em sentidos opostos. Entretanto, por

    ser medida absoluta, relativamente difcil julgar o relacionamento entre as duas variveis,

    porque as unidades dos valores podem mascarar esse relacionamento ou seja, por causa das

    medidas no serem padronizadas.

    Desse modo, contorna-se essa situao pelo uso da chamada correlao, medida

    padronizada da relao entre duas variveis. Ela calculada dividindo-se a covarincia pelo

    produtos dos desvios-padro de cada varivel. Essa correlao tambm chamada de

    coeficiente de correlao de Pearson ou coeficiente de correlao produto-momento ou ento

    "r de Pearson", o qual mede o grau da relacionamento (e o sentido desse relacionamento -

    se positivo ou negativo) entre duas variveis de escala intervalar ou proporcional.

    Calcula-se o coeficiente de correlao de Pearson pela expresso:

    onde e so os valores de cada uma das variveis sendo

    e

    as mdias aritmticas de ambas as variveis.

    3.3.2.2 Interpretao do coeficiente de correlao

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-25

    A correlao, denotada por r, encontra-se sempre entre -1 e +1. Uma correlao prxima a

    zero indica que as duas variveis no esto relacionadas linearmente. No entanto, pode

    existir uma dependncia no linear. Assim, o resultado r = 0 deve ser investigado por outros

    meios.

    Usamos o termo correlao positiva quando r>0, e nesse caso medida que, em mdia, x

    aumenta, y tambm aumenta, e correlao negativa quando r < 0 e, nesse caso, medida

    que x aumenta, y diminui.

    O valor de r est sempre entre -1 e +1, com r=0 correspondendo no associao linear.

    Quanto maior o valor de r (positivo ou negativo), mais forte a associao linear. Nos

    extremos, se r= +1 ou r= - 1, ento todos os pontos no grfico de disperso esto todos

    exatamente na mesma linha reta. Por outro lado, se r=0 no existe nenhuma associao

    linear.

    Note que correlaes no dependem da escala de valores de x ou de y (por exemplo,

    obteramos o mesmo valor se medssemos altura e peso em metros e quiilogramas ou em

    ps e libras.)

    No h regra fixa para descrever uma correlao em palavras, dado o valor numrico. Uma

    das classificaes est no Quadro 3.1.

    Quadro 3.1 Interpretao dos valores da correlao

    Valor do mdulo da correlao Interpretao

    0,00 Nenhuma

    0,00 -- 0,20 Bem fraca

    O,20 |-- 0,40 Fraca

    O,40 |-- 0,70 Moderada

    O,70 |-- 0,90 Forte

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-26

    O,90 |-- 1,00 Muito forte

    1,00 Perfeita

    No campo espacial, a partir do conceito de correlao, tem-se o de autocorrelao, medida

    que indica, o quanto o valor de uma varivel est relacionada com seus vizinhos ou ento

    com a regio em que se encontra.

    3.4 Indicadores de Autocorrelao Espacial

    Tem-se os chamados Indicadores Globais (ndices de Moran, Geary, G e G*) e os

    Indicadores Locais (ndices de Moran Local, Geary Local, G i e Gi*), alm dos multivariados da

    associao espacial, uma generalizao em mltiplas dimenses.

    Os Indicadores medem o quanto o valor observado de um atributo em uma regio

    independente dos valores desse atributo nas localizaes vizinhas, e podem ser expressos

    de um modo genrico, tanto para os indicadores globais quanto para os locais.

    1. Define-se um indicador local como sendo

    (i,j = 1, ..., n)

    Onde wij a medida de proximidade entre o objeto i e os j situados na sua

    vizinhana, e aij representa a associao entre o atributo do objeto i com os dos

    demais objetos de sua vizinhana.

    2. Define-se um indicador global como sendo

    ,

    para (i,j = 1, ..., n), quando se analisa o conjunto de todos os objetos de toda a regio.

    Os valores para o clculo desses indicadores podem ser as observaes originais ou,

    mais apropriadamente, alguma transformao destas, a fim de lidar apenas com as

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-27

    diferenas em relao media do conjunto, ou seja, verifica-se o quanto uma

    observao desvia-se da mdia do conjunto, definindo-se a varivel

    A partir dessa transformao, definem-se 3 indicadores para cada um dos objetivos

    desejados:

    a) determinar a interao entre os pontos a partir dos seus afastamentos em

    relao mdia deles, ou seja:

    b) determinar a disperso absoluta entre um par de observaes i e j

    c) determinar o valor ou a diferena simples entre eles:

    ou equivalente a ou

    No primeiro caso, temos o ndice de Moran, similar covarincia da Estatstica Clssica

    No segundo caso, o ndice de Geary, similar varincia da Estatstica Clssica

    No terceiro caso ,os ndices G ou G*, semelhantes mdia mvel da Estatstica Clssica

    3.4.1 - Indicadores Globais (ndice I de Moran, ndice de Geary

    e ndices G e G*)

    3.4.1.1. ndice Global I de Moran:

    Este ndice permite estabelecer se existe um padro aleatrio de distribuio de pontos ou

    reas ou se h algum tipo de dependncia espacial entre eles. O ndice I de Moran, uma

    medida de autocorrelao espacial desenvolvido por Patrick A. P. Moran [Figura 3.16], pode

    variar entre -1 e +1, sendo que o valor negativo significa correlao espacial negativa e (+1)

    correlao espacial positiva.

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-28

    Figura 3.16. Patrick Alfred Pierce Moran (July 14, 1917 September 19, 1988),

    A hiptese implcita de estacionaridade de primeira e segunda ordens, o que torna o ndice sem

    validade para dados no-estacionrios.

    O termo estacionaridade tem sua origem em processos aleatrios. Por estacionaridade de processos

    aleatrios entende-se como sendo aqueles cujas propriedades estatsticas no variam com o tempo.

    No caso da anlise espacial, a estacionaridade do processo est associada com a estacionaridade no

    espao, sendo descrita em termos de ordem: primeira ordem, segunda ordem etc. Os processos

    estacionrios de primeira ordem devem ter mdia constante, independentemente da configurao

    espacial dos pontos amostrados. A estacionaridade de segunda ordem implica que a funo de

    autocorrelao depende somente da separao das observaes no espao e no no tempo.

    O efeito da estacionaridade de primeira ordem est em desconsiderar o fato dos vizinhos terem

    valores mais prximos que reas distantes, tendo em vista serem comparados mdia global, o que

    torna o ndice maior do que deveria ser. A estacionaridade de segunda ordem (varincia constante)

    faz com que os valores das varincias sejam menores nas regies com maior varincia e maior nas

    reas com menor varincia.

    O ndice I de Moran indica se os dados so um conglomerado ou a disposio aleatria.

    Tem-se um conjunto de valores (zi) e um conjunto de pesos wij .Uma das maneiras mais simples para

    atender esses critrios o de multiplicar os valores das diferenas:

    Ponderando pela proximidade entre eles, tem-se

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-29

    Os padres de proximidade, dados pela matriz espacial de pesos, W = (wij), indicam os elementos

    que devem ser includos ou excludos. A expresso semelhante, na Estatstica clssica,

    covarincia, que depende fortemente da quantidade de valores (quanto mais valores, maior a

    covarincia).

    Para evitar essa influncia, divide-se pela soma das ponderaes utilizadas, ou seja,

    Para padronizar esta covarincia, ficando adimensional, divide-se pela varincia dos dados:

    Finalmente, a relao entre essas duas expresses gera o ndice, conhecido como I

    de Moran,

    Outra maneira de expressar este ndice o seguinte;

    onde: n o nmero de reas, xi o valor do atributo considerado na rea i, X-barra

    representa o valor mdio do atributo na regio de estudo, e wij os pesos atribudos

    conforme a conexo entre as reas i e j.

    Em geral, um valor do ndice de Moran:

    a) prximo a 1,0 indica um conglomerado de regies com as mesmas

    caractersticas, autocorrelao espacial positiva.

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-30

    b) prximo a -1,0 indica aleatoriedade em que as regies prximas podem ter

    comportamentos muito diferentes entre si, autocorrelao espacial negativa.

    c) iguais a zero indicam independncia espacial.

    Exemplo 3.7 Determinar o ndice de Moran para a Figura 3.17.

    Figura 3.17. Representao para o Exemplo 3.17

    Desenvolvimento:

    Matriz de proximidade

    25 21

    25 0 1

    21

    Clculo intermedirio

    25 21

    25 0 (25-21)2

    21

    Resposta: I = 0,487

    EXERCCIO 3.12

    Determinar o ndice de Moran para a Figura 3.18.

    AA BB

    CC DD

    1155 2200

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-31

    Figura 3.18. Representao para o Exemplo 3.7

    Resposta: I = 0,288

    Generalizando para o caso de matrizes de proximidade W(k)

    , a estimativa da funo de

    autocorrelao, considerando os vizinhos de ordem k, est representada pela equao abaixo:

    EXERCCIO 3.13

    1. Determinar o ndice de Moran para PIB do arquivo grid_teste no GeoDa, pelo critrio da distncia

    da rainha, contiguidade 1.

    Dica: Criar matrix de proximidade pelo critrio solicitado primeiramente e, em seguida, Space

    Univariate Moran para determinar o ndice de Moran.

    2. Observar que gerado um scatterplot.

    3. Determinar o ndice de Moran no TerraView.

    Dica: Anlise Estatstica Espacial Nmero de permutaes = 99.

    4. Comparar os dois resultados.

    3.4.1.2. ndice Global C de Geary:

    n

    =i

    i

    n

    =i

    n

    =j

    ji(k)ij

    (K)

    )y(y

    )y)(yy(ywn

    =I

    1

    2

    1 1

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-32

    Enquanto o ndice I de Moran uma medida global de autocorrelao espacial, h outro

    indicador, o ndice de Geary, mais sensvel s posies. Este ndice de Geary difere do de

    Moran por utilizar diferena entre os pares de pontos, enquanto que Moran utiliza a diferena

    entre cada ponto e a mdia global. O ndice de Geary adequado quando no h

    estacionaridade.

    Com essa considerao, define-se o ndice de Geary por

    O valor desse ndice varia entre 0 e 2. O valor 1 indica no haver autocorrelao espacial.

    Valores menores que 1 significam autocorrelao espacial negativa e maiores que 1,

    autocorrelao positiva. Este ndice foi desenvolvido por Roy C. Geary (Figura 3.19).

    Figura 3.19. Robert (Roy) Charles Geary (April 11, 1896 February 8, 1983)

    EXERCCIO 3.14

    Determinar o ndice de Geary para a situao da Figura 3.20.

    Figura 3.20 Grfico para o Exerccio 3.14

    3.4.1.3. Funes G e G*

    Ao contrrio do ndice de Moran e do ndice de Geary, as funes G e G* apresentam

    os valores dos desvios Zi e Zj combinados em relao mdia.

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-33

    para i j.

    A principal diferena entre as funes G e G* que a primeira inclui, no numerador, a soma dos

    valores de todos os vizinhos, exceto o valor no local i, ao passo que G* o considera.

    EXERCCIO 3.15

    Determinar os ndices G e G* para a situao da Figura 3.20.

    Figura 3.20 Grfico para o Exerccio 3.15

    3.4.2 - Indicadores Locais de Associao Espacial (Local Indicators

    of Spatial Association - LISA): ndice local de Moran e ndices Gi e

    Gi*

    G=

    i=0

    n

    j= 0

    n

    wij

    zi. z

    j

    i= 0

    n

    j=0

    n

    zi. z

    j

    n

    =i

    n

    =j

    ji

    n

    =i

    n

    =j

    jiij

    zz

    zzw

    =G

    0 0

    0 0

    .

    .

    *

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-34

    Como vimos, o estimador de autocorrelao espacial I de Moran fornece um valor nico como medida

    da associao espacial. Por outro lado, muitas vezes necessrio examinar padres numa escala

    maior. Neste caso, preciso utilizar indicadores locais de associao espacial que possam ser

    associados a diferentes localizaes de uma varivel distribuda espacialmente.

    A utilizao destes indicadores em conjunto com os indicadores globais, refinam nosso conhecimento

    sobre o processos que originam a dependncia espacial, e permitem avaliar diferentes regimes

    espaciais existentes na rea de estudo, porque medem a associao espacial entre uma observao

    i e sua vizinhana.

    Entre seus requisitos, temos:

    soma dos ndices locais deve ser proporcional ao ndice global.

    necessrio indicar a significncia da associao espacial para cada observao.

    Os LISA podem ser empregados com o propsito de identificar:

    a) bolses de no estacionaridade dos dados, denominados hot-spots

    b) a influncia de cada uma das reas sobre a estatstica global

    c) reas com valores discrepantes.

    3.4.2.1 ndice local de Moran

    Permite obter o ndice de Moran para cada unidade espacial individual, calculando-se a

    significncia estatstica para cada unidade de rea i e sua expresso :

    para i diferente de j

    3.4.2.2 ndices locais Gi e Gi*

    O ndice local de Moran pode apresentar alguns problemas em sua interpretao, em funo

    de sua distribuio estatstica no ser conhecida perfeitamente e ter de ser estimada por

    simulaes. Por isso, interessante o uso das funes normalizadas Gi e Gi*.

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-35

    As funes Gi e Gi* so dois ndices de autocorrelao espacial local, que permitem o

    teste de hipteses sobre a concentrao espacial da soma dos valores, associados aos

    pontos na vizinhana do ponto considerado.

    Uma vez que estes indicadores so compostos por um somatrio de valores de

    atributos, a observao de valores significativamente altos de Gi e Gi* indica a existncia de

    ocorrncia desse atributo em valores altos, sendo o oposto um indcio de agrupamento de

    valores baixos.

    A principal diferena entre as funes Gi e Gi* que, na primeira, consideram-se

    apenas os valores dos vizinhos e na segunda considera-se tambm a regio em estudo no

    clculo do ndice, ou seja, para i = j.

    3.5 Grficos espaciais: LISA MAPs

    aquele que indica as regies que apresentam correlao local significativamente diferente do resto

    dos dados.

    3.5.1 Mapa de significncia LISA (LISA significance map)

    Uma outra forma de anlise por meio do mapa denominado, usualmente, apenas por LISA Map.

    Na gerao do LISA MAP, os ndices locais so classificados como:

    a) no significantes, ou seja, os pontos so no correlacionados

    b) com significncia de 95% 99% e 99,9%, ou 0,05, 0,01 e 0,001%

    3.5.2 Visualizao do Moran scatterplot (Moran Map - MM)

    Uma outra forma de anlise por meio do mapa denominado Moran Map. Neste caso, os ndices

    locais so associados ao diagrama de espalhamento de Moran.

    Nota: este resultado apresenta somente as regies para os quais os valores dos ndices foram

    considerados significantes.

    A visualizao do Moran scatterplot compara o valor do desvio do valor da varivel em relao

    mdia global (Zi) com o desvio do valor da varivel em relao mdia regional (WZi).

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-36

    Aps, classifica-se a variabilidade espacial em High-High (HH), Low-Low (LL), High-Low (HL) e Low-

    High (LH), referindo-se ao valores de Zi e WZi , respectivamente.

    Portanto um local que conste como High-Low, apresenta valores da varivel acima da mdia global e

    abaixo da mdia local.

    O MM espacializa os dados considerados estatisticamente significativos, classificados segundo os

    quatro quadrantes do Diagrama de Espalhamento de Moran (DEM).

    A figura 3.21 apresenta o Moran Map para o PIB dos Estados Brasileiros no ano de 2002 destacando

    os estados brasileiros cujos PIBs encontrma-se acima ou abaixo da mdia global e acima ou abaixo

    da mdia local, e que apresentam significncia estatstica. Os valores da significncia estatstica

    podem ser vistos no LISA Map.. Tendo em vista a visualizao do Moran scatterplot fazer uma

    comparao global e regional entre valores da varivel, preciso definir, nesse caso, a matriz de

    proximidade ( no GeoDa, pelo comando Tools Weights)

    Figura 3.21 Moran Map do PIB dos Estados brasileiros no ano de 2002.

    3.5.3 Diagrama de Espalhamento de Moran - DEM (Moran Scatterplot)

    Neste chamado diagrama, a variabilidade espacial pode ser expressa por meio de um grfico

    scatterplot, em cujas regies ocorrem aglomerados espaciais (autocorrelao positiva), que esto

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-37

    representados como High-High (HH) na parte superior-direita e como Low-Low (LL) na parte inferior-

    esquerda. As regies de spatial outliers (autocorrelao negativa) encontramse na parte inferior

    direita como High-Low (HL) e na parte superior esquerda como Low-High (LH).

    A interpretao de High-High de uma regio acima da mdia global, entre vizinhos tambm acima

    da mdia. O caso de High-Low de uma regio acima da mdia global e abaixo dos vizinhos.

    Os valores do Map Moran, independentemente de sua significncia estatstica, podem ser

    visualizados no Moran Scatterplot, conforme a Figura 3.22.

    Figura 3.22 Diagrama de disperso do PIB dos Estados brasileiros no ano de 2002.

    O DEM pode ser apresentado na forma de um mapa coropltico bidimensional, onde cada polgono

    apresentado indicando-se seu quadrante no diagrama de espalhamento. Ele representa

    espacialmente o relacionamento entre os valores dos desvios e os valores das mdias locais,

    indicando diferentes regimes espaciais presentes nos dados.

    EXERCCIO 3.16

    1. Determinar o ndice Local de Moran (LISA) no TerraView com os dados do arquivo .

    Dica: Anlise - Estatstica Espacial Atributo VALOR1 - ndice Local de Moran (LISA) Permutaes = 999 Prefixo da coluna = cont. Observar que foram criadas as as colunas contZ, contWz e contMoranIndex.

    2. Explicar o significado das colunas contZ, contWz, contMoranIndex. Selecionar 3 registros da tabela e conferir os valores numricos.

    Dica: preciso conhecer a mdia e o desvio-padro do VALOR1.

    3. Construir os mapas coroplticos dos valores de contZ, contWz e contMoranIndex.

    Dica: Boto direito sobre grid_teste Editar Legenda Modo = Quantil Atributo = .

  • Anlises Estatsticas Espaciais Paulo Afonso Lopes e Marcos de Meneses Rocha

    Pgina 3-38

    4. Construir o Box Map a partir da coluna contBoxMap do TerraView.

    Dica: Boto direito sobre grid_teste Editar Legenda Modo = Valor nico Atributo = contBoxMap.

    5. Calcular o ndice de Moran no GeoDa e relacionar com o scatterplot gerado com os valores contZ e contWz.

    6. Indicar o que se pode inferir sobre os pontos situados em cada um dos quadrantes.

    Dica: Observar que o Box Map no TerraView visualiza o scatterplot do GeoDa (cuidado com as nomenclaturas).

    7. Relacionar cada quadrante com o respectivo valor numrico no TerraView.

    Para o 1. Quadrante no Scatterplot, o valor numrico no Terraview 1, para o 2. _______, para o 3 _________ e para o 4, o valor numrico no Terraview ________.

    8. Observar que a coluna contLISAsig mostra o valor da eststica p do teste de hiptese, o qual indica a no existncia de autocorrelao espacial quando os valores so maiores que 0,05. Alm disso. que que o contLISAMap apresenta valores 0 para p>0,05 e apresenta somente os valores p