Post on 06-Jan-2017
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
INSTITUTO DE INFORMÁTICA
CURSO DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
INTRODUÇÃO A SIG - SISTEMAS
DE INFORMAÇÕES GEOGRÁFICAS
por
JUGURTA LISBOA FILHO
T.I. nº 491 CPGCC-UFRGS Dezembro 1995
Trabalho Individual I
Prof. Dr. Cirano Iochpe
Orientador
Porto Alegre, dezembro de 1995
2
CIP - CATALOGAÇÃO NA PUBLICAÇÃO
LISBOA FILHO, JugurtaIntrodução a SIG - Sistemas de Informações
Geográficas / Jugurta Lisboa Filho. - Porto Alegre:CPGCC da UFRGS, 1995.
69p. - (TI - 491)
Trabalho orientado pelo Prof. Cirano Iochpe1. Informação Georeferenciada. 2. SIG. 3. Banco de
Dados Espacial. 4. Banco de Dados Geográfico. 5.Sistemas de Geoprocessamento. I. Iochpe, Cirano, II.Título. III. Série.
3
SUMÁRIO
LISTA DE FIGURAS ............................................................................................. 6
RESUMO................................................................................................................ 7
ABSTRACT ............................................................................................................ 8
1 INTRODUÇÃO .................................................................................................. 9
1.1 Disciplinas e Tecnologias Envolvidas............................................................. 11
1.2 Principais Áreas de Aplicação........................................................................ 12
1.2.1 Ocupação Humana........................................................................................ 12
1.2.2 Uso da Terra ................................................................................................. 13
1.2.3 Uso de Recursos Naturais.............................................................................. 13
1.2.4 Meio Ambiente .............................................................................................. 13
1.2.5 Atividades Econômicas.................................................................................. 13
2 DADOS GEOGRÁFICOS ................................................................................ 14
2.1 Mapas e Conceitos de Cartografia................................................................. 14
2.2 Natureza dos Dados Geográficos ................................................................... 17
2.3 Fontes de Dados.............................................................................................. 18
2.4 Métodos para Aquisição de Dados................................................................. 19
2.5 Qualidade dos Dados...................................................................................... 20
3 ARMAZENAMENTO DE DADOS EM SIG ................................................... 22
3.1 Conceitos Básicos em BD Espaciais ............................................................... 23
3.1.1 Identidade ..................................................................................................... 23
3.1.2 Entidade........................................................................................................ 23
3.1.3 Objeto ........................................................................................................... 23
3.1.4 Tipo de Entidade ........................................................................................... 23
3.1.5 Tipo de Objeto Espacial ................................................................................ 23
3.1.6 Classe de Objeto............................................................................................ 24
3.1.7 Atributo ......................................................................................................... 24
3.1.8 Valor de Atributo........................................................................................... 24
3.1.9 Camada (layer) ............................................................................................. 24
3.2 Modelos de Dados para SIG........................................................................... 25
3.3 Tipos de Objetos Espaciais............................................................................. 27
4
3.3.1 Dados do Tipo Ponto..................................................................................... 27
3.3.2 Dados do Tipo Linha..................................................................................... 28
3.3.3 Dados do Tipo Área....................................................................................... 29
3.3.4 Representação de Superfícies Contínuas........................................................ 30
3.4 Tipos de Relacionamentos entre Objetos Espaciais ...................................... 31
3.4.1 Exemplos de Relacionamentos Espaciais ....................................................... 32
3.5 Topologia em Banco de Dados ....................................................................... 34
3.6 Modelos de Representação de Dados Georeferenciados ............................... 36
3.6.1 Modelo Matricial (ou Raster) ........................................................................ 38
3.6.1.1 Técnica Run-Length Encoding ................................................................... 39
3.6.1.2 Quadtrees ................................................................................................... 40
3.6.2 Modelo Vetorial............................................................................................. 41
3.6.2.1 Estrutura de Dados para Armazenar Pontos ................................................ 43
3.6.2.2 Estrutura de Dados para Armazenar Linhas ................................................ 43
3.6.2.3 Estrutura de Dados para Armazenar Polígonos ........................................... 44
3.6.3 Comparação entre os Modelos Raster &Vetorial........................................... 46
4 ANÁLISE DE DADOS ESPACIAIS EM SIG.................................................. 48
4.1 Classificação de Funções de Análise .............................................................. 48
4.1.1 Funções de Manutenção e Análise de Dados Espaciais ................................. 49
4.1.1.1 Transformações de Formato........................................................................ 49
4.1.1.2 Transformações Geométricas...................................................................... 50
4.1.1.3 Transformações entre Projeções Geométricas ............................................. 50
4.1.1.4 Casamento de Bordas.................................................................................. 51
4.1.1.5 Edição de Elementos Gráficos .................................................................... 51
4.1.1.6 Redução de Coordenadas............................................................................ 51
4.1.2 Manutenção e Análise de Atributos Descritivos ............................................. 52
4.1.2.1 Edição de Atributos Descritivos.................................................................. 52
4.1.2.2 Consulta a Atributos Descritivos................................................................. 52
4.1.3 Análise Integrada de Dados Espaciais e Descritivos...................................... 52
4.1.3.1 Funções de Recuperação/Classificação e Medidas....................................... 53
4.1.3.2 Funções de Sobreposição de Camadas (overlay) ......................................... 54
4.1.3.3 Funções de Vizinhança ............................................................................... 55
4.1.3.4 Funções de Conectividade .......................................................................... 57
4.1.4 Formatação de Saída..................................................................................... 59
4.1.4.1 Anotações em Mapas.................................................................................. 59
5
4.1.4.2 Posicionamento de Rótulos......................................................................... 59
4.1.4.3 Padrões de Textura e Estilos de Linhas ....................................................... 59
4.1.4.4 Símbolos Gráficos ...................................................................................... 59
4.2 Um Exemplo de Análise Espacial .................................................................. 60
5 CONSIDERAÇÕES FINAIS ............................................................................ 64
REFERÊNCIAS BIBLIOGRÁFICAS ................................................................. 67
6
LISTA DE FIGURAS
Figura 1.1 - Aspectos Tecnológicos de SIG [ANT 91] ........................................... 12
Figura 2.1 - Exemplo de Mapas Temáticos [RAM 94] ........................................... 15
Figura 3.1 - Tipos Básicos de Objetos Espaciais .................................................... 24
Figura 3.2 - Modelos de Dados - Visão de Campo ................................................. 26
Figura 3.3 - Tabela de Atributos com dados espaciais ............................................ 28
Figura 3.4 - Exemplos de Estrutura de Rede [NCG 90].......................................... 28
Figura 3.5 - Distribuição Espacial de Áreas ........................................................... 29
Figura 3.6 - Distribuição Espacial com "buracos" ou "ilhas" .................................. 30
Figura 3.7 - Elevações em projeção tridimensional ................................................ 31
Figura 3.8 - Processo de Construir Topologia ........................................................ 35
Figura 3.9 - Estrutura de dados com topologia ....................................................... 36
Figura 3.10 - Exemplo de representação raster e vetorial ....................................... 37
Figura 3.11 - Técnica Run-Length Encoding [ARO 89] ......................................... 39
Figura 3.12 - Exemplo de estrutura quadtree [RAM 94]......................................... 41
Figura 3.13 - Estrutura de Dados para Rede [NCG 90]........................................... 43
Figura 3.14 - Representação em Grafos Não-direcionados [LAU 92]..................... 44
Figura 3.15 - Relacionamento de Polígonos Adjacentes [NCG 90]......................... 45
Figura 3.16 - Modelo Raster X Modelo Vetorial.................................................... 47
Figura 4.1 - Classificação de Funções de Análise [ARO 89] .................................. 49
Figura 4.2 - Exemplo de Operação de Redução de Coordenadas ............................ 51
Figura 4.3 - Funções de Generalização .................................................................. 53
Figura 4.4 - Operações de Sobreposição de Camadas............................................. 54
Figura 4.5 - Exemplo de Operação de Interpolação................................................ 56
Figura 4.6 - Exemplo de zonas de buffer ............................................................... 58
Figura 4.7 - Exemplo de BD Geográfico................................................................ 60
Figura 4.8 - Passo 1 - Selecionar Espécies de Pinus ............................................... 61
Figura 4.9 - Passo 2 - Selecionar Solos Bem Drenados .......................................... 61
Figura 4.10 - Passos 3 e 4 - Identificar Áreas Longe de Lago................................. 62
Figura 4.11 - Passo 5 - Selecionar Espécies e Solos Adequados ............................. 62
Figura 4.12 - Passo 6 - Resultado Final do Processo de Análise Espacial ............... 63
Figura 5.1- Tipos de modelos relacionados com SIG ............................................. 65
7
RESUMO
Sistemas de Informações Geográficas (SIG) são sistemas computacionais
capazes de capturar, armazenar, analisar e imprimir dados referenciados espacialmente
em relação à sua localização sobre a superfície terrestre. Os SIG são usados no suporte
às aplicações na área de Geoprocessamento, uma área multidisciplinar que engloba
conhecimentos de diferentes campos, como Geografia, Cartografia, Geodésia,
Sensoriamento Remoto, Ciência da Computação e diversos ramos da Engenharia e
Matemática.
Este trabalho apresenta um estudo inicial dos diferentes conceitos empregados
em SIG, com ênfase nos tipos de dados manipulados, nos métodos de armazenamento de
dados usados e nos tipos de operações disponíveis nesses sistemas.
PALAVRAS-CHAVE : Informação Georeferenciada, SIG, Banco de Dados Espacial, Banco de Dados Geográfico, Sistemas de Geoprocessamento.
8
ABSTRACT
Geographic Information Systems (GIS) are computing systems able to capture,
store, analyse, and print spatially referenced data related with their position in the earth's
surface. GIS are used to support applications in Geomatics area, a multidisciplinary area
which includes knowledge of different fields as Geography, Cartography, Geodesy,
Remote Sensing, Computer Science and other branches of Engineering and Mathematics.
This work presents a beginning study of different concepts applied to GIS, with
emphasis in the manipulated data types, data management methods and the functions of
analysis available in these systems.
KEYWORDS : Geographically referenced data, GIS, Spatial Database, Geographic Database, Geoprocessing Systems.
9
1 INTRODUÇÃO
Sistemas de Informações Geográficas (SIG) são sistemas computacionais
capazes de capturar, armazenar, consultar, manipular, analisar, exibir e imprimir dados
referenciados espacialmente sobre/sob a superfície da Terra [RAP 92].
Diversas definições são encontradas na literatura, umas mais genéricas, como esta
e outras mais específicas, incluindo detalhes das aplicações ou tecnologias empregadas.
A seguir são listadas algumas definições encontradas em [NCG 90]:
"Um SIG é uma forma particular de Sistema de Informação aplicado a dados
geográficos".
"Um SIG manipula dados referenciados geograficamente assim como dados
não-espaciais e inclui operações para suportar análises espaciais".
"Um SIG pode ser visto como um sistema de hardware, software e
procedimentos projetados para suportar captura, gerenciamento,
manipulação, análise, modelagem e consulta de dados referenciados
espacialmente, para solução de problemas de planejamento e
gerenciamento".
Existem outros sistemas que também manipulam dados espaciais (ex. AutoCad e
pacotes estatísticos). Porém, os SIG se caracterizam por permitir ao usuário, a realização
de complexas operações de análise sobre os dados espaciais.
Uma das vantagens dos SIG é que eles podem manipular dados gráficos e não-
gráficos de forma integrada, provendo uma forma consistente para análise e consulta
envolvendo dados geográficos. Pode-se permitir, por exemplo, acesso a registros de
imóveis a partir de sua localização geográfica. Além disso, podem fazer conexões entre
diferentes entidades, baseados no conceito de proximidade geográfica.
10
Normalmente, os SIG são desenvolvidos de forma integrada ou suportados por
um SGBD - Sistema Gerenciador de Banco de Dados [ESR 91]. Os dados gerenciados
pelos SIG podem ser classificados em três categorias principais: dados convencionais,
dados espaciais e dados pictórios [Ooi 90]. Estas estruturas de dados possibilitam o
armazenamento de informações sobre a localização geográfica, características
estruturais, geométricas e topológicas de entidades pertencentes a um determinado
domínio.
Pesquisas na área dos SIG tiveram início na década de 60, variando em
terminologia de acordo com a área de aplicação a que se destinavam. Termos como
Land Information System (LIS), Automated Mapping/Facilities Management (AM/FM),
Computer-Aided Drafting and Design (CADD), Multipurpose Cadastre e outros, foram
usados para identificar sistemas, em diferentes áreas da atividade humana, que têm como
característica comum, o tratamento de informações geográficas, ou seja, informações
com atributos associados a uma localização determinada dentro de um sistema de
coordenadas.
O gerenciamento de informações geográficas teve sua origem na metade do
século XVIII, quando, a partir do desenvolvimento da cartografia, foram produzidos os
primeiros mapas com precisão. Os SIG começaram a ser pesquisados paralelamente, e de
forma independente, em diversos países como EUA, Canadá e Inglaterra. Desde a
década de 60, a tecnologia de SIG tem sido utilizada em diferentes setores como
agricultura, exploração de petróleo, controle de recursos naturais, sócio-econômicos e
controle do uso da terra [ANT 91].
Os primeiros SIG eram dirigidos, principalmente, para o processamento de
atributos de dados e análises geográficas, mas possuíam capacidades gráficas
rudimentares. A partir das décadas de 70 e 80, o aumento na capacidade de
processamento dos computadores, aliado à redução dos custos de memória e hardware
em geral influenciaram substancialmente o desenvolvimento dos SIG. Também o
desenvolvimento de dispositivos de alta tecnologia, como monitores de vídeo coloridos e
"plotters" a jato de tinta, contribuíram para disseminar o uso da tecnologia. Os primeiros
sistemas comerciais começaram a surgir no início da década de 80, o sistema ARC/INFO
da Environment Systems Research Institute (ESRI) foi um dos primeiros. A integração
com a tecnologia de gerenciamento de banco de dados foi outro marco importante no
desenvolvimento desses sistemas [ESR 91].
11
1.1 Disciplinas e Tecnologias Envolvidas
O termo Geoprocessamento tem sido usado para caracterizar uma área
multidisciplinar, que envolve conhecimentos de diferentes disciplinas, como por exemplo,
Geografia, Cartografia, Ciência da Computação, Sensoriamento Remoto, Fotogrametria,
Levantamento de Campo, Geodésia, Estatística, Pesquisas Operacionais, Matemática,
Engenharia, etc.
Sistema de Geoprocessamento classifica os sistemas computacionais capazes de
capturar, processar e gerenciar dados geo-espaciais (ou georeferenciados), isto é,
objetos com atributos contendo informações sobre sua localização geográfica em relação
a um sistema de coordenadas. Como exemplos de sistemas de Geoprocessamento
podemos citar: Sistemas de Cartografia Automatizada (CAC), Sistemas de
Processamento de Imagens, Sistemas de CAD e principalmente, os SIG.
Bancos de Dados Espaciais é o nome atribuído aos sistemas capazes de
gerenciar dados com representação geométrica. São utilizados em diversas áreas não só
as ligadas a Geoprocessamento, como também Medicina, Astronomia, etc [MED 94]. O
termo Banco de Dados Geográficos caracteriza os sistemas de Banco de Dados
Espaciais utilizados em aplicações de Geoprocessamento, ou seja, são uma
especialização dos sistemas de Banco de Dados Espaciais [CAM 94].
O termo Geomatics, usado no Canadá, é um termo "guarda-chuva" que engloba
assuntos relacionados a cadastro, levantamento, mapeamento, sensoriamento remoto e
SIG [BEA 95]. Segundo [GEO 95], Geomatics é o campo de atividades que, utilizando
uma abordagem sistêmica, integra todos os meios empregados na aquisição e
gerenciamento de dados espaciais usados em aplicações científicas, administrativas,
legais e técnicas, envolvidas no processo de produção e gerenciamento de informação
espacial. No Brasil, o termo equivalente para Geomatics seria Geoprocessamento, que
também engloba diversas disciplinas relacionadas a dados referenciados geograficamente.
Segundo [ANT 91], os SIG constituem-se na integração de três aspectos
distintos da tecnologia computacional (Figura 1.1): Gerenciamento de Banco de Dados
(dados gráficos e não gráficos), Procedimentos para obtenção, manipulação, exibição e
impressão de dados com representação gráfica e, por último, Algoritmos e técnicas para
análise de dados espaciais.
12
SIG
Gerenciamento deBanco de Dados
Ferramentas paraAnálise Espacial
CapacidadesGráficas
Figura 1.1 - Aspectos Tecnológicos de SIG [ANT 91]
Dentro da área de Computação participam ainda, diversos outros domínios,
como por exemplo, Processamento de Imagens, Computação Gráfica, Banco de Dados,
Algoritmos, Interface com Usuário, Inteligência Artificial, Sistemas Distribuídos e
Engenharia de Software.
1.2 Principais Áreas de Aplicação
O universo de problemas onde os SIG podem atuar com contribuições
substanciais é muito vasto. Atualmente, estes sistemas têm sido utilizados principalmente
em órgãos públicos nos níveis federal, estadual e municipal, em institutos de pesquisa,
empresas de prestação de serviço de utilidade pública (ex. companhias de água, luz,
telefone, etc), na área de segurança militar e em diversos tipos de empresas privadas.
A seguir listamos diversas áreas de aplicação, classificadas em cinco grupos
principais, segundo [RAM 94].
1.2.1 Ocupação Humana
Planejamento e Gerenciamento Urbano - Redes de infra-estrutura como água,
luz, telecomunicações, gás e esgoto, Planejamento e supervisão de limpeza urbana,
Cadastramento territorial urbano e Mapeamento eleitoral;
Saúde e Educação - Rede hospitalar, Rede de ensino, Saneamento básico e
Controle epidemiológico;
13
Transporte - Supervisão de malhas viárias, Roteamento de veículos, Controle de
tráfego e Sistema de informações turísticas.
Segurança - Supervisão do espaço aéreo, marítimo e terrestre, Controle de
tráfego aéreo, Sistemas de cartografia náutica, Serviços de atendimentos emergenciais.
1.2.2 Uso da Terra
Planejamento agropecuário; Estocagem e escoamento da produção agrícola;
Classificação de solos e vegetação; Gerenciamento de bacias hidrográficas; Planejamento
de barragens; Cadastramento de propriedades rurais; Levantamento topográfico e
planimétricos; e Mapeamento do uso da terra.
1.2.3 Uso de Recursos Naturais
Controle do extrativismo vegetal e mineral; Classificação de poços petrolíferos;
Planejamento de gasodutos e oleodutos; Distribuição de energia elétrica; Identificação de
mananciais e Gerenciamento costeiro e marítimo.
1.2.4 Meio Ambiente
Controle de queimadas; Estudos de modificações climáticas; Acompanhamento
de emissão e ação de poluentes; e Gerenciamento florestal de desmatamento e
reflorestamento.
1.2.5 Atividades Econômicas
Planejamento de marketing; Pesquisas sócio-econômicas; Distribuição de
produtos e serviços; Transporte de matéria-prima e insumos.
Os capítulos seguintes estão organizados da seguinte forma: o capítulo 2
descreve os tipos de dados manipulados em SIG e também faz uma revisão dos
principais conceitos relacionados a Cartografia, que são freqüentemente mencionados na
literatura de Geoprocessamento. O capítulo 3 trata do armazenamento de dados,
descrevendo os diferentes modelos de dados conceituais e lógicos, utilizados nos SIG. O
capítulo 4 é dedicado à utilização dos SIG, onde são descritas as principais funções de
análise espacial. Por último algumas conclusões são apresentadas.
14
2 DADOS GEOGRÁFICOS
Dados geo-espaciais (ou georeferenciados) é o nome atribuído às informações
utilizadas pelas aplicações de Geoprocessamento. Conforme dito anteriormente, estes
dados recebem esta denominação, por possuírem atributos relacionados a sua localização
geográfica dentro de um sistema de coordenadas.
Devido às características das aplicações de Geoprocessamento, a obtenção dos
dados é feita, em sua maioria, a partir de fontes brutas de dados, ou seja, as aplicações
tratam com entidades ou objetos físicos distribuídos geograficamente como, por exemplo
rios, montanhas, ruas, lotes, etc. Isto torna o processo de obtenção de dados uma das
tarefas mais difíceis e importantes no desenvolvimento destes sistemas. Um SIG pode ser
alimentado por informações de diversas fontes, empregando tecnologias como
digitalização de mapas, aerofotogrametria, sensoriamento remoto, levantamento de
campo, etc [ROD 90].
Nas seções seguintes, estão descritos diversos conceitos relacionados com os
dados georeferenciados, que são normalmente empregados em SIG. Inicialmente são
apresentados os conceitos herdados da Cartografia, seguindo-se uma caracterização dos
tipos de dados georeferenciados. Uma descrição das principais fontes de dados e dos
métodos de aquisição empregados é dada a seguir e por último são descritos os
problemas relacionados com as imprecisões dos dados, decorrentes dos processos de
aquisição e representação.
2.1 Mapas e Conceitos de Cartografia
Os mapas, tradicionalmente, têm sido as principais fontes de dados para os SIG.
Um mapa é uma representação, em escala e sobre uma superfície plana, de uma seleção
de características abstratas sobre ou em relação à superfície da terra [NCG 90].
15
A confecção de um mapa requer, entre outras coisas, a seleção das características
a serem incluídas no mapa, a classificação dessas características em grupos, a
simplificação para representação, a ampliação de certas características para que possam
ser representadas e a escolha de símbolos para representar as diferentes classes.
Mapas topográficos têm sido tradicionalmente elaborados com o objetivo de
atender a uma infinidade de propósitos, enquanto que os mapas "temáticos" são
elaborados com objetivos mais específicos, como por exemplo para representar a
hidrografia de uma região, estradas de rodagem, tipos de solos, etc [BUR 86]. Em um
SIG, a idéia de mapas "temáticos" é implementada empregando-se o conceito de
camadas, onde, para uma mesma região podem ser criadas diversas camadas de dados,
uma para cada tema a ser representado (Figura 2.1). Isto facilita a realização de
operações de análise. Por exemplo, os SIG fornecem ferramentas de análise que são
capazes de obter resultados para consultas do tipo: "Identifique todas as áreas com um
determinado tipo de solo e que estejam acima de uma determinada altitude", o que seria
feito a partir da combinação de dois mapas temáticos, um sobre tipos de solos e outro
sobre altimetria.
3536373839
R.1R.2
solo
zoneamento
infraestrutura
propriedades
controle topográfico
planimetria
controle geodésico
distritamentopolítico-administrativo
Realidade Geo-Espacial
Figura 2.1 - Exemplo de Mapas Temáticos [RAM 94]
16
Dois conceitos relacionados com a construção de mapas, que são a escala e a
projeção utilizadas, precisam ser bem compreendidos.
A escala de um mapa é a razão entre as distâncias no mapa e suas
correspondentes distâncias no mundo real. Por exemplo, em um mapa de escala
1:50.000, um centímetro no mapa corresponde a 50.000 cm (ou 500m) na superfície da
terra. Uma escala grande como a de 1:10.000 (1cm no mapa corresponde a 100m reais),
é suficiente para representar o traçado urbano de ruas em uma cidade. Porém, é
insuficiente caso a aplicação necessite manipular informações a nível de lotes urbanos. Já
em uma escala pequena, tipo 1:250.000 ( 1cm no mapa corresponde a 2,5Km reais),
somente grandes características podem ser representadas, como por exemplo, tipos de
solos, limites municipais, rodovias, etc.
A superfície curva da terra, tem que ser representada em mapas, que
normalmente são confeccionados sobre uma superfície plana, o que inevitavelmente
ocasiona distorções. Projeção é um método matemático, pelo qual a superfície curva da
terra é representada sobre uma superfície plana. Existem diferentes tipos de projeções
utilizadas na confecção de mapas, estas projeções atendem a objetivos distintos, podendo
preservar a área (projeção equivalente) das características representadas, a forma das
características (projeção conformal) ou mesmo a distância ( projeção eqüidistante) entre
pontos no mapa [NCG 90].
Mapas podem ser usados para diferentes propósitos, sendo que os mais comuns
são: para exibição e armazenamento de dados (ex.: uma folha de mapa comum pode
conter milhares de informações que podem ser recuperadas visualmente); como índices
espaciais (ex.: cada área delimitada em um mapa pode estar associada a um conjunto de
informações em um manual separado); como ferramenta de análise de dados (ex.:
comparar a localizar áreas de terras improdutivas); ou mesmo como objeto decorativo
(ex.: mapas topográficos, mapas temáticos, mapas turísticos, etc são muitas vezes usados
para decorar ambientes em repartições, escolas, etc).
A Cartografia Computadorizada ("AM-Automated Mapping") tem como meta
principal a confecção de mapas, utilizando-se ferramentas sofisticadas para criação de
"layouts", posicionamento de rótulos, uso de bibliotecas de símbolos, etc. Porém, estes
sistemas diferem dos SIG porque não precisam armazenar os dados de forma a permitir
operações de análise.
17
2.2 Natureza dos Dados Geográficos
Segundo Aronoff [ARO 89], os dados georeferenciados possuem quatro
componentes principais, que armazenam informações sobre o que é a entidade, onde ela
está localizada, qual o relacionamento com outras entidades e em que momento ou
período de tempo a entidade é válida. São eles:
1) Atributos qualitativos e quantitativos - armazenam as características das
entidades mapeadas, podendo ser representados por tipos de dados
alfanuméricos. Estes atributos possuem aspectos não-gráficos e podem ser
tratados pelos SGBDs convencionais.
2) Atributos de localização geográfica - diz respeito à geometria dos objetos
e envolve conceitos de métrica, sistemas de coordenadas, distância entre
pontos, medidas de ângulos, posicionamento geodésico, etc.
3) Relacionamento topológico - representam as relações de vizinhança
espacial interna e externa dos objetos. Este aspecto requer a existência de
modelos e métodos de acesso não-convencionais para sua representação nos
SGBDs.
4) Componente tempo - diz respeito à características temporais, sazonais ou
periódicas dos objetos. O aspecto temporal em SGBD, segundo [NEW 92],
inclui suporte para três tipos de medida de tempo: instante de tempo,
intervalo de tempo e relacionamentos envolvendo o tempo, como noções de
antes, depois, durante, simultaneamente, etc.
Dentro de um SIG, estes componentes podem ser classificados em três categorias
principais [OOI 90]: dados convencionais - atributos alfanuméricos usados para
descrever os objetos (ex.: nome e população de uma cidade); dados espaciais -
descrevem a geometria, a localização e os relacionamentos topológicos dos objetos
geográficos; e dados pictórios - atributos que armazenam imagens (ex.: fotografia de
uma cidade).
18
2.3 Fontes de Dados
A obtenção de dados em aplicações de Geoprocessamento é um processo bem
mais complexo quando comparado com a maioria das aplicações convencionais [ARO
89]. Isto se deve ao fato da entrada de dados não se limitar a simples operações de
inserção. As dificuldades surgem por duas razões: primeiro por se tratar de informações
gráficas, o que naturalmente já é uma tarefa mais complexa do que a entrada de dados
alfanuméricos, embora os SIG também manipulem dados alfanuméricos. A segunda
razão, e principal, é devido a natureza das fontes de dados dessas aplicações.
As fontes de dados variam de acordo com o tipo de aplicação. Como exemplo,
podemos pensar nas seguintes aplicações: Sistema de suporte a uma companhia de
distribuição de água, onde as entidades a serem representadas são canos, válvulas e
conexões de diversos tipos; Sistema de roteamento intermunicipal de veículos, que
manipula estruturas de rede, onde os nós representam as cidades e as ligações
representam possíveis caminhos entre duas cidades; ou um Sistema de gerenciamento
marítimo da costa brasileira, para o qual torna-se necessário o armazenamento dos
mapas de toda a costa brasileira, provavelmente em uma escala muito menor do que as
demais aplicações. Como se pode notar, algumas vezes os dados precisam ser obtidos
diretamente da realidade (fontes brutas), uma vez que nem sempre existe um mapa
pronto, na escala apropriada.
Os dados manipulados em um SIG podem ser entidades ou fenômenos
geográficos distribuídos sobre a superfície da terra, podendo pertencer a sistemas
naturais ou criados pelo homem, tais como tipos de solos, vegetação, cidades,
propriedades rurais ou urbanas, redes de telefonia, escolas, hospitais, fluxo de veículos,
aspectos climáticos, etc. Podem ser também objetos resultantes de projetos envolvendo
entidades que ainda não existam, como por exemplo, o planejamento de uma barragem
para a construção de uma usina hidroelétrica [RAM 94].
Os processos de coleta de dados são baseados em tecnologias tipo fotogrametria,
sensoriamento remoto e levantamento de campo, ou seja, os mesmos já empregados há
muito tempo em diversas áreas da Geociências e da Engenharia. Com isto, os produtos
resultantes desses processos de coleta de dados é que são as verdadeiras fontes de dados
dos SIG [ROD 90]. Os SIG possuem dispositivos de interface que permitem que esses
resultados sejam transferidos para um meio de armazenamento digital.
19
Até hoje, os mapas têm sido a principal fonte de dados para SIG, e o
levantamento de campo, o principal processo de coleta de dados. Porém, em um futuro
próximo, a aerofotogrametria e o sensoriamento remoto devem tornar-se cada vez mais
utilizados como tecnologia de coleta de dados geo-espaciais [ANT 91].
O problema da entrada de dados em SIG, é muito importante porque é a partir
destes dados que as análises são executadas e, consequentemente, as decisões são
tomadas. A transferência dos dados do meio externo (fontes brutas) para o meio interno
(representação digital) é apenas um passo no processo de aquisição dos dados. Muitas
operações posteriores são geralmente realizadas como, por exemplo, a associação entre
os objetos gráficos e seus atributos não-gráficos, operações para corrigir e padronizar os
dados com relação a projeções, escalas, sistemas de coordenadas, etc.
2.4 Métodos para Aquisição de Dados
Os métodos mais comuns de aquisição de dados são: a digitalização manual, a
leitura ótica através de dispositivos de varredura tipo "scanner", a digitação via teclado e
a leitura de dados provenientes de outras fontes de armazenamento secundário (ex. fitas
magnéticas, discos óticos, teleprocessamento, etc) [ARO 89]. Estes métodos permitem a
transferência dos dados obtidos através dos mecanismos de captura tipo levantamento de
campo, sensoriamento remoto, imagens de satélites, etc, para a base de dados dos SIG.
A digitalização é o método no qual uma folha de papel contendo um mapa é
colocada sobre uma mesa digitalizadora e, através de um dispositivo de apontamento
(ex. caneta ótica) um operador vai assinalando diversos pontos, que são calculados e
interpretados como pares de coordenadas x e y. Normalmente, no início do processo de
digitalização, três ou mais pontos de coordenadas conhecidas são cadastrados no sistema
para serem utilizados como pontos de referência no cálculo das coordenadas dos pontos
digitalizados [PAR 94].
A eficiência do processo depende da qualidade do software de digitalização e da
experiência do operador. Além da digitalização de pontos, outras tarefas também são
realizadas, como por exemplo, o ajuste de nós, a construção de topologia, a identificação
de objetos, etc. Digitalização é uma tarefa muito cansativa, normalmente consome muito
tempo e podem ocorrer erros. Por isso, os softwares de digitalização fornecem
20
mecanismos que auxiliam o operador a identificar e corrigir os possíveis erros
introduzidos.
O método de leitura ótica através de dispositivos de varredura ("scanner"),
permite a criação de imagens digitais a partir da movimentação de um detetor eletrônico
sobre um mapa. É um processo bem mais rápido que a digitalização, mas não é
adequado a todos os tipos de situações. Um mapa, para ser lido por um "scanner",
precisa apresentar algumas características que vão permitir a geração de imagens de boa
qualidade. Por exemplo, alguns textos podem ser lidos acidentalmente como se fossem
entidades, linhas de contorno podem ser quebradas por textos ou símbolos do mapa, etc
[NCG 90].
A digitação via teclado é usada para a inserção dos atributos não-gráficos.
Informações provenientes de levantamento de campo normalmente são inseridas no
banco de dados via teclado. Outro meio, também usado, é o emprego do GPS ("Global
Positioning Systems"), um sistema de posicionamento geodésico, baseado em uma rede
de satélites. Este sistema possibilita a realização de levantamentos de campo, com alto
grau de acurácia (ver seção seguinte) e com o registro dos dados podendo ser realizado
diretamente em meio digital.
Segundo [ARO 91], o custo inicial de construção da base de dados de um SIG,
muitas vezes é maior que o custo total de investimentos realizados na aquisição dos
componentes de hardware e de software. Para diminuir estes custos, a tendência atual
tem sido o compartilhamento de dados geo-espaciais já disponíveis em meio digital.
Diversos padrões de armazenamento de dados têm sido adotados para possibilitar a troca
desse tipo de informação. Algumas empresas se especializaram em produzir e
comercializar dados para SIG.
2.5 Qualidade dos Dados
Dados com erros podem surgir nos SIG, mas precisam ser identificados e
tratados. Os erros podem ser introduzidos no banco de dados de diversas formas: serem
decorrentes de erros nas fontes originais, serem adicionados durante os processos de
obtenção e armazenamento, serem gerados durante a exibição ou impressão dos dados
ou surgirem a partir de resultados equivocados em operações de análise dos dados [BUR
86].
21
Acurácia pode ser definida como a estimativa dos valores serem verdadeiros, ou
como a probabilidade de uma predição estar correta. Sempre existe, em algum grau, um
erro associado com todas as informações espaciais. O objetivo quando se trata de
identificar erros nem sempre é o de eliminá-los, mas sim de gerenciá-los [ARO 89].
Embora todos os dados espaciais sejam representados com erro em algum grau,
eles geralmente são representados computacionalmente com alta precisão. Precisão é
definida como o número de casas decimais ou dígitos significativos em uma medida. Se
um objeto espacial possui atributos de posicionamento com vários dígitos significativos
não implica que esta informação seja acurada [NCG 90].
A acurácia dos dados é crucial para que os usuários confiem no sistema. Dados
com erros significativos podem afetar os resultados de análises por diversos anos, antes
de serem descobertos [GRU 92].
A qualidade dos dados pode ser medida a partir da análise dos seguintes
componentes: acurácia posicional, acurácia dos atributos, consistência lógica
(relacionamentos topológicos), resolução da imagem, completude de informações, fator
tempo e histórico do processo de obtenção dos dados [ARO 89].
22
3 ARMAZENAMENTO DE DADOS EM SIG
Os SIG precisam armazenar grandes quantidades de dados e torná-los disponíveis
para operações de consulta e análise. Os Sistemas Gerenciadores de Banco de Dados
(SBGD) são ferramentas fundamentais para os SIG, embora muitos ainda utilizem
sistemas de arquivos para fazer o gerenciamento dos dados. Isto dificulta por exemplo, o
intercâmbio de dados e ainda obriga os usuários a conhecerem as estruturas de
armazenamento de dados [FRA 88].
Grande quantidade de pesquisa tem sido realizada por parte da comunidade de
banco de dados, sob o tema de banco de dados espaciais, com o objetivo de buscar
soluções adequadas para o problema de gerenciamento de dados georeferenciados
[MED 94]. Atualmente, a arquitetura mais empregada na construção dos SIG é a que
utiliza um sistema dual, onde o SIG é composto de um SGBD relacional, responsável
pela gerência dos atributos não-gráficos, acoplado a um componente responsável pelo
gerenciamento dos atributos espaciais [CAM 94].
Neste capítulo são apresentados diversos assuntos relacionados com o emprego
de SGBDs em SIG. Na primeira seção são apresentadas algumas definições padrão,
conforme o proposto pelo US National Digital Cartographic Standart. Em seguida são
identificados os principais modelos de dados usados em SIG. Uma caracterização dos
tipos de objetos espaciais manipulados pelos SIG é feita na seção 3 e uma relação dos
tipos de relacionamentos existentes entre os objetos espaciais é descrita na seção 4. A
seção 5 caracteriza as diferenças entre banco de dados cartográfico e banco de dados
topológico e por último, na seção 6 são apresentados os modelos de representação de
dados mais utilizados, que são os modelos matricial (raster) e vetorial.
23
3.1 Conceitos Básicos em BD Espaciais
O conjunto de definições a seguir, é o resultado de um trabalho de padronização
de termos, que foi proposto pelo US National Digital Cartografic Standart. Estas
definições foram extraídas de [NCG 90]. Neste trabalho, procurou-se empregar os
conceitos de acordo com estas definições.
3.1.1 Identidade
Elementos da realidade modelados em um banco de dados geográfico têm duas
identidades: o elemento na realidade, denominado entidade e o elemento representado
no banco de dados, denominado objeto. Uma terceira identidade usada em aplicações
cartográficas é o símbolo usado para representar entidades/objetos como uma feição no
mapa.
3.1.2 Entidade
É um fenômeno de interesse na realidade que não pode ser subdividido em
fenômenos do mesmo tipo. Por exemplo, uma floresta pode ser dividida em florestas
menores, enquanto que uma cidade se for dividida, suas partes não serão cidades e sim
bairros ou distritos.
3.1.3 Objeto
É a representação digital de uma (ou parte de uma) entidade. A representação
digital varia de acordo com a escala utilizada (ex.: um aeroporto pode ser representado
por um ponto ou uma área, dependendo da escala em uso).
3.1.4 Tipo de Entidade
É a caracterização de um agrupamento de entidades similares que podem ser
representadas por objetos armazenados de maneira uniforme (ex: o conjunto das estradas
de uma região). Fornece uma estrutura conceitual para a descrição dos fenômenos.
3.1.5 Tipo de Objeto Espacial
Cada Tipo de Entidade em um Banco de Dados Espacial é representado de
acordo com um tipo de objeto espacial apropriado. A Figura 3.1 mostra os tipos básicos
24
de objetos espaciais, definidos pelo US National Digital Cartografic Standart e
classificados segundo suas dimensões espaciais:
dimensão tipo descrição
0D ponto Um objeto com posição no espaço, mas sem comprimento
1D linha Um objeto tendo comprimento. Composto de 2 ou maisobjetos 0D
2D área Um objeto com comprimento e largura. Limitado por pelomenos 3 objetos 1D
3D volume Um objeto de comprimento, largura e altura. Limitado por pelomenos 4 objetos 2D
Figura 3.1 - Tipos Básicos de Objetos Espaciais
3.1.6 Classe de Objeto
Descreve um conjunto de objetos que representa um conjunto de entidades (ex.:
o conjunto de pontos que representam um conjunto de nascentes, postes, etc ou o
conjunto de áreas representando lotes urbanos).
3.1.7 Atributo
Descreve características das entidades, normalmente de forma não-espacial.
Exemplos são o nome da cidade, diâmetro de um duto, etc.
3.1.8 Valor de Atributo
Valor quantitativo ou qualitativo associado ao atributo. (ex.: nome da cidade =
'Porto Alegre', Diâmetro do duto = 1 ½").
3.1.9 Camada (layer)
Os objetos espaciais em um BD Geográfico podem ser agrupados e dispostos
(apresentados) em camadas (ou temas). Normalmente, uma camada contém um único
tipo de entidade ou um grupo de entidades conceitualmente relacionadas (ex.: uma
camada pode representar somente as rodovias de uma região, ou pode representar
também as ferrovias).
25
3.2 Modelos de Dados para SIG
Um Banco de Dados Geográfico é uma coleção de dados referenciados
espacialmente, que funciona como um modelo da realidade. Um banco de dados é um
modelo da realidade por representar um conjunto selecionado de fenômenos da
realidade, que podem estar associados a diferentes períodos de tempo (passado, presente
ou futuro) [BAR 91]. Modelagem de dados geográficos é o processo de discretização
que converte uma realidade geográfica complexa em um conjunto finito de registros ou
objetos de um banco de dados [GOO 92].
Os modelos de dados existentes para SIG estão relacionados com as diferentes
formas de percepção da realidade que podem ser empregadas. Para Goodchild [GOO
90], estes modelos de dados podem ser divididos segundo duas visões: visão de campo e
visão de objetos.
Quando a realidade observada possui uma distribuição contínua no espaço, como
por exemplo temperatura ou relevo, os objetos do banco de dados são, na verdade,
criações do processo de modelagem e são representados usando-se o modelo de campos.
Por outro lado, muitas entidades existem independentemente de qualquer
processo de modelagem, como por exemplo, uma rua, que possui dimensões bem
definidas. Além disso, algumas vezes é necessário representar situações onde mais de um
objeto compartilha uma mesma posição geográfica (ex. um cruzamento de avenidas), o
que não é possível no modelo de campo. O modelo de objetos permite a representação
destes tipos de dados.
Goodchild [GOO 91] descreve seis tipos diferentes de modelos de dados
baseados na visão de campos, que são usados em SIG (Figura 3.2). São eles:
a) Amostragem Irregular de Pontos - o banco de dados contém um conjunto
de tuplas <x,y,z> representando valores coletados em um conjunto finito de
localizações irregularmente espaçadas. (ex.: estações de medição de
temperatura)
b) Contornos - o banco de dados contém um conjunto de linhas, cada uma
com um valor z associado. (ex.: curvas de nível)
26
c) Polígonos - a área é particionada em um conjunto de polígonos, onde cada
localização pertence a exatamente um único polígono. Cada polígono tem
um valor que é único em todas as posições dentro do polígono. Os limites
dos polígonos são descritos por pares ordenados de coordenadas x e y. (ex.:
tipos de solos)
d) Amostragem Regular de Pontos - como no item a, porém com pontos
distribuídos regularmente. (ex.: Modelo de elevação de terreno)
e) Grade de Células - a área é particionada em uma grade regular de células,
onde o valor da cada célula corresponde ao valor da variável para todas as
posições dentro da célula. (ex.: imagens de satélites)
f) Rede Triangular Irregular - a área é particionada em triângulos irregulares.
O valor da variável é definido em cada vértice do triângulo e varia
linearmente sobre o triângulo. (ex.: TIN - rede irregular triangularizada)
a) Amostragem Irregular
b) Curvas de nível
c) Polígonos
d) Amostragem Regular
e)Grade Regular
f) Rede Triangular Irregular (TIN)
Figura 3.2 - Modelos de Dados - Visão de Campo
27
Cada um desses modelos pode ser representado em um banco de dados como um
conjunto de pontos, linhas, áreas ou células. Normalmente, os modelos d e e são
mapeados no modelo matricial, enquanto os demais são mapeados no modelo vetorial
[GOO 91]. Os modelos de representação matricial e vetorial estão descritos na seção
3.6.
No Modelo de Objetos, os objetos são representados como pontos, linhas ou
áreas. Dois objetos podem estar localizados na mesma posição geográfica, ou seja,
podem possuir coordenadas idênticas. Muitas implementações não fazem distinção no
banco de dados, entre modelos de objetos e de campos. Por exemplo, um conjunto de
linhas pode representar contornos (modelo de campos) ou estradas (modelo de objetos),
embora as implicações das interseções sejam muito diferentes nos dois casos. O modelo
de objetos é mais adequado para aplicações sócio-econômicas, que tratam com entidades
criadas pelo homem (ex. rede de transporte, monumentos, escolas, etc), enquanto que os
modelos de campo são mais adequado para aplicações ambientais.
3.3 Tipos de Objetos Espaciais
Os objetos espaciais são as representações das entidades do mundo real,
armazenadas no BD Geográfico. A seguir, é descrito como os objetos primitivos
(pontos, linhas, áreas e superfícies) são usados para representar as complexas entidades
da realidade.
3.3.1 Dados do Tipo Ponto
A escolha das entidades que podem ser representadas como pontos depende da
escala em uso. Por exemplo, em um mapa de escala grande, uma escola poderia ser
representada como um ponto, já em um mapa de escala pequena, um ponto seria usado
para representar a localização central da cidade onde essa mesma escola está localizada.
As coordenadas dos objetos tipo ponto podem ser armazenadas como dois
atributos extras na tabela de atributos da entidade. Por exemplo, as coordenadas dos
pontos representando a localização de escolas municipais (Figura 3.3a) podem ser
armazenadas em uma tabela junto com os demais atributos descritivos (Figura 3.3b).
28
12
3
4 5
(a) Posição geográfica das escolas
ID Coord.X Coord.Y Nome da Escola Diretora Fundação N.alunos
1 4673000 252500 E.E.Sto Antonio Maria José 01/05/35 240
2 4674000 254500 E.E. Prof. Rambo Jose Silva 05/08/35 1100
3 4671000 253500 E.M. Imigrantes Rita reis 07/06/57 740
4 4667000 253500 E.E.Gabriela Mistral Rosa Maria 04/04/46 1250
5 4668000 254000 Instituto de Educação Ana Maria 28/05/68 2600
Figura 3.3b - Tabela de Atributos com dados espaciais
3.3.2 Dados do Tipo Linha
Linhas e pontos são usados para representar entidades cujas características se
baseiam em estruturas de redes (Figura 3.4). Aparecem normalmente em aplicações de
infra-estrutura (redes viárias), redes de utilidade pública (gás, eletricidade, água, etc),
linhas de tráfego aéreo, redes hidrográficas, etc.
As redes são formadas basicamente por dois construtores que são os nós (junções
e terminadores) e as ligações (arcos entre dois nós). Denota-se por valência de um nó, o
número de ligações no nó.
ligação
nó valência 3
valência 4
Figura 3.4 - Exemplos de Estrutura de Rede [NCG 90]
29
Os atributos dos dados em uma rede podem estar relacionados aos nós ou às
ligações. Como exemplo de atributos de ligações podemos citar: direção do sentido do
tráfego em uma rua, distância entre duas cidades, diâmetro de uma tubulação, voltagem
da rede elétrica, etc. Para atributos associados aos nós da rede podemos citar: existência
de semáforo em um cruzamento, tipo de válvula em um nó de rede de água, existência
de um transformador de voltagem em uma rede elétrica, etc.
3.3.3 Dados do Tipo Área
Entidades com características bidimensionais são representadas por objetos do
tipo área. Os limites das entidades podem ser definidos originalmente pelos próprios
fenômenos (ex. limites de um lago, região costeira, etc), ou podem ter sido criados pelo
homem (ex.: limites de um município, área de reserva florestal, etc).
Quanto à distribuição no espaço, as entidades podem ser representadas por áreas
isoladas com possibilidade de sobreposição, como mostra a Figura 3.5a (ex. área usada
para cultivo de cana-de-açúcar nas últimas décadas), ou cada posição pertence a
exatamente uma única entidade, exemplificado pela Figura 3.5b (ex. propriedades
rurais/urbanas).
1970
1980 19901960
125 126
129 130
127 128
131
(a) (b)
Figura 3.5 - Distribuição Espacial de Áreas
Uma entidade pode conter "buracos" ou outras entidades completamente
inseridas dentro da sua área, como mostra a Figura 3.6. Alguns sistemas permitem que
uma entidade possa ser representada por um objeto composto por mais de uma primitiva
de área, porém com um único conjunto de argumentos [NCG 90].
30
A B
CE
D
D
Figura 3.6 - Distribuição Espacial com "buracos" ou "ilhas"
A representação dos dados do tipo área, segundo as diferentes visões quanto a
distribuição no espaço, depende do modelo de dados suportado pelo sistema.
3.3.4 Representação de Superfícies Contínuas
Alguns fenômenos da natureza, como por exemplo, elevação de terreno, pressão
atmosférica, temperatura, densidade populacional, etc, são caracterizados por possuírem
variação contínua no espaço.
Segundo Burrough [BUR 86], a variação da elevação sobre uma área pode ser
modelada de diversas maneiras. Modelos de Elevação Digital, ou Modelos Digitais de
Terreno podem ser representados tanto por superfícies definidas matematicamente (ex.:
séries de Fourier) ou através de imagens de pontos/linhas.
As representações mais conhecidas, baseadas em imagens de pontos, são as
matrizes de altitude, onde os dados são coletados em intervalos regulares de pontos
(Figura 3.2d). Esta abordagem tem a desvantagem de introduzir redundância de dados,
quando a área observada possui comportamento estável e pode perder informações,
quando a área é muito acidentada.
Outra abordagem, também baseada em imagens de pontos (ou áreas, segundo
[NCG 90]), é o modelo de Rede Irregular Triangularizada ("TIN - Triangulated Irregular
Network"), onde os pontos são coletados mais densamente em áreas com maior variação
acidental e mais esporadicamente nas outras áreas (Figura 3.2f). Os pontos são
conectados formando faces triangulares, onde os valores coletados ficam associados aos
vértices dos triângulos.
O tipo de modelo de terreno mais utilizado, é formado por um conjunto de linhas
de contorno (linhas isométricas), que representam pontos de mesma elevação (Figura
3.2b).
31
Dentro de um SIG, os dados referentes à elevação podem ser convertidos de um
modelo para outro, mas podem ocorrer perdas de informações, reduzindo os detalhes da
superfície topográfica [ARO 89]. Projeções tridimensionais podem ser usadas para
permitir uma melhor visualização do relevo da área observada (Figura 3.7).
Figura 3.7 - Elevações em projeção tridimensional
3.4 Tipos de Relacionamentos entre Objetos Espaciais
Os objetos de um banco de dados espacial representam as entidades no mundo
real através do armazenamento de seus atributos (espaciais e não-espaciais) e seus
relacionamentos. A grande vantagem dos SIG está em possibilitar operações de análise
sobre os dados armazenados. Para isto, além da manutenção dos dados propriamente
dita, é necessário manter os diferentes tipos de relacionamentos envolvendo esses dados.
Existe uma enorme variedade de relacionamentos possíveis. Alguns são mantidos
através de estruturas de dados dos SIG, como por exemplo, os relacionamentos de
conectividade entre linhas e de adjacência entre áreas (polígonos), enquanto que outros
normalmente são calculados durante a execução das operações de análise espacial, como
por exemplo, o relacionamento de continência entre um ponto e uma área.
Uma entidade pode estar relacionada com outras entidades do mesmo tipo, como
por exemplo, dois bairros vizinhos em uma cidade, ou pode estar relacionada com
32
entidades de outros tipos, como por exemplo, bairros localizados num raio de 10 Km de
um centro de atendimento emergencial.
Segundo [NCG 90], existem três tipos de relacionamentos entre objetos
espaciais, são eles:
1) Relacionamentos usados para a construção de objetos complexos, a partir
de objetos mais simples. Exemplo, os polígonos são formados por um
conjunto de linhas, enquanto que uma linha é composta de um conjunto de
pares ordenados de coordenadas, que são os pontos.
2) Relacionamentos que podem ser calculados a partir das coordenadas dos
objetos. Por exemplo, se duas linhas se cruzam, se um ponto está dentro de
uma área, se duas áreas estão sobrepostas, etc.
3) Relacionamentos que precisam ser fornecidos no momento da entrada dos
dados. Por exemplo, duas linhas podem se cruzar, mas as rodovias
representadas por elas podem não estar conectadas devido a existência de
uma passagem elevada (um viaduto).
3.4.1 Exemplos de Relacionamentos Espaciais
A seguir são listados diversos tipos de relacionamentos entre objetos espaciais e
mostrados exemplos de consultas espaciais, que poderiam ser solucionadas através
desses relacionamentos.
A) Relacionamentos entre Pontos
- "vizinhança" - liste todos os postos de gasolina (representados por pontos)
existentes num raio de 20 Km de um quartel de bombeiros.
- "o mais próximo" - identifique o posto da policia rodoviária federal mais
próximo do local de um acidente.
33
B) Relacionamentos entre Ponto-Linha
- "termina em" - identificar o tipo de válvula existente nas extremidades de
um oleoduto.
- "o mais próximo" - identifique a rodovia mais próxima ao local da queda de
um avião.
C) Relacionamentos entre Ponto-Área
- "está contido" - identifique as escolas estaduais que se localizam em um
determinado bairro.
- "visibilidade" - calcule o número de agências bancárias que podem ser
alcançadas por uma torre de transmissão de microondas.
D) Relacionamentos entre Linhas
- "cruza" - verificar se duas rodovias se cruzam em algum ponto.
- "flui para/desemboca" - identificar quais os rios que deságuam em um rio
específico.
E) Relacionamentos entre Linha-Área
- "cruza" - identifique todas as linhas de ônibus que passam por um
determinado bairro.
- "limites/fronteira" - calcular se um rio faz parte da divisa de um município.
F) Relacionamentos entre Áreas
- "sobrepõe" - verificar se a área de incidência de doenças sobrepõe-se a uma
área sem infra-estrutura de água e esgoto.
- "mais próximo" - encontrar o lago mais próximo à área de incêndio
florestal.
- "é adjacente" - identificar os bairros adjacentes ao bairro Sant'Anna.
34
3.5 Topologia em Banco de Dados
Uma das características mais importantes dos SIG, é a capacidade desses
sistemas possuírem estruturas para o armazenamento dos relacionamentos (vizinhança,
proximidade e pertinência) entre os objetos espaciais [ARO 89]. Estes relacionamentos
são fundamentais para possibilitar a realização de diversos tipos de operações de análise
espacial.
Quando um mapa de uma região que está sobre a superfície curva da Terra, é
construído sobre uma superfície plana (ex.: folha de papel), algumas propriedades são
alteradas (ex.: ângulos e distâncias), enquanto que outras permanecem (ex.: adjacências e
pertinências). Estas propriedades que não se alteram quando o mapa sofre uma
transformação são conhecidas como propriedades topológicas [KEM 92].
O termo topologia é atribuído às estruturas de relacionamentos espaciais que
podem, ou não, ser mantidas no banco de dados. Um banco de dados espacial é dito
topológico se ele armazena a topologia dos objetos. Por outro lado, um banco de dados
é dito cartográfico se os objetos são vistos e manipulados somente de forma
independente [GOO 90].
Banco de dados cartográficos são usados em muitos pacotes para confecção de
mapas, onde as operações de análise são menos importantes do que rotinas que auxiliam
no posicionamento de rótulos, bibliotecas de símbolos cartográficos, etc.
Um banco de dados cartográfico pode ser convertido em um banco de dados
topológico através do cálculo e identificação dos relacionamentos entre objetos. Este
processo é conhecido como Construir Topologia (Building Topology) [LAU 92].
O processo de Construir Topologia é usado também, para identificar os objetos
em um mapa, a partir das linhas digitalizadas. Este processo é feito empregando-se o
conceito de Restrição Planar (Planar Enforcement), que consiste na aplicação de duas
regras, sobre os objetos usados para descrever a variação espacial.
Basicamente, as regras de Restrições Planar são as seguintes:
Regra 1: Dois objetos do tipo área não podem se sobrepor.
Regra 2: Cada posição no mapa pertence a uma única área, ou aum limite entre áreas adjacentes.
35
O processo de Construir Topologia, exemplificado na Figura 3.8, começa com
um conjunto de segmentos de linha não relacionados (a). Cada interseção de linhas ou
nodo terminal (nós) é identificado (b). Em seguida, cada segmento de linha existente
entre dois nós consecutivos (arestas) é identificado. Finalmente, cada polígono resultante
recebe um identificador, inclusive o polígono externo que pode receber um identificador
diferenciado (c).
1
2 3
4
5
6
78 9
10
A
BC
D
11121314
15 16
1718
19
(a) (b)
(c)
0
Figura 3.8 - Processo de Construir Topologia
Os pontos, as linhas e os polígonos identificados durante o processo de
construção da topologia são armazenadas em estruturas de dados adequadas, que variam
de acordo com a implementação de cada sistema.
A Figura 3.9 mostra uma estrutura de dados para armazenamento de topologia,
que é utilizada no sistema ARC/INFO [MOR 92]. A primeira tabela contém, para cada
polígono, o número total e a identificação dos arcos que formam o polígono (sinal
positivo no sentido da digitalização e negativo indicando sentido contrário). Uma
segunda tabela contém, para cada arco, os nós inicial e final que formam o arco e quais
os polígonos que estão à direita e à esquerda do arco. Neste método, arcos adjacentes a
dois polígonos são armazenados uma única vez no banco de dados.
36
AB
C D
1
a b
c
d
e
23
4
56
7
N.Polígono N.de Arcos Lista de ArcosA 3 -1,-2,3B 4 2,-7,5,0,-6C 3 -3,-5,4D 1 6
N.Arco NóInicial
NóFinal
Polígono àEsquerda
Polígono àDireita
1 c a A 02 b c A B3 b a C A4 d a 0 C5 d b C B6 e e B D7 d c B 0
Figura 3.9 - Estrutura de dados com topologia
3.6 Modelos de Representação de Dados Georeferenciados
A variação geográfica no mundo real é infinitamente complexa. Para serem
armazenados no banco de dados, os dados precisam ser reduzidos a uma quantidade
finita e gerenciavel, o que é feito através de processos de generalização ou abstração.
Um Modelo de Dados fornece um conjunto de regras para converter variações
geográficas no mundo real, em objetos discretos armazenados de forma digital [NCG
90].
Existem duas abordagens principais de representação dos componentes espaciais
associados às informações geográficas: o modelo matricial (ou raster) e o modelo
vetorial, exemplificados na Figura 3.10.
37
No modelo raster, a área em questão é dividida em uma grade regular de células,
normalmente quadradas ou retangulares. A posição da célula é definida de acordo com a
linha e a coluna onde está localizada. Cada célula contém um valor que corresponde ao
tipo de entidade que é encontrada naquela posição. Normalmente, uma área é
representada no modelo raster através de diferentes camadas (mapas temáticos), onde as
células de uma camada armazenam os valores associados a uma única variável ou tema
(ex.: tipo de solo, hidrologia, relevo, etc) [MAG 92]. O espaço é todo coberto, uma vez
que cada localização na área de estudo corresponde a uma célula no raster.
Formato Raster Formato Vetorial
ϖϖϖϖϖϖϖϖϖαϖϖϖϖϖϖϖϖϖϖϖϖϖϖϖϖϖααααααϖϖϖϖϖϖϖϖϖϖϖϖαββββββββαϖϖϖϖϖϖϖϖααβββββββββββααϖϖααααββββββββββββααααϖϖααββββββββββββαϖϖϖϖϖϖϖϖαββββββββαϖϖϖϖϖ
ϖϖϖϖϖϖϖϖϖϖαϖϖϖϖϖϖϖϖϖϖϖϖϖϖϖϖααααααϖϖϖϖϖϖϖ
Figura 3.10 - Exemplo de representação raster e vetorial
No modelo vetorial, as entidades do mundo real são representadas como pontos,
linhas e polígonos. A posição de cada objeto é definida por sua localização no espaço, de
acordo com algum sistema de coordenadas. Objetos vetoriais não preenchem todo o
espaço, ou seja, nem todas as posições do espaço necessitam ser referenciadas no
modelo.
Os polígonos, formados por uma cadeia de linhas, representam os limites das
entidades do tipo área (ex.: um lago, um lote urbano, etc), enquanto que no modelo
raster as entidades são representadas em toda a extensão da área dentro do polígono. As
linhas, além de servirem de construtores dos polígonos, também representam entidades
lineares como estradas, rios, redes elétricas, etc. A representação geométrica das
entidades varia de acordo com a escala em uso. Por exemplo, um lago pode ser
representado por um polígono em uma escala grande (ex. 1:10.000), ou por um ponto
em uma escala pequena (1:100.000).
Nas seções seguintes, são apresentados maiores detalhes dos modelos raster e
vetorial, respectivamente. Na seção 3.6.3 é apresentado um quadro comparativo desses
modelos, indicando vantagens e desvantagens de cada um.
38
3.6.1 Modelo Matricial (ou Raster)
Ao contrário do modelo vetorial, onde cada entidade do mundo real está
associada a um objeto espacial (ponto, linha ou polígono), no modelo raster as entidades
estão associadas a grupos de células de mesmo valor. O valor armazenado em uma célula
representa a característica mais marcante da variável em toda a área relativa à célula.
Dependendo do tipo de atributo observado e da potencialidade do sistema, as
células podem conter diferentes tipos de valores (ex.: inteiro, decimal, caractere, etc).
Muitos sistemas só permitem o tipo inteiro, enquanto outros restringem um único tipo de
valor por camada [PAR 94].
Dois conceitos importantes no modelo raster dizem respeito à resolução e à
orientação. A resolução corresponde à dimensão linear mínima da menor unidade do
espaço geográfico que está sendo considerado. A maioria dos sistemas utilizam unidades
(células) retangulares ou quadradas, embora existam modelos que utilizem hexágonos ou
triângulos [LAU 92]. Quanto menor a dimensão das células, maior a resolução da área e,
consequentemente, maior a quantidade de memória necessária para armazená-las.
A orientação de uma imagem raster corresponde ao ângulo entre o norte
verdadeiro e a direção definida pelas colunas da imagem. Normalmente, a localização
geográfica verdadeira de um ou mais vértices da imagem é conhecida.
No modelo raster cada célula armazena um único valor, que corresponde a uma
área específica na superfície terrestre. O número total de valores que precisam ser salvos
para o armazenamento de uma única imagem, é igual ao produto do número de linhas
pelo número de colunas da imagem raster. Assim, geralmente são gerados grandes
volumes de dados e por isso torna-se necessário o emprego de estruturas de dados que
utilizem técnicas de compactação de dados.
Como as entidades no modelo raster são representadas por um agrupamento de
células, todas contendo um mesmo valor, um número considerável de valores
redundantes ocorre em toda a extensão da imagem. Esta característica é muito explorada
nos métodos de compactação empregados nos SIG. Segundo Burrough [BUR 86],
existem quatro técnicas principais de compactação que são empregadas no
armazenamento de imagens raster. São elas:
39
a) Códigos de cadeia (Chain codes) - Os limites de cada região é
armazenado através de uma estrutura contendo uma célula de origem e uma
seqüência de vetores unitários, que são aplicados nas direções cardinais
(leste, oeste, norte e sul), percorridos no sentido horário.
b) Códigos em seqüência (Run-length codes) - Armazena, para cada linha, o
número de ocorrências de células de mesmo valor e o valor correspondente.
c) Códigos de bloco (Block codes) - Armazena, para cada quadrado que
pode ser formado por um conjunto de células de mesmo valor, as
coordenadas da célula inferior esquerda do quadrado, a quantidade de
células (tamanho) do lado do quadrado e o valor do atributo.
d) Árvores quaternárias (Quadtree) - Utiliza uma estrutura hierárquica
espacial, baseada no princípio de decomposição recursiva do espaço. Existe
uma grande variação de tipos de estruturas quadtree, um exemplo é
apresentado mais adiante.
A seguir são mostrados dois exemplos dessas técnicas de compressão de dados.
Uma descrição mais completa desse assunto foge ao escopo deste trabalho. Maiores
detalhes podem ser obtidos em [BUR 86] e [SAM 89].
3.6.1.1 Técnica Run-Length Encoding
Segundo Aronoff [ARO 89], existem diversas variações desta técnica e duas
delas são mostradas na Figura 3.11. Na técnica Run-Length Encoding (b), as células
adjacentes em uma mesma linha e que tenham o mesmo valor são tratadas como um
grupo. Ao invés do valor ser armazenado repetitivamente, ele é armazenado uma única
vez e a quantidade de vezes que o valor ocorre é também armazenada, juntamente com o
identificador da linha.
Uma variação desta técnica, conhecida como Value Point Encoding (c),
armazena somente os valores de cada grupo de células e a posição final dos grupos, com
relação à origem (canto superior esquerdo) da imagem. O grau de compressão obtidos
através desses métodos depende da complexidade da imagem.
40
Α Α Α Α Α Α Α Α Α ΑΑ Α Α Α Α Α Α Α Α ΑΑ Α Α Α Β Β Β Β Β ΒΑ Α Α Β Β Β Β Β Β Β∆ ∆ ∆ ∆ Β Β Β Β Β Β∆ ∆ ∆ ∆ ∆ Β Β Β Β Β∆ ∆ ∆ ∆ ∆ Χ Χ Χ Χ Χ∆ ∆ ∆ ∆ ∆ Χ Χ Χ Χ Χ∆ ∆ ∆ ∆ ∆ Χ Χ Χ Χ Χ∆ ∆ ∆ ∆ ∆ Χ Χ Χ Χ Χ
0 1 2 3 4 5 6 7 8 9
0123456789
VALOR COMP LINHA
Α 10 0Α 10 1Α 4 2
Α 3 3Β 7 3∆ 4 4Β 6 4∆ 5 5Β 5 5
Β 6 2
∆ 5 6Χ 5 6∆ 5 7Χ 5 7∆ 5 8Χ 5 8∆ 5 9Χ 5 9
VALOR PONTO
Α 23Β 29Α 32
∆ 43Β 49∆ 54Β 59∆ 64Χ 69
Β 39
∆ 74Χ 79∆ 84Χ 89∆ 94Χ 99
A. Raster Completo
(100 valores)
B. Método
Run-Length Encoding
(54 valores)
C. Método
Value Point Encoding
(32 valores)
Figura 3.11 - Técnica Run-Length Encoding [ARO 89]
3.6.1.2 Quadtrees
O termo quadtree é usado para descrever uma família de estruturas de dados
hierárquicas, todas baseadas no princípio de decomposição recursiva do espaço [SAM
89]. Elas são diferenciadas com base nos seguintes fatores: (1) tipo de dado que está
sendo representado (ex.: pontos, retângulos, regiões, curvas, superfícies e volumes); (2)
processo de decomposição empregado, que pode aplicar divisões em partes iguais ou
não; e (3) resolução da imagem, isto é, o número de vezes que a decomposição é
aplicada, que pode ser fixo ou variável.
A Figura 3.12 mostra a decomposição de uma imagem usando a estrutura
Region-quadtree, que é uma variação de quadtree para representação de regiões, onde
uma região (a), representada na matriz binária (b) é decomposta em blocos (c), gerando
a árvore correspondente.
Neste método, a raiz da árvore corresponde à imagem completa, ou seja, um
array de 2n x 2n valores de células. Cada nó da árvore pode ser um nó folha ou possuir
41
quatro ramos descendentes, compreendendo aos quatro quadrantes: nordeste (NE),
noroeste (NW), sudoeste (SW) e sudeste (SE). Nós folhas correspondem aos quadrantes
que não necessitam ser redivididos por possuírem somente células de mesmo valor. A
forma de decomposição espacial deste modelo possibilita a representação de imagens de
qualquer grau de resolução desejado [TIM 94].
1
2 3
67
1118
19
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
4 5
8
9 10
12
13 14
15 16
17
a b c
Level 3
Level 2
Level 1
Level 0
A
B C E
D F
NW NE SW SE
2 3 4 5 6
7 8 9 10
11 12 13 14
15 16 17 18
19
1
Figura 3.12 - Exemplo de estrutura quadtree [RAM 94]
3.6.2 Modelo Vetorial
O modelo de representação vetorial tem como primitiva principal o Ponto,
porém, são utilizados três construtores básicos: o ponto, a linha e o polígono. As
coordenadas x e y de um ponto correspondem à localização, em um sistema de
coordenadas específico, de entidades que são representadas sem dimensões espaciais. A
linha, formada por uma cadeia de segmentos de linha reta, ou mais especificamente, por
uma lista de coordenadas de pontos, é o objeto espacial usado para representar no banco
42
de dados, as entidades da realidade que possuem extensão linear. O polígono é o objeto
espacial que representa as entidades com extensões bidimensionais (área), através da
definição do contorno da área da entidade. O polígono é formado por uma cadeia
fechada de segmentos de linha, podendo ou não, ter outros polígonos embutidos em seu
interior.
Existe uma enorme variedade de técnicas de armazenamento de objetos espaciais,
que são baseadas no modelo vetorial [LAU 92]. Essas técnicas podem ser classificadas
de acordo com o tipo de objeto armazenado, ou seja, ponto, linha ou polígono.
Características do tipo de aplicações a que se destinam também são importantes. Por
exemplo, em um sistema de roteamento de veículos, uma característica fundamental é a
conectividade entre as arestas da rede viária, para possibilitar operações de análise de
melhor caminho.
Outra classificação existente leva em consideração se os relacionamentos
topológicos são, ou não, armazenados. Aronoff [ARO 89], divide os diversos modelos
vetoriais em dois grupos: Modelos de Dados Spaghetti e Modelos de Dados
Topológicos.
Os Modelos de Dados Spaghetti utilizam estruturas de dados que armazenam os
polígonos/linhas como seqüências de coordenadas de pontos. Nestes modelos, os limites
entre duas áreas adjacentes são registrados (digitalizados) e armazenados duas vezes,
uma para cada polígono. Estes modelos são utilizados em muitos pacotes de cartografia
automatizada, onde as informações sobre os relacionamentos entre as entidades não são
importantes [NCG 90].
A maioria dos SIG utilizam os Modelos de Dados Topológicos, os quais usam
estruturas de dados que possibilitam o armazenamento de alguns tipos de
relacionamentos, sendo que a ênfase principal é dada nos relacionamentos de
conectividade entre linhas de uma rede (contendo arestas interligadas por nós) e nos
relacionamentos de vizinhança entre áreas (representadas por polígonos) adjacentes.
Outros tipos de relacionamentos entre objetos espaciais, como por exemplo, se uma linha
"cruza" uma área ou se um ponto está "dentro" de uma área, são calculados a partir das
coordenadas desses objetos.
A seguir, são descritas algumas estruturas de dados vetoriais empregadas nos
SIG, de acordo com os tipos de objetos.
43
3.6.2.1 Estrutura de Dados para Armazenar Pontos
A princípio, as coordenadas (x,y) de posicionamento das entidades com
representação pontual podem ser adicionadas como dois atributos extras na tabela de
atributos (não-espaciais) que descrevem as entidades. A Figura 3.3, mostrada na seção
3.3, exemplifica esta alternativa. Porém, um objeto espacial do tipo ponto pode ter
diversos outros atributos associados a sua representação gráfica para impressão/exibição
em dispositivos de saída, como por exemplo, o tipo de símbolo que deve ser exibido, a
fonte, o tamanho e a orientação do texto que pode ser exibido próximo ao símbolo, etc.
Uma alternativa, é manter as informações espaciais em uma tabela e utilizar
identificadores de objetos para recuperar os demais atributos não-espaciais em uma
tabela do banco de dados textual [BUR 86].
3.6.2.2 Estrutura de Dados para Armazenar Linhas
As estruturas de armazenamento que visam manter os relacionamentos entre
objetos lineares são direcionadas a solucionar problemas em áreas de aplicações que são
baseadas em estruturas de rede, como por exemplo, redes de transporte, redes
hidrográficas, de distribuição de produtos, redes de infra-estrutura como água, luz e
telefone, etc.
A
B
C
D
1
23
4
5
Arco Nó de Nó deOrigem Destino
1 Β Α2 Χ Β3 ∆ Β4 Χ ∆5 Α Χ
Αρχοσ
Α 1 −5Β 3 2 −1Χ −4 −2 5∆ 4 −3
Nó
(a)
(b)(c)
Figura 3.13 - Estrutura de Dados para Rede [NCG 90]
44
As redes consistem de dois tipos de objetos espaciais: linhas (ligações, arestas ou
arcos) e pontos (nós, interseções ou junções) [NCG 90]. A Figura 3.13 mostra uma rede
composta de 4 nós e 5 arcos (a) e uma estrutura de dados simples (b), capaz de
possibilitar a navegação entre os diversos nós da rede.
Para melhorar a eficiência do algoritmo de navegação, pode ser acrescentada uma
nova tabela (c), contendo, para cada nó, a relação dos arcos adjacentes (números
positivos se os arcos atingem o nó e negativo para os arcos que partem do nó).
Uma estrutura de dados para o armazenamento de redes representadas por grafos
não-direcionados é mostrada na Figura 3.14. Neste exemplo, descrito em [LAU 92], são
empregadas três tabelas, contendo informações sobre os relacionamentos entre arco-
arcos, arco-nós e nó-arcos, possibilitando a navegação pela rede em qualquer sentido.
A
B
C
D
12
3
45
Arcos Adj.
Α 1 Β 2Χ 1,2,3∆ 3,4,5
Nó
EF
G
H
6
7
ArcoConectaaos arcos
1 2,32 1,33 1,2,4,54 3,55 3,4,6,76 5,77 5,6
ArcoConectaaos nós
1 Α,Χ2 Β,Χ3 Χ,∆4 Ε,∆5 ∆,Φ6 Γ,Φ7 Φ,Η
.
.
.
Figura 3.14 - Representação em Grafos Não-direcionados [LAU 92]
3.6.2.3 Estrutura de Dados para Armazenar Polígonos
O relacionamento de vizinhança entre entidades bidimensionais (áreas) é
representado através de estruturas de dados que armazenam informações sobre
polígonos adjacentes. A estratégia mais utilizada é baseada no armazenamento de
45
atributos dos arcos, acrescidos de dois apontadores extras, referentes aos polígonos
localizados à esquerda e à direita do arco, percorrido no sentido nó-origem-nó-destino.
A Figura 3.15 mostra um exemplo de uma estrutura de dados simples, que é
baseada em três tabelas. A primeira contém os atributos dos polígonos, a segunda os
atributos dos arcos e a terceira contém as coordenadas dos pontos que formam a
geometria dos arcos. Este método, utilizado no sistema ARC-INFO [ESR 91], tem a
desvantagem de não possibilitar a representação de entidades compostas de mais de um
polígono, como por exemplo, um arquipélago, que é uma entidade que precisa ser
representada como um conjunto de polígonos.
A
B
C1
2
3
4
5
6
Ι∆ Ατριβ1 Ατριβ2 Ατριβ3
Tab. Atributos de Polígonos
ΑΒΧ∆ (εξτεριορ)D
Αρχο ∆ιρ Εσθ Ορι ∆εσTab. Atributos de Arcos
1 Α ∆ α χ
α
β
2 Α Χ χ β 3 Α Β β α 4 ∆ Β α δ 5 Β Χ β δ 6 ∆ Χ δ χ
χ
δ
1 (ξ1,ψ1),(ξ2,ψ2),...
Tab. Geometria de Arcos
ετχ
2 (ξ1,ψ1),(ξ2,ψ2),...3 (ξ1,ψ1),(ξ2,ψ2),...
Figura 3.15 - Relacionamento de Polígonos Adjacentes [NCG 90]
Este tipo de estrutura possibilita a execução de operações de consulta de maneira
bastante eficiente, por não necessitar realizar operações com base nas coordenadas dos
objetos. Por exemplo, todos os polígonos adjacentes ao polígono B podem ser
encontrados a partir de consultas à Tabela de Atributos dos Arcos. Cada par de
apontadores (polígono à direita, polígono à esquerda), contendo o polígono B indica um
polígono adjacente a ele, por ter um arco em comum. Os arcos 3, 4 e 5 identificam os
46
polígonos adjacentes ao polígono B, sendo que o tratamento dado à área externa aos
polígonos (assinalada na figura como polígono D) varia de acordo com a implementação.
Existem muitas variações de estruturas de dados desenvolvidas para o
armazenamento da topologia de objetos espaciais. Um exemplo de estrutura mais
elaborada é a utilizada pelo sistema CanSIS - Canadian Soil Information System,
desenvolvida pelo Departamento de Agricultura do Canadá, que utiliza entre outras
coisas, uma estrutura para armazenar informações sobre objetos. Um objeto pode conter
uma lista de polígonos associada a um único conjunto de atributos, permitindo por
exemplo, um tratamento adequado à representação de um arquipélago [NCG 90].
3.6.3 Comparação entre os Modelos Raster &Vetorial
Os modelos de representação de dados raster e vetorial têm sido empregados de
acordo com o tipo de aplicações a que se destinam. Os modelos raster são mais
adequados para aplicações voltadas às áreas ambientais, enquanto os modelos vetoriais
são mais adequados para aplicações relacionadas às invenções humanas, como cadastro
de propriedades urbanas e rurais, redes de infra-estruturas, etc.
As aplicações onde as operações de análise espacial necessitam de informações
topológicas são normalmente desenvolvidas utilizando-se o modelo vetorial, enquanto
que as aplicações que necessitam realizar operações de sobreposição (overlay) a partir
de dois ou mais temas, utilizam o modelo raster. Os sistemas mais sofisticados fornecem
suporte para os dois modelos, incluindo procedimentos para a conversão entre os
modelos.
Como uma grande quantidade de dados normalmente é introduzida no sistema a
partir da digitalização de mapas disponíveis em folhas de papel, os dados muitas vezes
são armazenados no formato vetorial e convertidos para o formato raster para serem
utilizados em operações de overlay. Os resultados dessas operações também podem ser
convertidos para o formato vetorial para serem armazenados de forma mais eficiente.
No modelo raster, as informações sobre uma determinada área são organizadas
como um conjunto de camadas independentes, uma para cada tipo de variável, ou tema.
No modelo vetorial, os dados também podem estar divididos em diferentes camadas, o
que implica na existência de um conjunto de estruturas de armazenamento para cada
camada. Por exemplo, pode-se ter uma camada para armazenar os relacionamentos entre
arcos de uma rede em uma camada e os relacionamentos entre áreas em outra camada.
47
Pode-se ainda utilizar mais de uma camada de relacionamentos entre áreas, uma para
representar os lotes urbanos, outra para representar quadras e bairros. Estas escolhas são
definidas a nível de projeto das aplicações.
A Figura 3.16, adaptada de [ARO 89] e [COW 88], apresenta algumas vantagens
e desvantagens dos modelos raster e vetorial.
MODELO RASTER
Vantagens:
• Utiliza estrutura mais simples.
• Operações de overlay são implementadas mais eficientemente.
• Representação eficiente de áreas com alta variação espacial.
• Tratamento adequado de imagens produzidas por satélites.
Desvantagens:
• Estruturas de dados são menos compactas. Armazenam uma maior quantidadede dados, independente da utilização de métodos de compactação.
• Relacionamentos topológicos são mais difíceis de serem representados.
• Saída gráfica com menor resolução.
MODELO VETORIAL
Vantagens:
• Utiliza uma estrutura de dados mais compacta do que o modelo raster.
• Suporta o armazenamento de topologia.
• Permite a realização de cálculos de medidas espaciais mais precisos.
• Suporte adequado para operações que requerem informações topológicas.
• Gera saídas gráficas de melhor qualidade.
Desvantagens:
• As estruturas de dados são mais complexas que no modelo raster.
• Operações de overlay são mais difíceis de serem implementadas.
• A representação de áreas com alta variação espacial é ineficiente.
• Manipulação de imagens geradas por satélites é inadequado.
Figura 3.16 - Modelo Raster X Modelo Vetorial
48
4 ANÁLISE DE DADOS ESPACIAIS EM SIG
Segundo [ALV 90a], um SIG deve fornecer operações para a recuperação de
informações segundo critérios de natureza espacial e não-espacial. As linguagens de
consulta de SGBDs convencionais são adequadas para a recuperação de informações
segundo critérios não-espaciais. O SIG deve ser capaz de manipular dados espaciais e
recuperar informações com base em conceitos como proximidade, pertinência a uma
área, interseção entre objetos, etc.
Existe atualmente uma enorme variedade de funções de manipulação e análise de
dados, disponíveis nos sistemas. Além disso, novas funções estão sempre sendo
adicionadas ao conjunto das já existentes. Por outro lado, não existe uma padronização
dos nomes dessas funções, sendo comum a existência de funções com comportamento
idêntico, porém com nomes diferentes [NCG 90].
A seguir, é descrito um conjunto de funções que são freqüentemente encontradas
na maioria dos SIG. Existem diversos tipos de classificações de funções em um SIG, mas
nenhum é totalmente aceito. A classificação a seguir baseia-se na descrição feita em
[ARO 89].
4.1 Classificação de Funções de Análise
Na abordagem utilizada por Aronoff [ARO 89], as funções estão agrupadas em
quatro categorias principais, que são: (1) Manutenção e Análise de Dados Espaciais; (2)
Manutenção e Análise de Atributos Descritivos; (3) Análise Integrada de Dados
Espaciais e Descritivos; e (4) Formatação de Saída. Cada grupo desses é subdividido em
outros grupos, como mostra a Figura 4.1.
49
1.Manutenção e Análise de Dados Espaciais
-Transformações de Formato-Transformações Geométricas-Transformações entre Projeções-Casamento de Bordas-Edição de Elementos Gráficos-Redução de Coordenadas
2. Manutenção e Análise de Atributos Descritivos
-Edição de Atributos Descritivos-Consulta a Atributos Descritivos
3. Análise Integrada de Atributos Espaciais e Descritivos
-Recuperação, Classificação e Medidas
-Recuperação-Classificação e Generalização-Medidas
-Sobreposição (overlay)
-Vizinhança -Busca-Linha-em-Polígono e Ponto-em-Polígono-Funções Topográficas-Funções de Interpolação-Geração de Contornos
-Conectividade -Medidas de Contiguidade-Proximidade-Rede-Intervisibilidade
4. Formatação de Saída -Anotações em Mapa-Posicionamento de Rótulos-Padrões de Texto e Estilos de Linhas-Símbolos Gráficos
Figura 4.1 - Classificação de Funções de Análise [ARO 89]
4.1.1 Funções de Manutenção e Análise de Dados Espaciais
Neste grupo são incluídas as funções utilizadas na fase de pré-processamento dos
dados espaciais, ou seja, funções usadas na preparação ou reorganização dos dados para
que possam ser utilizados em operações de análise e consulta.
4.1.1.1 Transformações de Formato
Os dados obtidos a partir das diversas fontes de dados nem sempre estão no
formato adequado para o armazenamento nos SIG. Arquivos de dados externos
precisam ser convertidos para as estruturas de dados internas dos sistemas.
50
Para dados no formato raster, por exemplo, pode ser necessário adicionar
informações como descrição (nome), origem, tamanho, entre outras coisas. Para dados
obtidos no formato vetorial pode ser necessário construir a topologia, identificar os
objetos, etc.
4.1.1.2 Transformações Geométricas
São funções utilizadas para definir ou ajustar as coordenadas terrestres em um
mapa ou nas camadas de dados em um SIG, com o objetivo de possibilitar operações de
sobreposição (overlay) de camadas.
O procedimento de registro de camadas é utilizado para registrar diferentes
camadas de dados sobre um sistema de coordenadas comum ou em relação a uma
camada de dados usada como padrão (mestre).
Duas abordagens podem ser utilizadas para registrar camadas: Registro por
Posição Relativa - cada camada é registrada em relação a uma camada mestre; e
Registro por Posição Absoluta - cada camada é registrada separadamente, com base em
um mesmo sistema de coordenadas geográficas (ex.: UTM, latitude/longitude, etc).
O ajuste de posições relativas é feito escolhendo-se feições que possam ser
identificadas precisamente nas duas camadas (ex.: uma ponte indicando uma interseção
de uma estrada com um rio) e igualando suas coordenadas. Ajustados alguns pontos de
referência, as demais coordenadas são calculadas matematicamente.
4.1.1.3 Transformações entre Projeções Geométricas
Segundo Aronoff, as camadas de dados que são processadas conjuntamente em
um SIG, devem ser representadas usando o mesmo sistema de projeção. Os sistemas
normalmente suportam mais de um tipo de projeção, fornecendo operações para
transformar as projeções dos mapas.
No Brasil [ALV 90], como nos E.U.A. [ARO 89], os tipos de projeções mais
utilizados são: UTM (Universal Transverse Mercator) para mapas em escalas até
1:500.000, Lambert para cartas em escalas próximas de 1:1.000.000 e Mercator nas
cartas náuticas. Para representação do território brasileiro, normalmente as cartas são
produzidas usando a projeção Policônica em escalas entre 1:5.000.000 e 1:15.000.000.
51
4.1.1.4 Casamento de Bordas
Muitas vezes, a impressão da área armazenada, em estudo, não cabe em uma
única folha de papel. Nestes casos, são gerados diversos mapas (chamados de coberturas
no sistema ARC/INFO [ESR 91]), para representar uma única camada de dados. Em
muitos SIG, essa divisão é transparente ao usuário, durante a realização de operações de
análise que envolvam mais de uma cobertura. Porém, ajustes precisam ser feitos durante
a fase de preparação (pré-processamento) dos dados. Esses ajustes são feitos através de
operações que realizam a união de bordas entre coberturas adjacentes, nas quais os
objetos que ultrapassam os limites de uma cobertura têm suas coordenadas limites
ajustadas, caso ocorra alguma discrepância.
4.1.1.5 Edição de Elementos Gráficos
São funções usadas para adicionar, eliminar e modificar posições geográficas das
feições nos mapas. Por exemplo, quando as arestas que separam dois polígonos são
digitalizadas duas vezes, ou quando uma camada é gerada a partir da sobreposição de
outras duas camadas, podem surgir pequenas fatias de áreas sobrepostas ou fatias de
áreas sem informações. Nestes casos os ajustes e acertos precisam ser realizados
manualmente.
4.1.1.6 Redução de Coordenadas
Devido aos processos de digitalização e de leitura através de dispositivos de
varredura (scanners), muitas vezes são gerados mais pontos que o necessário para
armazenar as coordenadas das linhas dos objetos espaciais. As funções de redução de
coordenadas têm como objetivo diminuir a quantidade de pares de coordenadas
pertencentes a linhas, reduzindo assim, a quantidade total de dados armazenados em
cada camada. A Figura 4.2 exemplifica esta operação.
Figura 4.2 - Exemplo de Operação de Redução de Coordenadas
52
4.1.2 Manutenção e Análise de Atributos Descritivos
Na maioria dos SIG, a manipulação dos atributos descritivos (não-gráficos) é
realizada através de linguagens de manipulação/consulta de dados disponíveis nos
SGBDs. Muitas operações de análise podem ser resolvidas sem que seja necessário
acessar os atributos espaciais. Nos sistemas vetoriais, por exemplo, as informações sobre
a área e o perímetro dos polígonos são, normalmente, armazenadas junto com os demais
atributos descritivos associados a esses polígonos. Nestes casos, uma operação de
análise envolvendo áreas de polígonos pode ser resolvida por métodos tradicionais de
consulta a banco de dados.
4.1.2.1 Edição de Atributos Descritivos
São funções que possibilitam alterações nos dados descritivos sem que os dados
gráficos sejam afetados. Como exemplos podemos citar: a atualização do número de
habitantes de uma cidade ou de um bairro, a inclusão do número de habitantes de um
novo bairro, a exclusão dos dados referentes a um vilarejo que tenha ficado submerso em
uma represa de uma usina hidroelétrica, etc.
4.1.2.2 Consulta a Atributos Descritivos
Se o SIG está interligado a um SGBD, então essas operações são executadas pela
própria linguagem de consulta do SGBD (ex.: linguagem SQL). Quando não estão, os
SIG fornecem funções que possibilitam o acesso aos dados através de programas de
emissão de relatórios.
4.1.3 Análise Integrada de Dados Espaciais e Descritivos
Segundo Burrough [BUR 86], a potencialidade de um SIG está na capacidade de
realização de operações de análise espacial, envolvendo os atributos espaciais e os
atributos descritivos. Isto também é um dos principais fatores que distingüem um SIG de
um sistema de Cartografia Automatizada ou de um software para CAD.
O conjunto de funções que se enquadram nesta categoria é muito amplo, estando
subdividido em quatro subgrupos: Recuperação/Classificação/Medidas; Sobreposição;
Vizinhança; e Conectividade, descritas a seguir.
53
4.1.3.1 Funções de Recuperação/Classificação e Medidas
Nesta categoria de funções, os dados espaciais e descritivos são consultados mas
não são modificados.
A) Recuperação de Dados
São funções que envolvem busca seletiva, manipulação e geração de resultados,
sem alterar os valores armazenados no banco de dados. Um exemplo seria a geração de
um mapa urbano mostrando a localização das residências com valor nominal acima de
R$200.000,00.
B) Classificação e Generalização
O procedimento de classificação é utilizado para agrupar entidades espaciais de
acordo com algum padrão. Um exemplo seria, criar um novo atributo descritivo na
classe que descreve as Residências, informando o tipo de residência (classe A, classe B
ou classe C) em relação ao valor nominal do imóvel. O procedimento de classificação em
um sistema raster, normalmente denominado recoding, cria uma nova camada de dados,
onde os valores das células correspondem ao valor da classificação.
Generalização é o processo inverso, no qual as classes mais específicas são
agrupadas para formar superclasses, mais genéricas. A Figura 4.3 mostra um exemplo de
operação de generalização.
UrbanaResidencial
UrbanaIndustrial
RuralCultivada
RuralFloresta
Urbana
Rural
Figura 4.3 - Operação de Generealização
C) Funções de Medidas
São executadas sobre os objetos espaciais (pontos, linhas, polígonos e conjunto
de células) e incluem funções como distância entre dois pontos, comprimento de linhas,
perímetro de áreas, etc.
54
Em operações de Modelos Numéricos de Terreno, medidas tridimensionais
também são executadas, como por exemplo, o cálculo do volume de terra a ser removido
em um trecho da estrada que esteja sendo projetado. Normalmente, cálculos de área,
perímetro e centróide (ponto central de um polígono) são realizados durante o processo
de criação de polígonos, ficando disponíveis para consultas posteriores.
4.1.3.2 Funções de Sobreposição de Camadas (overlay)
Um dos tipos de operações mais utilizados na realização de análise espacial, é o
das funções de sobreposição de camadas (ou overlay), que acessam e relacionam
informações de duas ou mais camadas de dados. Essas funções podem executar
operações aritméticas (soma, subtração, divisão, etc) ou lógicas ('e', 'ou', 'ou exclusivo',
etc), entre os valores dos atributos dos objetos localizados em coordenadas idênticas nas
diversas camadas envolvidas (Figura 4.4).
A implementação dessas operações, é feita de maneira diferente nos modelos
raster e vetorial. No modelo raster essas operações são implementadas de forma mais
simples que no modelo vetorial e muitas vezes são executadas de forma mais eficiente.
Isto ocorre, devido à regularidade do tamanho das células em uma imagem raster e à
simplicidade de suas estruturas de armazenamento. Imagens compactadas por estruturas
de dados do tipo quadtree aumentam a complexidade de implementação dessas
operações, mas podem diminuir, de forma significativa, o tempo de resposta dessas
operações [PEU 84].
2
3
3
2
1
1
1
1
3
10
10
30
10
10
30
20
20
30
12
13
11
12 21
11
31
21
33
S
S
S
S
N
S
N
N
S
N
N
N
S
S
N
N
S
S
N
N
N
S
N
N
N
N
S
'E'
Figura 4.4 - Operações de Sobreposição de Camadas
55
Alguns sistemas convertem as imagens do formato vetorial para o formato raster,
para a execução de operações de sobreposição, convertendo a imagem resultante para o
armazenamento no formato vetorial.
4.1.3.3 Funções de Vizinhança
São funções que avaliam as características de uma área circunvizinha em relação
a uma localização específica. As funções de vizinhança são executadas com base em três
parâmetros básicos:
1) Uma ou mais localizações alvo;
2) Uma definição da área circunvizinha (normalmente na forma de umquadrado, retângulo ou círculo); e
3) Uma função a ser executada sobre os objetos pertencentes à área definida.
Existem diversos tipos de operações de vizinhança, entre elas podemos citar:
funções de busca, identificação de linhas-em-polígonos e pontos-em-polígonos, funções
topológicas, funções de interpolação e geração de contorno.
A) Funções de Busca
São usadas para localizar/calcular elementos que satisfaçam à função escolhida,
dentro da região especificada. Por exemplo, calcular o número de escolas (ou alunos) em
um raio de 5 Km de um centro esportivo.
A região especificada, ou região de interesse, pode não ser regular, podendo ser
gerada por outras funções disponíveis, como por exemplo, o polígono referente a um
bairro ou a um município.
B) Identificação de Linhas-em-Polígonos e Pontos-em-Polígonos
No formato vetorial, essas operações podem ser resolvidas como uma função de
busca especializada, enquanto no formato raster equivale a uma operação de
sobreposição. Essas operações podem ser usadas na solução de problemas do tipo:
Identificar as linhas de ônibus que "cruzam" ou "atendem" a um determinado bairro;
Verificar quais as propriedades rurais por onde passa uma linha de transmissão de
energia; ou Identificar as propriedades que possuem nascentes de água potável.
56
C) Funções Topográficas
O termo topografia diz respeito às formas de relevo de uma região. Mapas
topográficos são construídos a partir da obtenção dos valores de altitude em cada
localização dentro de uma área. Nos SIG, a topografia pode ser representada por
diferentes Modelos Numéricos de Terreno, conforme mostrado na Figura 3.2.
Funções topográficas são usadas para calcular valores que descrevem a
topografia em uma localização geográfica ou região circunvizinha. Exemplos de funções
topográficas são: declive, aspecto, gradiente, ângulo azimutal, etc.
D) Funções de Interpolação
Interpolação (Figura 4.5) é o método matemático no qual valores não definidos
em uma localização podem ser calculados com base em estimativas feitas a partir de
valores conhecidos em localizações vizinhas.
1 2 3 4 5 6
1 2 3 4 5 6
1 2 3 4 5 6
1 2 3 4 5 6
1 3 4 6
2 5
1 3 6
1 3 4 5
Valores conhecidos Valores conhecidos eestimados após interpolação
Figura 4.5 - Exemplo de Operação de Interpolação
Funções matemáticas, como regressão polinomial, Série de Fourier, médias
ponderadas, etc, são aplicadas de acordo com a variável que está sendo analisada. A
qualidade dos valores calculados depende, entre outros fatores, da escolha do melhor
modelo matemático que retrate a realidade em questão.
E) Geração de Contorno
Mapas de linhas de contorno são usados para representar superfícies, onde cada
linha é formada por pontos de mesmo valor (curvas isométricas). Funções de geração de
contorno são usadas para construir os mapas topográficos a partir de um conjunto de
57
pontos conhecidos. Segundo Aronoff [ARO 89], funções de interpolação podem ser
usadas para estimar valores desconhecidos durante a geração de linhas de contorno.
4.1.3.4 Funções de Conectividade
A principal característica das funções de conectividade é que elas executam
operações que acumulam valores ao longo da área analisada, ou seja, a cada trecho
analisado (percorrido), valores de atributos são considerados segundo critérios
quantitativos (ex. distância total percorrida) ou qualitativos (ex. local de destino
alcançado).
As funções de conectividade estão baseadas em três tipos de argumentos:
1) Especificação do tipo de interconexão existente entre os objetos espaciais;
2) Conjunto de regras que especificam os tipos de movimentos possíveis;
3) Unidade de medida.
Por exemplo, para se calcular a distância a ser percorrida por um veículo de
entrega de mercadorias, no deslocamento de um ponto a outro dentro de uma cidade, os
seguintes parâmetros precisam ser considerados:
1) Uma estrutura em rede representando o mapa das ruas da cidade;
2) As regras poderiam incluir: observação do sentido do tráfego, velocidademáxima permitida, ruas com tráfego proibido para transporte de cargas, etc;
3) Unidade de medida: distância (Km).
Calcular a distância entre dois pontos em uma malha viária é uma operação bem
mais complexa do que simplesmente calcular a distância linear entre dois pontos de
coordenadas espaciais, pois envolve primeiro a seleção de um caminho e depois o
cálculo da distância total.
Algumas funções pertencentes à categoria das funções de conectividade estão
descritas a seguir:
A) Medidas de Contiguidade
São funções que avaliam características de objetos espaciais que estão
conectados. Uma área contígua, por exemplo, compreende um conjunto de objetos bi-
dimensionais, que possuam uma ou mais características comuns, podendo ser tratados
58
como uma unidade. Um exemplo seria: “Localizar as áreas contíguas de 100 Km2,
apresentando tipo de solo A ou C”.
B) Funções de Proximidade
As funções que permitem análise de proximidade estão associadas à geração de
zonas de buffer. Uma zona de buffer é uma área de extensão definida, que é gerada ao
redor dos objetos espaciais, como mostra a Figura 4.6. Essas funções são úteis em
diversos tipos de análise espacial, como por exemplo: “Definir uma área de segurança em
volta de uma usina termo-elétrica.
Figura 4.6 - Exemplo de zonas de buffer
C) Funções de Rede
Estruturas de rede podem ser usadas para resolver problemas em uma grande
variedade de aplicações. Os principais tipos de problemas abordados podem ser
agrupados em: otimização de rota, alocação de recursos e prognósticos de carga da rede.
Algumas aplicações de rede possuem propriedades únicas que requerem funções
especiais de análise. Quanto mais sofisticadas as funções e as representações das redes,
menor o conjunto de aplicações que se adequam ao modelo.
D) Funções de Intervisibilidade
São funções que permitem a identificação de áreas que podem ser visíveis a partir
de localizações específicas. Podem ser usadas, por exemplo, em aplicações militares na
definição e cálculo do alcance de radares, em aplicações de telecomunicações, na
definição do posicionamento de antenas de retransmissão de imagens, etc. Funções de
59
intervisibilidade utilizam dados digitais de terreno para definir a topografia da área
circunvizinha.
4.1.4 Formatação de Saída
Os resultados das operações de análise espacial podem ser gerados na forma de
relatórios, gráficos ou, o mais comum, na forma de mapas. Diversas funções podem ser
usadas para melhorar a aparência dos mapas resultantes dessas operações, entre elas
pode-se citar: anotações em mapas, posicionamento de texto, símbolos, iluminação,
visões perspectivas, etc. Algumas dessas funções estão descritas a seguir.
4.1.4.1 Anotações em Mapas
Permitem adicionar aos mapas, informações como título, legendas, barra de
escala, orientação norte-sul, etc. Podem ser colocados fora dos limites do mapa ou
cobrindo alguma parte deste.
4.1.4.2 Posicionamento de Rótulos
Textos de rótulos normalmente são colocados juntos aos símbolos gráficos que
representam as entidades na mapa. Existem técnicas e padrões cartográficos para a
escolha do posicionamento de rótulos. A maioria dos SIG possuem ferramentas que
efetuam o posicionamento de forma automática ou manual, além disso, os rótulos podem
variar em tamanho e orientação.
4.1.4.3 Padrões de Textura e Estilos de Linhas
Os textos podem variar em tipo de fonte, tamanho, cor e estilo (negrito, itálico,
sublinhado, etc). A escolha dos tipos de letras devem obedecer convenções cartográficas,
assim como os estilos de linhas, que podem variar em espessura, cor e forma (ex.
tracejada, pontilhada, etc).
4.1.4.4 Símbolos Gráficos
Os símbolos gráficos são usados para representar classes de entidades em um
mapa. Alguns símbolos mais comuns são: símbolos de cidades (tamanho variando por
número populacional), pontes, aeroportos, hospitais, museus, escolas, etc. Alguns
sistemas utilizam o conceito de bibliotecas de símbolos, que podem ser adquiridas de
acordo com uma área de aplicação específica.
60
4.2 Um Exemplo de Análise Espacial
Nesta seção são descritas, passo-a-passo, as operações necessárias para a
execução de um procedimento de análise espacial, cujo objetivo é identificar áreas
adequadas para extração de árvores. Este exemplo foi adaptado de [NCG 90].
A área a ser identificada deve satisfazer os seguintes critérios:
1) Deve possuir, predominantemente, árvores da espécie Pinus;
2) Deve ter um tipo de solo bem drenado, para viabilizar a utilização de
equipamentos pesados como caminhões e tratores;
3) Deve estar distante pelo menos 500 m de qualquer curso d'água, para não
provocar danos ecológicos.
Para a solução deste problema, são utilizadas três camadas de dados, presentes
no BD Geográfico, que está definido conforme mostra a Figura 4.7.
BD Geográfico
.Camadas Temáticas:
-1) Lagos; 2) Espécies de Árvores; 3) Tipo de Drenagem do Solo
.Resolução: 500 m
.Cobertura total: 2,5 Km x 2,5 Km
.Orientação: colunas alinhadas na direção norte-sul
Camada 1: Lagos
1 1 0 0 0
1 1 0 0 0
1 0 0 0 0
0 0 0 0 0
0 0 0 0 0
1=lago
Camada 2: Espécies de Árvores
1=madeira de lei; 2=Pinus
0=sem lago 0=sem floresta
Camada 3: Tipo de Drenagem do Solo
1=pobre; 2=boa
0=alagado
0 0 2 2 2
0 0 2 2 2
0 1 1 1 2
1 1 1 1 1
1 1 1 1 1
0 0 2 2 2
0 0 1 1 2
0 0 1 1 2
0 1 1 1 2
1 1 1 2 2
Figura 4.7 - Exemplo de BD Geográfico
A estratégia de análise utilizada foi a de definir, para cada um dos critérios
descritos acima, uma nova camada contendo as áreas que satisfazem o critério,
assinaladas com valores lógicos ('S'-sim ou 'N'-não).
61
No primeiro passo (Figura 4.8), aplicou-se sobre a camada 2 (Espécies de
Árvores) a operação (recode), gerando uma nova camada (4 - Espécies Permitidas)
contendo as áreas de Pinus assinaladas com 'S'.
PASSO 1: recode camada 2SE valor = 2 (Pinus) ENTÃO 's' SENÃO 'n'
Camada 2: Espécies de Árvores Camada 4: Espécies Permitidas
0 0 2 2 2
0 0 2 2 2
0 1 1 1 2
1 1 1 1 1
1 1 1 1 1
n n s s s
n n s s s
n n n n s
n n n n n
n n n n n
Figura 4.8 - Passo 1 - Selecionar Espécies de Pinus
No segundo passo (Figura 4.9), de forma semelhante ao primeiro passo, criou-se
a camada 5 contendo áreas selecionadas com boa drenagem.
PASSO 2: recode camada 3SE valor = 2 (boa) ENTÃO 's' SENÃO 'n'
Camada 3: Tipo de Drenagem do Solo Camada 5: Solo Bem Drenado
0 0 2 2 2
0 0 1 1 2
0 0 1 1 2
0 1 1 1 2
1 1 1 2 2
n n s s s
n n n n s
n n n n s
n n n n s
n n n s s
Figura 4.9 - Passo 2 - Selecionar Solos Bem Drenados
O terceiro critério, que estabelece que as áreas devem estar distantes pelo menos
500 m de qualquer leito d'água, foi alcançado através dos passos 3 e 4 (Figura 4.10). No
passo 3 aplicou-se a operação de spread, ou seja, criação de zona de buffer de 500 m
(ou uma célula) sobre os objetos da camada 1 (Lagos), gerando uma nova camada (6 -
Áreas Perto de Lago). No passo 4, essa camada 6 foi recodificada criando a camada 7,
que contém as áreas que não estão próximas a lagos.
62
PASSO 3: spread camada 1
Camada 1: Lagos Camada 6: Perto de Lago
1 1 0 0 0
1 1 0 0 0
1 0 0 0 0
0 0 0 0 0
0 0 0 0 0
1 1 1 0 0
1 1 1 0 0
1 1 0 0 0
1 0 0 0 0
0 0 0 0 0
PASSO 4: recode camada 6
Camada 7: Longe de LagoCamada 6: Perto de Lago
n n n s s
n n n s s
n n s s s
n s s s s
s s s s s
1 1 1 0 0
1 1 1 0 0
1 1 0 0 0
1 0 0 0 0
0 0 0 0 0
SE valor = 1 (perto) ENTÃO 'n' SENÃO 's'
Figura 4.10 - Passos 3 e 4 - Identificar Áreas Longe de Lago
Após gerar as novas camadas de dados contendo as áreas que satisfazem cada um
dos critérios estabelecidos, são executados os passos 5 e 6 (Figuras 4.11 e 4.12), nos
quais as novas camadas são sobrepostas através da operação de sobreposição (overlay),
gerando finalmente a camada 9, contendo o resultado da análise, ou seja, as áreas que
são adequadas para a extração de árvores.
PASSO 5: overlay camadas 4 e 5
Camada 5:Camada 4:
n n s s s
n n n n s
n n n n s
n n n n s
n n n s s
Camada 8:
n n s s s
n n n n s
n n n n s
n n n n n
n n n n n
Espécies Permitidas Solo Adequado Espécies e Solos
'E' =
n n s s s
n n s s s
n n n n s
n n n n n
n n n n n
Figura 4.11 - Passo 5 - Selecionar Espécies e Solos Adequados
63
PASSO 6: overlay camadas 7 e 8
Camada 9:Camada 7:
n n n s s
n n n n s
n n n n s
n n n n n
n n n n n
Camada 8:
n n s s s
n n n n s
n n n n s
n n n n n
n n n n n
Longe de Lago Resultado FinalEspécies e Solos
'E' =
n n n s s
n n n s s
n n s s s
n s s s s
s s s s s
Figura 4.12 - Passo 6 - Resultado Final do Processo de Análise Espacial
Existem diversos algoritmos (seqüências de passos), que levariam ao mesmo
resultado. A escolha da melhor maneira vai depender das funções disponíveis no sistema
e da experiência do usuário.
64
5 CONSIDERAÇÕES FINAIS
Neste trabalho apresentou-se uma visão geral dos diversos conceitos
relacionados à Sistemas de Informações Geográficas (SIG), com ênfase nos principais
tipos de dados manipulados, no armazenamento desses dados e nos diferentes tipos de
manipulações, consultas e análises que são realizadas com dados espaciais.
Devido ao perfil multidisciplinar dos usuários envolvidos com sistemas de
Geoprocessamento (geógrafos, geólogos, antropólogos, engenheiros, ambientalistas, etc)
e à ausência de uma padronização de conceitos, tanto no âmbito das pesquisas como no
âmbito comercial, surgem problemas que dificultam a comunicação e a troca de
experiências entre esses usuários. Por exemplo, dependendo do sistema utilizado, uma
mesmo conceito da realidade pode ser denominado de diferentes maneiras, como no caso
de temas, categorias, camadas, planos de informação, coberturas, mapas e feições
[PIRE95].
Um dos pontos críticos e de importância significativa no desenvolvimento de
aplicações de Geoprocessamento diz respeito à obtenção dos dados. Dependendo da
disponibilidade das fontes de dados, em escalas adequadas, o custo da aquisição, captura
e preparação dos dados pode ser muito superior aos custos de aquisição do hardware e
do software juntos. Outro fator importante é a dificuldade de compatibilização dos dados
provenientes de diversas fontes, que podem estar em diferentes formatos, escalas,
projeções, etc.
No tocante ao armazenamento de dados, a maioria dos SIG existentes atualmente
foram construídos baseados no tipo de arquitetura dual, onde dois componentes de
software são utilizados. Um SGBD relacional é o responsável pelo armazenamento dos
atributos descritivos das entidades e um outro módulo é o responsável pelo
armazenamento e manipulação dos atributos espaciais (geometria, localização e
topologia). Muitas pesquisas estão sendo realizadas com o objetivo de explorar as
65
potencialidades dos SGBDs Orientados a Objetos e Relacional Estendido, como
arquiteturas alternativas, mas existem ainda poucos resultados práticos, entre eles [VIJ
92], [SCH 92].
O termo modelo é empregado na literatura de forma generalizada, variando desde
a identificação de conceitos relacionados à descrição conceitual de entidades do mundo
real até a descrição de estruturas internas de armazenamento de dados. Um modelo,
conforme definido por Tsichritzis e Lochovsky (1977), citado em [GOO 92], é "um
conjunto de orientações para a representação da organização lógica dos dados em um
banco de dados... (consistindo) de unidades lógicas nomeadas de dados e dos
relacionamentos entre elas."
Com base nos conceitos de modelo conceitual, lógico e físico [NAV 92] e
segundo as duas diferentes visões (campo e objeto) dos usuários com relação a forma de
"ver" a realidade [GOO 90], pode-se elaborar as seguintes estruturas para classificar os
diferentes tipos de modelos utilizados em SIG:
Modelo decamadas
Modelosde campos
Modelosde objetos
Polígonos
Grade de células
Rede triangular
Linhas de contorno
Modelo geométrico
Modelo descritivo
Modelo simbólico
Estruturas de dadosespaciais
Modelo Modelo
Estruturas quadtree
Estruturas lineares
Modelo topológico
Rede
Modelo
MODELOS CONCEITUAIS MODELOS LÓGICOS
vetorialraster
spaghetti
Figura 5.1- Tipos de modelos relacionados com SIG
A continuidade deste trabalho se dará, inicialmente, através da realização de um
estudo mais aprofundado das diversas metodologias de modelagem de dados para SIG,
existentes atualmente, bem como no levantamento e identificação de requisitos de dados
das aplicações, tanto na área ambiental, como em aplicações de áreas sócio-econômicas.
66
Alguns tópicos, como por exemplo, linguagens de consulta envolvendo dados
espaciais, temporalidade de dados geográficos e padronização de formatos para
intercâmbio de dados, não foram cobertos neste trabalho, sendo também, tópicos para
futuras investigações.
67
REFERÊNCIAS BIBLIOGRÁFICAS
[ALV 90] ALVES, D. S. Sistemas de Informação Geográfica. In: SIMPÓSIOBRASILEIRO DE GEOPROCESSAMENTO, 1., 1990, São Paulo.Anais... São Paulo:USP, 1990.
[ALV 90a] ALVES, D. S. Modelo de Dados para Sistemas de InformaçõesGeográficas. São José dos Campos, SP: USP, 1994. Tese deDoutorado.
[ANT 91] ANTENUCCI, J.C.; BROWN, K.; CROSWELL, P.L.; et al. GeographicInformation Systems: A guide to the technology. Van NostrandReinhold, 1991.
[ARO 89] ARONOF, S. Geographic Information Systems: a managementperspective. Canada: WDL Publications, 1989.
[BAR 91] BARRERA, E.D.; FRANK, A.; AL-TAHA, K. Temporal relations ingeographic information systems. ACM SIGMOD Record , New York,v.20, n.3, p.85-93, 1991.
[BEA 95] BEAULIEU, Denis. Geomatics in Canada. Geomatica, Canada, v.49, n.1,p.124-128, 1995.
[BUR 86] BURROUGH, P.A. Principles of Geographical Information Systemsfor Land Resources Assessment. Oxford: Clarendon Press, 1986.
[CAM 94] CÂMARA, Gilberto. Análise de Arquiteturas para Bancos de DadosGeográficos Orientados-a-Objetos. São José dos Campos, SP: USP,1994. Tese de Doutorado.
[COW 88] COWEN, David J. GIS versus CAD versus DBMS: What area thedifferences?. Photogrammetric Engineering and remote sensing,[S.l.], v.4, n11, p.1551-1555, 1988.
[ESR 91] ENVIRONMENTAL SYSTEMS RESEARCH INSTITUTE.Understanding GIS: The ARC/INFO Method. Redlands, CA:Environmental Systems Research Institute, 1991.
68
[FRA 88] FRANK, Andrew U. Requirements for a databases management systemfor a GIS. Photogrammetric Engineering and remote sensing, [S.l.],v.54, n.11, p.1557-1564, 1988.
[GEO 95] Geomatica. Canada: Canadian Institute of Geomatics, v.49, n.1,contracapa, 1995.
[GOO 90] GOODCHILD, Michael F. Geographical data modeling. In: FRANK, A.U.; GOODCHILD, M.F. Two Perspectives on Geographical DataModelling. Santa Barbara, CA: National Center for GeographicInformation & Analysis/NCGIA, 1990. (Technical Paper 90-11)
[GOO 91] GOODCHILD, Michael F. Integrating GIS and environmental modeling atglobal scales. In: GIS/LIS '91. Proceedings... Atlanta, GE: [s.n.], 1991.V.1.
[GOO 92] GOODCHILD, Michael F., Geographical data modeling. Computers &Geosciences, London, v.18, n.4, p.401-408, 1992.
[GRU 92] GRUPE, Fritz H. Geographic Information Systems: A Case Study. In:Data Base Management. Boston: AUERBACH, 1992.
[KEM 92] KEMP, Zarine; THEARLE, Roy. Modelling relationships in spatialdatabases. In: INT. SYMP. SPATIAL DATA HANDLING, 5.,Arlington, 1992. Proceeding... Arlington: [s.n.], 1992.
[LAU 92] LAURINI, Robert; THOMPSON, Derek. Fundamentals of SpatialInformation Systems. San Diego: Academic Press, 1992.
[MAG 92] MAGUIRE, David J. The raster GIS design model - a profile of ERDAS.Computers and Geosciences, London, v.18, n.4, p.463-470, 1992.
[MED 94] MEDEIROS, Cláudia B.; PIRES, Fátima. Databases for GIS, ACMSIGMOD Record, New York, v.23, n.1, 1994.
[MOR 92] MOREHOUSE, Scott. The ARC/INFO geographic information system.Computers and Geosciences, London, v.18, n.4, p.435-441, 1992.
[NAV92] NAVATHE, S. B. Evolution of Data Modeling for Databases.Communications of the ACM, New York, v.35, n.9, p.112-123,1992.
[NCG 90] NATIONAL CENTER FOR GEOGRAPHIC INFORMATION ANDANALYSIS, NCGIA Core Curriculum . Edited by Michael F.Goodchild and Karen K Kemp (Eds.), Santa Barbara: University ofCalifornia, 1990.
69
[NEW 92] NEWELL, R. et al. Temporal GIS - modelling the evolution of spatialdata in time. Computers & Geosciences, London, v18, n.4, p.427-434,1992.
[OOI 90] OOI, B.C. Efficient Query Processing in Geographic InformationSystems. Berlin: Spring-Verlag, 1990. (Lecture Notes in ComputerScience, v. 471).
[PAR 94] PAREDES, E. A. Sistema de Informação Geográfica - Princípios eAplicações: Geoprocessamento, São Paulo: Ed. Érica, 1994.
[PEU 84] PEUQUET, Donna J. A conceptual framework and comparison of spatialdata models. Cartographica, [S.l.], n.21, p66-113, 1984.
[PIR 95] PIRES, Fátima; MEDEIROS, Cláudia B. Um ambiente computacional demodelagem de aplicações Geográficas. Caderno de InformaçõesGeoreferenciadas - SIG, Campinas, v.1, n.1, nov. 1995. wwwhttp://orion.cpa.unicamp.br/revista.html.
[RAM 94] RAMIREZ, M. R. Sistemas Gerenciadores de Bancos de Dados paraGeoprocessamento. Rio de Janeiro: COPPE/UFRJ, 1994. Dissertaçãode Mestrado.
[RAP 92] RAPER, J. F.; MAGUIRE, D. J. Design Models and Functionality in GIS.Computers and Geosciences, London, v.18, n.4, p.387-400, 1992.
[ROD 90] RODRIGUES, M. Introdução ao Geoprocessamento. In: SIMPÓSIOBRASILEIRO DE GEOPROCESSAMENTO, 1., 1990, São Paulo.Anais... São Paulo:USP, 1990.
[SAM 89] SAMET, Hanan. The Design and Analysis of Spatial Data Structures.Reading, MA: Addison-Wesley, 1989.
[SCH 92] SCHOLL, M.; VOISARD, A. Building and Object-oriented System -the Story of O2. California: Morgan Kaufmann, 1992.
[TIM 94] TIMES, Valéria C.; SALGADO, Ana C. Uma Modelagem Orientada aObjetos para Aplicações Geográficas. In: SIMPÓSIO BRASILEIRODE BANCO DE DADOS, 9., 1992, São Carlos-SP. Anais... SãoCarlos-SP, 1994.
[VIJ 92] VIJBRIEF, T.; OSTEROM, P.V. The GEO++ System: an extensible GIS.In: INT. SYMP. SPATIAL DATA HANDLING, 5., Arlington, 1992.Proceeding... Arlington:[s.n.], 1992.