Projeto de Banco de Dados para Sistemas de … · 6 Mapas podem ser usados com diferentes...

39
Projeto de Banco de Dados para Sistemas de Informação Geográfica Jugurta Lisboa Filho Universidade Federal de Viçosa, Departamento de Informática 36571-000 Viçosa, MG, Brasil - Fone: (31) 3899-1762 [email protected] Resumo: O termo Sistema de Informação Geográfica (SIG) caracteriza os sistemas de informação cuja principal característica é possibilitar a realização de análises espaciais envolvendo dados referenciados geograficamente. Entre os principais componentes de um software de SIG está o componente de armazenamento, denominado sistema de banco de dados geográficos. Devido à complexidade das aplicações que são desenvolvidas a partir de um SIG, um dos problemas mais críticos no desenvolvimento desses sistemas tem sido projetar o banco de dados geográficos. O projeto de banco de dados deve ser realizado com o apoio de um modelo de dados de alto nível (modelo conceitual). Modelagem conceitual tem sido aplicada com sucesso no projeto de bancos de dados em geral. Independentes de plataformas de hardware e software, os modelos conceituais permitem representar, de maneira abstrata, formal e não ambígua, a realidade da aplicação, facilitando a comunicação entre projetistas e usuários. Aplicações geográficas, contudo, impõem alguns requisitos específicos de modelagem que não são satisfatoriamente atendidos pelos modelos conceituais de dados de propósito geral. O objetivo desse curso é apresentar uma abordagem para modelagem conceitual de banco de dados geográficos com base na linguagem UML [BOO 98] e no GeoFrame, um framework conceitual. Inicialmente é apresentada uma breve introdução aos conceitos fundamentais da área de Geoprocessamento e descritos os principais componentes de um SIG. Palavras chaves: Banco de dados; Modelo conceitual; Sistema de Informação Geográfica.

Transcript of Projeto de Banco de Dados para Sistemas de … · 6 Mapas podem ser usados com diferentes...

Projeto de Banco de Dados paraSistemas de Informação Geográfica

Jugurta Lisboa Filho

Universidade Federal de Viçosa, Departamento de Informática36571-000 Viçosa, MG, Brasil - Fone: (31) 3899-1762

[email protected]

Resumo:

O termo Sistema de Informação Geográfica (SIG) caracteriza os sistemas deinformação cuja principal característica é possibilitar a realização de análises espaciaisenvolvendo dados referenciados geograficamente. Entre os principais componentes de umsoftware de SIG está o componente de armazenamento, denominado sistema de banco dedados geográficos. Devido à complexidade das aplicações que são desenvolvidas a partir deum SIG, um dos problemas mais críticos no desenvolvimento desses sistemas tem sidoprojetar o banco de dados geográficos. O projeto de banco de dados deve ser realizado com oapoio de um modelo de dados de alto nível (modelo conceitual). Modelagem conceitual temsido aplicada com sucesso no projeto de bancos de dados em geral. Independentes deplataformas de hardware e software, os modelos conceituais permitem representar, de maneiraabstrata, formal e não ambígua, a realidade da aplicação, facilitando a comunicação entreprojetistas e usuários. Aplicações geográficas, contudo, impõem alguns requisitos específicosde modelagem que não são satisfatoriamente atendidos pelos modelos conceituais de dados depropósito geral. O objetivo desse curso é apresentar uma abordagem para modelagemconceitual de banco de dados geográficos com base na linguagem UML [BOO 98] e noGeoFrame, um framework conceitual. Inicialmente é apresentada uma breve introdução aosconceitos fundamentais da área de Geoprocessamento e descritos os principais componentesde um SIG.

Palavras chaves: Banco de dados; Modelo conceitual; Sistema de Informação Geográfica.

2

Conteúdo

1 Introdução.............................................................................................. 3

2 Sistemas de Informação Geográfica.................................................... 42.1 Conceitos Básicos .............................................................................................4

2.2 Fundamentos em Cartografia e Sensoriamento Remoto...................................5

2.3 Componentes de SIG.........................................................................................8

2.3.1 Entrada e Integração de Dados ...........................................................10

2.3.2 Armazenamento de Dados Espaciais..................................................11

2.3.3 Funções de Processamento, Análise e de Apresentação.....................16

3 Projeto de Bancos de Dados Geográficos.......................................... 203.1 Dado, Informação e Fenômeno Geográfico ....................................................20

3.1.1 Componentes da informação geográfica.............................................20

3.2 Requisitos de Modelagem para Aplicações de SIG ........................................22

3.2.1 Fenômeno Geográfico e Objeto Convencional...................................22

3.2.2 Visões de Campo e de Objetos ...........................................................22

3.2.3 Aspectos Temáticos ............................................................................23

3.2.4 Aspectos Espaciais..............................................................................23

3.2.5 Múltiplas Representações ...................................................................24

3.2.6 Relacionamentos Espaciais.................................................................24

3.2.7 Aspectos Temporais............................................................................24

3.3 Modelos Conceituais de Dados para SIG........................................................25

3.4 Modelando Banco de Dados Geográficos com UML-GeoFrame...................26

3.4.1 GeoFrame............................................................................................28

3.4.2 Processo de Modelagem UML-GeoFrame .........................................30

3.4.3 Estudo de Caso: Região Carbonífera do RS .......................................33

4. Considerações Finais............................................................................. 36

Bibliografia ................................................................................................ 37

3

1 Introdução

O termo Sistema de Informação Geográfica (SIG) caracteriza os sistemas deinformação que tornam possível a captura, modelagem, manipulação, recuperação, análise eapresentação de dados referenciados geograficamente (ou dados georreferenciados)[WOR 95]. De forma geral, um software de SIG é um sistema composto de quatro grandescomponentes: componente de captura de dados, componente de armazenamento, componentede análise e componente de apresentação dos dados.

O componente de armazenamento, denominado sistema de banco de dadosgeográficos, estrutura e armazena os dados de forma a possibilitar a realização das operaçõesde análise envolvendo dados espaciais. Devido à complexidade das aplicações que sãodesenvolvidas a partir de um SIG, um dos grandes problemas no desenvolvimento dessessistemas tem sido projetar o banco de dados geográficos.

O projeto de um banco de dados deve ser realizado com o apoio de um modelo dedados de alto nível, também conhecido como modelo conceitual. Durante vários anos, aspesquisas no campo dos modelos de dados para SIG centraram-se na busca por estruturas dedados para o armazenamento de dados georreferenciados, o que ficou conhecido como“ debate raster-vector” [COU 92].

A necessidade de novos modelos conceituais para o desenvolvimento de aplicações deSIG foi identificada no final da década de 80 [EGE 87]. Embora existam diversas propostasde modelos conceituais específicos para SIG, o desenvolvimento dessas aplicações tem sidofeito de forma não metodológica, tendo como resultado diversos problemas decorrentes deabordagens evolutivas desordenadas.

O objetivo desse curso1 é apresentar uma abordagem para modelagem conceitual debanco de dados geográficos com base no uso na linguagem UML [BOO 98], maisespecificamente em seu diagrama de classes, e no framework conceitual GeoFrame [LIS 99].

O documento está organizado da seguinte forma. A Seção 2 apresenta uma introduçãoaos Sistemas de Informação Geográfica. A Seção 3 descreve o projeto de banco de dadosgeográficos, apresentando alguns requisitos de modelagem impostos pelas aplicações de SIGe que devem ser suportados pelos modelos conceituais de dados específicos para essasaplicações. Em seguida descreve o uso do modelo de objetos da linguagem UML de formaintegrada com o framework GeoFrame. É apresentado um exemplo real de modelagem dedados seguindo essa abordagem. As considerações finais e alguns dos tópicos atuais depesquisa na área de SIG são apresentados na Seção 4.

1 Este material é uma revisão dos textos apresentados na VIII Escola de Informática da SBC- Sul, maio de 2000,e na III Escola Regional de Informática do Centro-Oeste, outubro de 2000.

4

2 Sistemas de Informação Geográfica

Esta seção apresenta uma breve introdução aos sistemas de informação geográfica, quefoi extraída e atualizada a partir da apostila Introdução à Sistemas de InformaçõesGeográficas com Ênfase em Banco de Dados, apresentada na XV Jornada de Atualização emInformática, durante o XVI Congresso da SBC e, também, na 10ª Escuela de CienciasInformáticas, ocorrida em Buenos Aires em 1996.

São apresentados alguns conceitos importantes na área de geoprocessamento,conceitos básicos sobre cartografia e sensoriamento remoto e é feita uma descrição dosprincipais componentes de um sistema de informação geográfica.

2.1 Conceitos BásicosConforme descrito na seção anterior, Sistemas de Informação Geográfica (SIG) são

sistemas computacionais que permitem a captura, armazenamento, manipulação, recuperação,análise e apresentação de dados referenciados geograficamente [WOR 95]. Dadosreferenciados geograficamente ou, simplesmente, dados georreferenciados são dados quedescrevem fenômenos geográficos cuja localização está associada a uma posição sobre/sob asuperfície terrestre.

Uma das principais características de um SIG é sua capacidade de manipular dadosgráficos (cartográficos) e não-gráficos (descritivos) de forma integrada, provendo uma formaconsistente para análise e consulta. É possível, desta forma, ter acesso às informaçõesdescritivas de um fenômeno geográfico a partir de sua localização e vice-versa. Além disso,pode-se fazer conexões entre diferentes fenômenos com base em relacionamentos espaciais.

Quatro aspectos caracterizam um dado georreferenciado:

• a descrição do fenômeno geográfico;

• sua posição (ou localização) geográfica;

• relacionamentos espaciais com outros fenômenos geográficos; e

• instante ou intervalo de tempo em que a fenômeno existe ou é válido.

Estes aspectos são classificados em duas categorias de dados: dados convencionais -atributos alfanuméricos usados para armazenar os dados descritivos e temporais; e dadosespaciais - atributos que descrevem a geometria, a localização geográfica e osrelacionamentos espaciais [OOI 90]. Além disso, um SIG pode possuir dados pictórios, quearmazenam imagens sobre regiões geográficas (ex.: fotografia de uma cidade ou uma imagemde satélite).

Existem diversos tipos de sistemas que manipulam dados espaciais, como os sistemasde cartografia automatizada e os sistemas de CAD (Projeto Auxiliado por Computador),porém, os SIG se diferenciam desses sistemas por dois motivos principais. Primeiro, por suacapacidade de representar os relacionamentos espaciais (ou topológicos) entre fenômenosgeográficos. Segundo, por permitir a realização de complexas operações de análise espacialcom os dados geográficos.

O termo Geomatics, usado em alguns países (ex.: Canadá), é um termo "guarda-chuva" que engloba toda ciência ou tecnologia relacionada a cadastro, levantamento,mapeamento, sensoriamento remoto e SIG. Geomatics é definido como “o campo de

5

atividades que, utilizando uma abordagem sistêmica, integra todos os meios empregados naaquisição e gerenciamento de dados espaciais usados em aplicações científicas,administrativas, legais e técnicas, envolvidas no processo de produção e gerenciamento deinformação espacial” [GEO 95]. No Brasil, Geomatics corresponde a Geoprocessamento.

Portanto, o termo Sistema de Geoprocessamento engloba todos os sistemascomputacionais capazes de processar dados georreferenciados, tais como os sistemas decartografia automatizada (CAC), sistemas de processamento de imagens, sistemas degerenciamento de redes de infra-estrutura, sistemas de apoio a projeto (CAD) e,principalmente, os SIG [RAM 94]. No Brasil, freqüentemente, o termo sistema degeoprocessamento têm sido utilizado, pela comunidade de usuários, como sendo sinônimo desistema de informação geográfica.

O número de problemas onde os SIG são empregados aumenta a cada dia.Tradicionalmente, estes sistemas têm sido utilizados por instituições públicas, empresas deprestação de serviço de utilidade (ex. companhias de água, luz e telefone), na área desegurança militar e em diversos tipos de empresas privadas (ex.: engenharia civil,terraplanagem). A seguir, é apresentada uma relação das diversas áreas de aplicação de SIG,divididas em cinco grupos principais, segundo [RAM 94].

• Ocupação Humana - redes de infra-estrutura; planejamento e supervisão de limpezaurbana; cadastramento territorial urbano; mapeamento eleitoral; rede hospitalar;rede de ensino; controle epidemiológico; roteamento de veículos; sistema deinformações turísticas; controle de tráfego aéreo; sistemas de cartografia náutica;serviços de atendimentos emergenciais.

• Uso da Terra - planejamento agropecuário; estocagem e escoamento da produçãoagrícola; classificação de solos; gerenciamento de bacias hidrográficas;planejamento de barragens; cadastramento de propriedades rurais; levantamentotopográfico e planimétrico; mapeamento do uso da terra.

• Uso de Recursos Naturais - controle do extrativismo vegetal e mineral;classificação de poços petrolíferos; planejamento de gasodutos e oleodutos;distribuição de energia elétrica; identificação de mananciais; gerenciamentocosteiro e marítimo.

• Meio Ambiente - controle de queimadas; estudos de modificações climáticas;acompanhamento de emissão e ação de poluentes; gerenciamento florestal dedesmatamento e reflorestamento.

• Atividades Econômicas - planejamento de marketing; pesquisas sócio-econômicas;distribuição de produtos e serviços; transporte de matéria-prima.

2.2 Fundamentos em Cartografia e Sensoriamento RemotoEsta seção descreve alguns conceitos básicos das áreas de Cartografia e Sensoriamento

Remoto que são importantes para o entendimento do funcionamento de um SIG. Maioresdetalhes o leitor pode encontrar, por exemplo, em [OLI 93] e [LIL 87].

Um mapa é uma representação, em escala e sobre uma superfície plana, de umaseleção de características sobre ou em relação à superfície da terra [NCG 90].Tradicionalmente, os mapas têm sido a principal fonte de dados para os SIG.

6

Mapas podem ser usados com diferentes propósitos, sendo que os mais comuns são:exibição e armazenamento de dados (ex.: uma folha de mapa pode conter milhares deinformações que são recuperadas visualmente); como índices espaciais (ex.: cada áreadelimitada em um mapa pode estar associada a um conjunto de informações em um manualseparado); como ferramenta de análise de dados (ex.: comparar e localizar áreas de terrasimprodutivas); ou mesmo como objeto decorativo (ex.: mapas turísticos).

A confecção de um mapa requer, entre outras coisas, a seleção das características aserem incluídas no mapa, a classificação dessas características em grupos, sua simplificaçãopara representação, a ampliação de certas características para melhor representa-las no mapa,e a escolha de símbolos para representar as diferentes classes de características [ARO 89].

Existem diversos tipos de mapas. Mapas topográficos são elaborados com o objetivode atender a uma infinidade de propósitos, enquanto que mapas temáticos são elaborados comobjetivos mais específicos, por conter informações sobre um único assunto, por exemplo, pararepresentar o relevo, a vegetação ou o tipo de solo de uma região.

A escala de um mapa é a razão entre as distâncias representadas no mapa e suascorrespondentes distâncias no mundo real. Por exemplo, em um mapa de escala 1:50.000,1cm no mapa corresponde a 50.000cm (ou 500m) na superfície terrestre. Uma escala de1:10.000 (1cm no mapa corresponde a 100m) é suficiente para representar o traçado de ruasem uma cidade. Porém, é insuficiente caso a aplicação necessite manipular informações sobrelotes urbanos. Por outro lado, numa escala de 1:250.000 (1cm no mapa corresponde a2,5 Km), somente grandes fenômenos geográficos podem ser representados, tais como tiposde vegetação, limites municipais e rodovias.

O sistema de coordenadas permite definir a localização de qualquer elemento sobre asuperfície terrestre. Os sistemas mais empregados são os sistemas de coordenadas geográficas(ou terrestres) e os sistemas de coordenadas planas (ou cartesianas) [CAM 96].

Nos sistemas de coordenadas geográficas, cada ponto é definido através do par decoordenadas referente à interseção de um meridiano com um paralelo. Os meridianos sãocírculos da esfera terrestre que passam pelos Pólos Norte e Sul, enquanto que os paralelos sãocírculos da esfera terrestre cujos planos são perpendiculares ao eixo dos Pólos Norte-Sul. Osmeridianos são medidos em longitude a partir do meridiano de Greenwich, escolhidoarbitrariamente como sendo o meridiano de origem, com valores variando de 0º de longitude(na origem) até +180º de longitude a leste e -180º de longitude a oeste. O paralelo do Equadordivide a Terra nos hemisférios norte e sul, definindo as medidas de latitude como sendo 0º noparalelo do Equador, +90º no Pólo Norte e -90º no Pólo Sul.

Os sistemas de coordenadas planas são baseados em um par de eixos perpendiculares,onde a interseção dos eixos representa a origem para a localização de qualquer ponto sobre oplano. Nestes sistemas, as coordenadas dos pontos são representadas por um par de valores(x,y) representando a projeção do ponto sobre cada um dos eixos. Normalmente, o eixohorizontal fica associado à medida de longitude enquanto que o eixo vertical fica associado àmedida de latitude, o que permite conversões entre os sistemas de coordenadas, a partir detransformações matemáticas.

A superfície curva da terra é representada em mapas que, normalmente, sãoconfeccionados sobre uma folha de papel, ou seja, sobre uma superfície plana, o que,inevitavelmente, provoca distorções entre a realidade e sua representação. Projeção

7

Cartográfica é o método matemático através do qual a superfície curva da terra érepresentada sobre uma superfície plana.

Existem diferentes tipos de projeções utilizadas na confecção de mapas (Figura 1).Estas projeções atendem a objetivos distintos, podendo preservar a área (projeçãoequivalente) dos fenômenos representados, a forma dos fenômenos (projeção conformal) oumesmo a distância (projeção eqüidistante) entre pontos no mapa [NCG 90]. Algumas dasprojeções mais empregadas são: projeção cônica de Lambert, projeção UTM (“UniversalTransverse Mercator”) e projeção plana. No Brasil existe um mapeamento sistemáticorealizado pelo Serviço de Cartografia do Exército, feito na projeção UTM, nas escalas de1:250.000, 1:100.000 e 1:50.000 [CAM 96].

Projeção Cilíndrica Projeção Cônica

Figura 1 – Exemplo de projeções

Sensoriamento Remoto é definido como a ciência e a arte de se obter informaçõessobre objetos, áreas ou fenômenos, através da análise dos dados adquiridos por um dispositivoque não esteja em contato com o objeto, área ou fenômeno sob investigação [LIL 87].

O processo de obtenção de dados através do sensoriamento remoto utiliza sensorespara se obter dados, de forma remota, que podem ser analisados para gerar informações sobreas áreas observadas [LIL 87]. Existem diversas formas de captura de dados através desensores remotos como, por exemplo, através da distribuição de ondas acústicas. Porém, nocontexto de SIG, apenas as técnicas empregadas pelos sensores de energia eletromagnéticasão importantes. Estes sensores são operados a partir de veículos aeroespaciais (ex.: satélitesem órbita terrestre).

Os materiais que estão sobre a superfície terrestre refletem a energia eletromagnéticaproveniente de fontes naturais (ex.: sol) ou de fontes artificiais (ex.: lâmpadas), que é captadapor dispositivos sensores. Os sensores eletromagnéticos podem ser divididos em dois grupos:passivos e ativos. Sensores passivos (ex.: fotografia aérea) medem a energia existente noambiente, enquanto que os sensores ativos geram sua própria fonte de energia (ex.: SistemaRadar).

O sistema de radar emite energia na região de microondas do espectro eletromagnético(Figura 2) e capta a energia refletida pelos materiais que estão sobre a superfície terrestre[EAS 95].

8

10-6

10-5

10-4

10-3

10-1

10-2

0.5

1 10 10 102

103

104

105

106

107

108 9

0.6 0.70.4 (µm)

verazul ver

u.v.

visível

comprimento de onda (µm)

raios cósmicos raio X

ultravioleta(u.v.)

i.v. próximoi.v. médio

i.v. termal microonda tv e rádio

infravermelho (i.v.)

(1mm) (1m)

de melho

sist. radar

Figura 2 - Espectro eletromagnético [LIL 87]

Segundo Amaral [AMA 90], os materiais apresentam comportamentos distintos aolongo do espectro eletromagnético para diferentes atributos (ex.: emissividade, reflectância,absortância, transmissividade, luminescência, etc). Desta forma, sensores operando emdiferentes intervalos espectrais (sensores multi-espectrais) são capazes de discriminardeterminados objetos ou fenômenos sobre/sob a superfície terrestre.

O espectro eletromagnético é muito amplo e nem todos os comprimentos de onda sãoadequados para fins de sensoriamento remoto. Por exemplo, os intervalos de comprimento deondas verde, vermelho (visíveis) e também o infravermelho apresentam baixa interferênciaatmosférica, possibilitando uma boa oportunidade para medir as interações com a superfícieterrestre. A maioria das imagens produzidas via sensoriamento remoto para aplicaçõesrelacionadas com SIG são obtidas nestes intervalos [LIL 87].

Existem diversas propriedades básicas para um sensor eletromagnético, as principaissão [CAM 96].:

• resolução espectral - número de bandas do espectro eletromagnético que sãocaptadas pelo sensor;

• resolução espacial - área da superfície terrestre observada pelo sensor;

• resolução temporal - intervalo de tempo entre duas tomadas de imagens.

Os sistemas de processamento de imagens são softwares desenvolvidos para resolverproblemas específicos de tratamento de imagens obtidas remotamente, sendo que alguns SIGpossuem módulos acoplados que permitem ao usuário realizar um conjunto, normalmentelimitado, de operações envolvendo imagens de satélite.

2.3 Componentes de SIGOs SIG precisam armazenar grandes quantidades de dados e torná-los disponíveis para

operações de consulta e análise. Sistemas Gerenciadores de Banco de Dados (SBGD) sãoferramentas fundamentais para os SIG, embora alguns sistemas comerciais ainda utilizemsistemas de arquivos para fazer o gerenciamento dos dados.

Com o objetivo de encontrar soluções adequadas para o problema do gerenciamentode dados georreferenciados, diversas pesquisas têm sido realizadas por parte da comunidadede banco de dados, sob os temas de banco de dados espaciais e geográficos [MED 94].Atualmente, a arquitetura mais empregada na construção dos SIG é a que utiliza um sistemadual, onde o SIG é composto de um SGBD relacional, responsável pela gerência dos atributos

9

descritivos, acoplado a um componente de software responsável pelo gerenciamento dosatributos espaciais [CAM 96]. A tendência atual é que os novos SIG estão incorporandocaracterísticas de sistemas orientados a objetos.

Segundo Antenucci [ANT 91], os SIG constituem-se na integração de três aspectosdistintos da tecnologia computacional (Figura 3): sistemas de gerenciamento de banco dedados geográficos (BDGeo); procedimentos para obtenção, manipulação, exibição eimpressão de dados com representação gráfica (Interface); e algoritmos e técnicas para análisede dados espaciais (Ferramentas).

FontesSIG

Resultados

BDGeoFerramentas

Interface

Os SIG apresentam funcionalidades bastante distintas, dependendo do tipo deaplicação em que são utilizados. Alguns produtos são comercializados em módulos separados,de acordo com as necessidades específicas dos clientes, como o sistema MGE daINTERGRAPH e o sistema Arc-Info da ESRI. Módulos para processamento de imagens desatélite, para operações com modelos numéricos de terreno (MNT) ou para gerenciamento deredes de infra-estrutura, podem, ou não, estar disponíveis no sistema. Porém, existe umconjunto de componentes que são comuns à maioria dos sistemas.

Câmara [CAM 96] apresenta um SIG como possuindo a seguinte arquitetura(Figura 4): interface com usuário; entrada e integração de dados; funções de processamento;visualização e plotagem; e armazenamento e recuperação de dados.

Figura 3 - Aspectos tecnológicos de SIG

10

Interface

Entrada e Integr. Dados

Funções deProcessamento

Visualização ePlotagem

Armazenamento e Recuperação

BD Geográfico

Figura 4 - Arquitetura de um SIG [CAM 96]

Existem três tipos de interfaces que são utilizadas nos SIG: linguagem de comandos,menus hierárquicos e sistemas de janelas. Estes tipos de interfaces acompanham a evoluçãodas técnicas empregadas em sistemas de informações em geral.

O componente responsável pela entrada e integração de dados possibilita a obtençãodos dados através de diversos métodos como leitura ótica, digitalização de mapas ouaquisição via meio magnético. O componente responsável pelo armazenamento e recuperaçãode dados geográficos provê as estruturas de dados que possibilitam a compactação deimagens, armazenamento de relacionamentos espaciais (topologia), acesso aos dados atravésde índices espaciais, etc. O conjunto das funções de processamento é o componente que maisse diferencia de sistema para sistema, porém, existe um grande número de funções que sãocomuns a esses sistemas.

A maioria dos dados gerados por uma aplicação de SIG são apresentados na forma demapas. Desta maneira, um SIG deve prover funções que são equivalentes àquelas dossistemas de cartografia automatizada, como colocação automática de rótulos, descrição delegendas e escalas gráficas, entre outras.

A seguir cada um desses componentes é apresentado em maiores detalhes.

2.3.1 Entrada e Integração de Dados

A obtenção de dados em aplicações de geoprocessamento é um processo bem maiscomplexo quando comparado com a maioria das aplicações [ARO 89]. Isto se deve ao fato daentrada de dados não se limitar a simples operações de inserção. As dificuldades surgem porduas razões. Primeiro, por se tratar de informações gráficas, o que naturalmente já é umatarefa mais complexa do que a entrada de dados alfanuméricos, embora os SIG tambémmanipulem dados alfanuméricos.

A segunda razão, e principal, é devido a natureza das fontes de dados dessasaplicações. Os dados manipulados em um SIG, dizem respeito a fenômenos geográficos queestão distribuídos sobre a superfície da terra, podendo pertencer a sistemas naturais ou criadospelo homem, tais como tipos de solos, vegetação, cidades, propriedades rurais ou urbanas,redes de telefonia, escolas, aspectos climáticos, etc. Podem ser também objetos resultantes de

11

projetos envolvendo entidades que ainda não existem como, por exemplo, o planejamento deuma barragem para a construção de uma usina hidroelétrica [RAM 94].

Os processos de coleta de dados são baseados em tecnologias como fotogrametria,sensoriamento remoto e levantamento de campo, ou seja, os mesmos que vêm sendoempregados há muito tempo em diversas outras áreas. Com isto, os produtos resultantesdesses processos de coleta de dados é que são as verdadeiras fontes de dados dos SIG. Os SIGpossuem dispositivos de interface que permitem que esses dados sejam transferidos para ummeio de armazenamento digital.

A transferência dos dados do meio externo (fontes brutas) para o meio interno(representação digital) é apenas um passo no processo de aquisição dos dados. Muitasoperações posteriores são realizadas como, por exemplo, a associação entre os objetosespaciais e atributos descritivos, operações para corrigir e padronizar os dados com relação aprojeções, escalas e sistemas de coordenadas.

Os métodos mais empregados na aquisição de dados são: a digitalização em mesa; adigitalização automática feita através de leitura ótica por meio de dispositivos de varreduratipo "scanner"; a digitação via teclado; GPS-Global Positioning Systems, e a leitura de dadosprovenientes de outras fontes de armazenamento secundário (ex. fitas magnéticas, discosóticos, teleprocessamento). Estes métodos permitem a transferência dos dados obtidos atravésdesses mecanismos para a base de dados dos SIG.

2.3.2 Armazenamento de Dados Espaciais

Dados espaciais podem ser estruturados de diversas formas. Porém, duas abordagenssão amplamente utilizadas na estruturação dos componentes espaciais associados àsinformações geográficas: a estrutura matricial (raster) e a estrutura vetorial. A Figura 5ilustra a diferença entre esses dois tipos de estruturas, a partir da sobreposição de umaimagem vetorial sobre uma imagem matricial. Observe que na estrutura matricial ocorre umaperda de qualidade quando a imagem é consultada mais detalhadamente.

Figura 5 - Exemplo de representação matricial e vetorial

12

Na estrutura matricial, a área em questão é dividida em uma grade regular de célulasde formato, normalmente, retangular. A posição da célula é definida pela linha e pela colunaonde está localizada na grade. Cada célula armazena um valor que corresponde ao tipo deentidade que é encontrada naquela posição. Uma área geográfica pode ser representadaatravés de diversas camadas, onde as células de uma camada armazenam os valoresassociados a uma única variável (ex.: vegetação) [CHR 97]. As camadas ficam totalmentepreenchidas, uma vez que cada célula corresponde a uma porção do espaço sendorepresentado.

Na estrutura vetorial, cada fenômeno geográfico é representado, no banco de dados,por um objeto com identificação própria e representação espacial do tipo ponto, linha,polígono ou um objeto complexo. A posição de cada objeto é definida por sua localização noespaço, de acordo com um sistema de coordenadas. Objetos vetoriais não preenchem todo oespaço, ou seja, nem todas as posições do espaço necessitam estar referenciadas na base dedados.

Enquanto que a representação vetorial é capaz de armazenar informações sobrefenômenos que podem ser identificados univocamente no mundo real, a representaçãomatricial armazena informações sobre o conjunto de todos os pontos de uma determinadaregião do espaço.

Estruturas Matriciais

Ao contrário da estrutura vetorial, onde cada fenômeno do mundo real está associado aum objeto espacial, na estrutura matricial os atributos dos fenômenos geográficos estãoassociados a grupos de células de mesmo valor. O valor armazenado em uma célularepresenta a característica mais marcante do atributo em toda a área relativa à célula.

A resolução de uma imagem matricial corresponde à dimensão linear mínima damenor unidade do espaço geográfico (célula) sendo considerada. Quanto menor a dimensãodas células, maior a resolução da imagem matricial e, consequentemente, maior a quantidadede memória necessária para armazená-la.

Cada célula armazena um único valor que corresponde a uma área específica nasuperfície terrestre. O total de valores que precisam ser armazenados pode ser calculado,multiplicando-se o número de linhas pelo número de colunas da estrutura matricial. Assim,geralmente são gerados grandes volumes de dados, tornando-se necessário o emprego detécnicas de compactação de dados.

Como um fenômeno geográfico é representado, na estrutura matricial, por umagrupamento de células, todas contendo um mesmo valor, ocorre um número considerável devalores redundantes em toda a estrutura. Esta característica é muito explorada nos métodos decompactação.

Existem diversas técnicas de compactação que podem ser empregadas noarmazenamento de estruturas matriciais. Algumas delas são [LAU 92]:

• Códigos de cadeia (Chain codes) - os limites de cada região são armazenadosatravés de uma estrutura que contém uma célula de origem e uma seqüência devetores unitários. Esses vetores unitários são aplicados nas direções cardinais (leste,oeste, norte e sul), de cada região, percorridos no sentido horário;

13

• Códigos em seqüência (Run-length codes) - armazena, para cada linha, o número deocorrências de células de mesmo valor e o valor correspondente;

• Códigos de bloco (Block codes) - são armazenadas, para cada quadrado máximo,que pode ser formado por um conjunto de células de mesmo valor, as coordenadasda célula inferior esquerda do quadrado, a quantidade de células (tamanho) do ladodo quadrado e o valor do atributo;

• Árvores quaternárias (Quadtree) - utiliza uma estrutura hierárquica espacial. Existeuma grande variação de tipos de estruturas quadtree, um exemplo é apresentadoabaixo.

O termo quadtree descreve uma família de estruturas de dados hierárquicas, quebaseiam-se no princípio de decomposição recursiva do espaço [SAM 89]. Elas sãodiferenciadas pelos seguintes fatores:

• tipo de dado que está sendo representado (pontos, retângulos, regiões, curvas,superfícies ou volumes);

• processo de decomposição empregado, que pode aplicar divisões em partes iguaisou não;

• resolução da imagem, isto é, o número de vezes que a decomposição é aplicada, quepode ser fixo ou variável.

A Figura 6 mostra a decomposição de uma imagem usando a estrutura Region-quadtree, que é uma variação de quadtree para representação de regiões, onde uma região(Figura 6-a), representada na matriz binária (Figura 6-b) é decomposta em blocos (Figura 6-c), gerando a árvore correspondente. Em uma region-quadtree, a imagem é dividida sempreem partes iguais, porém, o número de vezes em que a imagem é dividida é variável, ou seja,depende dos valores armazenados pela imagem.

Neste método, a raiz da árvore corresponde à imagem completa, ou seja, um array de

2n x 2n valores de células. Cada nó da árvore pode ser um nó folha ou possuir quatro ramosdescendentes, compreendendo aos quatro quadrantes: nordeste (NE), noroeste (NW), sudoeste(SW) e sudeste (SE). Nós folhas correspondem aos quadrantes que não necessitam serredivididos por possuírem somente células de mesmo valor. Estruturas quadtrees sãoutilizadas, também, como árvores de busca, possibilitando uma melhor eficiência na execuçãode diversas operações espaciais.

Estruturas Vetoriais

Antes de descrever as estruturas de dados vetoriais é importante conhecer o conceitode topologia. Quando um mapa de uma região que está sobre a superfície curva da Terra, éprojetado sobre uma superfície plana (ex.: folha de papel), algumas propriedades são alteradas(ex.: ângulo e distância), enquanto outras permanecem inalteradas (ex.: adjacência epertinência). Estas propriedades que não se alteram quando o mapa sofre uma transformaçãosão conhecidas como propriedades topológicas.

O termo topologia é atribuído aos relacionamentos espaciais mantidos no banco dedados. Um banco de dados espacial é dito topológico se ele armazena a topologia dos objetos,ou cartográfico se os objetos são vistos e manipulados somente de forma independente[LAU 92].

14

1

2 3

67

1118

19

4 5

8

9 10

12

13 14

15 16

17

a b c

Nível 3

Nível 2

Nível 1

Nível 0

A

B C E

D F

NW NE SW SE

2 3 4 5 6

7 8 9 10

11 12 13 14

15 16 17 18

19

1

Figura 6 - Exemplo de estrutura quadtree [SAM 89]

Bancos de dados cartográficos são usados em muitos pacotes de confecção de mapas,onde as operações de análise são menos importantes do que as funções que auxiliam naelaboração de mapas como, por exemplo, posicionamento de rótulos. Um banco de dadoscartográfico pode ser convertido em um banco de dados topológico através do cálculo eidentificação dos relacionamentos entre objetos. Este processo é conhecido como Processo deConstrução da Topologia (Building Topology) [LAU 92].

Este processo (Figura 7) é usado, também, na fase de identificação dos objetos em ummapa a partir de linhas digitalizadas, o que é feito empregando-se o conceito de RestriçãoPlanar (Planar Enforcement), que consiste na aplicação de duas regras sobre os objetosusados para descrever a variação espacial.

As regras de Restrições Planar são as seguintes:

• Regra 1: Dois polígonos não podem se sobrepor.• Regra 2: Cada posição no mapa pertence a um único polígono, ou a

um limite entre dois plígonos.

De forma simplificada, o processo de construção da topologia começa com umconjunto de segmentos de linhas não relacionados (Figura 7-a). Cada interseção de linhas ounodo terminal é identificado (Figura 7-b). Em seguida, cada segmento de linha existente entredois nós consecutivos (arestas) é identificado (numerado na Figura 7-c). Finalmente, cadapolígono resultante recebe um identificador, inclusive o polígono externo que recebe umidentificador diferenciado.

15

(a) (b)

(c)

1

23

4

5

6

78

9

10

A

B

C

D

11

12131415

16

17

18

19

E

Figura 7 - Processo de construção da topologia [NCG 90]

A estrutura vetorial tem como primitiva principal o ponto, porém, os sistemas utilizamtrês construtores básicos: ponto, linha e polígono. As coordenadas (x,y) de um pontorepresentam a localização, em um sistema de coordenadas específico, de fenômenos que nãopossuem dimensões espaciais na escala de representação escolhida. A linha, formada por umacadeia de segmentos de linha reta, ou mais especificamente, por uma lista de coordenadas depontos, é usada para representar as entidades da realidade que possuem dimensão linear. Opolígono representa as entidades com extensões bidimensionais, através da definição docontorno da área da entidade. O polígono é formado por uma cadeia fechada de segmentos delinha, podendo ou não possuir outros polígonos embutidos em seu interior.

Existem diversas técnicas para armazenamento de objetos espaciais baseadas naestrutura vetorial. Aronoff [ARO 89] divide essas estruturas em dois grandes grupos:estruturas de dados spaghetti e estruturas de dados topológicos, levando-se em consideraçãose os relacionamentos topológicos são, ou não, armazenados.

• Estruturas de dados spaghetti - armazenam os polígonos/linhas como seqüências decoordenadas de pontos. São utilizadas em pacotes de cartografia automatizada, ondeas informações sobre os relacionamentos entre as entidades não são importantes.

• Estruturas de dados topológicos - armazenam alguns tipos de relacionamentosespaciais, sendo que a ênfase principal é dada nos relacionamentos de conectividadeentre linhas de uma rede e nos relacionamentos de adjacência entre polígonos. Sãoempregadas na maioria dos SIG.

A Figura 8 exemplifica uma estrutura de dados vetorial capaz de manter a topologia depolígonos adjacentes. A estratégia é baseada no armazenamento de atributos dos arcos,acrescidos de dois apontadores extras, referentes aos polígonos localizados à esquerda e àdireita do arco, percorrido no sentido nó-origem-nó-destino.

Uma tabela contém os atributos dos polígonos, uma outra tabela armazena os atributosdos arcos e uma terceira contém as coordenadas dos pontos que formam a geometria dos

16

arcos. Este tipo de estrutura possibilita a execução de operações de consulta de maneirabastante eficiente, por não necessitar realizar operações com base nas coordenadas dosobjetos. Por exemplo, todos os polígonos adjacentes ao polígono B podem ser encontrados apartir da Tabela de Atributos dos Arcos. Cada par de apontadores (polígono à direita,polígono à esquerda), contendo o polígono B indica um polígono adjacente a ele, por ter umarco em comum. Desta forma, os arcos 3, 4 e 5 identificam os polígonos adjacentes aopolígono B.

A

B

C

D

12

3

4

5

6

a

b

c

d

Tab. Atributos de Polígonos

ID Atrib1 Atrib2 Atrib3ABCD (exterior)

Tab. Atributos de Arcos

Arco Dir Esq Ori Des 1 A D a c 2 A C c b 3 A B b a 4 D B a d 5 B C b d 6 D C d c

Tab. Geometria de Arcos

Arco Coordenadas 1 (x1,y1),(x2,y2),...... 2 (x1,y1),(x2,y2),...... 3 (x1,y1),(x2,y2),...... 4 (x1,y1),(x2,y2),......

Figura 8 - Relacionamento de polígonos adjacentes [NCG 90]

2.3.3 Funções de Processamento, Análise e de Apresentação

Segundo Chrisman [CHR 97], um SIG deve fornecer operações para a recuperação deinformações com base em critérios de natureza espacial e não-espacial. As linguagens deconsulta de SGBDs convencionais foram projetadas para recuperar informações segundocritérios não-espaciais. O SIG deve ser capaz de manipular dados espaciais e recuperarinformações com base em relacionamentos direcionais como “acima de” e “perto de” e emrelacionamentos topológicos como “próximo a”, “dentro de” e “ao lado de” [CAM 96].

Existem diferentes funções de manipulação e análise de dados disponíveis nossistemas atuais. Além disso, novas funções podem ser adicionadas ao conjunto das jáexistentes. Porém, não existe um padrão para os nomes dessas funções, sendo comum aexistência de funções com comportamento idêntico porém com nomes distintos [NCG 90].

A classificação apresentada nesta seção teve como base o trabalho de Aronoff[ARO 89], o qual apresenta uma taxonomia das funções encontradas na maioria dos SIG, masque não se refere a nenhum software em especial. Essas funções estão agrupadas em quatrocategorias principais. São elas:

• Manutenção de Dados Espaciais;

• Manutenção e Análise de Atributos Descritivos;

17

• Análise Integrada de Dados Espaciais e Descritivos; e

• Formatação de Saída.

Funções de Manutenção de Dados Espaciais

Este grupo inclui as funções utilizadas na fase de pré-processamento dos dadosespaciais, ou seja, funções usadas na preparação ou reorganização dos dados para que possamser utilizados em operações de análise e consulta. Alguns exemplos estão relacionados abaixo.

• Transformações de formato – dados obtidos a partir de diversas fontes nem sempreestão armazenados no formato adequado para ser processado no SIG.

• Transformações geométricas - utilizadas para definir ou ajustar as coordenadasterrestres em um mapa, ou entre as camadas de dados.

• Transformações entre projeções geométricas - SIG normalmente suportam mais deum tipo de projeção, fornecendo operações para transformar as projeções dosmapas.

• Casamento de bordas - alguns ajustes precisam ser feitos durante a fase depreparação (pré processamento) dos dados. Casamento de bordas são feitos pormeio de operações que realizam a união de linhas entre coberturas adjacentes, ondeos objetos que ultrapassam os limites de uma cobertura têm suas coordenadaslimites ajustadas em todas as coberturas onde aparecem.

• Edição de elementos gráficos - São funções usadas para adicionar, eliminar emodificar objetos no mapa. Por exemplo, quando a aresta que separa dois polígonosé digitalizada duas vezes podem surgir pequenas fatias de áreas sobrepostas oufatias de áreas sem informações. Nestes casos os ajustes e acertos precisam serrealizados manualmente.

• Redução de coordenadas - têm como objetivo diminuir a quantidade de pares decoordenadas pertencentes às linhas, reduzindo assim, a quantidade total de dadosarmazenados em cada camada. A Figura 9 exemplifica esta operação.

Figura 9 - Exemplo de redução de coordenadas

Funções de Manutenção e Análise de Atributos Descritivos

Na maioria dos SIG, a manipulação dos atributos descritivos (não-gráficos) é realizadaatravés de linguagens de manipulação/consulta de dados disponíveis nos SGBDs. Diversasoperações de análise podem ser resolvidas sem consulta aos atributos espaciais. Nos sistemasvetoriais, por exemplo, as informações sobre a área e o perímetro dos polígonos podem serarmazenadas junto aos demais atributos descritivos associados a esses polígonos. Nestes

18

casos, uma operação de análise envolvendo áreas de polígonos pode ser resolvida pormétodos tradicionais de consulta a bancos de dados convencionais (ex.: Linguagem SQL).

Funções de Análise Integrada de Dados Espaciais e Descritivos

A potencialidade de um SIG está na sua capacidade de realizar operações de análiseespacial envolvendo atributos espaciais e descritivos de forma conjunta. Isto também é umdos principais fatores que distinguem um SIG dos demais sistemas de geoprocessamento. Onúmero de funções que se enquadram nesta categoria é muito grande. A seguir citamosalgumas dessas funções.

• Recuperação de dados - são funções que envolvem busca seletiva, manipulação egeração de resultados, sem alterar os valores armazenados no banco de dados. Umexemplo seria a geração de um mapa urbano mostrando a localização dasresidências com valor nominal acima de um determinado valor.

• Funções de medidas - são executadas sobre os objetos espaciais (pontos, linhas,polígonos e conjunto de células) e incluem funções como distância entre doispontos, comprimento de linhas, perímetro de áreas, etc.

• Funções de sobreposição de camadas (overlay) - relaciona informações de duas oumais camadas de dados. Essas funções podem executar operações aritméticas oulógicas entre os valores das células localizadas em coordenadas idênticas nasdiversas camadas envolvidas (Figura 10).

2

3

3

2

1

1

1

1

3

10

10

30

10

10

30

20

20

30

12

13

33

12 21

11

31

21

33

S

S

S

S

N

S

N

N

S

N

N

N

S

S

N

N

S

S

N

N

N

S

N

N

N

N

S

'E'

Figura 10 - Operações de sobreposição de camadas

• Funções de interpolação - interpolação é o método matemático no qual valores nãodefinidos em uma localização podem ser calculados com base em estimativas feitasa partir de valores conhecidos em localizações vizinhas. Funções matemáticas comoregressão polinomial, Séries de Fourier, médias ponderadas, entre outras, sãoaplicadas de acordo com a variável que está sendo analisada.

19

• Geração de contorno - linhas de contorno (ou isolinhas) são usadas para representarsuperfícies, onde cada linha é formada por pontos de mesmo valor. Funções degeração de linhas de contorno são usadas para construir os mapas topográficos apartir de um conjunto de pontos conhecidos.

• Funções de proximidade - funções que permitem análise de proximidade estãoassociadas à geração de zonas de buffer. Uma zona de buffer é uma área de extensãoregular, que é gerada ao redor dos objetos espaciais (Figura 11).

500m de uma reserva florestal

200m do leito do rio

um raio de 5 Km deum depósito de gás

Figura 11 - Exemplo de zonas de buffer

Funções de Formatação de Saída

Os resultados das operações de análise espacial podem ser gerados na forma derelatórios, gráficos ou, mais comumente, na forma de mapas. Diversas funções podem serusadas para melhorar a aparência dos mapas resultantes dessas operações como, por exemplo,anotações em mapas, posicionamento de texto, símbolos, iluminação e visões emperspectivas. A seguir, estão listadas algumas dessas funções.

• Anotações em mapas - permitem adicionar aos mapas informações como título,legendas, barra de escala, orientação norte-sul, etc. Podem ser colocados fora doslimites do mapa ou cobrindo alguma parte deste.

• Posicionamento de rótulos - rótulos são colocados junto aos símbolos gráficos querepresentam fenômenos no mapa. Existem padrões cartográficos para a escolha doposicionamento de rótulos. A maioria dos SIG possuem ferramentas que efetuam oposicionamento de forma automática ou manual.

• Padrões de textura e estilos de linhas - os textos podem variar em tipo de fonte,tamanho, cor e estilo (ex.: negrito, itálico). A escolha dos tipos de letra devemobedecer convenções cartográficas, assim como os estilos de linhas, que podemvariar em espessura, cor e forma (ex. tracejada, pontilhada).

• Símbolos gráficos - os símbolos gráficos são usados para representar classes deentidades em um mapa. Alguns símbolos mais comuns são: símbolos de cidades(ex.: tamanho variando de acordo com a população), pontes, aeroportos, hospitais,museus, escolas. Alguns sistemas utilizam o conceito de bibliotecas de símbolos,que podem ser adquiridas de acordo com a área de aplicação específica.

20

3 Projeto de Bancos de Dados Geográficos

3.1 Dado, Informação e Fenômeno GeográficoUma informação é obtida a partir do processamento ou da contextualização de dados

brutos. Um dado bruto corresponde a um valor para uma medida observada. Por exemplo, adata 7/9/1822 é um dado bruto. Quando este dado está associado a um contexto torna-seinformação. Assim, na expressão “O Brasil tornou-se independente de Portugal em 7 desetembro de 1822”, o dado é transformado em informação.

De modo equivalente, informação geográfica é resultado do processamento de dadosgeográficos. Um dado geográfico refere-se a uma medida observada de um fenômeno queocorre sobre/sob a superfície terrestre, onde a localização da observação é um componentefundamental do dado.

O termo fenômeno geográfico compreende, de forma abrangente, a qualquerocorrência que pode ser: natural (ex.: um lago, a pressão atmosférica, uma formaçãogeológica); antrópica (ex.: uma rodovia, um hospital, divisão territorial política); de fatos (ex.:uma epidemia, uma batalha); ou mesmo de objetos ainda inexistentes (ex.: o planejamento deum gasoduto, projeto de uma usina hidroelétrica).

3.1.1 Componentes da informação geográfica

Segundo Chrisman [CHR 97], a informação geográfica possui três componentesbásicos: atributo, espaço e tempo, que possibilitam responder, respectivamente, a trêsperguntas: o quê? onde? e quando?. Segundo Worboys [WOR 95], cada um dessescomponentes determina uma categoria de dimensão ao longo da qual os valores são medidos(Figura 12).

Figura 12 - Categorias de dimensões da informação geográfica

Para que um dos três componentes possa ser medido deve-se fixar um segundocomponente e usar o terceiro como controle (Sinton, 1978 Apud [CHR 97]). Por exemplo,para medir a altitude (atributo) de uma determinada região, fixa-se o componente tempo, faz-se variar a posição no espaço (controle) e toma-se o valor da altitude para os diversos pontosna região. Um segundo exemplo compreende a medição da temperatura em uma estaçãometeorológica. Neste caso, a localização da estação é fixa (espaço), o período de tempo daobservação serve de controle e a temperatura (atributo) é medida para cada unidade de tempoestabelecida. A definição de qual dimensão pretende-se fixar, usar como controle ou medir,possibilita uma grande variedade de estruturas de medidas da informação geográfica.

atributo

espaço

tempo

21

Componente Espaço

O componente espacial descreve a localização geográfica e a forma geométrica dofenômeno descrito pela informação geográfica, além de relacionamentos com outrosfenômenos geográficos. Como a principal função de um SIG é possibilitar a realização deoperações de análise espacial, o componente espacial é o mais importante no contexto de SIG.

Um dado geográfico é, antes de mais nada, um dado espacial, isto é, descreve a formageométrica (coordenadas numéricas) de um objeto no espaço. Por exemplo, a forma de umcubo no espaço ℜ3 ou uma circunferência projetada no espaço ℜ2 são dados espaciais. Assim,uma linha unindo dois pontos quaisquer em uma imagem de ecografia é um dado espacial,mas não um dado geográfico.

Quando o dado espacial está relacionado com sua localização sobre a superfícieterrestre, ou seja, são utilizadas coordenadas geográficas (ex.: latitude/longitude), este dado,além de ser espacial, é um dado geográfico, também conhecido por dado geo-espacial ou dadogeorreferenciado.

Devido a uma herança cultural no desenvolvimento de SIG, decorrente do uso demapas em papel, existe uma predominância quase total no processamento de dadosbidimensionais, embora seja possível o processamento de dados espaciais em três dimensões.

Componente Atributo

Um fenômeno geográfico possui características qualitativas e quantitativas que sãodescritas de forma textual e/ou numérica. O componente atributo, também conhecido poratributo descritivo ou atributo não-espacial, descreve as características não espaciais de umfenômeno geográfico. Nome, população e orçamento anual de um município são exemplos deatributos descritivos.

Atributos descritivos são os mais freqüentes na maioria dos sistemas de informaçãoem geral. A maioria dos SIG utilizam um SGBD para o gerenciamento dos atributosdescritivos.

Segundo Aronoff [ARO 89], existe um certo grau de incerteza que é inerente aocomponente atributo. Por exemplo, uma floresta de Eucaliptos pode não ser formada porárvores 100% do tipo Eucalipto ou um bairro residencial pode possuir algumas pequenasindústrias instaladas. Para alguns tipos de análises pode ser importante considerar a existênciadessas incertezas, embora normalmente este tipo de problema seja desconsiderado pelosusuários de SIG.

Componente Tempo

Todo fenômeno geográfico é eminentemente temporal, ou seja, está associado a uminstante ou intervalo de tempo em que este ocorre ou em que é observado [PEU 95]. Ocomponente tempo pode ser crítico para a informação geográfica, dependendo do tipo defenômeno e do tipo de aplicação em que este está sendo utilizado.

O componente tempo, embora muitas vezes esteja implicitamente associado aosdemais componentes da informação geográfica, tem sido tratado como uma simplesinformação complementar. Por exemplo, todo mapa está associado ao período de temporelativo à sua confecção e ao período de tempo relativo à validade da informação apresentada.Um novo mapa retratando as divisões provinciais do Brasil no século XVII ilustra estasituação.

22

A maioria dos sistemas são projetados para fornecer informação atual sobre osfenômenos geográficos. Por exemplo, um sistema de rede de telefonia deve fornecer aos seususuários, a informação mais atualizada possível. Desta forma, a informação que é extraída dosistema é tida como verdadeira para o momento da consulta. É comum a existência deaplicações onde os aspectos temporais não são contemplados ou são tratados de maneirasuperficial. No entanto, existem aplicações onde o aspecto temporal é fundamental. Porexemplo, em um sistema de cadastro urbano, os limites dos lotes podem ser modificados(divididos ou unidos a outros lotes), proprietários podem ser trocados, edificações sãoconstruídas. O histórico dessas modificações no cadastro territorial é um fator importanteneste tipo de aplicação.

3.2 Requisitos de Modelagem para Aplicações de SIGDevido à necessidade de tratar as três dimensões da informação geográfica, as

aplicações de SIG impõem alguns requisitos especiais de modelagem que devem sersuportados pelos modelos conceituais no projeto de banco de dados para estas aplicações. Aseguir é descrito o conjunto de requisitos mínimos que um modelo conceitual de dados paraaplicações de SIG deve suportar [LIS 99a].

3.2.1 Fenômeno Geográfico e Objeto Convencional

Em um banco de dados geográficos existem, além dos dados referentes aos fenômenosgeográficos, outros objetos convencionais, presentes na maioria dos sistemas de informação.Por exemplo, uma fazenda é um fenômeno geográfico quando suas informações espaciais(ex.: os limites da fazenda) estão armazenadas no banco de dados. Neste mesmo banco dedados pode-se ter dados sobre os proprietários de fazendas, considerados objetosconvencionais por não terem informações espaciais associadas. Em um esquema conceitual éimportante que se possa diferenciar, facilmente, entre classes (ou entidades) descrevendoesses dois tipos de objetos.

3.2.2 Visões de Campo e de Objetos

Segundo Goodchild [GOO 92], a realidade geográfica pode ser observada segundoduas visões: de campo e de objetos.

Na visão de campo a realidade é modelada por variáveis que possuem umadistribuição contínua no espaço. Toda posição no espaço geográfico pode ser caracterizadaatravés de um conjunto de atributos como temperatura, tipo de solo e relevo, medidos para umconjunto de coordenadas geográficas.

Na visão de objetos, a realidade consiste de fenômenos individuais, bem definidos eidentificáveis. Cada fenômeno na visão de objetos tem suas propriedades individuais e ocupaum determinado lugar no espaço. A realidade é modelada como um grande espaço onde osfenômenos estão distribuídos sem que, necessariamente, todas as posições do espaço estejamocupadas.

A modelagem de fenômenos geográficos na visão de objetos2 é um processo natural edireto (ex.: rios são descritos pela classe ou entidade Rio). No entanto, um campo geográfico

2 É importante ressaltar a diferença entre os conceitos de visão de objetos, em contrapartida à visão de campos, emodelos de objetos, referente à orientação a objetos.

23

(ex.: Altimetria) não pode ser modelado diretamente como uma classe, pois Altimetria não éum objeto e, consequentemente, não pode ser descrito diretamente por uma classe.

Um modelo conceitual de dados deve prover construtores especiais para modelar tantoos campos quanto os objetos geográficos. A maioria dos modelos existentes não suporta amodelagem dos fenômenos geográficos que são percebidos na visão de campo.

3.2.3 Aspectos Temáticos

Os fenômenos geográficos possuem vários atributos, dentre os quais o que fornece sualocalização geográfica (atributo espacial). A localização e a forma dos fenômenos geográficossão representadas através de objetos espaciais, associados a um sistema de coordenadas. Umobjeto representando um fenômeno geográfico (ex.: um rio) deve estar associado a um oumais objetos espaciais que representam sua localização e sua forma sobre a superfícieterrestre. Em um SIG, esses objetos espaciais não são tratados isoladamente, mas sim, emgrupos que representam fenômenos com características e relacionamentos em comum.Diferentes termos como tema, camada e plano de informação são encontrados na literatura,referindo-se a estes agrupamentos.

No nível interno de um SIG, a organização dos dados espaciais é feita em camadasfísicas (ex.: conjunto de polígonos representando os limites dos lotes urbanos). No entanto,embora o projeto de camadas físicas seja um problema a ser tratado nas etapas de projetológico ou físico, diversos autores afirmam que é importante que camadas conceituais sejamdefinidas durante a fase de projeto conceitual [WOR 95, HAD 96]. Para Hadzilacos[HAD 96], camadas conceituais não necessitam ter uma relação um-para-um com camadasfísicas. Por exemplo, uma única camada conceitual, como Hidrografia, pode dar origem adiferentes camadas físicas, uma contendo somente os rios, outra contendo somente os lagos,etc.

3.2.4 Aspectos Espaciais

A localização geográfica e a forma espacial dos fenômenos geográficos podem serimplementadas, em um SIG, através de objetos espaciais. Todo objeto espacial possui umageometria, que representa a forma espacial do fenômeno, sendo que suas coordenadas devemestar registradas com base em um determinado sistema de coordenadas (ex.: latitude elongitude) e um sistema de projeção (ex.: UTM).

Embora os aspectos espaciais dos fenômenos geográficos possam parecer detalhes quenão deveriam ser tratados durante a modelagem conceitual, a sua inclusão no esquemaconceitual tem sido fator fundamental na comunicação com o usuário [LIS 00].

Na visão de objetos, os fenômenos geográficos são representados por objetos espaciaisdo tipo ponto, linha, polígono ou combinações destes, enquanto que na visão de campo umasuperfície contínua pode ser representada, por exemplo, através de modelos numéricos,conjuntos de isolinhas, polígonos adjacentes e grade de células.

Diferentes abordagens têm sido propostas para modelagem conceitual dos aspectosespaciais dos fenômenos geográficos. A abordagem mais comum é a que define umaassociação entre a classe que descreve o fenômeno e a classe do tipo de objeto espacial

24

correspondente a sua representação espacial. Alguns modelos, no entanto, utilizampictogramas3 para substituir esta associação.

3.2.5 Múltiplas Representações

Uma das características das aplicações geográficas é a possibilidade de existência demúltiplas representações para um mesmo fenômeno geográfico. Esta necessidade surge emresposta à complexidade da realidade a ser representada e às diferentes visões que os usuáriostêm de um mesmo fenômeno. Um fenômeno geográfico pode ser representado em diferentesescalas ou projeções, inclusive por diferentes objetos espaciais.

A existência de múltiplas representações pode ser modelada através da inclusão devárias associações entre o fenômeno geográfico e os tipos de objetos espaciaiscorrespondentes.

3.2.6 Relacionamentos Espaciais

Uma das tarefas mais importantes quando se está modelando os dados de umaaplicação é a identificação de quais os relacionamentos que deverão ser mantidos no banco dedados, dentre os possíveis relacionamentos observáveis na realidade. No domínio dasaplicações geográficas este problema é bem complexo, uma vez que o número derelacionamentos possíveis de serem mantidos é ainda maior, devido à existência dosrelacionamentos espaciais entre os fenômenos geográficos.

A maioria dos SIG fornece estruturas especiais para o armazenamento explícito dealguns tipos de relacionamentos espaciais. Normalmente são mantidos somente osrelacionamentos de adjacência ou de conectividade, deixando os demais tipos derelacionamentos espaciais (ex.: pertinência, cruza) para serem calculados a partir dascoordenadas espaciais dos objetos. Por outro lado, existem aplicações nas quais algunsrelacionamentos espaciais possuem significado semântico relevante, tal como vizinhança ecruzamento de ruas. Nestes casos o projetista necessita especificar estas informações nomodelo de dados.

As cardinalidades associadas aos relacionamentos formam um conjunto de restriçõesde integridade que devem ser mantidas entre as instâncias dos objetos no banco de dados.Para os relacionamentos espaciais, novos tipos de cardinalidade podem ser definidos, taiscomo, associação espacial, pertinência, etc. Um modelo conceitual de dados para SIG devefornecer meios para que o projetista represente os relacionamentos a serem mantidos no bancode dados geográficos. Isto inclui tanto os relacionamentos convencionais como osrelacionamentos espaciais.

3.2.7 Aspectos Temporais

A maioria dos SIG disponíveis atualmente considera os fenômenos como se o mundoexistisse somente no presente. Dados geográficos são alterados ao longo do tempo, mas ohistórico dessas transformações não é mantido no banco de dados.

Para Hadzilacos [HAD 96], a necessidade de os dados geográficos estaremqualificados com base no tempo, se deve à necessidade de se registrar estados passados deforma a possibilitar o estudo da evolução dos fenômenos geográficos. Para possibilitar uma

3 Pequenos símbolos gráficos incluídos na definição das classes/entidades.

25

análise de dados com base na evolução dos fenômenos geográficos é necessário adicionar aosSIG as potencialidades dos sistemas de bancos de dados temporais. Isto implica na inclusãode informações temporais relacionadas aos fenômenos geográficos e da extensão daslinguagens de consulta disponíveis para que estas suportem cláusulas de condição associadasa aspectos temporais [WOR 95].

Alguns modelos conceituais propostos na literatura estendem a notação gráfica pararessaltar a existência dos aspectos temporais em determinadas classes. O modelo GeoOOA[KOS 97], por exemplo, utiliza um pictograma especial (símbolo de um relógio), paradiferenciar classes temporais . Além disso, a notação gráfica do modelo é estendida pararepresentar dois tipos especiais de relacionamentos temporais: conexão ancestral e conexãode atributo temporal. A Figura 13 ilustra um trecho da modelagem de um sistema decadastramento de lotes.

LOTE

NúmeroTerritórioTipo de uso

Val idade uso

ESCRITURA

NúmeroDataRelatór io

D O N O

N o m eEndereçoDt-nasc

Compra

0,N 0,N1,N1,N1,N

1,N

Conexão ancestral

Classe espaço-temporal

Conexão de atr ibuto temporal

Classe convencional

Figura 13 - Aspectos temporais no modelo GeoOOA

No modelo GeoOOA, um relacionamento de conexão ancestral permite a associaçãoentre versões de um mesmo objeto. Por exemplo, um lote pode ser dividido, em umdeterminado momento, dando origem a dois novos lotes. A conexão de atributo temporal éusada para destacar uma associação decorrente da necessidade de modelar o aspecto temporalde um atributo. Na figura acima, a classe Escritura é resultado da modelagem dos dadoshistóricos do lote. Na modelagem não temporal, o usual é que cada lote tenha uma únicaassociação com o proprietário atual.

3.3 Modelos Conceituais de Dados para SIGUm modelo conceitual de dados fornece uma base formal (notacional e semântica)

para ferramentas e técnicas usadas para suportar a modelagem de dados. Modelagem dedados é o processo de abstração onde somente os elementos essenciais da realidade observadasão enfatizados, descartando-se os elementos não essenciais. O processo de modelagemconceitual de banco de dados compreende a descrição dos possíveis conteúdos dos dados,além de estruturas e de regras a eles aplicáveis. Essa descrição do banco de dados é feita combase nos construtores semânticos fornecidos por um modelo conceitual.

Os requisitos apresentados anteriormente fazem com que modelos conceituaisconvencionais, como o modelo E-R, não sejam adequados para modelagem de bancos dedados geográficos, ou seja, para modelagem de aplicações de SIG. Atualmente, diversaspropostas de modelos conceituais de dados específicos para bancos de dados geográficospodem ser encontrados na literatura. Estes modelos são, na verdade, extensões dos modelostradicionais. Abaixo são citados os principais modelos encontrados na literatura, classificadosde acordo com o tipo de formalismo usado como base:

26

• Formalismo E-R: Modul-R [BED 96], GISER [SHE 97], Geo-ER [HAD 97];

• Formalismo OO: GMOD [PIR 97], Geo-OMT [BOR 97], GeoOOA [KOS 97],MADS [PAR 98], Perceptory [BED 99], UML-GeoFrame [LIS 99].

Uma análise crítica desses modelos, feita com base nos requisitos descritos nesta seçãoé apresentada em [LIS 99a].

3.4 Modelando Banco de Dados Geográficos com UML-GeoFrameNesta seção é apresentada a abordagem UML-GeoFrame, ou seja, o uso da linguagem

UML (Unified Modeling Language) [BOO 98], com base no framework GeoFrame [LIS 99],para a modelagem conceitual de bancos de dados geográficos. Esta solução possibilita aobtenção de esquemas conceituais de dados numa linguagem bastante clara e, portanto, defácil entendimento por parte dos usuários.

Não é objetivo desse material, a apresentação da linguagem UML. Para maioresdetalhes o leitor pode consultar, por exemplo, [BOO 98]. Apenas uma pequena parte dosrecursos da UML são utilizados, os quais fazem parte do modelo de classes, cujos principaisconstrutores gráficos são mostrados na Figura 14. Por questões, também de simplificação, aparte da modelagem dinâmica (métodos) não está sendo abordada.

PACOTE

ClasseAgregada

atr ibuto : domínio

Classe

atr ibuto : domínio

Subclasse

atr ibuto : domínio

Subclasse

atr ibuto : domínio

ClasseComponente

atr ibuto : domínio

agregação

general ização -especia l ização

objeto : c lasseinstanciação

1 *

mult ip l ic idade

assoc iação

compos ição

Figura 14 - Notação gráfica do diagrama de classes UML (resumida)

Os mecanismos de abstração e os respectivos elementos construtores da linguagemUML, que são utilizados na abordagem UML-GeoFrame, estão resumidos a seguir:

• Classificação – Nos modelos orientados a objetos, um fenômeno de interesse daaplicação é representado como um objeto, o qual possui uma estrutura, capaz dearmazenar suas características (atributos) e um comportamento, descrito peloconjunto de operações que podem ser realizadas com o objeto. Objetos semelhantessão modelados através da definição de uma classe, a qual especifica um conjunto deatributos que descrevem a estrutura e um conjunto de métodos (ou operações) quedefinem o comportamento dos objetos definidos pela classe.

• Instanciação – Um objeto pertencente a uma classe é dito ser uma instância destaclasse.

27

• Generalização – Classes semelhantes podem ser agrupadas e descritas de formageneralizada. Neste caso, as propriedades da classe genérica (superclasse), ou seja,atributos, métodos e associações, são herdadas pelas classes que foram generalizadas(subclasses).

• Especialização – A especialização é o mecanismo inverso da generalização, no qualuma classe genérica (superclasse) pode ser especializada em uma ou mais classesespecíficas (subclasses), as quais herdam as propriedades da superclasse, além denovas propriedades poderem ser definidas.

• Associação – Representa os relacionamentos que podem haver entre objetos dediferentes classes. Multiplicidade é o nome dado à cardinalidade de uma associação.

• Agregação – Tipo especial de associação para representar relacionamentos entreobjetos compostos e suas partes.

• Composição – Tipo especial de agregação na qual a existência do objeto composto (otodo) depende da existência dos objetos componentes (suas partes).

Além dos mecanismos de abstração relacionados anteriormente, a abordagem UML-GeoFrame utiliza dois elementos próprios da linguagem UML. São eles:

• Pacote – Usado para particionar um diagrama de classes através do agrupamento deelementos da linguagem UML.

• Estereótipo – Mecanismo de extensão dos construtores da linguagem UML. Permiteque o projetista defina novos construtores e o utilize na elaboração de diagramasUML.

A Figura 15 ilustra um exemplo de diagrama de classe elaborado usando a UML.Algumas leituras que podem ser feitas neste diagrama são: uma Quadra é uma agregação deLotes; Lote Edificado e Lote Territorial são especializações de Lote; uma Edificação é umacomposição de Unidades Edificadas, as quais estão associadas a um proprietário cada; odiagrama de classes foi incluído em um pacote denominado Loteamento.

Loteamento

* 1

*

*

1

LoteTerritorial

LoteEdif icado

1

* *

QuadraProprietário

UnidadeEdif icada

Edif icação

Lote

Figura 15 - Exemplo de esquema de classes em UML

De forma semelhante ao modelo E-R, o diagrama de classes da linguagem UMLtambém não é adequado à modelagem de banco de dados geográficos, por não atender avários dos requisitos impostos pelas aplicações de SIG. A seguir é descrito o GeoFrame, o

28

qual estende os construtores da linguagem UML através da definição de um conjunto simplesde estereótipos para serem usados na modelagem de banco de dados geográficos.

3.4.1 GeoFrame

GeoFrame é um framework conceitual que fornece um diagrama de classes básicaspara auxiliar o projetista nos primeiros passos da modelagem conceitual de dados de umanova aplicação de SIG [LIS 99]. Um framework pode ser definido como um projeto genéricoem um domínio que pode ser adaptado a aplicações específicas, servindo como um moldepara a construção de aplicações. Esta definição fornece uma visão bem mais abrangente sobrea potencialidade de um framework do que as definições apresentadas por autores mais ligadosà programação orientada a objetos. Por exemplo, Ralph Johnson define um framework comosendo “um projeto reutilizável de um programa, ou parte de um programa, expresso como umconjunto de classes” [JOH 92].

Como instrumento de reutilização, um framework não necessita estar implementadoem uma linguagem de programação para fornecer a solução parcial a uma família deproblemas. O framework GeoFrame (Figura 16) foi elaborado sob esse enfoque maisgenérico, onde o mesmo expressa a idéia de um projeto conceitual parcial para uma família deaplicações geográficas.

Tema

ObjetoNãoGeográf ico FenômenoGeográf ico

CampoGeográf ico ObjetoGeográf ico

GradeCélulas PolAdjacentes Isolinhas GradePontos TIN PontosIrregulares

Linha PolígonoPonto ObjEspComplexo

RepresentaçãoCampo ObjetoEspacial

nome

Regiãogeográf ica

descrição

retrata

representa representa

*

2..n**

*

*

*

1 1

1

Figura 16 - Diagrama de classes do GeoFrame

O GeoFrame foi definido de acordo com as regras do formalismo da orientação aobjetos, utilizando a notação gráfica do diagrama de classes da linguagem UML. Assubseções seguintes descrevem as classes do diagrama.

29

Tema e RegiãoGeográfica

As classes TEMA e REGIÃOGEOGRÁFICA formam a base de qualquer aplicaçãogeográfica. Toda aplicação geográfica tem como objetivo o gerenciamento e a manipulaçãode um conjunto de dados para uma determinada região de interesse, constituindo um banco dedados geográfico. Assim, para cada região geográfica pode-se especificar uma coleção detemas.

Outra vantagem da utilização do conceito de temas, no esquema conceitual, é que elefunciona como um mecanismo para redução da complexidade em grandes esquemas. Écomum existirem aplicações geográficas com centenas de entidades modeladas (ex.:SIGPROGB [LIS 97]). O uso de temas permite ao projetista dividir o esquema emsubesquemas coesos, nos quais são agrupadas classes fortemente relacionadas entre si. Emgrandes projetos, conjuntos de temas afins podem ser agrupados em um tema mais genérico,formando uma hierarquia de temas.

ObjetoNãoGeográfico e FenômenoGeográfico

Em um banco de dados geográficos existem, além dos dados referentes àquelesfenômenos georreferenciados, com ou sem representação geoespacial, objetos convencionaispresentes em qualquer sistema de informação. Alguns objetos não possuem referência comrelação a uma localização geográfica, sendo tratados, genericamente, como instâncias desubclasses da classe OBJETONÃOGEOGRÁFICO.

A classe abstrata FENÔMENOGEOGRÁFICO generaliza qualquer fenômeno cujalocalização em relação à superfície terrestre seja considerada. Por exemplo, um lote de terra éuma instância de FENÔMENOGEOGRÁFICO caso seus atributos espaciais estejam representadosno banco de dados.

Fenômenos geográficos e objetos não geográficos podem estar relacionados entre si(associação relacionaCom), como no caso em que “todo lote pertence a um proprietário”. Amodelagem desse tipo de relacionamento permite que os dados armazenados em um SIGestejam integrados com os demais sistemas de informação da organização.

CampoGeográfico e ObjetoGeográfico

Fenômenos geográficos são percebidos, na realidade, segundo as visões dicotômicasde campo e de objeto [GOO 92]. Essas duas visões acarretam diferentes maneiras demodelagem dos fenômenos geográficos. As classes CAMPOGEOGRÁFICO eOBJETOGEOGRÁFICO especializam a classe FENÔMENOGEOGRÁFICO, permitindo ao projetistaespecificar, de forma distinta porém integrada, os campos e os objetos geográficos,respectivamente.

A classe abstrata OBJETOGEOGRÁFICO é uma generalização de todas as classes dodomínio que são percebidas na visão de objetos. Neste caso estão incluídas aquelas classesque representam fenômenos geográficos que podem ser individualizados, ou seja, quepossuem identidade própria e suas características podem ser descritas através de atributos.

A classe abstrata CAMPOGEOGRÁFICO generaliza os fenômenos que se enquadram navisão de campo. Campos geográficos são modelados como funções sobre uma variável. Combase nesta definição, um campo geográfico pode ser modelado conceitualmente comosubclasse de CAMPOGEOGRÁFICO. Alguns tipos de campos geográficos, os chamados

30

categóricos, possuem uma associação especial com uma classe que representa a imagem dafunção de mapeamento do campo, uma subclasse de OBJETONÃOGEOGRÁFICO.

ObjetoEspacial

É uma classe abstrata cujas subclasses formam o conjunto mínimo de construtorespara a especificação do componente espacial dos fenômenos geográficos na visão de objetos.Alguns fenômenos geográficos podem apresentar dimensão espacial complexa, ou seja,composta por outros objetos espaciais (ex.: um arquipélago). Assim, a classeOBJETOESPACIAL, possui as subclasses (PONTO, LINHA, POLÍGONO eOBJESPACIALCOMPLEXO), que constituem o conjunto mínimo de classes necessárias para afase do projeto conceitual.

RepresentaçãoCampo

Os aspectos espaciais de um campo geográfico são abstraídos de forma diferente dosaspectos espaciais de um objeto geográfico. Para especificação do componente espacial de umcampo geográfico são usadas as subclasses da classe REPRESENTAÇÃOCAMPO. São elas:GRADECÉLULAS, POLADJACENTES, ISOLINHAS, GRADEPONTOS, TIN e PONTOSIRREGULARES.

Um mesmo campo geográfico pode ter seu componente espacial abstraído dediferentes formas, ou seja, através de mais de um desses modelos. Por exemplo, o campoTemperatura pode ser abstraído por meio de um conjunto de pontos irregularmentedistribuídos ou por meio de isolinhas. Problema semelhante ocorre com os objetosgeográficos cujos componentes espaciais podem ser percebidos, ora por formas alternativas,ora por formas duplas, dependendo de aspectos como a escala com a qual se pretende capturara forma espacial de cada fenômeno. A possibilidade de haver múltiplas representações ésinalizada no GeoFrame, através das associações (1:n), denominadas representa.

3.4.2 Processo de Modelagem UML-GeoFrame

A abordagem UML-GeoFrame permite a solução da maioria dos requisitos demodelagem apresentados na Seção 4.2. Um esquema conceitual de dados geográficosconstruído com base no GeoFrame inclui, por exemplo, a modelagem dos aspectos espaciaisda informação geográfica e a diferenciação entre objetos convencionais e objetos/camposgeográficos.

O processo de modelagem com base na abordagem UML-GeoFrame envolve trêsetapas:

• Passo 1: identificar temas e sub-temas para cada área geográfica;

• Passo 2: para cada tema, elaborar o sub-diagrama de classes. Associar classes dediferentes temas;

• Passo 3: modelar o componente espacial para cada fenômeno geográficoidentificado.

A seguir, cada passo é apresentado em maiores detalhes.

Passo 1 – Identificar temas por região geográfica

Uma das primeiras escolhas a ser realizada, no desenvolvimento de uma novaaplicação de SIG, é a escolha da área geográfica para a qual os dados serão coletados e

31

analisados. A seguir, partindo-se dos objetivos iniciais da nova aplicação, deve ser feita aidentificação dos principais temas para os quais os dados serão coletados e mantidos no bancode dados geográfico.

Na abordagem UML-GeoFrame, temas são representados através do construtor Pacoteda linguagem UML. Os diversos temas identificados na aplicação são modelados através daelaboração de um diagrama hierárquico de temas para cada região geográfica da aplicação. AFigura 17 ilustra o diagrama de temas do sistema de gerenciamento costeiro da região nortedo litoral do estado do Rio Grande do Sul [LIS 97].

At iv idadeAntrópicaMeioAmbien te

Cl ima

AtivIndustr ialEst rada

O N G sAbastec imento

Água

SolosVegetaçãoRelevo

Hidrograf ia

Li tora lNorteRS : RegiãoGeográf ica

Figura 17 - Exemplo de diagrama de temas

Passo 2: Construir diagramas de classes por tema

A partir da análise dos requisitos da aplicação, um diagrama de classe deve serelaborado para cada tema especificado. Com base no diagrama de classes do frameworkGeoFrame, as classes da aplicação devem ser modeladas como subclasses de uma das classesOBJETOGEOGRÁFICO, CAMPOGEOGRÁFICO ou OBJETONÃOGEOGRÁFICO.

O problema que ocorre é o surgimento de um grande número de relacionamentos deespecialização entre as diversas classes da aplicação e estas três classes do GeoFrame. Asolução proposta pela abordagem UML-GeoFrame é a substituição destes relacionamentos deespecialização por estereótipos. A Figura 18 ilustra o conjunto total de estereótipos utilizadosna abordagem UML-GeoFrame.

Componente espacia lde campos geográf icos

Componente espacia lde objetos geográf icos

Fenômeno geográf ico eObjeto convencional

��

� Ponto

Linha

Pol ígono

Obj. espacial complexo

3=

4

Campo geográf ico

Objeto não geográf ico

Objeto geográf ico

9

8

1

:<;

Pontos irregulares

Grade de pontos

TIN

Polígonos adjacentes

Isol inhas

Grade de células<<função>> função categórica

Figura 18 - Estereótipos GeoFrame

O primeiro conjunto de estereótipos (Fenômeno geográfico e Objeto convencional) éusado para diferenciar os dois principais tipos de objetos pertencentes a um banco de dadosgeográficos: (1) Fenômeno geográfico, que é especializado em Objeto geográfico (3) e

32

Campo geográfico (=), segundo as duas formas de percepção dos fenômenos geográficos; (2)Objeto não geográfico, ou seja, objetos sem representação espacial são modelados de formatradicional e são identificados através do estereótipo (4).

Passo 3: Modelar o componente espacial dos fenômenos geográficos

O terceiro passo, que pode ser executado simultaneamente ao segundo passo, implicana especificação dos possíveis tipos de representação espacial dos fenômenos geográficos. Deacordo com o diagrama de classes do GeoFrame, o componente espacial dos campos e objetosgeográficos é modelado através de associações (Representa) entre as classes da aplicação e assubclasses de REPRESENTAÇÃOCAMPO e OBJETOESPACIAL, respectivamente. Novamente, afim de evitar a poluição visual do diagrama de classes, estas associações são substituídas porestereótipos.

O segundo e o terceiro conjuntos de estereótipos apresentados na figura anterior(Componente espacial de objetos geográficos e Componente espacial de campos geográficos)são usados para a modelagem do componente espacial de fenômenos segundo as visões deobjeto e de campo, respectivamente. A existência de múltiplas representações é modeladaatravés da combinação de dois ou mais estereótipos em uma mesma classe. Por exemplo, umaclasse Município pode ter duas formas de abstração de seu componente espacial, pontual e/oupoligonal, o que é especificado pelo par de estereótipos (�).

Por último, o estereótipo <<função>> é usado para caracterizar um tipo especial deassociação que ocorre quando da modelagem de campos categóricos. Segundo Chrisman[CHR 97], numa estrutura de cobertura categórica o espaço é classificado em categoriasmutuamente exclusivas, ou seja, uma variável possui um valor do tipo categoria em todos ospontos dentro de uma região (ex.: tipos de solos).

As figuras 19 apresenta um exemplo de diagrama de classes de uma aplicação de SIGna área de aplicação de gestão urbana, modelada segundo a abordagem UML-GeoFrame.

1

SistemaViár io

* *

** *

S is temaViário

3

�Logradouro

4

TrechoLograd

3

Cruza-mento

3

*

Loteamento

* 1

*

*

1

LoteTerritorial

LoteEdi f icado

1

* *

Quadra3

Proprietár io

4

UnidadeEdi f icada

4

Edi f icação3

Lote3

*

*

UsoSo lo

<<função>> T ipoUso4UsoSo lo

Urbano=

1

Figura 19 - Exemplo de aplicação na área de gestão urbana

33

3.4.3 Estudo de Caso: Região Carbonífera do RS

O projeto Energia e Meio Ambiente: a questão do carvão no Rio Grande do Sul(PADCT/CIAMB) é um trabalho que envolveu inúmeras equipes de pesquisadores dediferentes unidades da Universidade Federal do Rio Grande do Sul [LIS 00]. O objetivo foi oexercício de um trabalho interdisciplinar tendo como tema o estudo da região carbonífera doBaixo Jacuí-RS, que é uma região produtora e consumidora de carvão, produto de potencialeconômico limitado e grande potencial poluidor.

Para possibilitar a realização de uma análise multidisciplinar e integrativa, buscou-seinvestigar os aspectos sócio-econômicos e ambientais de modo a realizar um diagnóstico dopotencial econômico regional e dos meios de recuperação ambiental de áreas degradadas emfunção da exploração ou da deposição dos rejeitos. Também foram alvo do projeto a busca dealternativas tecnológicas para recuperação de áreas, para uma exploração mais racional e aconscientização da população sobre as vantagens e as limitações da exploração carbonífera(efeitos na economia e na saúde pública).

Esta gama variada de objetivos, de abrangência regional e local, gerou um conjunto dedados amplo e complexo, devido à natureza temporal e espacial dos dados gerados. Estesdados estão distribuídos em diversos meios digitais (SIG) e analógicos (relatórios técnicos). Aintegração dos diversos grupos de pesquisadores passa necessariamente pelo intercâmbio dedados, tanto para verificação quanto para a geração de novos dados derivados.

A metodologia empregada na modelagem conceitual dos dados do ProjetoPADCT/CIAMB seguiu uma abordagem inversa a que ocorre na maioria dos sistemas.Utilizando-se técnicas da engenharia reversa [HEU 98], partiu-se de uma análise dos dadosexistentes no SIG, bem como de análise em outras fontes como relatórios e entrevistas comexecutores do projeto, para gerar o esquema conceitual, tendo como base o GeoFrame.

Inicialmente, identificou-se os diversos temas para os quais existe algum tipo de dado.Tais temas, denominados de sub-temas, foram agrupados em dois temas mais genéricos:Meio_Antrópico e Meio_Biótico_e_Abiótico (Figura 20). De acordo com o GeoFrame, ostemas retratam uma região geográfica. A região geográfica em questão é a região carboníferado Baixo Jacuí-RS, representada como uma instância da classe REGIÃOGEOGRÁFICA. AFigura 20 ilustra o diagrama de temas, que fornece uma visão mais abstrata do esquemaconceitual de dados.

MEIO_BIÓTICO_E_ABIÓTICOMEIO_ANTRÓPICO

CLIMA

RELEVO

IMAGENS_FOTOS

SÓCIO-ECONOMIA SISTEMA_VIÁRIO

LIMITES

CARVÃO

HIDROGRAFIA

SOLOS

GEOLOGIA

USO_SOLO

Região Carbonífera Baixo Jacuí-RS : RegiãoGeográf ica

Figura 20 - Diagrama de temas

34

As Figuras 21 e 22 apresentam, respectivamente, o detalhamento (diagramas declasses) dos diversos sub-temas dos temas Meio_Antrópico e Meio_Biótico_e_Abiótico.

SÓCIO-ECONOMIA

LIMITES

Município

nomeMun : char dataEmancip : date áreaMun : real histórico : char classFuncional : int

SetorCensitário

ano : int

MicroRegião

nomeMR : char

3

33

Censo

ano : int popRural : int popUrbana : int

4

Distrito

nomeDistr : char

4

ProdIntBruto

ano : int vlrPIB : real

4

AtivEconômica

t ipoAtiv : char

EstrutEconômica

ano : int porcentagem : real

4

4

ATIV_CARBON ÍFERA

Jazida

lavrado : boolean

MinaCarvão

nome : char t ipoExploração : int at iva : boolean

� 3

3

EmpresaCarbonífera

nomeEmpresa : char produção : int numOperár ios : int produt iv idade : real

Produ çãoCarvão

ano : int qtde : real

4

4

Emprego

ano : int numEmpregados : in t

GêneroIndustrial

codigo : int descr ição : char

4

4

SedeMun3

IMAGENS_FOTOS

ImagemSat

data : date

=

<

SISTEMA_VIÁRIO

Rodovia

c lasse : char

3

USO-SOLO

UsoCobSolo

TipoUsoSolo

t ipoUso : int descrTipoUso : char

4

=

1

FotoAérea

data : date

=

<

1

*

1

*

1

*

1

*

1

*<<função>>

1

*

1*

1

*

1

*

1

*

1*

1*

1

1*

*

Figura 21 - Tema Meio Antrópico

35

GEOLOGIA

SOLOS

CLIMA

HIDROGRAFIA

RecursoHídrico

PermInter : char

Geologia

Solos

EstaçãoMeteorológica

estação : char órgão : char período : date

PtoColetaAgua

descrPto : char

TipoSolo

t ipoSolo : int descrTpSolo : Char

UnidGeológica

t ipoUnidGeolog : int descrUnidGeol : char

Precipitação Temperatura Umidade

Vento

direção : char velocidade : real

Evaporação Insolação

3

3

3

= =

=

= =

=

8;

8

8 8

88

=

4

1

4

=

1

ParâmetroQual

parâmetro : char unidMed : char

4

PtoAmostrSolo3

BaciaHidrográfica

BaciaDrenagemPto

Ilha

3

3

RELEVO

Topografia=

89;

Declividade=

9Exposição

=

9

Medição

data : date valor : num

4

1

*

*

*

<<função>>

*

1

1

*

1*

<<função>>

Figura 22 - Tema Meio Biótico e Abiótico

Observando-se os esquemas de dados apresentados nas Figuras 21 e 22 pode-se notara modelagem de alguns dos requisitos citados na Seção 3 como, por exemplo, (1) adiferenciação entre objetos convencionais (ex.: AtivEconômica 4) e fenômenos geográficos(ex.: Ilha 3 ou UsoCobSolo =), (2) a modelagem dos aspectos espaciais nas diversassubclasses de fenômeno geográfico, tanto na visão de objetos (ex.: Rodovia �) como na visãode campo (ex.: ImagemSat <), (3) o aspecto de múltiplas representações pode ocorrer nasduas visões (ex.: RecursoHídrico � e Topografia 9<;), (4) o uso do estereótipo (<<função>> ), para especificar o tipo de associação especial que ocorre entre camposcategóricos (ex.: Geologia 1) e objetos convencionais (ex.: UnidGeológica 4).

A experiência do desenvolvimento da modelagem conceitual do projetoPADCT/CIAMB mostrou que abordagem UML-GeoFrame teve uma boa aceitação por partedos usuários envolvidos, os quais contribuíram ativamente na etapa de validação.

36

4. Considerações Finais

A elaboração do esquema conceitual utilizando a abordagem UML-GeoFrameapresenta algumas vantagens importantes. Dentre as quais, pode-se citar:

• o esquema de dados final torna-se bastante claro, uma vez que apenas os elementosessenciais da aplicação são modelados;

• o uso de estereótipos permite, sem sobrecarregar visualmente o esquema, a fácildiferenciação entre os objetos não geográficos e os fenômenos geográficos (campose objetos);

• a divisão do diagrama de classes em temas, especificado através de pacotes, torna oesquema mais fácil de ser lido, uma vez que a atenção do leitor pode se ater aapenas uma pequena parte do esquema por vez;

• devido ao alto nível de acoplamento entre as classes dentro de um mesmo tema, onúmero de associações entre classes de diferentes temas fica reduzido, contribuindopara a clareza do esquema.

As pesquisas na área dos SIG têm sido desenvolvidas de forma multidisciplinar, porpesquisadores de diversas áreas tais como Geografia, Cartografia, Sensoriamento Remoto,Geologia, Ciência da Computação. No contexto da área de Ciência da Computação existemdiversos tópicos atuais de pesquisa. Alguns desses tópicos são:

• Modelos de dados e análise de requisitos - buscam uma forma de especificação queseja correta e completa, para os requisitos apresentados no domínio das aplicaçõesgeográficas. Diversas propostas de modelos de dados têm sido apresentadas como,por exemplo, modelos que permitem a representação espaço-temporal de entidadesgeográficas, que possibilitem o tratamento de limites nebulosos (fuzzy), entreoutros.

• Reutilização de projeto de banco de dados - através da definição de padrões deanálise, que descrevem componentes conceituais reutilizáveis, pode-se obter não sóa reutilização de dados georreferenciados, mas principalmente, de projetos debancos de dados geográficos [LIS 98].

• Métodos de acesso espacial - novas estruturas de dados para armazenamento erecuperação de dados espaciais têm sido desenvolvidas com o objetivo de aumentara eficiência dos sistemas atuais, em termos de capacidade de armazenamento etempo de resposta.

• Interface homem-máquina e linguagens de consulta - os sistemas de interface comusuário têm evoluído para possibilitar uma maior facilidade de uso por parte dosusuários. Pesquisas em linguagens para banco de dados geográficos e métodos devisualização têm contribuído para a melhoria das interfaces de uso dos SIG[OLI 97].

• Qualidade e confiabilidade dos dados - um dos problemas principais com os dadosespaciais é o controle da propagação de erros através de operações espaciais.Métodos para representação de informações sobre a qualidade dos dados espaciais(metadados de qualidade) têm sido pesquisados.

37

• Orientação a objetos - a tecnologia dos sistemas de banco de dados relacionaisapresenta diversas limitações com relação ao armazenamento e recuperação dedados espaciais. Conceitos provenientes do paradigma da orientação a objetos têmsido utilizados na implementação de novos SIG.

• Intercâmbio de dados espaciais - o custo de aquisição de dados geográficos é umdos maiores problemas encontrados por instituições usuárias de SIG. A definição deformatos padronizados para intercâmbio de dados espaciais tem sido adotada empaíses como EUA, Canadá e Inglaterra. A criação de Centros de Dados Geográficostem sido uma saída para possibilitar o uso cooperativo de dados geográficos porinstituições governamentais ou privadas [CAM 96].

AgradecimentosAgradeço aos colegas Prof. Heinrich Hasenack e Eliseu Weber, do Centro de Recursos

Idrisi para os Países de Língua Portuguesa (UFRGS), pela colaboração e co-autoria do artigodo qual foi extraído o exemplo de modelagem apresentado. Agradeço, também, ao Prof.Cirano Iochpe (UFRGS), meu orientador de doutorado e co-autor na apostila da qual foiextraído o texto de introdução a SIG.

Bibliografia

[AMA 90] AMARAL, G. Princípios de Sensoriamento Remoto. In: SIMPÓSIOBRASILEIRO DE GEOPROCESSAMENTO, 1., 1990, São Paulo. Anais...São Paulo:USP, 1990.

[ANT 91] ANTENUCCI, J. C. et al. Geographic Information Systems: a guide to thetechnology. New York: Van Nostrand Reinhold, 1991.

[ARO 89] ARONOF, S. Geographic Information Systems: a management perspective.Canada: WDL Publications, 1989.

[BED 96] BÉDARD, Y. et al. Adapting data models for the design of spatio-temporaldatabases. Computers, Environment, and Urban Systems, v.20, n.1, 1996.

[BOO 98] BOOCH, G.; JACOBSON, I.; RUMBAUGH, J. The Unified ModelingLanguage User Guide. Reading: Addison-Wesley, 1998.

[BOR 97] BORGES, K. A. V. Modelagem de Dados Geográficos: uma extensão domodelo OMT para aplicações geográficas. Belo Horizonte: Fundação JoãoPinheiro, 1997. Dissertação de Mestrado.

[CAM 96] CÂMARA, G. et al. Anatomia de Sistemas de Informação Geográfica.Campinas: Instituto de Computação, UNICAMP, 1996. (X Escola deComputação).

[COU 92] COUCLELIS, H. People manipulate objects (but cultivate fields): beyond theraster-vector debate in GIS. In: Theories and methods of spatial-temporalreasoning in geographic space. Berlin: Springer-Verlag, 1992. p.65-77.(Lecture Notes in Computer Science 639).

38

[CHR 97] CHRISMAN, N. Exploring Geographic Information Systems. New York: JohnWiley & Sons, 1997.

[EAS 95] EASTMAN, J.R. Idrisi for windows user’s guide. Worcester, MA: ClarkUniversity, 1995.

[EGE 87] EGENHOFER, M. J.; FRANK, A. U. Object-oriented databases: databaserequirements for GIS. In: INT. GEOGRAPHIC INFORMATION SYSTEMSSYMPOSIUM, 1987, Arlington. Proceedings... Virginia:[s.n.], 1987.

[FUR 98] FURLAN, J. D. Modelagem de Objetos através da UML: the Unified ModelingLanguage. São Paulo: Makron Books, 1998.

[GEO 95] Geomatica. Canada: Canadian Institute of Geomatics, v.49, n.1, contracapa,1995.

[GOO 92] GOODCHILD, M. F., Geographical data modeling. Computers & Geosciences,v.18, n.4, p.401-408, 1992.

[HAD 96] HADZILACOS, T.; TRYFONA, N. Logical data modelling for geographicalapplications. Int. Journal of Geographical Information Science, v.10, n.2,p.179-203, 1996.

[HEU 98] HEUSER, C. A. Projeto de Banco de Dados. Porto Alegre: Sagra Luzzato, 1998.(Série livros didáticos, n.4)

[KOS 97] KÖSTERS, G. et al. GIS-Application Development with GeoOOA. Int. Journal ofGeographical Information Science, v.11, n.4, 1997.

[LAU 92] LAURINI, R.; THOMPSON, D. Fundamentals of Spatial InformationSystems. San Diego: Academic Press, 1992.

[LIS 98] LISBOA FILHO, J.; IOCHPE, C.; BEARD, K. Applying Analysis Patterns in theGIS Domain. In: ANNUAL COLLOQUIUM OF THE SPATIALINFORMATION RESEARCH CENTRE - SIRC, 10., 1998, Dunedin, NZ.Proceedings... Dunedin: SIRC, University of Otago, 1998.

[LIS 99] LISBOA FILHO, J.; IOCHPE, C. Specifying analysis patterns for geographicdatabases on the basis of a conceptual framework. In: ACM SYMPOSIUM ONADVANCES IN GEOGRAPHIC INFORMATION SYSTEMS, 7., 1999,Kansas City, USA. Proceedings... Kansas City: ACM Press, 1999.

[LIS 99a] LISBOA FILHO, J.; IOCHPE, C. Um estudo sobre modelos conceituais de dadospara projeto de bancos de dados geográficos. Revista IP-Informática Pública,Belo Horizonte, v.1, n.2, 1999.

[LIS 99b] LISBOA FILHO, J.; COSTA, A. C.; IOCHPE, C. Projeto de banco de dadosgeográficos: mapeando esquemas GeoFrame para o SIG Spring. In:BRAZILIAN WORKSHOP ON GEOINFORMATICS - GEO-INFO, 1., 1999,Campinas. Anais... São José dos Campos: INPE, 1999.

[LIS 00] LISBOA FILHO, J.; IOCHPE, C.; HASENACK, H.; WEBER, E. J. Modelagemconceitual de banco de dados geográficos: o estudo de caso do projetoPADCT/CIAMB. In: CENTRO DE ECOLOGIA/UFRGS. Carvão e MeioAmbiente. Porto Alegre: Ed. Universidade/UFRGS, 2000.

39

[MED 94] MEDEIROS, C. B.; PIRES, F. Databases for GIS, ACM SIGMOD Record , NewYork, v.23, n.1, 1994.

[NCG 90] NATIONAL CENTER FOR GEOGRAPHIC INFORMATION ANDANALYSIS, NCGIA Core Curriculum . GOODCHILD, M.F.; KEMP, K.K.(Eds.). Santa Barbara: University of California, 1990.

[OLI 93] OLIVEIRA, C. Curso de Cartografia Moderna. 2 ed. Rio de Janeiro: IBGE,1993.

[OLI 97] OLIVEIRA, J.L.; PIRES, F.; MEDEIROS, C. B. An environment for integratedmodelling and analysis of geographic information. GeoInformatica, Boston,n.1, p.29-58, 1997.

[OOI 90] OOI, B.C. Efficient Query Processing in Geographic Information Systems.Berlin: Spring-Verlag, 1990. (Lecture Notes in Computer Science, v. 471).

[PAR 99] PARENT, C.; SPACCAPIETRA, S.; ZIMANYI, E. Spatial-temporal conceptualmodels: data structures + space + time. In: ACM SYMPOSIUM ONADVANCES IN GEOGRAPHIC INFORMATION SYSTEMS, 7., 1999,Kansas City, USA. Proceedings... Kansas City: ACM Press, 1999.

[PIR 97] PIRES, F. Um ambiente computacional para modelagem de aplicaçõesgeográficas. Campinas: Unicamp, Instituto de Computação, 1997. Tese deDoutorado.

[RAM 94] RAMIREZ, M. R. Sistemas Gerenciadores de Bancos de Dados paraGeoprocessamento. Rio de Janeiro: COPPE/UFRJ, 1994. Dissertação deMestrado.

[SAM 89] SAMET, H. The Design and Analysis of Spatial Data Structures. Reading,MA: Addison-Wesley, 1989

[WOR 95] WORBOYS, M.F. GIS: A Computing Perspective. London: Taylor and Francis,1995.