Basi di Dati Spaziali
Daniela PoggioliIREA - CNR
DIIAR - Politecnico di Milano
Indice1. Introduzione alle basi di dati
• Definizioni e caratteristiche principali 2. Progettazione di una base dati
• Esterna, concettuale, logica, interna o fisica3. Modellizzazione concettuale di dati
• Diagramma entità - relazione • Diagramma UML
4. Modellizzazione logica: il modello relazionale5. Modellizzazione di dati geografici
• Il dato geografico• Aspetto spaziale
- Dati raster e vettoriali- Geometria e topologia
• Aspetto semantico- Accessibilità dei contenuti- Ontologie
• Aspetto di qualità- Metadati
6. Cenni ai GIS7. Il problema dell’interoperabilità
• Infrastrutture di dati spaziali (SDI): definizione• L’iniziativa europea Inspire
1. Introduzione alle basi si dati: Definizioni e caratteristiche principali
Rappresentare e gestire l’informazione Sistemi informativi, informazioni e dati Basi di dati e sistemi di gestione di basi di dati Linguaggi per le basi di dati Vantaggi e svantaggi dei DBMS
Rappresentare e gestire l’ informazione
Ogni organizzazione ha bisogno di memorizzare e mantenere informazioni specifiche. Ad esempio:
Utenze telefoniche Studenti iscritti ad un corso di laurea Quotazione azioni nei mercati telematici Proprietà catastali
Necessitano di strumenti per la rappresentazione dell’informazione e della sua gestione.
Rappresentare e gestire l’ informazione
Informazione: é parte di qualsiasi attività umana
Rappresentazione: il problema di astrarre i concetti importanti da quelli trascurabili per poter modellare la realtà di interesse: ci serve studiare metodi di rappresentazione appropriati
Gestione: uso e trasformazione dell’informazione in maniera funzionale agli obiettivi
Sistemi informativi, informazioni e datiI sistemi informativi organizzano e gestiscono le informazioni necessarie allo svolgimento di ogni attività di una organizzazione:
Sistema Informativo
(Attività di organizzazione
e gestione)
DATI Informazioni
Il concetto di sistema informativo è indipendente dalla sua gestione automatica (es. archivi bancari, servizi anagrafici, …)Se è gestito in modo automatizzato => basi di dati Dati = elementi di informazione, che di per sé non hanno interpretazione Informazione = dati interpretati e correlati opportunamente Dati “stabili”: poiché sono una risorsa da mantenere, devono essere indipendenti dalle procedure e applicazioni che operano su di essi
2377540 2377540 Numero matricola
Sistemi informativi
Un sistema informativo è un insieme di: risorse umane, strumenti di elaborazione, scambio, acquisizione di
informazioni, regole e procedure per il loro trattamento. L’obiettivo è quello di memorizzare grandi quantità di
informazioni, rendendone disponibili anche le operazioni di modifica e di reperimento
L’evoluzione dei sistemi informativi da settoriali a integrati per garantire l’interoperabilità dei dati
Gestione dei sistemi informativi
Le informazioni differiscono dal tipo di applicazioni e dal loro uso, ma devono avere in comune un sistema di gestione che preveda:
Input e verifica dei dati Gestione e memorizzazione dei dati Presentazione e output dei dati Trasformazione dei dati Interazione con l’utente
Basi di dati e sistemi di gestione di basi di dati
Una base di dati è una collezione di dati utilizzati per rappresentare le informazioni di interesse per un sistema informativo.
Un sistema di gestione di basi di dati (DBMS) è un sistema software in grado di gestire collezioni di dati grandi, condivise e persistenti, assicurando la loro affidabilità e privatezza. Come ogni prodotto informatico un DBMS deve essere efficiente ed efficace.
Caratteristiche delle basi di dati
Grandi: anche migliaia di miliardi di byte (necessità di prevedere gestione dati in memoria secondaria)
Condivise: applicazioni e utenti diversi devono poter accedere, secondo opportune modalità, a dati comuni.
In questo modo si riduce la ridondanza dei dati e la possibilità di inconsistenze cioè copie non uguali dello stesso dato.
Persistenti: i dati devono essere mantenuti, la loro esistenza non è limitata al periodo delle singole esecuzioni dei programmi che le utilizzano.
Caratteristiche deisistemi di gestione di basi di dati
Affidabilità: Capacità del sistema di conservare intatto il contenuto della base di dati (funzionalità di salvataggio e ripristino dei dati) Privatezza: Definizione di meccanismi per le limitazioni dell’accesso (autorizzazioni)
Efficienza: Capacità di svolgere le operazioni utilizzando un insieme di risorse (tempo di esecuzione e spazio di memoria) accettabile per gli utenti
Efficacia: Capacità di rendere produttive le attività dell’utente
DBMS: struttura semplificata
Utenti
Dati Metadati
Software per l’accesso
Software per i programmi e le richieste
DBMS
Applicazioni
Database System
Noi ci occuperemo della progettazione una base di dati
Linguaggi per le basi di dati
Data Definition Language (DDL) = definisce livelli fisici, logici, esterni del DB (tratta anche le autorizzazioni di accesso)
Data Manipulation Language (DML) = per formulare interrogazioni e aggiornamenti delle istanze del DB
Alcuni linguaggi (ad es. SQL) presentano in forma integrata le funzionalità di entrambe le catagorie.
L’accesso ai dati può avvenire mediante:
1. Linguaggi testuali interattivi (es. SQL)2. Comandi speciali integrati in un linguaggio di programmazione
(Pascal, C, Cobol, ...)3. Interfacce user-friendly che permettono di sintetizzare
interrogazioni senza usare un linguaggio testuale
Vantaggi e svantaggi dei DBMSVANTAGGI Permettono di considerare i dati come una risorsa
comune, e le basi di dati come modello della realtà Controllo centralizzato dei dati con possibilità di
standardizzazione La condivisione porta alla riduzione di ridondanze e
inconsistenze Indipendenza dei dati favorisce lo sviluppo e la
manutenzione di applicazioni flessibili e modificabili
SVANTAGGI Complessi, costosi, hanno specifici requisiti in termini
di SW e HW Servizi forniti dai DBMS, in forma integrata
2. Progettazione di base di dati
Il ciclo di vita dei sistemi informativi Metodologie di progettazione Fasi di progettazione di basi di dati Modelli dei dati: esterno, concettuale, logico, interno
Il ciclo di vita dei sistemi informativi
Il progetto di una base di dati si inserisce nel ciclo di vita del sistema informativo che comprende le seguenti attività:
Studio di fattibilità
Raccolta ed analisi dei requisiti
Progettazione
Implementazione
Validazione e collaudo
Funzionamento e manutenzione
La progettazione dei dati che individua l’organizzazione e la struttura della base di dati
La progettazione delle applicazioni (funzioni), che schematizza le operazioni sui dati e progetta il software applicativo
Metodologie di progettazione Una metodologia di progettazione consiste in:
Decomposizione dell’intera attività di progetto in passi successivi indipendenti fra loro (ad es. separare le decisioni relative a “cosa” rappresentare e “come” farlo)
Insieme di strategie e criteri di scelta da seguire nei vari passi
Modelli di riferimento per la descrizione dei dati
Metodologie di progettazione: proprietà
Le proprietà che una metodologia di progettazione deve garantire sono:
La generalità rispetto alle applicazioni (possibilità di utilizzo indipendentemente dal caso di studio e dagli strumenti) La qualità del prodotto in termini di correttezza, completezza ed efficienza in relazione alle risorse impiegate La facilità d’uso sia delle strategie che dei modelli di riferimento
Le fasi della progettazione
2. ProgettazioneConcettuale: Esprime i requisiti di un sistema in una descrizione adatta all’analisi dal punto di vista informaticoLogica: Evidenzia l’organizzazione dei dati dal punto di vista del loro contenuto informativo, descrivendo la struttura di ciascun record e i collegamenti tra record diversi. Fisica: A questo livello la base di dati è vista come un insieme di blocchi fisici su disco. Qui viene decisa l’allocazione dei dati e le modalità di memorizzazione dei dati.
1. Analisi dei requisiti Individuare e studiare le funzionalità che il sistema dovrà fornire
3. Implementazione e validazioneRealizzazione del sistema informativo e verifica del corretto funzionamento
Progettazioneconcettuale
Progettazionefisica
Progettazionelogica
Le fasi della progettazione
Come procedo? Dovrò:1. Modellare dati e relazioni (il mondo reale va
descritto)2. Trovare le strutture appropriate per i dati
Ogni fase della progettazione avrà come prodotto uno SCHEMA che fa riferimento ad un MODELLO di dati.
Modelli dei dati, schemi e istanze
Modello dei dati: è un insieme di concetti che possono essere utilizzati per rappresentare la realtà, per organizzare i dati di interesse e descriverne la struttura.
Schema dei dati: rappresentazione di una specifica parte della realtà, che usa un modello dei dati.
Istanza: collezione di valori dei dati che rispetta la struttura dello schema.
Modellazione esterna dei dati
Si devono individuare e studiare le funzionalità che il sistema dovrà fornire. Comporta l’interazione con gli utenti del sistema e gli esperti di dominio e si conclude in una descrizione informale dei requisiti.
Uso il linguaggio naturale che però è soggetto ad ambiguità
Modellazione concettuale dei dati
Ha lo scopo di rappresentare la realtà di interesse in termini di una descrizione precisa e completa ma indipendente dai criteri di rappresentazione usati dal sistema informatico scelto per gestire la base di dati (rappresentazione astratta)
Uso un linguaggio formale Esempi: Entità-relazione, UML
Modellazione logica dei datiLo schema concettuale definito nella fase precedente viene tradotto nello schema logico che fa riferimento ad un modello logico. Ogni modello logico ha lo scopo di rappresentare la realtà di interesse in termini di una descrizione ancora indipendente dai dettagli fisici ma concreta, in quanto presente nei sistemi di gestioni delle basi di dati.
Uso un linguaggio comprensibile al computer (mappatura)Esempi: relazionale, reticolare, gerarchico, a oggetti.
Modellazione interna dei dati
Lo schema logico viene mappato nella struttura dei parametri fisici di memorizzazione dei dati (organizzazione dei file e degli indici). Si definisce lo schema fisico dei dati che dipende dal sistema di gestione di basi di dati scelto.
IMPLEMENTAZIONE
3. Modellizzazione concettuale di dati
Il modello Entità-Relazioni: definizione, associazioni, identificatori,
gerarchie e loro proprietà
Il modello UML: il diagramma delle classi e le relazioni
Diagramma entità relazioniGli schemi del vari modello esterno descritti nel
linguaggio naturale che derivano dall’analisi dei requisiti, vanno rappresentati con un modello concettuale utilizzando un linguaggio formale.
Un metodo tra i più utilizzati è l'approccio entità - relazione: linguaggio formale basato sui concetti fondamentali di entità, relazioni, attributi, domini.
Entità
Sono insiemi di oggetti concettualmente appartenenti ad una stessa classe, aventi proprietà comuni ed esistenza autonoma rispetto agli elementi di altre entità.Ogni entità ha un nome che la identifica univocamente.
Es. Città, Dipartimento, Impiegato, Acquisto e Vendita (nel contesto di un’applicazione aziendale)
Una occorrenza di una entità è un oggetto della classe che l’entità rappresenta
Impiegato DipartimentoCittà
Relazione E' un legame concettuale tra due o più entità;
Ad esempio: Residenza: tra le entità Città e Impiegato Esame: tra le entità Studente e Corso
Un occorrenza di relazione è una n-upla costituita da occorrenze di entità. Ad esempio:
Residenza: Bologna, Rossi; oppure Firenze, Verdi
Ogni relazione ha un nome che la identifica univocamente Graficamente:
Studente CorsoEsame
Relazione
Possono esistere relazioni diverse che coinvolgono le stesse entità. Ad esempio:
È possibile avere relazione tra una entità e se stessa.
Impiegato CittàResidenza
Sede di lavoro
Collega
Attributi Descrivono le proprietà elementari di entità e relazioni che
sono di interesse ai fini dell’applicazione. Ad es: Cognome, Stipendio e Età sono possibili attributi dell’entità
Impiegato Data e Voto sono possibili attributi della relazione Esame tra
Studente e Corso
Un attributo associa a ciascuna occorrenza di entità o di relazione un valore appartenente al dominio dell’ attributo
Dominio: range di valori ammissibili per l’attributo
Studente CorsoEsameAnno diiscrizione
MatricolaVoto Data esame
Crediti
Nome
Docente
Attributi
Attributi composti: Può risultare comodo raggruppare attributi che
presentano affinità nel loro significato e uso L’insieme di attributi che si ottiene in questo
modo viene detto attributo composto
Persona Via
EtàNome
Sesso
IndirizzoCAP
Numero civico
Attributi semplici
Attributi composti
Cardinalità delle relazioni
Per ogni entità che partecipa alla relazione viene indicata la cardinalità, cioè il numero minimo e massimo di legami che un elemento di quell’entità può formare con le occorrenze delle altre entità coinvolte.
La cardinalità rappresenta il numero di volte che una data istanza di entità deve o può partecipare alla relazione, ad es.
Libro PersonaPrestito(0,1) (0,5)
Un libro può essere in prestito o meno, una persona può avere in prestito fino a 5 libri.
Cardinalità delle relazioni Nella maggiore parte dei casi, è sufficiente utilizzare
solo tre valori: Zero Uno Il simbolo N: indica genericamente un intero maggiore di uno
Cardinalità minima: Zero: la partecipazione dell’entità relativa è opzionale Uno: la partecipazione dell’entità relativa è obbligatoria
Cardinalità massima: Uno: la partecipazione dell’entità relativa associa a una
occorrenza dell’entità una sola occorrenza (o nessuna) dell’altra entità che partecipa alla relazione
Molti: c’è una associazione con un numero arbitrario di occorrenze dell’altra entità
Cardinalità delle relazioniOsservando le cardinalità massime si ottiene la classificazione seguente:
Cardinalità massima pari a uno per entrambe le entità coinvolte: definisce una corrispondenza uno a uno tra le occorrenze di tali entità.
Ordine FatturaVendita(0,1) (1,1)
Relazione uno a uno
Relazione uno a molti
Persona CittàResidenza(1,1) (0,N)Ogni persona è residente in una sola città. Ogni città può avere molti residenti Relazione molti a molti
Turista ViaggioPrenotazione(1,N) (0,N)
Cardinalità massima pari a N per entrambe le entità coinvolte
Cardinalità degli attributi Possono essere specificate per gli attributi di entità
o relazioni Descrivono il numero minimo e massimo di valori
dell’attributo associati a ogni occorrenza di entità o relazione
Nella maggior parte dei casi, la cardinalità di un attributo è (1,1) e viene omessa
Cardinalità minima0: l’attributo è opzionale (l’informazione potrebbe essere non disponibile)1: l’attributo è obbligatorio
PersonaTarga automobile
Numero patente
Nome
(0,N)
(0,1)Cardinalità massimaN: l’attributo è multivalore
Simbologia
Simbologia adottata nel diagramma entità - relazione
Identificatori delle entità (chiavi) Descrivono i concetti (attributi e/o entità) che
permettono di identificare univocamente le occorrenza delle entità
In molti casi, uno o più attributi di una entità sono sufficienti a individuare un identificatore interno (o chiave)
Esempio: non possono esistere due automobili con la stessa targa
Identificatore internoAutomobile
Targa
Colore
Modello
Identificatori delle entità (chiavi) Es: un identificatore interno per l’entità Persona
può essere Nome, Cognome e Data di nascita
PersonaData di nascita
Nome
Cognome
Indirizzo
Alcune volte gli attributi di una entità non sono sufficienti a identificare univocamente le sue occorrenze, ad es.
Identificatori delle entità (chiavi) Due studenti iscritti a università diverse possono avere lo
stesso numero di matricola Per identificare univocamente uno studente serve, oltre al
numero di matricola, anche la relativa università Un identificatore corretto per l’entità studente è costituito
dall’attributo Matricola e dall’entità Università Questa identificazione è resa possibile dalla relazione uno
a molti tra Università e Studente
Studente UniversitàIscrizione(1,1) (1,N)
Nome
Indirizzo
Città
Matricola
Cognome
Annoiscrizione
Identificatori delle entità
Identificatore esterno: quando l’identificazione di una entità è ottenuta utilizzando altre entità.
Una entità E può essere identificata da altre entità solo se tali entità sono coinvolte in una relazione cui E partecipa con cardinalità (1,1).
Generalizzazioni
Rappresentano legami logici tra una entità E detta padre e più entità E1 ,E2, ..., En dette entità figlie. L’entità E è più generale e comprende le entità figlie. (Struttura gerarchica)
Ogni proprietà dell’entità padre è anche una proprietà delle entità figlie (ereditarietà) Es. Gli studenti hanno un nome e un indirizzo
Ogni occorrenza di una entità figlia è anche occorrenza dell’entità padre.Es. Gli impiegati sono persone
Generalizzazioni Una generalizzazione è totale se ogni occorrenza
della classe padre è una occorrenza di almeno una delle entità figlie, altrimenti è parziale.
Ad esempio la generalizzazione tra Persona e le entità Uomo e Donna è totale, la generalizzazione tra Veicolo e le entità Automobile e Bicicletta e parziale
Veicolo
Automobile Bicicletta
Generalizzazioni Una generalizzazione è esclusiva se ogni occorrenza
della classe padre è al più una occorrenza di una delle entità figlie, altrimenti è sovrapposta
Ad esempio la generalizzazione tra Veicolo e le entità Automobile e Bicicletta è esclusiva, la generalizzazione tra persona e le entità Studente e Lavoratore è sovrapposta
Le generalizzazioni sovrapposte possono essere trasformate in generalizzazioni esclusive. Si aggiungono una o più entità figlie, per rappresentare i concetti che costituiscono le “intersezioni” delle entità che si sovrappongono, ad es: aggiungere l’entità StudenteLavoratore
Generalizzazioni
Una stessa entità può essere coinvolta in più generalizzazione diverse
Posso esserci generalizzazioni su più livelli (una gerarchia)
ESEMPIO: modellizzazione di dati geografici
Il Catasto vuole un sistema informativo che permetta di associare le proprietà catastali ai rispettivi proprietari.
Le proprietà catastali sono oggetti o "fenomeni” spaziali georeferenziabili tramite
indirizzo (posizionamento indiretto) o coordinate del perimetro (posizionamento diretto)
Esempi di possibili applicazioni
Evidenziare tutte le particelle appartenenti al signor Rossi Dare gli indirizzi e le dimensioni superficiali di tutte le particelle
appartenenti al signor Rossi Dare indirizzi e proprietari di tutte le particelle con dimensione
maggiore di un certo valore Trovare tutte le particelle adiacenti alle particelle del signor
Rossi Verificare se il signor Rossi e il signor Verdi hanno particelle
confinanti Dare le dimensioni di tutte le particelle che si affacciano sulla
strada "NomeStrada".
Stiamo considerando entità di tipo superficiale dobbiamo descrivere non solo le posizioni degli oggetti (particelle) ma anche le loro relazioni con altri oggetti (altre particelle, strade, proprietari,...)
ESEMPIO
Consideriamo la modellazione solo geometrica dell'aspetto spaziale della carta; come primitive geometriche supponiamo di considerare:
• punti• segmenti (curve caratterizzate
solo da 2 vertici e dal metodo di interpolazione del cammino minimo)
Supponiamo inoltre di avere informazioni relative al nome e tipologia delle strade; all'identificativo e all'indirizzo delle particelle catastali e dati anagrafici relativi ai proprietari delle particelle stesse (Codice Fiscale, Nome, Cognome, Data di Nascita, Luogo di Nascita, Indirizzo).
Entità
Relazioni
Diagramma Entità-Relazione:
Il modello UML
Esigenza di avere un linguaggio universale per modellare gli oggetti che potesse essere utilizzato dalle aziende produttrici di software.
Linguaggio UML (Unified Modeling Language)
Linguaggio per la modellazione completa (dati, operazioni, processi e architetture) di applicazioni software che definisce le caratteristiche e le relazioni esistenti tra le diverse componenti di un progetto (es. classi, attributi, procedure, relazioni, moduli, ...).
Il modello UML Il linguaggio UML contiene svariati elementi grafici ed
utilizza delle regole per combinare i componenti del linguaggio durante la creazione dei diagrammi.
I modelli di diagramma sono rappresentazioni grafiche delle componenti del progetto.
L’obiettivo dei diagrammi è quello di costruire molteplici viste di un sistema tutte correlate tra di loro.
Il linguaggio UML consiste di nove diagrammi di base, ma è possibile costruire e aggiungere diagrammi differenti dagli standard.
Il diagramma delle classi Cosa è una classe?
Tutti gli oggetti o esseri viventi, spesso, sono riconducibili a determinate categorie che hanno attributi e comportamenti simili. Queste categorie individuano delle classi.
La rappresentazione grafica di una classe, entità fondamentale del diagramma delle classi; sono evidenziate le tre parti: nome, attributi e operazioni.
Il diagramma delle classi
Esempi di classi
Indirizzo
Street: StringCity: String
GetStreet(): StringSetStreet(_street:string)GetCity():StringSetCity(_city:String)
Viene indicato il tipo (string) degli attributi che specificano un indirizzo ovvero street e city e quattro metodi. Due mi permettono di ricavare l’informazione contenuta negli attributi e gli altri due di settare un valore degli attributi utilizzando un parametro.
Punto
X: intY: int
Punto(x:int, y:int)X():intY():intAdd(p: punto)
Gli attributi che descrivono la classe punto sono di tipo intero (le sue coordinate). I metodi mi permettono di costruire un nuovo punto e di compiere una somma delle coordinate x e y di due punti.
Le relazioni
Una relazione è una connessione tra elementi UML.
Senza le relazioni, un modello di classi sarebbe soltanto una lista di entità che rappresentano un "vocabolario" del sistema.
Le relazioni mostrano come i termini del vocabolario si connettono tra di loro per fornire un quadro della parte di progetto che si sta modellando.
Esistono diversi tipi di relazioni:
Associazioni (normali, aggregazioni semplici, aggregazioni di composizione) Relazioni di dipendenza Relazioni di generalizzazioni
Le relazioni: associazioni Una associazione dichiara una relazione semantica tra le classi e rappresenta un insieme di legami tra le istanze di tali classi. Ogni associazione ha almeno due estremi, per ognuno dei quali possono essere definiti:
Un nome Una molteplicità (numero di istanze della classe associato ad un estremo che possono essere collegate a ciascuna delle istanze della classe collocato all’altro estremo dell’associazione) Un indicatore di navigabilità
Cliente Ordine1 0..*
Utente Password
1 1
Non solo ad ogni utente è associata una password, ma posso anche raggiungerla.
Le relazioni: associazioni Aggregazioni semplici esprimono una relazione tra un insieme e delle parti di tale
insieme (“tutto/parte”), ma non implicano vincoli particolari per l’esistenza della parte o dell’insieme.
Aggregazioni di composizione implicano vincoli precisi: ogni istanza della classe “parte” può
essere riferita ad una sola istanza del “tutto”; inoltre il “tutto” è responsabile per la creazione e la distruzione delle sue parti, che non possono avere una esistenza autonoma.
PersonaComitato
* *
Ordine RigaOrdine
1 1..*
Le relazioni: dipendenza e generalizzazione Relazioni di dipendenza
Indica che il funzionamento di un elemento richiede la presenza di uno o più altri elementi e che se un elemento viene modificato, potrebbe essere necessario modificare anche ogni elemento che da esso dipende.
Relazioni di generalizzazione Collega un elemento più generico ad un elemento più specifico;
(specializzazione). L’elemento più specifico deve essere pienamente consistente con quello più generico, cioè ne eredita tutte le caratteristiche (attributi, operazioni e associazioni delle sue superclassi), ma ne può definire altre.
Dato Fonte dei dati
EntitàGeografica
Ghiacciaio
Esempio: modello di dati geograficoSi vogliono rappresentare le entità geografiche e le
relazioni coinvolte nella descrizione di applicazioni di monitoraggio glaciologico.
1) Identificare le classi che fanno parte del modello, prendendo in considerazione tutti gli elementi coinvolti nelle applicazioni di interesse. Es. Classi Ghiacciaio, Bacino, Stazione di misura, …
2) Identificare le classi che descrivono i dati derivanti da differenti fonti ( catasto, cartografia, telerilevamento, …) Es. Classi Dato, Fonte dei dati, Qualità, Organizzazione
3) Considerare la rappresentazione di fenomeni spazio-temporali Es. Classi Spazio, Tempo, Evento
4) Creare fra le classi i diversi tipi di relazione
Esempio: modello di dati geografico
4. Modellizzazione logica: il modello relazionale
I modelli logici per le basi di dati Il concetto di relazione Relazioni con attributi Relazioni e basi di dati Vincoli di integrità Algebra relazionale
I modelli logici per le basi di dati
Tradizionalmente, esistono tre modelli logici:
Gerarchico
Reticolare
Relazionale
Negli ultimi 10 anni: a oggetti
Le strutture utilizzate dai modelli sono astratte, ma riflettono una particolare organizzazione
Struttura ad albero
Tabelle
Grafo
I modelli logici per le basi di dati
I modelli gerarchico e reticolare sono più vicini alle strutture fisiche di memorizzazione, mentre il modello relazionale è più astratto:
nel modello relazionale si rappresentano solo valori. Anche i riferimenti fra dati in strutture (relazioni) diverse sono rappresentati per mezzo dei valori stessi;
nei modelli gerarchico e reticolare si utilizzano riferimenti espliciti (puntatori) fra record.
Il modello a oggetti è un ibrido tra queste due concezioni, poiché è di livello alto ma fa uso di riferimenti
Il modello relazionale
Proposto da E. F. Codd nel 1970 e reso disponibile come modello logico in DBMS nel 1981.
Si basa sul concetto matematico di relazione, (teoria degli insiemi).
Le relazioni hanno una rappresentazione naturale per mezzo di tabelle. Tabella: rappresentazione grafica di una relazione, (concetto intuitivo)
Il modello relazionale
Garantisce indipendenza dei dati Utenti che accedono ai dati e programmatori
che sviluppano applicazioni fanno riferimento al livello logico dei dati.
Cioè, agli utenti e ai programmatori, non serve sapere come i dati sono memorizzati fisicamente.
Relazione matematica: secondo la definizione data nella teoria degli insiemi; da questa derivano le seguenti:
Relazione secondo la definizione del modello relazionale dei dati.
Relazione come traduzione di relationship costrutto del modello concettuale Entity-Relationship; che descrive legami tra entità del mondo reale.
Relazione: tre accezioni
Prodotto cartesiano Prodotto cartesiano di due insiemi A e B
AxB = {(x1,x2) | x1A e x2B}dove (x1,x2) sono coppie ordinate di elementi
Per esempio: A = {1,2,4}, B= {a,b}AxB = {(1,a),(1,b),(2,a),(2,b),(4,a),(4,b)}
Relazione matematica Relazione matematica su insiemi A e B
(domini della relazione) = sottoinsieme di AxB
Per esempio: AxB = {(1,a),(1,b),(2,a),(2,b),(4,a),(4,b)}
Una relazione matematica su insieme A e B potrebbe essere:
R={(1,a),(1,b),(4,b)}
Rappresentazione tabellare:
1 a
1 b
2 a
2 b
4 a
4 b
1 a
1 b
4 b
Relazione matematica
Dominio: finito o infinito? Per esempio: {z|z è un numero naturale} è un insieme infinito {y|y è un numero naturale t.c. 18≤y≤ 30 } è un insieme
finito
In un DB non possono esserci insiemi infiniti Sistemi di calcolo gestiscono solo insiemi finiti
Ma è utile ammettere domini infiniti per permettere ad ogni istante di assumere esistenza di un valore non presente nel DB
Assumiamo che i DB siano costituiti da relazioni finite su domini eventualmente infiniti
Definizione: Dati n>0 insiemi D1, D2, …, Dn si chiama prodotto cartesiano di D1, D2, …, Dn , indicato con D1×D2×…×Dn, l’insieme delle n-uple ordinate (d1 ,d2,…,dn) t. c. di Di , con i=1,…, n
Definizione: Una relazione matematica R sugli insiemi D1, D2, …, Dn è un sottoinsieme di D1×D2×…×Dn
Definizioni: D1, D2, …, Dn sono detti domini della relazione R. n è il grado di R. Il numero di n-uple è la cardinalità della relazione.
Relazione matematica
Relazione matematica Esempio: relazione di grado n=3
D1={0,1}, D2={a,b}, D3={rosso,blu} Che cos’è D1xD2xD3?
{(0,a,rosso), (0,a,blu), (0,b,rosso), (0,b,blu), (1,a,rosso), (1,a,blu), (1,b,rosso), (1,b,blu)}
Una relazione sugli insiemi {0,1}, {a,b}, {rosso,blu} potrebbe essere
{(0,b,blu), (1,a,rosso), (1,b,rosso), (1,b,blu)}(Relazione di cardinalità 4)
Relazioni e tabelle Per esempio: risultati partite di calcio
Juventus Lazio 3 2
Lazio Milan 2 0
Juventus Roma 2 1
Roma Milan 1 2
Sequenza di carattere (stringa) Numero naturale (intero)
Relazione R t. c. R Stringa × Stringa × Intero × Intero
Relazioni e tabelle
Una relazione è un insieme: n-uple della relazione devono essere distinte (no righe
ripetute in tabella) n-uple non sono tra loro ordinate (tabelle con stesse
righe ordinate in modo diverso rappresentano la stessa relazione)
Insieme: collezione di elementi Un insieme non contiene duplicati L’ordine degli elementi non è importante
Relazioni e tabelle n-upla contiene dati tra loro collegati, che verificano
la relazione
L’ordine degli elementi delle n-uple (colonne) è significativo. Se nella tabella precedente scambiamo il terzo e il
quarto dominio, cambieremmo il significato della nostra relazione. Ciascuno dei due domini intero e stringa compare due volte, e le due occorrenze sono distinte attraverso la posizione.
Ordinamento dei domini di una relazione impone una struttura posizionale degli elementi di n-uple
Relazioni con attributi In una relazione, ogni dominio rappresenta
un ruolo associamo a ciascuna occorrenza di dominio nella
relazione un nome, detto attributo per identificare le rispettive componenti delle n-uple
In una tabella: attributo intestazione di colonne della tabella
Modificando la definizione di relazione con l’introduzione degli attributi l’ordinamento delle colonne nella tabella, risulta irrilevante: la struttura non è posizionale
Relazioni con attributi
SquadraDiCasa SquadraOspitata RetiCasa RetiOspitata
Juventus Lazio 3 2
Lazio Milan 2 0
Juventus Roma 2 1
Roma Milan 1 2
L’ordinamento non posizionale permette di far riferimento alle componenti delle n-uple in modo non ambiguo.
Relazioni con attributi Dati insieme di attributi X={A1,…,An} e insieme di
domini D={D1,…,Dm} Stabiliamo corrispondenza tra attributi e domini
mediante funzione DOM: X D Cioè, la funzione DOM associa a ciascun attributo AX
un dominio DOM(A) D
X DA3D7
DOM
Relazioni con attributi
Tupla su insieme di attributi X è una funzione t che associa a ciascun attributo A X un valore del dominio DOM(A) Per esempio: t[SquadraDiCasa]=Juventus
Relazione (con attributi) su X è insieme di tuple su X
n-uple: elementi individuati per posizione Tuple: elementi individuati per attributo
Relazioni con attributi: esempio DOM:{SquadraDiCasa, SquadraOspitata, Reti Casa,
RetiOspitata} {Stringa, Intero} Cioè:
Insieme di attributi X = {SquadraDiCasa, SquadraOspitata, Reti Casa, RetiOspitata}
Insieme di domini D = {Stringa, Intero}
DOM(SquadraDiCasa) = Stringa DOM(SquadraOspitata) = Stringa DOM(Reti Casa) = Intero DOM(RetiOspitata) = Intero
Tabelle e relazioniUna tabella rappresenta una relazione se i valori di ciascuna colonna sono fra loro omogenei (dallo stesso dominio) le righe sono diverse fra loro le intestazioni delle colonne sono diverse tra loro (perciò i campi sono distinguibili mediante il loro nome e non la loro posizione)
Inoltre, in una tabella che rappresenta una relazione: l’ordinamento tra le righe è irrilevante l’ordinamento tra le colonne è irrilevante
Tabelle e relazioni
Il modello relazionale è basato su valori:I riferimenti fra dati in relazioni diverse sono rappresentati per mezzo di valori dei domini che compaiono nelle tuple.
Altri modelli logici (reticolare e gerarchico) realizzano le corrispondenze in modo esplicito attraverso puntatori.(Modelli basati su record e puntatori)
Esempio
Stessa base di dati con puntatori al posto dei riferimenti realizzati tramite valori
Base di dati relazionale
Base di dati con puntatori
Vantaggi della struttura basata sui valori
Indipendenza dalle strutture fisiche (si potrebbe anche con puntatori di alto livello) che possono cambiare anche dinamicamente Si rappresenta solo ciò che è rilevante dal punto di vista dell’applicazione (dell’utente); i puntatori sono meno comprensibili per l’utente finale (senza, l’utente finale vede gli stessi dati dei programmatori) I dati sono trasferibili piu' facilmente da un sistema ad unaltro
NOTE:• i puntatori possono esistere a livello fisico• nel modello a oggetti esistono i riferimenti, che funzionano da ‘puntatori di alto livello’
Relazioni e Basi di Dati
Un DB è solitamente costituito da più relazioni (tabelle) le cui tuple contengono valori comuni (usati per stabilire corrispondenza tra tuple)
Per esempio: tabelle che descrivono studenti, esami e corsi
Matricola Cognome Nome DataNascita276545 Rossi Maria 25/11/1981
485745 Neri Anna 23/04/1982
200768 Verdi Fabio 12/02/1982
587614 Rossi Luca 10/10/1981
937653 Bruni Mario 01/12/1981
Studenti
Relazioni e Basi di Dati
Codice Titolo Docente01 Analisi Giani
03 Chimica Melli
04 Chimica Belli
Studente Voto Corso276545 28 01
485745 27 04
200768 25 01
587614 24 04
Esami
Corsi
Schemi di relazioni e di DB
Schema di relazione: R(X) Costituita da simbolo R (nome della relazione) e da
insieme di nomi di attributi X={A1,…,An} Per esempio:
Esami(Studente,Voto,Corso) Istanza di relazione su schema R(X)
Insieme r di tuple su X
Studente Voto Corso276545 28 01
485745 27 04
200768 25 01
587614 24 04
Esami
Schemi di relazioni e di DB
Schema di base di dati: R={R1(X1),…,Rn(Xn)} Insiemi di schemi di relazione con nomi diversi
Per esempio: Università =
{Studenti(Matricola,Cognome,Nome,DataNascita), Esami(Studente,Voto,Corso), Corso(Codice,Titolo,Docente)}
Istanza di base di dati su schema R={R1(X1),…,Rn(Xn)} Insieme r di relazione r={r1,…,rn} dove ogni ri è una
relazione sullo schema Ri(Xi)
Informazione incompleta
ll modello relazionale impone ai dati una struttura rigida:– le informazioni sono rappresentate per mezzo di tuple– solo alcuni formati di tuple sono ammessi: quelli che corrispondono agli schemi di relazione.I dati disponibili possono non corrispondere esattamente al formato previsto, per varie ragioni.
ESEMPIO: Tipi di valori nullo
Persone n. telefonoSonia Morandi Simone RossiAngelo ColombiMaria Sordi
02 70638847
Valore sconosciuto
Valore non esistente
Valore senza informazione
Informazione incompleta: soluzioni
Non conviene utilizzare valori ordinari del dominio (0, stringa nulla, “99”, etc), per vari motivi:
– potrebbero non esistere valori “non utilizzati”– valori “non utilizzati” potrebbero diventare significativi– in fase di utilizzo nei programmi sarebbe necessario ogni volta tener conto del loro significato
Si utilizza NULL: valore nullo Viene assegnato agli elementi di tuple inesistenti o sconosciuti E’ un valore aggiuntivo rispetto al dominio di un attributo
Informazione incompleta e valori nulli Non tutti gli attributi di una relazione possono assumere
valore nullo In definizione di relazione, si può specificare quali attributi
non devono mai essere nulli nelle tuple
Matricola Cognome Nome DataNascita
276545 Rossi Maria NULL
NULL Neri Anna 23/04/1982
NULL Verdi Fabio 12/02/1982
587614 Rossi Luca 10/10/1981
937653 Bruni Mario 01/12/1981
Studenti
Informazione incompleta e valori nulli Non tutti gli attributi di una relazione possono
assumere valore nullo In definizione di relazione, si può specificare quali
attributi non devono mai essere nulli nelle tuple
Matricola Cognome Nome DataNascita
276545 Rossi Maria NULL
NULL Neri Anna 23/04/1982
NULL Verdi Fabio 12/02/1982
587614 Rossi Luca 10/10/1981
937653 Bruni Mario 01/12/1981
Studenti
No: matricola usata per correlare
relazione
Vincoli di integrità
Oltre a imporre restrizioni sulla presenza di valori nulli bisogna evitare la creazione di istanze sintatticamente corrette, ma che non rappresentano informazioni possibili.
Un vincolo di integrità è una proprietà che deve essere soddisfatta dalle istanze che rappresentano informazioni corrette.
Ogni vincolo può essere visto come una funzione booleana (o un predicato) che associa ad ogni istanza il valore vero o falso.
Vincoli di integrità
Definendo lo schema di un base di dati si associano vincoli di integrità che si riferiscono a tutte le istanze.
Questi vincoli permettono di considerare corrette le sole istanze che li verificano tutti
Vincoli intrarelazionali Vincolo di tupla
Vincolo di dominio Vincoli su assegnamento di valori ad attributi diversi di
una tupla Vincolo di chiave
Vincoli interrelazionali
Vincoli intrarelazionali Vincoli interni a una relazione:
Soddisfacimento definito rispetto ad una singola relazione della base di dati
Vincolo di tupla: esprime condizioni sui valori di ciascuna tupla indipendentemente dalle altre tuple Vincolo di dominio (vincolo su valori): restrizione su
dominio di attributo Vincoli su assegnamento di valori ad attributi diversi di
una tupla
Vincoli di tupla Esprimibili mediante espressioni booleane (AND, OR,
NOT) i cui termini contengono: Uguaglianze, disuguaglianze, ordinamenti di valori di
attributo Espressione aritmetiche su valori di attributo
Per esempio: Vincolo di dominio
(Voto 18) AND (Voto 30) Vincolo su più attributi
Pagamenti(Data, Importo, Ritenute, Netto)Netto = Importo - Ritenute
Vincoli di chiave
Superchiave/chiave: insieme di attributi che identificano univocamente le
tuple di una relazione Superchiave: un insieme K di attributi è detto
superchiave di una relazione r se r non contiene due tuple t1 e t2 con t1[K]=t2[K]
K è una chiave di r se è una superchiave minimale di r Ogni chiave è una superchiave
Vincoli di chiave {Matricola} è una chiave è superchiave minimale (contiene un solo attributo)
Matricola Cognome Nome Nascita Corso
4328 Rossi Luigi 29/04/79 Informatica
6328 Rossi Dario 29/04/79 Informatica
4766 Rossi Luca 01/05/81 Fisica
4856 Neri Luca 01/05/81 Economia
5536 Neri Luca 05/03/78 Economia
Vincoli di chiave {Cognome, Nome, Nascita} è una chiave è superchiave minimale (nessuno dei suoi sottoinsiemi
è superchiave)
Matricola Cognome Nome Nascita Corso
4328 Rossi Luigi 29/04/79 Informatica
6328 Rossi Dario 29/04/79 Informatica
4766 Rossi Luca 01/05/81 Fisica
4856 Neri Luca 01/05/81 Economia
5536 Neri Luca 05/03/78 Economia
Vincoli di chiave {Matricola, Corso} è una superchiave, ma non una
chiave
Matricola Cognome Nome Nascita Corso
4328 Rossi Luigi 29/04/79 Informatica
6328 Rossi Dario 29/04/79 Informatica
4766 Rossi Luca 01/05/81 Fisica
4856 Neri Luca 01/05/81 Economia
5536 Neri Luca 05/03/78 Economia
Vincoli di chiave {Nome, Corso} non è una superchiave
Matricola Cognome Nome Nascita Corso
4328 Rossi Luigi 29/04/79 Informatica
6328 Rossi Dario 29/04/79 Informatica
4766 Rossi Luca 01/05/81 Fisica
4856 Neri Luca 01/05/81 Economia
5536 Neri Luca 05/03/78 Economia
Vincoli di chiave In questo caso {Nome, Corso} è una chiave, ma non
è ben definita
Matricola Cognome Nome Nascita Corso
6328 Rossi Dario 29/04/79 Informatica
4766 Rossi Luca 01/05/81 Fisica
4856 Neri Luca 01/05/81 Economia
5536 Neri Luca 05/03/78 Informatica
Vincoli di chiave
Ogni relazione r, con la schema r(X), ha una chiave Essendo un insieme, r è costituita da tuple diverse tra
loro X (insieme degli attributi) è sicuramente superchiave di r
X potrebbe essere una chiave di r Se X non è una chiave di r, allora esiste un
sottoinsieme Y di X tale che Y è una chiave
Importanza delle chiavi
Il fatto che ogni schema di relazione abbia almeno una chiave garantisce: L’accessibilità a ciascun dato della base di dati. Ogni
singolo valore è univocamente accessibile tramite: nome della relazione valore della chiave nome dell’attributo
La possibilità di definire corrispondenze tra dati contenuti in relazioni diverse
Individuazione delle chiavi
Li individuiamo: considerando le proprietà che i dati soddisfano
nell’applicazione notando quali insiemi di attributi permettono di identificare
univocamente le tuple; e individuando i sottoinsiemi minimali di tali insiemi che
conservano la capacità di identificare le tuple.
I vincoli corrispondono a proprietà del mondo reale modellato dalla base di dati, quindi interessano a livello di schema (con riferimento cioè a tutte le istanze.
Ad uno schema associamo un insieme di vincoli e consideriamo corrette (ammissibili) solo le istanze che soddisfano tutti i vincoli.
Esempio DB Ghiacciai Lombardia
OBIETTIVICreare un modello dei dati che consenta di archiviare e ricercare le informazioni ricavate dall’osservazione protratta nel tempo di ghiacciai alpini da sorgenti diverse (campagna di misura, elaborazione di immagini, …)
Grande eterogeneità di dati Ruolo chiave dell’attributo temporale Necessità di non duplicare i dati Necessità di confrontare i dati Flessibilità nella gestione delle variazioni dei corpi glaciali Armonizzazione con database internazionali Collegamento ad un visualizzatore di dati vettoriali
Esempio
Accesso ai dati di un DB: algebra relazionale
Aggiornamento di DB: funzione che, data istanza di DB, produce altra istanza di DB, sullo stesso schema Modifica, aggiunta, rimozione tuple
Interrogazione a DB: funzione che, dato un DB, produce una relazione su un dato schema (non necessariamente uno degli schemi definiti nel DB)
Aggiornamento e interrogazione vengono effettuati usando specifici linguaggi Ad esempio: algebra relazionale
Algebra relazionale
Algebra relazionale: basata su insiemi di operatori Definiti su relazioni Producono relazioni come risultati
Operatori Insiemistici: unione, intersezione, differenza Specifici: ridenominazione, selezione, proiezione, join
5. Modellizzazione di dati geografici
Il dato geografico Definizione di carta Relazioni spaziali fra entità geografiche Cartografia numerica Entità e campi Aspetto spaziale Aspetto semantico Aspetto di qualità: i metadati
Il dato geograficoDato caratterizzato da un riferimento spaziale che ci aiuta a collocarlo nel mondoLocalizzazione = coordinate x, y (e z)Sistemi di riferimento
Dato georeferenziatoOgni documento o evento che si riferisce ad una determinata porzione della superficie terrestre ed è quindi possibile rappresentarlo anche dal punto di vista cartografico mediante carte o immagini da aereo/satellitari.
Informazione geografica
Informazioni spaziali digitali caratterizzate da: Grande quantità di dati Struttura complessa
Differiscono dal dal modo in cui sono ottenute: Collezioni di dati (primari)
derivano da varie sorgenti di dati: campagne di misura, dati GPS, immagini telerilevate, foto aeree, …Problemi: delimitazione oggetti (confini fuzzy) e associazione dei valori degli attributi tematici agli oggetti spaziali
Dati derivanti da mappe esistentimappe create dall’integrazione di diverse sorgenti di dati digitaliProblemi: eterogeneità delle scale e del sistema di coordinate, qualità dei dati
Definizione di carta
Una carta è un insieme di punti, linee e aree definite:
dalla posizione nello spazio da attributi non spazialiGeneralmente si considerano separate
planimetria e altimetria.
La LEGENDA della carta è la chiave di connessione degli attributi non spaziali alle entità spaziali.
Gli attributi non spaziali possono essere indicati visivamente con COLORI, SIMBOLI, SFUMATURE il cui significato è deducibile dalla legenda.
Relazioni spaziali tra entità geograficheL'analisi di una carta consente di:
dare una conoscenza del territorio sia puntuale (basata sull'osservazione di ogni singolo oggetto) che generale (visione d’insieme);
di sviluppare processi logici di tipo deduttivo e induttivo in funzione di relazioni di concomitanza, vicinanza, frequenza,...;
Le relazioni spaziali tra entità geografiche esistenti su una carta possono essere classificate in vari modi.
Una distinzione è quella tra le relazioni che sono indipendenti dall’orientamento, dette RELAZIONI TOPOLOGICHE, e quelle che ne dipendono, dette RELAZIONI DIREZIONALI.
Relazioni spaziali tra entità geografiche
Le relazioni topologiche tra entità geografiche sono del tipo: equivalenza (si sovrappone completamente); equivalenza parziale (si sovrappone parzialmente,
attraversa); contenimento (è interna); adiacenza (è connessa o incontra); separatezza (è disgiunta)
Relazioni spaziali tra entità geografiche
Relazioni spaziali tra entità geografiche
Le relazioni direzionali includono le seguenti relazioni tra entità:
di fronte a dall’altra parte di sopra Sotto descrizioni metriche di angoli azimutali
a nord a sud a est a ovestE loro combinazioni
Si hanno poi relazioni di vicinanza che descrivono la distanza tra entità geografiche sia in termini metrici quantitativi (misura della distanza) che in termini qualitativi, mediante termini quali
vicino lontano in prossimità di
Relazioni spaziali tra entità geografiche
Relazioni topologiche, direzionali e di vicinanzasono spesso utilizzate combinate tra loro
Esempio di relazioni spaziali tra entità
• Topologicheb è interno a ca è connesso a cd è disgiunto da af è sovrapposto a e• Vicinanzaa vicino a bf lontano da a• Direzionalig a est di bd a nord di g
Cartografia numerica
coordinate che descrivono gli schemi spaziali che rappresentano gli oggetti del territorio o le entità geografiche (features);
relazioni tra gli elementi di tale rappresentazione;
attributi che ne individuano la tipologia.
Cartografia numerica
La cartografia numerica ha tutti i contenuti e almeno tutte le stesse funzioni di base della cartografia tradizionale.
La cartografia numerica è in un certo senso un’immagine speculare della cartografia tradizionale:
• l’elemento base della cartografia tradizionale è un disegno che contiene in forma implicita le coordinate dei punti• nella cartografia numerica l’elemento base è l’insieme delle coordinate che contiene in forma implicita la sua visualizzazione sotto forma di disegno.
Entità e campi
Astraendo dal loro contenuto, i dati georeferenziati possono essere ripartiti nelle categorie principali di campi o di entità.
I campi sono rappresentativi di fenomeni continui quasi ovunque nel dominio di definizione.Esempio: il rumore ambientale, l’altimetria del territorio.
I campi vengono usualmente discretizzati, e rappresentati mediante matrici regolari di attributi (modello matrix o raster georeferenziato)
Entità e campi
Alla categoria entità appartengono viceversa gli oggetti discontinui, delimitati spazialmente da confini ben precisi, eventualmente, caratterizzati da specifici attributi.
Esempi:la ripartizione del territorio in aree normative, il grafo descrittivo di una rete di infrastrutture di trasporto;
In ambito GIS le entità vengono usualmente rappresentate mediante modelli vettoriali, eventualmente topologici, cui vengono associate opportune tabelle di attributi.
Fenomeni geografici modellizabili a campi
MODELLO DIGITALE DEL TERRENO
IMMAGINE TELERILEVATA
Fenomeni geografici modellizabili a campiPER UN MODELLO DIGITALE E' POSSIBILE ANCHE
UNA RAPPRESENTAZIONE A CURVE DI LIVELLO
Fenomeni geografici modellizabili a campi
O UNA RAPPRESENTAZIONE A TRIANGOLIIRREGOLARI (TIN)
Fenomeni geografici modellizabili a entità
MODELLO A ENTITA’
Fenomeni geografici modellizabili a entità
MA LA CARTA POTREBBE ESSERE DERIVATA DA UNA IMMAGINE DIGITALE
Fenomeni geografici modellizabili a entità
Inoltre:• in molti casi può essere più comodo trattare dati grigliati (ad esempio si possono usare algoritmi di algebra matriciale)• non ci sono più, come nel passato, problemi legati all'occupazione di memoria di massa.
I FENOMENI GEOGRAFICI POSSONOESSERE MODELLIZZATI SECONDO UNMODELLO IBRIDO
I dati appartenenti a una base di dati geografici sono sostanzialmente caratterizzati da tre componenti:
ASPETTO SPAZIALE
Modellizzazione di dati geografici
ASPETTO SEMANTICO
ASPETTO DI QUALITA’
La geometria di un fenomeno, descritta per mezzo di coordinate di punti e funzioni matematiche, usa come elementi standard di base le primitive geometriche.La componente geometrica può essere: • vettoriale (coordinate dei punti che descrivono la forma geometrica)• raster (insieme di pixel corrispondenti al particolare oggetto)
La topologia (relazioni topologiche: adiacenza, connessione e contenimento) è invariante per deformazioni elastiche e continue (ad esempio trasformazioni di datum o di sistema di coordinate) ed è descritta a partire da primitive topologiche.
Una volta definito un oggetto come fenomeno singolo del mondo reale lo schema spaziale fornisce la descrizione della sua geometria e topologia.
Aspetto spaziale
Aspetto semantico e di qualità
ASPETTO SEMANTICOattributi statistici e/o testuali
ASPETTO DI QUALITA’
La componente semantica è data dall’insieme degli attributi di vario dominio (numerico, stringa,…) associati alla parte geometrica del dato.
L'aspetto di qualità è descritto mediante le categorie di accuratezza, completezza ed aggiornamento.
Aspetto spaziale dei dati geografici
Le primitive geometriche descrivono, parzialmente o totalmente, la rappresentazione spaziale di un oggetto mediante coordinate e funzioni matematiche: tutte le posizioni che concorrono alla descrizione di una primitiva devono essere riferite allo stesso sistema geodetico di riferimento e alla stessa scala di rappresentazione (la scala definisce il dettaglio e le approssimazioni rispetto alla "realtà")..
Le entità geometriche utilizzate per la descrizione di fenomeni spaziali nel dominio bidimensionale sono:
puntocurva
superficie
Entità vettoriali Campigrigliapixelbanda rastervoxelblocco raster
Immagini vettoriali e raster
Immagine Vettoriale - E' un sistema di archiviazione di dati grafici secondo il quale gli oggetti vengono memorizzati in base alle coordinate cartesiane dei punti e linee che li compongono.
Immagine raster - Qualsiasi immagine può essere pensata come formata da un insieme di piccole aree uguali (pixel), ordinate secondo linee e colonne, tali da costituire una matrice. I valori associati ad ogni cella possono esprimere sia informazioni di tipo grafico (colore, tono di grigio, …) sia di tipo descrittivo (temperatura, pendenza, …).
Comprendono immagini digitali ottenute da riprese aeree o satellitari (a colori), ed immagini digitali ottenute da scansione di mappe cartacee (in bianco e nero contenenti linee, tessiture, simboli).Successive elaborazioni possono aggiungere altri attributi ai pixel.
Primitive geometriche
Punto: è una primitiva geometrica 0-dimensionale, la cui posizione spaziale è descritta da coordinate (posizionamento diretto: insieme ordinato di numeri in un sistema di riferimento di posizioni).
Curva: è una primitiva geometrica limitata, continua, monodimensionale e può essere chiusa o aperta.Una curva è descritta da un metodo di interpolazione (cammino minimo, arco, B-spline, …) applicato ad una lista di due o più posizioni dirette.
Primitive geometriche
Superficie possibile
Bordo: è un elemento chiuso monodimensionale non intrecciato (né esplicitamente, né implicitamente); può essere composto da una o più curve.
Superficie: è una primitiva geometrica limitata, continua, bidimensionale, delimitata da un bordo esterno e da zero o più bordi ( o confini) interni non annidati e non intrecciati.
Superficie non possibile
Superficie non possibile
Primitive geometriche
Struttura (frame): è una primitiva basata su una partizione con areole dello spazio considerato: tali areole sono l'elemento base della struttura. La forma e dimensione delle areole lungo ogni asse del sistema di riferimento scelto per la struttura sono costanti e caratterizzano la struttura stessa.
Si considerano strutture bi o tridimensionali: nell’ultimo caso la struttura è una partizione costituita da uno o più piani contigui di righe e colonne contigue, di unità regolari che riempiono una parte limitata dello spazio.
Primitive geometricheGriglia: è una distribuzione regolare di punti, derivabile dagli angoli di tassellatura determinati da una struttura. Una griglia è definita in accordo con la specifica struttura che fornisce la posizione spaziale di ogni punto della griglia stessa.
Pixel: è una primitiva geometrica bidimensionale, elemento base (o unità) di una specifica struttura bidimensionale. La sua posizione spaziale è definita dal numero di riga e di colonna. P(i,j)
TopologiaL'aspetto geometrico delle entità geografiche è descritto da coordinate di punti relativamente ad un sistema geodetico di riferimento.
Ma la geometria che descrive le entità di un territorio può variare in funzione di molti fattori, ad esempio al variare della scala della rappresentazione digitale.(Scala nominale: rapporto di scala a cui si può riprodurre una carta digitale in modo che abbia gli stessi requisiti qualitativi e metrici della relativa carta tradizionale).
Per garantire quindi la consistenza della rappresentazione si devono introdurre dei vincoli e delle relazioni di tipo non metrico.
TopologiaLa topologia è la disciplina matematica che si occupa di connessione
e adiacenza di punti e linee e che permette quindi di analizzare le relazioni spaziali tra dati geografici.
Una struttura dati topologica determina esattamente come e dove sono connessi punti e linee su una carta numerica per mezzo di congiunzioni topologiche, dette nodi.
La teoria dei grafi è lo strumento utilizzabile per rendere consistente una carta numerica descritta per mezzo di primitive geometriche.
Un qualsiasi aggiornamento della carta dovrà rispettare i vincoli topologici imposti alle varie entità geografiche coinvolte.
Primitive topologicheLe primitive topologiche descrivono gli aspetti topologici delle entità
geografiche stabilendo delle relazioni che le connettono.Gli aspetti topologici di un oggetto possono essere descritti da una o
più primitive topologiche.Le entità topologiche per una descrizione neldominio bidimensionale sono:
nodospigoloanellofaccia
Primitive topologicheNodo: è una primitiva topologica 0-dimensionale.Si può distinguere tra due tipi di nodi.
• Nodo connesso. Si tratta di un nodo connesso ad uno o più spigoli. In questo caso si può ulteriormente distinguere tra nodo che è iniziale o finale di uno spigolo, detto nodo terminale, e nodo che è solo intersezione di lati, in questo caso si parla di nodo intermedio.
• Nodo isolato: nodo che non è connesso con nessuno spigolo.
Si può osservare che quello che può essere considerato nodo intermedio se riferito ad un determinato spigolo può anche essere terminale rispetto ad un altro spigolo.
Primitive topologiche
Spigolo: è una primitiva topologica monodimensionale che rappresenta una connessione orientata tra due nodi terminali; i due nodi possono essere coincidenti.
Anello: è un insieme ordinato di spigoli connessi che formano un elemento monodimensionale non intersecantesi né implicitamente né esplicitamente. I punti estremanti di un anello convergono allo stesso nodo.
Faccia: è una primitiva topologica descritta da un anello esterno e da zero a molti anelli interni.
Questo aspetto diventa fondamentale quando si parla di interoperabilità e condivisione dei dati anche sul Web.
Aspetto semantico dei dati geografici
Ricerca dei dati più adatti al mio scopo
Necessità di associare ad essi una semantica strutturata…
Problema generale: accessibilità dei contenuti
Ricerca di informazione
L’informazione che ci interessa può essere contenuta in più documenti e siti diversi. Nulla ci permette ad esempio di descrivere concetti come: prima, dopo, coincidenza, percorso, …
Cooperazione
Ricerca di documenti
Link
Motori di ricerca
Processo cognitivamente molto ricco, ma può essere dispendioso in termini di tempo
Richiede poca informazione iniziale, ma l’80% del contenuto del web è “nascosto” perché non indicizzato o non indicizzabile. Inoltre la ricerca per parole chiave comporta il fenomeno dei “falsi positivi” (pagine contenenti le parole cercate, ma con l’informazione errata) o dei “falsi negativi” (pagine contenenti sinonimi dei termini cercati)Integrazione
di informazione
Non vengono forniti servizi ad altri servizi, ma solo contenitori di informazioni
Ridefinire e ristrutturare i dati su Web in modo che il loro significato sia accessibile, non solo alle persone, ma anche a programmi che li utilizzano per manipolarli, integrarli, renderli disponibili per diverse applicazioni e non solo per mostrarli
Semantic Web
Una soluzione
“Il Semantic Web è un’estensione dell’attuale Web, nella quale all’informazione viene dato un significato ben definito, permettendo così ai computer e alle persone di lavorare meglio in cooperazione.”
[Tim Berners-Lee, James Hendler, Ora Lassila, “The Semantic Web”, Scientific American, Maggio 2001]
Semantic Web
World Wide Web
Aumentare le potenzialità del WWW e
eliminarne le limitazioni
ONTOLOGIE
Branca che studia la natura e l‘organizzazione della realtà
“Lo studio dell'essere in quanto essere”, Aristotele (Metafisica)
Ontologia in filosofia
Non ha per oggetto una realtà in particolare, bensì la realtà in generale, cioè gli aspetti fondamentali e comuni di tutta al realtà.
Come la matematica studia l'essere come quantità; la fisica studia l'essere come movimento, solo l’ontologia studia l'essere in quanto tale, considerando le caratteristiche universali di ogni essere, ed è dunque il presupposto indispensabile di ogni ricerca.
Pone le domande:• Cosa è l‘essere?• Cosa caratterizza l‘essere?
Ontologia (informatica)
• Un‘ ontologia consiste in– uno specifico vocabolario usato per descrivere un dominio– un insieme di asserzioni sul significato inteso dal vocabolario
• Un‘ ontologia è una descrizione formale esplicita di un determinato dominio di interesse
DESCRIZIONE: Una forma di rappresentazione della conoscenza
FORMALE: Simbolica e meccanizzabile
ESPLICITA: Elenchi estesi di frammenti di conoscenza
DOMINIO: ristretta ad un determinato sottoinsieme dello scibile, affrontato da un certo punto di vista
• “Un’esplicita specificazione di una concettualizzazione”, Gruber (1993)
Contenuto di un’ontologia
Un insieme di classi = concettiAstrazioni del mondo reale a vari livelli di dettaglio non necessariamente disgiunti e non necessariamente esaustivi
Un insieme di relazioni (fra concetti)Le più importanti sono ereditarietà, generalizzazione, particolarizzazione. Esempi: sinonimo, opposto fornito_da, …
Un insieme di proprietà Attributi di ciascuna classe
Un insieme di restrizioniImpongono il tipo di dato delle proprietà
IstanzeRappresentano specifici oggetti del modo reale ereditano attributi e relazioni dalle classi
AnnotazioniRelazioni fra un’istanza di un oggetto e una classe dell’ ontologia.
Rappresentabile mediante la tripla <oggetto, relazione, classe>
Osservazioni
La realizzazione del Semantic Web potrebbe diventare uno strumento per supportare la condivisione e l’evoluzione dell’intera conoscenza umana
• Condivisione della conoscenza
• Comunicazione tra agenti con diverse “teorie del mondo”
Caratteristica e limite delle ontologie: si riferiscono ad un particolare dominio quindi se vogliono comunicare dovranno avere un protocollo comune
ALBERO
IT Nautica Botanica
Aspetto di qualità dei dati geografici
La qualità del dato geografico riguarda aspetti come: accuratezza completezza aggiornamento
Questi ed altri aspetti sono espressi mediante i metadati.
Dati sui dati: descrizione standardizzata del contenuto, qualità, codifiche e altre caratteristiche dei dati
Servono a fornire:
• Informazioni sui dati disponibili
• Informazioni necessarie per il trattamento e l’interpretazione dei dati
Metadati: esempi
Sono strumenti che usiamo abitualmente:
Ingredienti, data di scadenza, nome e sede del produttore o del venditore, modalità di conservazione e di utilizzo, tabella nutrizionale, marchi di qualità
Etichette
Documentazione tecnica, istruzioni per l'uso, definizione della destinazione del prodotto, garanzia
Libretto istruzioni
Composizione, posologia, effetti collaterali, avvertenze, indicazioni e controindicazioni
Bugiardino
Metadati geograficiDomande a cui dovrebbero rispondere:
1. Cosa descrive il dataset?2. Chi lo ha prodotto?3. Quali sono i possibili utilizzi?4. Come sono stati creati i dati?5. Perché è stato creato il dataset?6. C’ è la possibilità di ottenerne una copia?7. Chi ha scritto i metadati?
Metadati geografici
a. Qual è il titolo?b. Quale area geografica è rappresentata?c. Quali sono i dati della situazione descritta?d. Qual è il formato dell’informazione geografica presentata? e. Quali sono le parole chiave del dataset? f. Quali sono i possibili utilizzi?h. Con che frequenza l’informazione è aggiornata?
1. Cosa descrive il dataset?
File XML
Metadati geografici: XML<title>Catalonia Topographic Base 1:5.000. Version 2</title>
<abstract>Topographic cartography that covers catalan territory.</abstract>
<purpose>Topographic base of Catalonia. Needed for the development of technic activities, management and territorial planification within DPTOP and other departments of Generalitat of Catalonia. Also is necessary to other public organisms and private entities. Obtaining of land elevations database of Catalonia.</purpose>
<status>
<MD_ProgressCode value="underdevelopment" />
</status>
<distributorFormat>
<b-name>DGN, DXF, E00</b-name>
</distributorFormat>
<descriptiveKeywords>
<keyword>Spain</keyword>
<keyword>Catalonia</keyword>
<keyword>Topographic cartography</keyword>
<keyword>Cartography</keyword>
<keyword>Topographic database</keyword>
</descriptiveKeywords>
<pointOfContact>
<organisationName>Institut Cartogràfic de Catalunya</organisationName>
<positionName>Responsable de Distribució i Vendes</positionName>
</pointOfContact>
<MD_MaintenanceFrequencyCode value="irregular" />
Standard per i metadati: XML: struttura fisica
XML (eXtensible Markup Language)• E’ una raccomandazione del W3C• È pensato per gestire qualsiasi tipo di contenuto che possa essere descritto in forma di testo• È orientato alla rappresentazione di documenti fruibili tramite Internet• E’ un metalinguaggio: permette tramite la sua sintassi di descrivere altri linguaggi• E’ open source e sta diventando lo standard per l’interscambio dei dati di ogni applicazione
6. GIS (Geographic Information System) (cenni)
Definizioni Componenti Applicazioni e finalità Strutture di gestione di basi dati nei GIS
Definizione
E’ un sistema informativo che tratta dati geografici
Un sistema informativo è un insieme organizzato di procedure risorse umane risorse materiali
Sono utilizzati per la raccolta l'archiviazione l'elaborazione la comunicazione
di informazioni necessarie ad una organizzazione per gestire le proprie attività operative e di governo.
Informazioni georeferenziate
Informazione georeferenziata: ogni documento o evento che si riferisce ad una determinata porzione della superficie terrestre è un esempio di informazione geografica
I dati spaziali o geografici rappresentano fenomeni del mondo reale e sono caratterizzati: dalla posizione nello spazio rispetto ad un sistema di riferimento
e di coordinate da attributi non spaziali (colore, temperatura, etc…) dalle reciproche relazioni spaziali (topologiche, direzionali, di
distanza)
Dati nei GIS ambientaliSfondi cartograficivettoriali e raster
Osservazioni sul campo
Modelli digitali di superficiee del terreno
Ortofoto e immaginitelerilevate
Carte tematiche primarieCarte tematiche
derivate
Definizioni di GIS basate sul concetto di Database
“un database in cui la maggior parte dei dati sono spazialmente indicizzati e sui quali un insieme di procedure opera per rispondere a query legate ai loro attributi spaziali”
Smith T.R., S. Menon, J.L. Starr, and J.E. Estes, 1987.Requirements and principles for the implementation and construction of large-scale geographic information systems. International J. of Geographical Information Systems, 1: 13-31.
“ogni insieme di procedure manuali o informatiche usato per memorizzare e manipolare dati georeferenziati”
Aronoff S., 1989. Geographic Information Systems: A Management Perspective. WDL Publ., Ottawa, Canada.
Componenti di un Sistema Informativo geografico
Un GIS non è quindi solo l’insieme dei motori software che si occupano di acquisire e aggiornare, pretrattare, archiviare, analizzare e rappresentare in forma grafica con carte e diagrammi un certo fenomeno georeferenziabile.
STRUTTURE ORGANIZZATIVE METODI DI LAVORO COMPONENTI HARDWARE COMPONENTI SOFTWARE (motori del GIS) DATI
SISTEMA INFORMATIVO SPAZIALE=
MODELLO DEL MONDO REALE
Obiettivi e metodi di un GIS
La definizione di un GIS prevede contestualmente la definizione dei suoi obiettivi e metodi:
per obiettivi del GIS si intende l'insieme di risultati che si vogliono conseguire al momento della definizione e creazione del GIS stesso
i metodi del GIS sono invece l'insieme di operatori, codificati in forma astratta, che permettono il conseguimento di tali obiettivi
Schema dei GIS ambientali
Modellizzazione dei dati nei GIS ambientali
Funzionalità di base
Funzionalità specifiche
Applicazioni ambientali/territorialidei GIS
Stato ambiente/territorio: analisi e controllo Pianificazione delle attività antropiche Azioni per ambiente/territorio
Ricerca in campo ambientale/territoriale
Finalità delle applicazioni ambientali/territoriali
Produzione di archivigeografici, carte tematicheed inventari (locali oaccessibili via Internet)
• Automazione dell’elaborazione del Bilancio Territoriale Ambientale;• Automazione della formazione degli strumenti a supporto della ecopianificazione e di governo delle attività attuate sul territorio;• Selezione delle priorità e adeguamento delle politiche ambientali per la formazione di Piani di Azione in campo ambientale.
Strutture di gestione di basi dati nei GIS:Sistemi ibridi
I GIS che implementano un’architettura ibrida sono caratterizzati da:
parte testuale strutturata utilizzando un modello di dati relazionale e gestita da un DB relazionale;
parte geometrica gestita da un sistema proprietario appositamente realizzato per rendere possibile la memorizzazione della parte spaziale del dato, utilizzando
particolari indicizzazioni la gestione usando algoritmi implementati in dipendenza del tipo
di dati che il sistema GIS deve gestire
Strutture di gestione di basi dati nei GIS:Sistemi ibridi
Strutture di gestione di basi dati nei GIS:Sistemi integrati
Il RDBMS deve avere estensioni spaziali.
La componente spaziale (i file delle coordinate dei punti e della topologia degli elementi geometrici) coesiste con la componente testuale (i file degli attributi) ed è in relazione con questa, creando una base di dati geometrico-statistica.
7. Il problema dell’interoperabilità
• Infrastrutture di dati spaziali (SDI): definizione• L’iniziativa europea Inspire
Cosa è una infrastruttura?
• E’ un insieme di elementi interconnessi che forniscono una rete per il supporto dell’intera struttura. Esempi: istituzionale, dei trasporti, urbanistica, economica, militare, …
• Ha il compito di supportare fondamentali attività, dovrà facilitare il flusso di beni o persone o servizi
• Sono necessari enti preposti per la pianificazione dell’infrastruttura e per l’implementazione
• Comporta un investimento anticipato e a lungo termine, di costi, impegno e manutenzione
Esempio: l‘ infrastruttura stradale
Tecnologie: costruzione della rete stradale
Politiche: pianificazione e gestione ad ogni livello
(locale, statale, …)
Standard: indicazioni stradali, segnaletica,
informazioni sul percorso
ottimizzare le capacità delle reti stradali esistenti
garantire l'efficienza e la
sicurezza d'esercizio delle
strade
garantire il migliore accesso
alla rete autostradale
Infrastruttura di dati spaziali: perchè?
• Protezione dell’ ambiente
• Miglioramento della sicurezza e dei trasporti
• Lo sviluppo sociale
• Miglioramento dei servizi per i cittadini
Ruolo fondamentale dell’informazione geografica: le sfide principali
Cresce la necessità di:
• individuare dove i bisogni sono più pressanti
• indirizzare in modo efficace gli interventi
• monitorare i risultati e valutare gli impatti
L’informazione geografica deve essere accessibile,
deve essere facile identificare chi la possiede,
si deve poter stimare quanto essa risolve il problema da affrontare,
come può essere ottenuta,
se può essere integrata con altre informazioni
ARMONIZZAZIONE
SDI: definizione
SDI
Migliore gestione dei dati geografici
• acquisizione• elaborazione• memorizzazione• distribuzioneStandards
Tecnologie
Politiche
Risorse umane Massimizzazione del loro utilizzo
Executive order 12906, April 13, 1994http://www.fgdc.gov/publications/documents/geninfo/execord.html
Esempio: l’ NSDI americana
Riduzione del deficit federaleMigliore gestione della spesa per l’informazione geografica
Motivazioni iniziali:
Promuovere l’uso e il riuso dei dati spaziali per scopi diversi da parte della pubblica amministrazione e dei cittadini
Organizzare i servizi necessari per permettere il reperimento e l’accesso all’informazione geografica da parte della collettività
In seguito:
Leadership affidata al Federal Geographic Data Committee (FGDC)
Esempio: l’ NSDI americanaLe componenti
• Geospatial Data Clearinghouse
Network distribuito di produttori, gestori, utilizzatori di dati geografici
connessi elettronicamente
2003: geodata.govIl portale per un accesso
alle mappe ai dati e ad altri servizi
Dati sui dati: descrizione standardizzata del contenuto, qualità, codifiche e altre caratteristiche dei dati
Servono a fornire: • Informazioni sui dati disponibili
• Informazioni necessarie per il trattamento e
l’interpretazione dei dati
Dati di base: sia perché molto utilizzati in contesti diversi sia perché utili per la
costruzione di altri dati geografici
I temi più utilizzati nel 1994:• Altimetria• Idrografia
• Unità amministrative• Ortofoto • Trasporti • Catasto
• Rete geodetica
• Metadata
• Framework data
Alcuni riferimenti:
– 1986 Avvio di Australian Land Information Council (ALIC)
– 1990 Avvio della FGDC (US)– 1993 Creazione di EUROGI– 1994 Clinton Executive Order– 1996 Prima conferenza sulle GSDI (Bonn)– 1996 11 SDI nazionali– 2000 53 SDI nazionali
• Europa 13• America 21• Asia e Australia 13• Africa 6
– 2003 120 SDI nazionali
Il fenomeno SDI
L’Europa diviene sempre più economicamente e socialmente integrata
Coscienza di affrontare a livello europeo molti processi: Protezione dell’ ambiente Sicurezza sociale Trasporti
Tali processi necessitano di una SDI con un minimo set di dati comune a tutti i paesi della comunità
Contesto europeo
Alcuni di questi hanno avviato il processo di realizzazionedella propria SDI a vari livelli (nazionale, regionale o locale)
La commissione europea ha avviato una iniziativa per lo sviluppo di una Infrastruttura di Dati Spaziali Europea
Sviluppo di aspetti legislativi per la creazione di una SDI
Coordinamento fra il livello europeo e quello nazionale/locale
InspireINfrastructure for SPatial InfoRmation in Europe
Prevede la creazione di servizi integrati di informazione spaziale basati su un network distribuito di database, connessi da standard e protocolli comuni che assicurino la compatibilità e l’ interoperabilità
InspireINfrastructure for SPatial InfoRmation in Europe
L’interoperabilità è la possibilità per due o più autonome entità ( ad es. sistemi, applicazioni,
data sets, …) di comunicare e cooperare tra loro in modo significativo.
Ciò non deve richiedere particolari sforzi…
Sistemi non-interoperabili
MapGuide™
GIS Viewer
ModelServer ImagerCARIS Internet Server
TerraServer
Orthophoto Browser
Mapquest InternetMapObjects IMS
Spatial Web Broker
OGDI
STAR Next Surf
TIGER Map ServerGLOBE Visualization
GeoMedia™ WebMapMapXtreme™
ELVISNetGIS
PARC Map ViewerInternet Map Server
EnviroMapper
Web Browser
GISDATA
Web Browser
GISDATA
Web Browser
GISDATA
GISDATA
Web Browser Web Browser
GISDATA
Web Browser
GISDATA
Web Browser
GISDATA
Web Browser
GISDATA
Web Browser
GISDATA
Web Browser
GISDATA
Web Browser
GISDATA
Web Browser
GISDATA
Web Browser
GISDATA
GISDATA
Web Browser
GISDATA
Web Browser
GISDATA
Web Browser
GISDATA
Web Browser
GISDATA
Web Browser
GISDATA
Web Browser
GISDATA
X X X X X X X X X X X X X X X X X X X
Web Browser
Possibili servizi sono:
InspireINfrastructure for SPatial InfoRmation in Europe
La visualizzazione delle informazioni
L’overlay di informazioni provenienti da fonti diverse
Analisi spaziali e temporali
Questi servizi devono permettere agli utenti di individuare ed accedere ai dati spaziali di fonti diverse, dal livello locale al livello globale, in modo interoperabile, per scopi diversi
Principi INSPIRE :
I dati geografici devono diventare facili da capire e interpretare in maniera user-friendly tramite tools di visualizzazione
I dati vanno raccolti una sola volta e gestiti dove ciò può essere fatto nel modo più efficace
Deve essere possibile combinare informazioni territoriali provenienti da diverse fonti in Europa e condividerle tra più utenti e applicazioni
Deve essere possibile che informazioni raccolte ad un livello siano condivise a diversi livelli, con informazioni dettagliate per le analisi, generali per scopi strategici
L’informazione geografica necessaria per il buon governo deve esistere ed essere ampiamente accessibile
Deve essere facile individuare quale informazione geografica è disponibile, adatta ai propri scopi e le condizioni secondo cui è possibile acquisirla ed usarla
MetadataDocumentazione necessaria ad un utente per scoprire se una risorsa delle informazioni esiste, chi la possiede, quali sono i termini per accedere ad essa e se corrisponde agli scopi dell'utente
Elementi chiave
CoordinamentoPer gestire il grande numero di data sets derivante da differenti produttori a differenti momenti e per differenti scopi
Core data setsIdentificazione di alcuni dei data sets più importanti che sono di largo uso fra le diverse comunità di utenti
INSPIRE: il modello dell’architettura
Clients
Middleware
ServersFeaturesCoverages
Metadata updateCatalogsGeo-processingand catalog Services
ContentRepositories
Other data
e.g., administrative,statistical, env. reporting
Distributed Geographic reference data
Service chaining:
search, display, access, e-commerce,
….
User applications
Directdataaccess
Access to transformeddata, pictures, maps, reports,
multi-media content
Metadata search and retrieval for data and services
Standard OGC
Nome FunzionalitàWeb Map Service(WMS)
Creazione di mappe da datasets raster e vettoriali. Le mappe generate possono essere visualizzate da un comune web browsers
Web Feature Service(WFS)
Accesso ai dati vettoriali spediti in formato GML (v. 2.1.) al client che può processare questi dati
Web Coverage Service(WCS)
Accesso ai dati raster in vari formati (tiff, gif, jpeg, bmp, bnm) che possono essere ulteriormente elaborati
Web Catalog Service (WCAS)
Gestione e query dei metadati che descrivono i dati e i geo servizi. Permettono la ricerca basata su criteri testuali e spaziali
Web Gazetteer Service (WFS-G)
Servizio che permette la georeferenziazione delle entità geografiche basate su identificatori testuali
Web Terrain Service (WTS)
Creazione di views di dati 3D (es. il DEM) visualizzabili da qualsiasi web browsers
Web Coordinate Transformation Service (WCTS)
Permette la trasformazione di coordinate geografiche da un sistema di riferimento di coordinate a un altro
WMS
Web Map Service
La specifica WMS standardizza il modo in cui i clients richiedono le mappe.
Un Web Map Service (WMS) produce mappe di dati georeferenziati.
La specifica definisce tre operazioni WMS : 1. GetCapabilities fornisce metadati a livello del service, che
sono descrizioni sul contenuto delle informazioni del servizio e sui parametri richiesti accettati;
2. GetMap fornisce una mappa i cui i parametri geospaziali e dimensionali sono ben definiti;
3. GetFeatureInfo (opzionale) fornisce informazioni circa particolari features mostrate sulla mappa.
La condivisione dei dati territoriali
Pubbliche amministrazioni
ed enti governativi Utility & servizi
pubblici
Utenza Comm. & profess.
Enti di ricerca
Associazioni no profit
Cittadini
Risorse
Dati Locali
DatiNazionali Regionali
DatiEuropei
Utenti
Servizi di Discovery
Integrazione tecnica
Politiche dati
Accordi di collaborazione
Specifiche INSPIRE
Richiesta di servizi informativi
Distribuzione di servizi informativi
ISO
Dati forniti ma quasi mai accompagnati dalla documentazione necessaria
Dati non forniti, non perché riservati, ma per la scarsa qualità, incompletezza e disorganizzazione
Accesso e qualità dei dati
Libro verde sull’informazione del settore pubblico: una risorsa fondamentale per l’Europa (1999)
Incremento di accesso viene identificato come cruciale
Data Data Data
ServerServer Server
Web Client
standards, Interfacce
WebMapping Testbed (WMT)
• Studio di fattibilità (Ottobre 1999) sulla connessione di servers e clients eterogenei
• Un test per la collaborazione fra varie compagnie e agenzie
• Ricercare i dati in data servers di varie nazioni, da vari clients
OGC Web Mapping Testbed (WMT)
Dati atmosfericiFornitore A
Dati perl’evacuazione
Fornitore DTopografiaFornitore B
Zone allagate
Fornitore E
ImmaginiFornitore F
WMT distribuiràWMT distribuiràI dati attraversoI dati attraverso
map serversmap serversusando differentiusando differenti
fornitorifornitori
Scenario: evento atmosferico catastroficoScenario: evento atmosferico catastrofico
Dati di censimentoFornitore C
TerraServer - http://terraserver.microsoft.com
Prima del WMTMapQuest - http://www.mapquest.comEPA - http://www.epa.gov/enviro/enviromapper.html
Server 1
Server 2
Server 3
Interoperable Web Mapping
Dati Coverage areeMappe vettorialiFormatiCosti
Dati Coverage areeMappe vettorialiFormatiCosti
Dati Coverage areeMappe vettorialiFormatiCosti
CatalogService
Source: Digital Earth, NASA
Viewer Client: Mappe combinate
Topografia?Idrografia?
Confini?
CatalogService
Interoperable Web Mapping
Server 1
Server 2
Server 3
Server 1: Topografia
Server 2: Idrografia
Server 3: Confini
Source: Digital Earth, NASA
Riferimenti
Basi di dati, Atzeni, Ceri, Paraboschi, Torlone
Appunti del corso di GIS, M. Brovelli
Top Related