Un Algoritmo Efficiente di Cammino Minimo per Sistemi Informativi Territoriali (Estratto)

Università degli Studi di Roma "Tor Vergata"

Facoltà di Ingegneria

Tesi di Laurea Specialistica in Ingegneria Gestionale

UUNN AALLGGOORRIITTMMOO EEFFFFIICCIIEENNTTEE DDII

CCAAMMMMIINNOO MMIINNIIMMOO PPEERR SSIISSTTEEMMII

IINNFFOORRMMAATTIIVVII TTEERRRRIITTOORRIIAALLII

Relatore: Candidato:

Prof. Giuseppe Confessore Giancarlo Volpe

Correlatore:

Ing. Giuseppe Stecca

Anno Accademico 2007/2008

____________________________________________________________________

_________________________________________________________________ 3

SOMMARIO

INTRODUZIONE...................................................................................................... 6

1. SISTEMI INFORMATIVI TERRITORIALI.................................................. 9

1.1. Che cos’è un Sistema Informativo Territoriale................................................ 9

1.1.1. Informazione e sistema informativo ............................................................ 9

1.1.2. Informazione territoriale ............................................................................ 13

1.1.3. Sistema informativo territoriale ................................................................. 17

1.1.4. Breve storia ................................................................................................ 19

1.2. Struttura di un GIS......................................................................................... 21

1.2.1. Modellazione dello spazio: modello Vector e Raster ................................ 21

1.2.2. Topologia ................................................................................................... 26

1.2.3. DBMS e Query .......................................................................................... 28

1.3. Come lavora il GIS ........................................................................................ 32

1.3.1. Overlay....................................................................................................... 33

1.3.2. Buffer ......................................................................................................... 34

1.3.3. Map algebra ............................................................................................... 35

1.4. L’origine dei dati ........................................................................................... 37

1.4.1. Il formato Shapefile ................................................................................... 37

1.4.2. Caratteristiche del database NAVSTREETS®

........................................... 39

1.5. Interfaccia tra dati cartografici e software di ................................................. 41

navigazione ................................................................................................................ 41

1.5.1. Libreria GeoTools...................................................................................... 42

2. IL PROBLEMA DEL CAMMINO MINIMO ............................................... 43

2.1. Descrizione del problema .............................................................................. 43

2.2. Cenni di teoria dei grafi ................................................................................. 44

2.2.1. Definizioni fondamentali ........................................................................... 45

2.2.2. Cammini, cammini orientati e componenti connesse ................................ 47

2.3. Cammini minimi ............................................................................................ 49

2.3.1. Percorso orientato di peso minimo ............................................................ 49

2.3.2. Formulazione matematica del problema.................................................... 50

3. ALGORITMI DI RISOLUZIONE.................................................................. 52

3.1. Analisi della letteratura.................................................................................. 52

____________________________________________________________________

_________________________________________________________________ 4

3.2. Descrizione degli algoritmi implementati...................................................... 56

3.2.1. Algoritmo di Dijkstra................................................................................. 57

3.2.2. Algoritmo A*............................................................................................. 60

3.2.3. Algoritmo di Dijkstra Bidirezionale .......................................................... 65

3.2.4. Algoritmo A* Bidirezionale ...................................................................... 69

3.3. Analisi delle strutture dati.............................................................................. 73

3.3.1. Priority Queue............................................................................................ 75

4. ALGORITMO SOGLIA* ................................................................................ 78

4.1. Motivazioni.................................................................................................... 78

4.2. L’idea di base................................................................................................. 79

4.3. Descrizione dell’algoritmo ............................................................................ 80

4.3.1. Fase di ricerca nella soglia......................................................................... 81

4.3.2. Fase di ricerca verso la destinazione.......................................................... 82

4.4. Ammissibilità dell’algoritmo Soglia*............................................................ 85

4.4.1. Ammissibilità della stima euristica............................................................ 85

4.4.2. Assunzione di consistenza ......................................................................... 87

4.4.3. Ottimalità dell’algoritmo Soglia* .............................................................. 89

5. TEST E RISULTATI........................................................................................ 92

5.1. Descrizione della rete..................................................................................... 92

5.2. Descrizione delle simulazioni........................................................................ 93

5.3. Risultati sperimentali ..................................................................................... 96

5.3.1. Funzione obiettivo DISTANCE.................................................................. 96

5.3.2. Funzione obiettivo TIME ........................................................................... 99

5.4. Considerazioni sul valore della soglia ......................................................... 106

6. CONCLUSIONI E SVILUPPI FUTURI ...................................................... 110

APPENDICE: CODICE JAVA ............................................................................ 117

RINGRAZIAMENTI............................................................................................. 118

BIBLIOGRAFIA ................................................................................................... 119

____________________________________________________________________

_________________________________________________________________ 6

INTRODUZIONE

La pianificazione dei percorsi stradali è un’attività che si è fortemente radicata nella

cultura sociale dei nostri giorni. Questo fenomeno, spinto dal progredire della

tecnologia realizzata per supportarlo, coinvolge svariati ambiti, dal pubblico al

commerciale, al sociale. Basti pensare alla vastissima offerta di navigatori satellitari

presente sul mercato o alla disponibilità, su vari siti web specializzati, di software per

calcolare le rotte ottimali, in base a determinati requisiti. In ambito commerciale, tra

le aziende che si occupano di spedizioni o di servizi logistici, nasce l’esigenza di

pianificare in modo sempre più ottimale le rotte dei mezzi di cui dispongono per

offrire un alto livello di servizio e, soprattutto, per ottimizzare i propri costi; infatti, i

costi del carburante e del personale sono delle voci predominanti nei bilanci di queste

aziende, e cercare di allocare le risorse in modo da ottimizzare tali costi, diventa una

strategia fondamentale, un vantaggio competitivo imprescindibile.

I requisiti fondamentali di un utente generico che richiede la pianificazione di un

percorso sono la correttezza della soluzione e la tempestività con cui tale soluzione è

resa disponibile. In ambito sociale, questi requisiti determinano dei benefici per la

collettività; i servizi sanitari di pronto soccorso, gli enti di pubblica sicurezza e le

associazioni che operano per il soccorso della popolazione in caso di calamità

naturali (terremoti, incendi, frane, ecc..), basano la qualità del loro servizio in

relazione al tempo di risposta ottenuto per pianificare il percorso dalle loro basi

operative fino ai luoghi dove prestare assistenza. Essi contano, anche, sulla sicurezza

di poter disporre in tempo reale di percorsi alternativi, necessari nei casi in cui tali

catastrofi naturali causino il dissesto del suolo e delle infrastrutture stradali.

In questo lavoro di tesi presentiamo un nuovo algoritmo che permette di risolvere in

modo efficiente il problema del cammino minimo in un sistema informativo

territoriale. L’obiettivo alla base dell’implementazione è stato proprio quello di

ridurre il tempo di risposta, avvicinarsi il più possibile ad una modalità real-time, in

maniera tale da poter essere disponile e utile per le numerose applicazioni sopra

descritte. L’algoritmo è il frutto di un’attenta elaborazione delle tecniche classiche

dedite alla risoluzione del problema in esame e dell’introduzione di semplici idee con

____________________________________________________________________

_________________________________________________________________ 7

una solida base teorica, che hanno prodotto i risultati desiderati in termini di

performance. La strategia si basa su un approccio euristico, cioè vengono sfruttate le

informazioni contenute implicitamente nella rete per migliorare la qualità dei dati di

input e, di conseguenza, ottenere una soluzione in minor tempo investigando solo

una piccola parte della rete stradale.

L’algoritmo è stato implementato mediante linguaggio di programmazione Java ed è

stato testato sulla rete stradale del territorio italiano. Sono stati effettuati dei test su

percorsi stradali di lunghezza diversa e le prestazioni sono state confrontate con

quelle degli altri algoritmi descritti. Dall’analisi dei risultati è risultata evidente la

maggiore efficienza dell’esecuzione del nostro algoritmo.

Nel Capitolo 1 verrà introdotto il concetto di sistema informativo territoriale, il GIS

(Geographical Information System), che rappresenta il framework del nostro lavoro e

saranno analizzate le mappe utilizzate per l’esecuzione degli algoritmi. Nel Capitolo

2 sarà descritto il problema generale del cammino minimo e saranno richiamati i

concetti basilari di teoria dei grafi, lo strumento matematico utile ad analizzare e

formulare il problema. La letteratura presente e gli algoritmi classici sviluppati per

risolvere il problema, saranno introdotti nel Capitolo 3, dove descriveremo le

seguenti tecniche: Dijkstra, Dijkstra bidirezionale, A* e A* bidirezionale. Saranno,

poi, studiate le strutture dati utilizzate nell’implementazione degli algoritmi. Nel

Capitolo 4 sarà presentato il nuovo algoritmo introdotto in questa tesi, identificato

nel corso del lavoro con Soglia*, con la descrizione dell’idea base e delle tecniche

utilizzate per la su implementazione. Saranno presentate e dimostrate alcune

proprietà delle funzioni euristiche di stima usate dall’algoritmo e discuteremo

teoricamente i vantaggi in termini di efficienza forniti dall’algoritmo rispetto alle

altre tecniche. Nel Capitolo 5 saranno esposti i risultati dei test effettuati per

l’algoritmo Soglia* sulle mappe a disposizione, e confrontati con le prestazioni degli

altri algoritmi descritti. Le simulazioni sono state condotte considerando due funzioni

obiettivo, la distanza e il tempo, e i risultati analizzati in termini di tempo di

esecuzione dell’algoritmo e di vastità dell’area visitata. Nel Capitolo 6 saranno

esposte le conclusioni sul lavoro svolto e gli sviluppi futuri ipotizzati.

____________________________________________________________________

_________________________________________________________________ 8

Il presente lavoro di tesi è stato svolto presso l’ITIA (Istituto di Tecnologie

Industriali e Automazione) del CNR, nel comprensorio dell’Area della Ricerca di

Roma 1 con sede a Montelibretti, Roma. Il lavoro fa parte di un progetto svolto in

collaborazione con la società di ingegneria ACT SOLUTIONS, riguardante lo studio

e l’implementazione di un sistema di pianificazione di rotte stradali.

____________________________________________________________________

_________________________________________________________________ 110

CAPITOLO 6

CONCLUSIONI E SVILUPPI FUTURI

Il presente lavoro di tesi è stato finalizzato all’analisi del problema di determinare il

cammino ottimo in una rete territoriale. L’algoritmo Soglia* è una nuova

implementazione basata su tecniche euristiche che riduce efficientemente lo spazio di

ricerca degli algoritmi classici. Gli esperimenti hanno mostrato che l’algoritmo

ottiene le prestazioni migliori considerando come parametri di valutazione

l’estensione dell’area visitata durante la ricerca e il tempo di esecuzione degli

algoritmi. I confronti sono stati effettuati con tecniche algoritmiche sviluppate nel

corso degli anni con l’intendo di migliorarne l’efficienza, a partire

dall’implementazione classica di Dijkstra. I miglioramenti sono stati apportati con le

strategie di ricerca bidirezionali, euristiche e una combinazione delle precedenti.

L’algoritmo presentato in questa tesi sfrutta queste tecniche introducendo alcune

modifiche nella scelta della strategia usata per alternare le ricerche bidirezionali e

sfruttando tale strategia per ottenere delle funzioni euristiche di stima migliori, più

informate, che concorrono a rendere l’esecuzione dell’algoritmo più efficiente, nel

senso che, per individuare la soluzione ottima, si visita un’area di ricerca molto

ristretta. L’introduzione del concetto di soglia ha permesso di ottenere questi

benefici, dimostrando l’ammissibilità della funzione euristica ad essa associata nella

ricerca in direzione forward.

Abbiamo visto come il tempo di esecuzione di un algoritmo di cammino minimo

dipenda dal numero di nodi scanditi e visitati durante la ricerca, e ciò ha confermato

il fatto che l’algoritmo Soglia* ha ottenuto le prestazioni migliori anche secondo

questo parametro, per tutte le tipologie di percorso simulate.

Tra i due criteri di valutazione utilizzati, si è posta l’attenzione maggiore sul valore

del Ratio, la misura di efficienza data dalla differenza tra il numero di nodi scanditi

durante la ricerca e il numero di nodi sul percorso ottimo, proprio perché il tempo di

esecuzione (Run-Time) è funzione di questo valore; la condizione desiderabile per un

algoritmo di cammino minimo è che questo valore sia uguale ad 1, cioè si

scandiscono esattamente tutti e soli i nodi del percorso ottimo. Per ottenere questa

____________________________________________________________________

_________________________________________________________________ 111

qualità bisognerebbe agire con le tecniche euristiche migliorando utilizzando una

funzione di stima ottima. Seguendo questa strada, si può intuitivamente visualizzare

l’area di ricerca come un corridoio attorno al cammino ottimo, che si stringe sempre

di più attorno ad esso man mano che il valore di Ratio si avvicina 1. L’algoritmo

Soglia* fornisce proprio una soluzione che riduce l’area di questo corridoio. Il

miglioramento è notevole se si pensa all’andamento ottenuto da altri algoritmi: ad

esempio, Dijkstra visita un’area approssimabile ad un cerchio centrato nell’origine e

con un raggio uguale alla distanza o-d; Dijkstra bidirezionale migliora, è

approssimabile a due cerchi che si incontrano, centrati nell’origine e la destinazione.

Le tecniche euristiche A* e A* bidirezionale rendono più visibile l’idea del corridoio

intorno al cammino.

Considerando il percorso Ciampino-Velletri, utilizzato nei test, con distanza aerea di

19 Km e percorso ottimo di 23 Km, visualizziamo nelle figure successive l’area di

ricerca reale ottenuta dalle simulazioni degli algoritmi descritti.

Figura 6.1: Area visitata dall’algoritmo di Dijkstra

____________________________________________________________________

_________________________________________________________________ 112

Figura 6.2: Area visitata dall’algoritmo di Dijkstra bidirezionale

Le immagini sono state ottenute do ogni simulazione degli algoritmi, memorizzando

l’area man mano visitata e visualizzandola su file KML tramite il supporto

dell’immagine satellitare fornita da GOOGLE EARTH. La sequenza di strade che

formano il percorso visualizzato in rosso è l cammino ottimo individuato.

Queste immagini rendono l’idea dell’efficienza degli algoritmi in termini del numero

di nodi visitati durante la ricerca.

Le Figure 6.1 e 6.2 mostrano lo spazio di ricerca degli algoritmi Dijkstra e Dijkstra

bidirezionale; si vedono chiaramente i fenomeni ipotizzati in precedenza: dei cerchi

centrati nell’origine, e nell’origine e nella destinazione che si incontrano. Osservando

la 6.1 si vede la vastità dello spazio inutilmente ricercato da Dijkstra, nelle zone

completamente opposte alla destinazione; risulta essere altamente inefficiente.

____________________________________________________________________

_________________________________________________________________ 113

Mentre in Figura 6.2 vediamo già i primi benefici dovuti alla tecnica di ricerca in due

direzioni: viene visitata anche la zona tutto intorno alla destinazione, ma l’area totale

investigata è ridotta di molto.

Figura 6.3: Area visitata dall’algoritmo A*

Le Figure 6.3 e 6.4 mostrano chiaramente il principio su cui si basano le tecniche di

ricerca euristica: la ricerca è condotta direttamente verso la destinazione (e verso

l’origine), concentrandosi sull’area compresa tra i due punti di partenza e di arrivo,

sfruttando le informazioni date dalla topologia della rete. Prende forma il concetto di

corridoio intorno al percorso ottimo, che si assottiglia ulteriormente passando da A*

ad A* bidirezionale. La parte di territorio inutile ai fine della ricerca del percorso

ottimo, quella sul territorio della città di Roma, è stata ignorata.

____________________________________________________________________

_________________________________________________________________ 114

Figura 6.4: Area visitata dall’algoritmo A* bidirezionale

Infine, in Figura 6.5 è visualizzata l’area investigata dall’algoritmo Soglia*. In

questo caso il corridoio aderisce in modo quasi totale all’andamento del percorso

ottimo e l’aerea totale risulta essere molto ridotta. La differenza è netta, nonostante il

percorso analizzato è relativamente breve, e questo fa comprendere ancora meglio

l’efficienza di questa tecnica se pensiamo a cosa potrebbe accadere considerando un

percorso più lungo dove gli altri algoritmi visiterebbero un’area inutilmente vasta.

Analizzando la figura, notiamo intorno alla destinazione, Velletri, una piccola area

circoscritta che è il limite di ricerca relativo al valore della soglia. Se confrontiamo

con le figure relative alle tecniche euristiche il tratto di corridoio intorno all’origine,

risulta chiaramente la dimensione molto ridotta di quello generato da Soglia*; questo

è giustificato dai risultati teorici presentati in precedenza, dove il l’utilizzo di una

____________________________________________________________________

_________________________________________________________________ 115

stima euristica della distanza “più informata” produce un beneficio in termini di nodi

visitati dalla ricerca.

Figura 6.5: Area visitata dall’algoritmo Soglia*

Concludendo, l’algoritmo presentato in questo lavoro di tesi ha fornito una soluzione

efficiente ad uno dei problemi di ricerca operativa più classici e più utilizzato in

applicazioni del mondo reale, il problema del cammino minimo. L’algoritmo è

particolarmente flessibile e può essere direttamente impiegato in applicazioni relative

alla pianificazione di rotte stradali all’interno di reti reali che costituiscono un

sistema informativo territoriale.

____________________________________________________________________

_________________________________________________________________ 116

Un primo miglioramento che può essere apportato all’algoritmo, consiste

nell’individuazione teorica del valore di soglia ottima da utilizzare nelle simulazioni.

Relativamente a questo problema, è stato effettuato uno studio solo sperimentale che

ha fornito un range di valori possibili in cui individuare la soglia ottima. Sebbene

tutti i valori interni al range garantiscono risultati migliori degli altri algoritmi,

individuare il valore di soglia ottima in modo teorico produrrebbe ulteriori benefici.

Un’ulteriore sviluppo riguarda l’integrazione dell’algoritmo con le tecniche di

preprocessing, essendo questo l’approccio verso il quale si sta focalizzando la ricerca

riguardo al problema del cammino minimo.

La tecnica si basa sulla disponibilità ulteriore di memoria, dove vengono

memorizzati i risultati del preprocessing, cioè i percorsi minimi precalcolati tra punti

particolari di una rete. L’algoritmo Soglia* può essere utilizzato sia nella fase di

preprocessing, diminuendo il tempo di esecuzione che rappresenta in questa fase una

grossa inefficienza, e sia nella fase di risposta alla query che viene effettuata in

tempo reale.

L’aumento effettivo di qualità della soluzione e di efficienza dell’esecuzione, indotti

da questa tecnica, dovrebbero essere notevoli.

Un Algoritmo Efficiente di Cammino Minimo per Sistemi Informativi Territoriali (Estratto)

Documents

Transcript of Un Algoritmo Efficiente di Cammino Minimo per Sistemi Informativi Territoriali (Estratto)