Visual Exploration of Open Data

62
Visual exploration of Open Data Una proposta di applicazione dei princìpi di Data Visualization ai dati aperti STUDENTI Emanuela Giovannoni Laura Pippinato RELATORE Christian Racca CO-RELATORE Lorenzo Benussi

description

The project proposes a Web interface based on Data Visualization for Open Data portals, to improve the user experience in the data exploration process. Thesis project by Emanuela Giovannoni e Laura Pippinato, Graphic Design Virtual - Polytechnic of Turin, 2012

Transcript of Visual Exploration of Open Data

Page 1: Visual Exploration of Open Data

Visual explorationof Open Data

Una proposta di applicazione dei princìpi di Data Visualization

ai dati aperti

STUDENTI

Emanuela GiovannoniLaura Pippinato

RELATORE

Christian Racca

CO-RELATORE

Lorenzo Benussi

Vis

ual

Exp

lora

tio

n o

f O

pe

n D

ata

Page 2: Visual Exploration of Open Data

| UNIVERSITÀ

1° Facoltà di ArchitetturaA.A. 2011 / 2012

| OGGETTO

Tesi di Laurea in Progetto Grafico e Virtuale

| RELATORE

Christian Racca

| CO-RELATORE

Lorenzo Benussi

| STUDENTE

Emanuela GiovannoniLaura Pippinato

| CONTENUTI, IMPAGINAZIONE E

PROGETTO GRAFICO

Emanuela [email protected]

Laura [email protected]

| STAMPA E RILEGATURA A CURA DI

Legatoria MontiVia Gen. Perotti 40Grugliasco (TO)

| LICENZA

Visual Exploration of Open Data di Emanuela Giovannoni e Laura Pippinato è distribuito con licenza Creative Commons Attribuzione 3.0

Page 3: Visual Exploration of Open Data

3

Page 4: Visual Exploration of Open Data

4

Lo spunto iniziale per la stesura di questa trattazione nasce a seguito di una lezione universitaria durante il corso Materiali e Modelli III al Politecnico di Torino.La tematica Open Data, materia inesplorata fino a quel momento, ha suscitato da subito un forte e spontaneo interesse verso l’argomento: è stato infatti immediatamente chiaro il ruolo che essa potrebbe adempiere nel contesto contemporaneo, nonché le conseguenze che potrebbero derivare dalla sua diffu-sione, oggi ancora non così estesa.

Le conoscenze accumulate in campo grafico hanno inoltre portato a porre in relazione a questo un altro rilevante ambito di approfondimento, associabile, non solo per assonanza, al tema Open Data: la Data Visua-lization. Anche in questo caso ci si trova davanti a un soggetto che presenta potenzialità tanto grandi, quanto al mo-mento sottovalutate, nonostante essa viva oggigiorno il momento di massima popolarità.

Entrambi i campi hanno come oggetto d’interesse i dati, l’uno in senso di apertura, di condivisione, di riuso e di estrazione di valore grazie al libero accesso delle informazioni; l’altro invece, in senso più prettamen-te funzionale, utilizza i dati come base per ottenere rappresentazioni che, al di là dell’aspetto estetico, ne permettono una comprensione più immediata.

Se gli Open Data oggi non risultano così conosciuti e diffusi come meriterebbero, a causa soprattutto della lentezza di aziende e istituzioni ad aderire a questo modello, la Data Visualization sta prendendo invece sempre più piede, senza che però se ne apprezzi in modo profondo le caratteristiche e gli obiettivi. Entrambi i campi risultano quindi bisognosi di un’o-perazione di rivalutazione che possa proporre nuove soluzioni e risolvere i loro punti più deboli.

L’intento focale di questa pubblicazione uno scam-bievole arricchimento delle due tematiche tramite l’applicazione dell’una all’altra.

Introduzione

Page 5: Visual Exploration of Open Data

5

Nello specifico si propone di utilizzare le possibili-tà funzionali della Data visualization applicandole al contesto Open Data, in modo tale da elevare, da un lato, la Datavis a un vero e proprio strumento di analisi, mostrandone le capacità in un contesto sensibile, e dall’altro rendere più intuitiva la navigazione degli Open Data, al fine di facilitare l’accesso alle informa-zioni contenute.

E’ ovvio quindi che per perseguire questo obiettivo si sia scelto nel concreto di sviluppare il progetto sulla modalità principale attraverso cui i dati aperti vengono maggiormente fruiti: i portali Open Data. Tra quelli esistenti, si è scelto quindi di prendere in esa-me il portale dati.piemonte.it che, per le sue caratteri-stiche di maturità nel panorama italiano, rappresenta, la solida base per lo sviluppo della visualizzazione.

Page 6: Visual Exploration of Open Data
Page 7: Visual Exploration of Open Data

IL PROGETTO

Page 8: Visual Exploration of Open Data

8

Lo scopo che si prefigge questa trattazione è sfruttare le potenzialità

della Data Visualization, applicandola nello specifico al contesto Open Data.

Questo permetterà da un lato di ottenere quelle funzionalità specificate dal

mantra di Shneidermann, raggiungibili solo considerando la visualizzazione

dei dati un vero e proprio strumento di analisi; dall’altro lato si potrebbe

migliorare la consultazione degli Open data, rendendoli più facilmente

navigabili e analizzabili, incentivandone l’interesse e il dialogo. Per compiere

questo passaggio, in concreto, si è scelto di utilizzare come base per le

considerazione e lo sviluppo progettuale il mezzo con cui i dati aperti

vengono resi pubblici: i portali Open Data.

Sfruttare

le funzioni

potenzial i del la

Data Visual izat ion

appl icandola agl i

Open Data

Arr icchire le

due tematiche:

1 E levare la Datavis

a strumento di

anal is i grazie a i dat i

apert i ;

2 Faci l i tare accesso

e navigazione degl i

Open Data;

Ut i l izzare forme

di Datavis per

la r icerca e

l ’esplorazione

del le informazioni

sui portal i Open

cosa perchè come

Page 9: Visual Exploration of Open Data

9

Di seguito si riporta un’analisi approfondita del sito

dati.piemonte.it ( www.dati.piemonte.it ), scelto come

base per sviluppare una una proposta di applicazione

di elementi Datavis a un portale di ricerca Open

Data. La scelta di esaminare il sito piemontese è

stata dettata dalla rilevanza che esso ha assunto,

essendo il primo in ordine temporale nel panorama

italiano e quindi considerato un consolidato punto di

riferimento.

L’analisi della piattaforma è suddivisa in 2 sezioni.

La sezione A contiene e esamina gli aspetti che

ne costituiscono la filosofia e la base concreta,

relavamente all’archivio dei dati e agli utilizzatori,

aspetti sui quali non si sono effettuate modifiche

in fase progettuale, essendo sostanzialmente le

premesse su cui costruire la proposta.

La sezione B contiene invece le specifiche riguardo

struttura organizzativa dei dati e funzionalità del

portale dati.piemonte.it, che sono le aree principali in

cui applicare la Data Visualization e quindi operare le

modifiche.

Il caso

dati.piemonte

Page 10: Visual Exploration of Open Data

10

Sez. A

COS’È DATI.PIEMONTE.IT

PARTE 1 / 4

Dati.piemonte.it è il portale promosso dalla Regione Piemonte, a disposizione di tutti gli enti della PA piemontese, per la condivisione dei dati e delle informazioni pubbliche. Rappresenta il primo esempio italiano sul tema della disponibilità dei dati pubblici, che ha dato concreta risposta alla Direttiva europea 2003/98/CE e che si pone oggi come punto di riferimento sia per la consultazione dei dati riusabili delle PA piemontesi, sia come punto di incontro della comunità degli utenti.Il portale è on-line dal 28 maggio 2010 e solo nel primo mese di vita ha ottenuto 7.000 visite.

A CHE COSA SERVE

PARTE 2 / 4

Il progetto nasce per dare attuazione a quanto previsto a livello comunitario in materia di riutilizzo delle informazioni pubbliche. L’Unione Europea infatti attribuisce al riutilizzo delle informazioni del settore pubblico un ruolo fondamentale, sia per lo sviluppo economico e sociale del territorio, sia per la diffusione delle nuove tecnologie digitali fra enti pubblici, imprese e cittadini. Il portale rappresenta un punto preferenziale di accesso per il mondo privato ai dati dell’amministrazione pubblica: la modalità Open con cui sono resi disponibili questi dati permette di sfruttarne il pieno potenziale, costituendo così un’immensa occasione di sviluppo. A livello della PA piemontese i benefici potenziali sono notevoli, in relazione alla dimensione, in termini numerici, del patrimonio informativo raccolto.

Page 11: Visual Exploration of Open Data

11

Sez. A

ASPETTO ECONOMICO

Sviluppo economico e sociale del territorio

| PROPOSITI PREFISSATI

ASPETTOTECNOLOGICO

Diffusione tecnologie digitali tra enti pubblici

ASPETTOCULTURALE

Promozione della filosofia Open

| INTEFACCIA PORTALE

Page 12: Visual Exploration of Open Data

12

A CHI È RIVOLTO

PARTE 3 / 4

Il portale si rivolge a tutti gli operatori pubblici, privati o commerciali alla ricerca di dataset specifici per esplorarli e/o riutilizzarli a scopo commerciale o non commerciale. L’obiettivo è quello di stimolare un nuovo rapporto fra pubblico e privato e di favorire lo sviluppo di iniziative imprenditoriali.

I DATI

PARTE 4 / 4

I dati sono affidabili, imparziali, completi e raccolti nel lungo periodo.Attualmente sono 327 quelli disponibili su dati.piemonte.it; in aggiunta si contano i 27 raccolti dai portali federati e i 243 del portale Ckan.Il caricamento di nuove informazioni è comunque costantemente in corso.I dati sono stati rilasciati da 16 enti, per un totale di 34 unità organizzative. Il patrimonio è strutturato in formati diversi: dai dati non strutturati, come le raccolte legislative, o semistrutturati, come i dati catalografici delle raccolte culturali, ai dati strutturati derivanti da basi dati gestionali e decisionali, ai dati geografici.La maggior parte dei dati si trova nel formato originale con cui è stato realizzato o archiviato per la Regione Piemonte.Inoltre, nella sezione RDF Data, è possibile accedere alla pagina nella quale si trovano i dati in formato RDF, che rappresentano l’inizio di un percorso di pubblicazione di una quantità via via crescente di informazioni secondo lo standard Linked Data.

Sez. A

Page 13: Visual Exploration of Open Data

13

RICERCA

| USER CASES

SVILUPPO

RICERCATORI

Sviluppo di

analisi o

pubblicazioni;

cultori del tema

Open

***assiduo

STUDENTI

Stesura di

ricerche

in ambito

accademico

*sporadico

GIORNALISTA

Verifica delle

affermazioni

tramite i dati

**frequente

SVILUPPATORI

Creazione di

nuovi servizi

utilizzando

mashup di

dati

***assiduo

DESIGNERS

Realizzazioni

di infografiche

e/o datavis

**frequente

* frequenza di consultazione

FORMATO: CC0 CCBY

| DATI PER ENTE

Regione Piemonte Unioncamera

Fossanese

Settimo

Borgomanero GalliateVerbania Cuorgnè

Forno Canavese

Altri

327dataset

Sez. A

Page 14: Visual Exploration of Open Data

14

POLITICA

INFO SCIENTIFICA

E RICERCA

COME SONO ORGANIZZATI I DATASET

PARTE 1 / 2

I dati sono organizzati in 13 categorie stilate autonomamente dallo staff di dati.piemonte.it. Lo stesso dato può essere inserito dall’ente proprietario anche in due o più categorie differenti. Al momento del caricamento del dato è possibile specificare eventuali sottocategorie, visualizzabili solo all’apertura della scheda tecnica dello stesso e non considerati nei filtri di ricerca.

AMBIENTE

E METEO

AGRICOLTURA,

TERRITORIO E PESCA

CULTURA

ECONOMIA

INFO GEOGRAFICHE

LEGALI

RISORSE NATURALI

SOCIALE

TRAFFICO E

TRASPORTI

TURISMO E

TEMPO LIBERO

FORMAZIONE

Sez. B

Page 15: Visual Exploration of Open Data

15

| NUMERO DATI E SOTTOCATEGORIE

37 dataset

/ .../ dati imprese agr. / uso del suolo/ edilizia

72 dataset

/ .../ bandi e gare / documenti/ istituzioni/ verbali assemblee

60 dataset

/ .../ artigianato / dati imprese/ industria e comm./ info finanziarie

45 dataset

/ .../ alberghi / eventi e intr./ sport

34 dataset

/ .../ reti viarie e di trasp.

29 dataset

/ .../ info biologiche/ info geologiche

26 dataset

/ .../ atti di conferenze / scuole

20 dataset

/ .../ dati idrografici

20 dataset

/ .../ catasto / confini politici/ dati spaziali/ topografia

17 dataset

/ .../ dati demografici / indagini settoriali/ statistiche lavoro

12 dataset

/ .../ monumenti e siti / musei e mostre/ risorse bibliotecarie/ altri archivi pubblici

1 dataset

/ .../ iniziative finan.

0 dataset = 72

numero dataset

Sez. B

Page 16: Visual Exploration of Open Data

16

FLUSSO DEL DATO

PARTE 2 / 2

Il portale permette di scaricare dati (o documenti contenenti dati pubblici) prodotti dalle Pubbliche Amministrazioni nell’ambito delle proprie attività istituzionali. Si tratta di dati o documenti che, dopo una serie di verifiche (fra cui quella in materia di privacy) possono essere diffuse dalla PA in un’ottica di riuso. Il portale si fonda sui cataloghi di metadati in cui sono censite le basi dati e gli applicativi degli enti.

/ Gli enti proprietari dei dati possono effettuare l’upload dei loro dati tramite un semplice form, a cui possono accedere previa registrazione. I campi da compilare sono liberi e rappresentano le informazioni che andranno a formare la scheda tecnica del dato. Nel dettaglio questi campi sono: nome dataset, descrizione, formato, licenza, argomento (categorizzazione), parole chiave, data di creazione. L’ente ha in seguito la possibilità di aggiornare il dato, se esso lo necessita, o di caricare revisioni o altre versioni.

/ Le principali funzionalità disponibili per gli utenti sono sostanzialmente quelle di download dei dati e di social networking: ricerca dei dati, accesso ai set di dati, possibilità di lasciare feedback sulla qualità dell’informazione fornita, forum/RSS, news su filosofia e iniziative Open, servizio “l’esperto risponde”.

/ La ricerca dei dati può essere effettuata tramite ricerca semplice, ricerca avanzata, che permette di utilizzare dei filtri, oppure ricerca estesa nei portali federati con dati.piemonte.it. I risultati della ricerca si presentano sotto forma di elenco, con i nomi del dataset in evidenza e con la possibilità di osservare con un click una preview con alcune delle caratteristiche principali del dataset. Una volta trovato il risultato di interesse, è possibile visualizzare la relativa scheda di dettaglio con tutte le informazioni, scheda tecnica e il link per effettuare il download. Per ogni scheda tecnica è possibile votare la qualità del dato e lasciare un commento, oppure fare click sui dati correlati proposti.

/ Nella versione precedente del sito era presente una visualizzazione base, esplora, che permetteva di muoversi all’interno della classificazione scelta per i dati. Si effettuavano una serie di click che permettevano di entrare in profondità, di categoria in sottocategorie (in certi casi le sottocategorie erano anche di due livelli gerarchici), fino a scoprire i dati in esse contenuti. Tale visualizzazione risultavano comunque piuttosto rigida e poco intuitiva; al momento non è stata riproposta nella nuova versione della piattaforma.

Sez. B

Page 17: Visual Exploration of Open Data

17

Sez. B

Login

Form

Carica un dataset Carica un altro dataset

Carica una nuova versione

Ricerca per parola

Ricerca per filtri

Estendi ricerca

Dati in evidenza

Digita parola

Elenco

Apri preview

Scheda dato

Scegli filtri

Digita parola Portale

Ckan

Download

Vota

Commenta

Dati correlati

| POSSIBILI AZIONI ALL’INTERNO DEL PORTALE

ENTE

Requisito iniziale: REGISTRAZIONE

Digita parola

UTENTE

Requisito iniziale: NESSUNO RICHIESTO

Page 18: Visual Exploration of Open Data

18

1 2 3

4 5 6 7

8 9 10

Soluzione

progettuale

L’analisi della soluzione progettuale è

suddivisa in due sezioni: la sezione C espone

i cambiamenti strutturali che si propongono

per ottenere gli obiettivi definiti, ovvero la

riorganizzazione della classificazione dei dati

e le nuove funzioni implementate; la sezione

D infine riporta tutte le caratteristiche grafiche

che permettono di ottenere tali migliorie.

Page 19: Visual Exploration of Open Data

19

Page 20: Visual Exploration of Open Data

20

COME SONO ORGANIZZATI I DATASET

PARTE 1 / 2

Da un punto di vista organizzativo/strutturale la proposta in oggetto comporta l’adozione del thesaurus Eurovoc, come modello standard internazionale per l’organizzazione interna di categorie e sottocategorie.

Eurovoc è un thesaurus multilingue e multidisciplinare specificamente concepito per il trattamento dell’informazione documentaria delle istituzioni dell’Unione europea.

E’ sostanzialmente un vocabolario controllato che comprende settori sufficientemente ampi per inglobare ottiche comunitarie e nazionali: permette quindi la normalizzazione terminologica dei vocabolari di indicizzazione, consentendo un’efficace gestione dei documenti e nel contempo una maggiore precisione nella ricerca degli stessi.

La funzione del thesaurus è di eliminare le ambiguità, garantendo che ogni concetto sia situato in un contesto tale che il suo significato risulti univoco. Ogni concetto infatti viene circoscritto ad un solo significato, all’interno del settore e del microthesaurus cui appartiene, dalle sue relazioni semantiche, dalle informazioni aggiuntive (note operative, di definizione o storiche), nonchè dai suoi equivalenti nelle altre lingue di Eurovoc; il multilinguismo di questo thesaurus comporta infatti la definizione di equivalenze linguistiche tra concetti identici espressi in lingue diverse, permettendo l’indicizzazione dei documenti nella lingua del documentarista e la ricerca nella lingua dell’utente.

Sez. C

Page 21: Visual Exploration of Open Data

21

Sez. C

Thesaurus multidisciplinare dell’Unione Europea

VANTAGGI

/ Normalizzazione terminologica

/ Multilinguismo, equivalenze linguistiche

Precisione nella categorizzazione e nella ricerca documentaria

Indicizzazione nella lingua di documentalista e utente

| L’EUROVOC

EUROVOC PROGETTO

Settori

Microthesauri

Termini

Relazioni tra termini

Nomi dei paesi

Categorie

Sottocategorie

Tag, parole chiave

Relazioni tra dataset;

Lingua

Organizzazione internazionali / Comunità europee / Produzione e ricerca / Scienze / Diritto / Agricoltura e pesca / Geografia / Industria / Finanze / Impresa e concorrenza / Agroalimentare / Energia / Scambi commerciali / Vita economia / Relazioni intern. / Vita politica / Educazione Questioni sociali / Occupazione e lavoro / Trasporto

STRUTTURA

NUOVE CATEGORIE

diventano

Page 22: Visual Exploration of Open Data

22

FLUSSO DEL DATO

PARTE 2 / 2

Anche se le finalità e gli obiettivi descritti per il portale dati.piemonte.it rimangono i medesimi anche nella proposta progettuale, il sistema strutturale proposto permette di ottenere funzionalità aggiunte, in particolare la capacità di muoversi in maniera libera e dinamica all’interno della classificazione in cui sono distribuiti i link ai dataset.

/ L’elemento chiave per ottenere una classificazione coerente si esprime concretamente con un form destinato agli enti proprietari. I campi da compilare nello specifico sono: titolo dato; titolo abbreviato; scelta categoria di classificazione; scelta sottocategoria; descrizione/abstract; parole chiave; formato; licenza; usabili; aggiornamento.

/ Le principali funzionalità disponibili per gli utenti sono sostanzialmente quelle di download dei dati e di social networking: ricerca dei dati, accesso ai set di dati, possibilità di lasciare feedback sulla qualità dell’informazione fornita, forum/RSS, news su filosofia e iniziative Open, servizio “l’esperto risponde”.

/ La ricerca dei dati può essere effettuata tramite ricerca semplice, ricerca avanzata, che permette di utilizzare dei filtri, oppure ricerca estesa nei portali federati con dati.piemonte. I risultati della ricerca si presentano sotto forma di elenco, con i nomi del dataset in evidenza e con la possibilità di osservare con un click una preview con alcune delle caratteristiche principali del dataset. Una volta trovato il risultato di interesse, è possibile visualizzare la relativa scheda di dettaglio con tutte le informazioni, scheda tecnica e il link per effettuare il download. Per ogni scheda tecnica è possibile votare la qualità del dato e lasciare un commento, oppure fare click sui dati correlati proposti.

/ Nella versione precedente del sito era presente una visualizzazione base, “esplora”, che permetteva di muoversi all’interno della classificazione scelta per i dati. Si effettuavano una serie di click che permettevano di entrare in profondità, di categoria in sottocategorie (in certi casi le sottocategorie erano anche di due livelli gerarchici), fino a scoprire i dati in esse contenuti. Tale visualizzazione risultavano comunque piuttosto rigida e poco intuitiva; al momento non è stata riproposta nella nuova versione della piattaforma.

Sez. C

Page 23: Visual Exploration of Open Data

23

Sez. C

Visualizzazione

Scheda dato

Filtra categ,

Scegli filtri

Download

Filtra per parola

Visualizza categ.

Visualizza sottocat.

Visualizza per categoria

Tutti i dati della stessa sotttocat.

| POSSIBILI AZIONI ALL’INTERNO DEL PORTALE

UTENTE

Requisito iniziale: NESSUNO RICHIESTO

Ricerca per parola

Ricerca per filtri

Esplora

Digita parola

Visualizza per enti

sottocategoria

Suggerimenti

ente

Login

Form

Carica un dataset Carica un altro dataset

Carica una nuova versione

ENTE

Requisito iniziale: REGISTRAZIONE

Page 24: Visual Exploration of Open Data

24

1 2 3

4 5 6 7

8 9 10

Interfaccia

Page 25: Visual Exploration of Open Data

25

Sez. D

Page 26: Visual Exploration of Open Data

26

1 2 3

4 5 6 7

8 9 10

Soluzione

progettuale

Questa è la proposta grafica di interfaccia per

supportare la ricerca di dataset all’interno di

portali Open Data.

I dati, come già precedentemente descritto,

sono organizzati secondo l’Eurovoc, il

modello di thesaurus riconosciuto a livello

internazionale.

L’interfaccia si apre con una videata suddivisa in

tre macro aree:

/ ricerca avanzata (Avanzate, a sinistra)

/ ricerca per parola (Cerca posto al centro)

/ esplorazione libera (Esplora, a destra)

Page 27: Visual Exploration of Open Data

27

Sez. D

Page 28: Visual Exploration of Open Data

28

1 2 3

4 5 6 7

8 9 10

Cliccando all’interno della sezione “Ricerca per

parola”, ossia nell’area delimitata dal cerchio

posto al centro dell’interfaccia, è possibile

digitale la parola che si ritiene più opportuna

per iniziare la ricerca di specifiche informazioni.

Una funzionalità dell’interfaccia prevede la

comparsa di alcuni suggerimenti mentre si sta

componendo la parola da ricercare: vengono

così mostrate le parole chiave che sono già

presenti nell’Eurovoc.

Soluzione

progettuale

Page 29: Visual Exploration of Open Data

29

La presenza di suggerimentipermette all’utente di essere maggiormente indirizzato verso l’argomento ricercato,suggerendo parole chiave catalogate al’interno della struttura.

Sez. D

Page 30: Visual Exploration of Open Data

30

1 2 3

4 5 6 7

8 9 10

L’utente può decidere se usufruire dei

suggerimenti, cliccando su una delle parole

chiave mostrate nell’elenco, oppure se

ricercare dati inserendo una specifica parola.

In tale caso, dopo aver digitato il nome, è

necessario premere il tasto Invio, per avviare

così la ricerca.

Il caricamento della pagina successiva è

preceduto, come mostra l’immagine sotto,

da una piccola animazione di download che

permette, tramite l’utilizzo di un espediente

grafico, di visualizzare le quantità di dataset

relative alla parola ricercata presenti nelle

differenti categorie.

Soluzione

progettuale

Page 31: Visual Exploration of Open Data

31

Sez. D

Page 32: Visual Exploration of Open Data

32

1 2 3

4 5 6 7

8 9 10

L’animazione di interconnessione tra le due

pagine dura appena il tempo per mostrare

la corrispondenza tra colore/categoria e la

quantità di dataset: la lunghezza dell’arco

indica la quantità di dati relativi alla parola

ricercata contenuti in quella sottocategoria. Il

numero dei dataset e il nome della categoria

sono esplicitati per esteso nel testo al di sotto

della linea all’interno della circonferenza di

ricerca.

Soluzione

progettuale

Page 33: Visual Exploration of Open Data

33

Sono mostrate tutte le categorie in cui la parola ricercata compare; la lunghezza dell’elemento grafico fa intuire immediatamente la suddivisione strutturale.

In questo caso, la categoria corrispondente a verde chiaro rappresenta quella che contiene al suo interno più dataset inerenti alla parola “acqua”.

Sez. D

Page 34: Visual Exploration of Open Data

34

1 2 3

4 5 6 7

8 9 10

La visualizzazione a lato rappresenta la

schermata dei risultati di ricerca.

I dataset sono rappresentati come piccoli

cerchi colorati a seconda della categoria e

compaiono all’interno di 2 anelli.

A seconda della loro collocazione all’interno

di essi, si indica l’affinità del singolo dataset

con la parola ricercata: i dataset disposti

all’interno del primo anello, quello più vicino

all’anello centrale delle categorie, sono quelli

maggiormente inerenti alla parola ricercata.

Soluzione

progettuale

Page 35: Visual Exploration of Open Data

35

Sez. D

Page 36: Visual Exploration of Open Data

36

1 2 3

4 5 6 7

8 9 10

I dataset sono rappresentati quindi

tramite piccoli cerchi colorati in maniera

differente a seconda della categoria a cui

corrispondono. Altre due caratteristiche sono

rappresentate graficamente: la qualità, data

dalla combinazione tra il tipo di formato e di

licenza, che viene rappresentato attraverso

un anello esterno; l’aggiornamento,

rappresentato con un punto bianco al centro

del cerchio che definisce il il dataset.

È possibile interagire con la visualizzazione

modificandone alcuni aspetti grafici come

dimensione del carattere oppure grandezza

dell’immagine.

Soluzione

progettuale

Page 37: Visual Exploration of Open Data

37

Sono mostrate tutte le categorie in cui la parola ricercata compare; la lunghezza dell’elemento grafico fa intuire immediatamente la suddivisione strutturale.

In questo caso la categoria corrispondente a verde chiaro rappresenta quella che contiene al suo interno più dataset inerenti alla parola “acqua”.

Sez. D

Page 38: Visual Exploration of Open Data

38

1 2 3

4 5 6 7

8 9 10

È possibile visualizzare il titolo del dataset

semplicemente posizionando il cursore sopra

il cerchio che lo rappresenta.

In questa posizione inoltre è possibile

attingere a ulteriori informazioni: sul lato

sinistro compaiono infatti, evidenziate da

un filetto grigio, le indicazioni relative alla

categoria e alla sottocategoria a cui il dataset

appartiene. La rappresentazione di categorie

e sottocategorie sulla sinistra permette di

esplorarle cliccando semplicemente sopra

una di esse.

Soluzione

progettuale

Page 39: Visual Exploration of Open Data

39

Sez. D

Page 40: Visual Exploration of Open Data

40

1 2 3

4 5 6 7

8 9 10

In basso a destra della schermata, invece, è

possibile attivare o disattivare i tag relativi a

tutti i dataset visualizzati, a seconda dei quali

si attiveranno o disattiveranno i dataset che li

contengono.

In alto a destra compare inoltre il filtro

per categoria. Cliccando sui cerchi del

colore relativo alla categoria è possibile

disabilitare la visualizzazione della categoria

corrispondente.

Soluzione

progettuale

Page 41: Visual Exploration of Open Data

41

Cliccando su uno degli archi che compongono il cerchio centrale, è possibile visualizzare i titoletti di tutti i dataset appartenenti ad una categoria.

Sez. D

Page 42: Visual Exploration of Open Data

42

1 2 3

4 5 6 7

8 9 10

Cliccando su un dataset si aprirà una

scheda tecnica, simile ad un pop-up, con le

caratteristiche specifiche del dataset (breve

descrizione, formato, licenza, categoria e

sottocategoria) e il link relativo al download.

Inoltre la scheda tecnica è composta di altri

due elementi:

/ suggerimenti, ossia dataset che hanno in

comune tre o più parole chiave e quindi per

questo facilmente associabili;

/ visualizza tutti i dataset della stessa

categoria a cui appartiene quello selezionato.

Per uscire dalla visualizzazione è necessario

cliccare in un qualsiasi punto esterno non

appartenente al pop-up.

Soluzione

progettuale

Page 43: Visual Exploration of Open Data

43

Sez. D

Page 44: Visual Exploration of Open Data

44

1 2 3

4 5 6 7

8 9 10

Tornando alla schermata iniziale, tramite click

sul logo posto in alto a sinistra avente link

diretto con la home, è possibile accedere,

previo click sul pulsante Esplora posizionato

sulla destra della schermata, ad un’altra

sezione: quella dell’esplorazione libera dei

dataset.

Soluzione

progettuale

Page 45: Visual Exploration of Open Data

45

Sez. D

Page 46: Visual Exploration of Open Data

46

1 2 3

4 5 6 7

8 9 10

Qui a lato viene riportata la prima schermata

della sezione. I cerchi colorati, in questo caso,

rappresentano le singole categorie e la loro

dimensione indica il numero di dataset in

esse contenuti. Questo tipo di visualizzazione

permette di avere un’idea generale della

disposizione dei dataset nelle differenti

categorie.

Cliccando in corrispondenza di uno dei cerchi

colorati, si passerà alla finestra successiva. A

lato, il menù “Visualizza per”, dà la possibilità

di cambiare tipo di visualizzazione.

Soluzione

progettuale

Page 47: Visual Exploration of Open Data

47

Sez. D

Page 48: Visual Exploration of Open Data

48

1 2 3

4 5 6 7

8 9 10

Questa visualizzazione pone al centro la

categoria, rappresentata da una circonferenza

del colore corrispondente: attorno ad essa

sono riportati tutti dataset appartenenti a

quella data categoria.

Tali dataset sono raggruppati per

sottocategoria: quest’ulteriore suddivisione

facilita l’utente alla scoperta dei dataset,

rendendo la ricerca più mirata e accurata.

Soluzione

progettuale

Page 49: Visual Exploration of Open Data

49

Cliccando non sul dataset ma direttamente sulla sottocategoria, nella schermata apparirà al centro, al posto della scritta “Ambiente” il nome della sottocategoria e, in automatico, i dataset inerenti a tale sottocategoria, ridistribuiti attorno all’anello centrale.

Sez. D

Page 50: Visual Exploration of Open Data

50

1 2 3

4 5 6 7

8 9 10

In alternativa alla visualizzazione per

categoria, è possibile selezionare dal menù

di destra “Visualizza per: Ente”, che viene

mostrata qui a lato.

In questa schermata i dataset vengono

riportati suddivisi per ente di produzione.

Come nella precendente interfaccia, la

dimensione dei cerchi corrisponde al numero

di dataset in essi contenuti.

Soluzione

progettuale

Page 51: Visual Exploration of Open Data

51

Sez. D

Page 52: Visual Exploration of Open Data

52

1 2 3

4 5 6 7

8 9 10

Cliccando sul cerchio relativo all’ente di

produzione dei dati, si rimanda alla finestra di

interfaccia qui a lato. Al centro viene mostrato

il nome dell’ente e, intorno all’anello centrale,

vengono disposti tutti i dataset prodotti

da tale amministrazione. Come mostra

l’immagine, i dataset sono raggruppati per

colore, ossia per categoria.

Soluzione

progettuale

Page 53: Visual Exploration of Open Data

53

Cliccando su un dataset, l’utente viene portato alla visualizzazione della scheda tecnica relativa.

Sez. D

Page 54: Visual Exploration of Open Data

54

1 2 3

4 5 6 7

8 9 10

L’ultima sezione è dedicata alla “Ricerca

Avanzata”. In questa schermata è possibile,

oltre a ricercare i dataset per parola,

selezionare uno o più filtri di ricerca che

permettono all’utente di “raggiungere” i

dataset necessari più facilmente.

I filtri presenti sono: categoria, ente, formato,

licenza e data di produzione.

Soluzione

progettuale

Page 55: Visual Exploration of Open Data

55

Sez. D

Page 56: Visual Exploration of Open Data

56

Il percorso intrapreso, che ha avuto origine dai dati aperti, passando attraverso la Data Visualization, si è concretizzato nello sviluppo del progetto esposto, scaturito come naturale conseguenza dall’analisi delle due tematiche a confronto.

La particolarità di tale percorso è che l’obiettivo che si è scelto di perseguire non è stato stabilito a priori, ma solo dopo aver analizzato in maniera attenta i campi proposti, partendo in prima battuta, come si è visto, dall’ambito Open.Questo ha portato ad una completa imparzialità nell’approccio a tali argomenti, facilitando l’individua-zione delle reali problematiche e la proposizione di possibili soluzioni. E’ stato quindi necessario ottenere un’adeguata conoscenza e familiarità degli argomenti per poter capire in modo profondo l’ambìto di azione e trarne la successiva proposta progettuale.

Il progetto, che potrebbe sembrare in prima istanza, una soluzione poco concreta, deve essere valutato in realtà soprattutto per lo spirito e la finalità con il quale è stato costruito.La proposta creata è attualmente disponibile solo in forma grafica e non è sviluppata sottoforma di codice sorgente: in questa fase, infatti, non è l’aspetto tecnico quello che risulta rilevante e neanche la definizione di una precisa collocazione futura. L’ottica in sostanza è quella di suggerire un modello di interfaccia per gli Open Data che possa facilitarne l’accesso e la consultazione, incrementando l’interes-se attorno all’argomento e che permette contempora-neamente di far emergere la Data Visualization come strumento da utilizzare per l’analisi delle informazioni e non solo come puro espediente estetico.

Si tenga ben presente che, per quanto riguarda la riva-lutazione del ruolo della Datavis, si è ottenuta grazie al fatto di applicarla non a dati stettamente numerici. In-fatti, l’applicazione è stata fatta non tanto al contenuto dei dataset open, ma ai dataset in quanto elementi classificati secondo una certa struttura e categorizza-

Conclusioni

Page 57: Visual Exploration of Open Data

57

zione. Si è così dimostrato che i dati possono avere tipologie differenti, non solo relegate alle semplici quantità.

Per quanto riguarda la collocazione del progetto in rapporto al portale piemontese e all’ambiente Open, si è deciso di non escludere alcun tipo di sviluppo successivo.Questo non per mancanza di progettualità, ma perchè effettivamente la soluzione si presta a essere trattata in diversi modi; in linea di massima la proposta non pre-vede una sostituzione del portale esistente, ma piutto-sto un’integrazione, un supporto nella fase di ricerca ed esplorazione. Si tratta quindi di un arricchimento che, in quanto tale, non comporta la scomparsa o la sostituzione dei modelli precedenti.È tuttavia vero che parte del progetto prevede una componente aggiuntiva dettata dalla riorganizzazione delle categorie esistenti. Questa prescrizione in effetti risulterebbe necessaria non solo a livello regionale o nazionale, ma soprattutto a livello europeo: in effetti il vantaggio di un vocabolario semantico, come quello dell’Eurovoc, sta proprio nella sua internazionalità. Un adeguamento di questo genere comportereb-be una riorganizzazione della struttura di portali già esistenti, cosa però piuttosto dispendiosa in termini di tempo e manodopera. La proposta quindi rimane valida per i portali di nuova generazione, nello specifi-co in ambito europeo. Si tenga comunque conto che, in generale, qualsiasi operazione di standardizzazione prevede in ogni ambìto un dispiego di energie affinchè i modelli già esistenti si adeguino alle nuove soluzioni. In questi casi si presuppone che tali energie siano am-piamente ripagate dai vantaggi ottenuti grazie a queste modifiche.

Durante lo sviluppo del progetto la fattibilità della soluzione è stata verificata interpellando al riguardo diversi esperti con competenze diverse, che potessero esprimere le loro conoscenze riguardo i codici di pro-grammazione e la situazione italiana degli Open Data, o che avessero conoscenza specifica del portale dati.piemonte.it, essendo parte del progetto stesso: questo ovviamente per verificare sia la possibilità concreta di realizzarlo che l’effettiva utilità.

Il futuro rimane sostanzialmente aperto a molte solu-zioni e non si esclude che la piattaforma possa subire migliorie, adeguamenti o sviluppi più concreti.

Page 58: Visual Exploration of Open Data

58

Page 59: Visual Exploration of Open Data

59

Si ringraziano per il supporto tecnico,

in ordine alfabetico

GIUSEPPE FUTIA

Communication Manager

presso Nexa Center

DANIELE GALIFFA

CTO & co-founder

presso GoalShouter e VISup

MAURIZIO NAPOLITANO

Technologist

presso Fondazione B. Kessler

SAVERINO REALE

Project Manager

presso CSI Piemonte

MASSIMO ZAGLIO

R&D Project Manager

presso TOP-IX Consortium

Page 60: Visual Exploration of Open Data
Page 61: Visual Exploration of Open Data

61

Page 62: Visual Exploration of Open Data

62

Visual explorationof Open Data

Una proposta di applicazione dei princìpi di Data Visualization

ai dati aperti

STUDENTI

Emanuela GiovannoniLaura Pippinato

RELATORE

Christian Racca

CO-RELATORE

Lorenzo Benussi

Vis

ual

Exp

lora

tio

n o

f O

pe

n D

ata