Sistemi Informativi Statistici

57
A Cura di: Vincenzo Patruno, Marina Venturi Sistemi informativi Statistici Università “La Sapienza” Facoltà di Scienze Statistiche 23 Febbraio 2004

description

 

Transcript of Sistemi Informativi Statistici

Page 1: Sistemi Informativi Statistici

A Cura di:

Vincenzo Patruno, Marina Venturi

Sistemi informativi Statistici

Università “La Sapienza”

Facoltà di Scienze Statistiche

23 Febbraio 2004

Page 2: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Crescita della domanda di informazione statistica

Dati aggiornati e dettagliati

Riduzione del carico sui rispondenti

Sfruttamento dei giacimenti informativi esistenti

Sviluppo tecnologico e informatico (es. DB, Internet) per la fruibilità immediata dei dati

Page 3: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Necessità di individuare soluzioni metodologiche e organizzative efficienti che consentono di:

•Integrare le informazioni raccolte da indagini diverse organizzandole e inquadrandole in uno schema coerente •Passare da una visione per singola fonte, singola indagine e quindi singolo processo di produzione ad una visione di sistema di fonti, sistema di indagini

SISTEMA INFORMATIVO STATISTICO

Page 4: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

La nozione di Sistemi Informativi nasce in ambito aziendale.

Si intende l’insieme di strumenti automatici di memorizzazione, scambio, acquisizione, elaborazione, interrogazione e diffusione di informazioni raccolte da una azienda per soddisfare i propri scopi di esercizio, controllo e pianificazione basato su una architettura

informatica di tipo Data Base

Page 5: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Ciclo di gestione della produzione statistica

Processi: insieme di procedure di acquisizione, correzione, validazione, produzione di dati elementari, di

elaborazione, trasformazione e diffusione di dati aggregati.

Prodotti: archivi di microdati validati e tavole di pubblicazione (in formato cartaceo o elettronico)

Page 6: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

SIS: E’ la naturale evoluzione del ciclo di gestione della produzione statistica

•Esistenza di una base dati in linea

•Esistenza di un livello di integrazione orizzontale e verticale

Page 7: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Sistema Informativo Statistico

•Estendibilità

•Flessibilità

•Semplicità d’uso

•Integrità e robustezza

Page 8: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Standard di qualità su Web

Accessibilità

Un sito è “accessibile” se i contenuti, le modalità di

navigazione e le funzioni interattive sono accessibili a

tutti gli utenti, indipendentemente contesto tecnologico e

culturale e dal livello di competenze degli utenti

Page 9: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Standard di qualità su Web

Usabilità

un sito web è effettivamente “usabile” se è “orientato

all’utente”, cioè se garantisce un

set di requisiti che riguardano:

» efficienza

» efficacia

» soddisfazione

Page 10: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Standard di qualità su Web

Efficienza

Un sito è “efficiente” se è in grado di soddisfare le

esigenze degli utenti attraverso un impiego razionale

delle risorse disponibili (economiche, tecnologiche e

informative)

Page 11: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Standard di qualità su Web

Efficacia

Un sito web è “efficace” se è in grado di soddisfare i

bisogni informativi degli utenti in modo accurato e

completo

Page 12: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Standard di qualità su Web

Soddisfazione

Un sito è “di soddisfazione” per gli utenti se è

liberamente accessibile, non implica vincoli e condizioni

all’accesso e invoglia gli utenti ad un utilizzo non

occasionale

Page 13: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Standard di qualità su Web

Mission

Le finalità del sito, gli obiettivi informativi fondamentali e i

principali target di riferimento devono essere esplicitati in

modo evidente

Page 14: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Standard di qualità su Web

Linearità e Sinteticità

Un sito è “lineare” se le funzioni sono programmate in

modo da ridurre il numero di modi in cui certe attività

operative possono essere svolte, in modo da

semplificare l’utilizzo da parte degli utenti

I contenuti testuali devono essere essenziali e non

ridondanti

Page 15: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Standard di qualità su Web

Organizzazione per Grappoli

Le informazioni devono essere organizzate in modo logico e consequenziale e distribuiti per “grappoli” e “nidificazioni”, per tema, ordine cronologico o fonte

in funzione del tipo di informazioni, degli obiettivi e delle caratteristiche tecniche del sito e del livello di conoscenza degli utenti

Page 16: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Standard di qualità su Web

Nidificazioni GerarchicheI grappoli di informazioni devono essere organizzati gerarchicamente in modo che l’articolazione sia:

•logica, internamente coerente, adeguata al modello concettuale

•facilmente comprensibile e gestibile dagli utenti

Page 17: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Standard di qualità su Web

Layout delle pagine

Ciascuna pagina deve essere autosufficiente: coprire un dominio specifico senza dover ricorrere a pagine differenti per cogliere l’informazione chiave.

Quando una pagina contiene troppe informazioni si deve adottare una organizzazione per grappoli e una struttura gerarchica dei contenuti (cfr.)

Page 18: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Tipologie di Sistemi Informativi Statistici

•Sistemi di metadati (per la gestione di definizioni, classificazioni, nomenclature comuni a tutte le indagini)•Sistemi strumentali (sistemi di supporto alla produzione statistica)•Sistemi di produzione (insieme dei sottosistemi per la gestione delle fasi relative al ciclo di produzione delle indagini)

•Sottosistemi di acquisizione dei dati (tecniche CAI)

•Sottosistemi di diffusione (dedicati al ritrovamento e alla presentazione delle informazioni statistiche per l’utente finale)

Page 19: Sistemi Informativi Statistici

Dalle Fonti ai Sistemi Informativi

Tipologie di Sistemi Informativi Statistici

Esempio di sistema integrato di produzione dati di indagini sulla popolazione

http://modem.istat.it

http://demo.istat.it

Page 20: Sistemi Informativi Statistici

DEMO-GEODEMO:I dati diffusi

•Movimento e calcolo della popolazione residente (Rilevazione P.2)

•Cittadini stranieri iscritti in Anagrafe: Bilancio Demografico e Popolazione residente per sesso e cittadinanza (Rilevazione P.3)

•Popolazione residente per sesso, età e stato civile (Rilevazione POSAS)

•Tavole di mortalità

•Previsioni della popolazione residente

Page 21: Sistemi Informativi Statistici

Interfaccia utente Programmi Strutture Dati

Page 22: Sistemi Informativi Statistici

Interfaccia utente

Page 23: Sistemi Informativi Statistici

Interfaccia utente

E’ la “porta di accesso” ai dati

L’obiettivo di demo.istat.it è stato quello di ottenere una interfaccia per consentire:

•Facile accesso ai dati

•Facile selezione dei parametri di input

•Veloci interrogazioni sul Data Base

Page 24: Sistemi Informativi Statistici

Interfaccia utente

Sul Web questo significa:

•Costruire l’interfaccia utente come pagina HTML

•Usando le tecnologie disponibili (DHTML)

•Utilizzando il protocollo HTTP per inviare query e per ottenere i risultati

Problemi: Compatibilità tra browser, limiti di DHTML, natura di HTTP

Page 25: Sistemi Informativi Statistici

Interfaccia utente

1 3

2

Page 26: Sistemi Informativi Statistici
Page 27: Sistemi Informativi Statistici

Interfaccia utente

L’utente utilizza la stessa finestra

•Per effettuare interrogazioni

•Per ottenere i risultati

•Per salvare i dati

Page 28: Sistemi Informativi Statistici

Strutture dati

Page 29: Sistemi Informativi Statistici

OLTP: On line Transaction Processing

E’ una classe di programmi per la gestione di sistemi di tipo transazionale (tipicamente data entry e retrieval transactions)

OLAP: On Line Analytical Processing

Permette all’utente di estrarre dati in modo facile e selettivo e di vedere i dati da differenti punti di vista.

Page 30: Sistemi Informativi Statistici

•Il modello ER è basato su una rappresentazione della realtà oggetto di studio sulla base di oggetti chiamati Entità e delle relazioni tra questi oggetti.

•Ad ogni entità è associato un insieme di attributi che la caratterizzano

Modello Entità-Relazioni (ER)

Page 31: Sistemi Informativi Statistici

Modello Entità-Relazioni (ER)

Famiglia IndividuoAppartiene

N. Componenti

Struttura

Sesso Età

Titolo di StudioCondizione

professionale

1 n

Page 32: Sistemi Informativi Statistici

Schema E-R di un c/c bancario

Page 33: Sistemi Informativi Statistici

•Un Data Warehouse è un repository per tutti o una parte dei dati che vengono raccolti dai vari sistemi aziendali

•Un Data warehouse è una raccolta di dati disegnati e organizzati per il supporto decisionale

•Un Data Warehouse è un sistema informatico disegnato per supportare coloro che hanno il compito di prendere decisioni strategiche costruito copiando i dati da sistemi esistenti e memorizzandoli in maniera opportuna per il loro utilizzo da parte dei dirigenti

Un Data Warehouse è una copia dei dati esistenti opportunamente strutturati per consentire sia interrogazioni che la generazione di report.

(Ralph Kimball's pag. 310 of The Data Warehouse Toolkit - John Wiley & Sons 1996)

Data Warehouse

Page 34: Sistemi Informativi Statistici

•Il DM è la tecnica di analisi e rappresentazione concettuale dei dati più adatta nella costruzione di sistemi di warehouse

•Nel DM, un modello di tavole e relazioni è costruito con lo scopo di massimizzare la velocità di accesso ai dati e di osservarli secondo più dimensioni

Modello dimensionale (DM)

Page 35: Sistemi Informativi Statistici

Modello dimensionale (DM)

•DM è costruito attorno ad un “business subject”

•Ciò significa identificare il soggetto da modellare e tutte le misure che descrivono quel soggetto.

•Nello stesso tempo vanno identificati tutti quei parametri da cui le misure possono essere viste.

Page 36: Sistemi Informativi Statistici

Modello dimensionale (DM)

Popolazione Residente

Maschi

Femmine

Celibi

Nubili

……

Età_FK

Territorio_FK

Territorio

Territorio_PK

Comune

Provincia

Regione

Ripartizione

Età

Età_PK

Età_desc

Page 37: Sistemi Informativi Statistici

•Il DM non cambia se implementato in un Data Base Relazionale. (Il DM viene chiamato Star Schema)

•Ogni dimensione diventa una tabella nel data base (Dimension Table)

•La tavola dei Fatti diventa una tavola di dimensioni ragguardevoli, contenente un gran numero di righe. Contiene infatti le misure più le chiavi esterne per il collegamento con le Dimension Table.

Modello dimensionale (DM)

Page 38: Sistemi Informativi Statistici

Modello dimensionale (DM)

Le misure vengono dette FATTI

I parametri da cui un fatto può essere visto vengono detti DIMENSIONI

Il livello di dettaglio delle misure nella Fact Table è detto GRANULOSITA’

Page 39: Sistemi Informativi Statistici

Il DM è orientato alla facile gestione delle gerarchie

Modello dimensionale (DM)

Popolazione Residente

AGG_BY_PROVINCE

Maschi

Femmine

Celibi

Nubili

……

Età_FK

Territorio_FK

Territorio

Territorio_PK

Provincia

Età

Età_PK

Età_desc

Page 40: Sistemi Informativi Statistici

Popolatione Residente AGG_BY_ITALY

Popolatione Residente

AGG_BY_GEOGRAPHICAL_AREA

Popolatione Residente

AGG_BY_REGION

Popolatione Residente

AGG_BY_PROVINCE

BASE Popolatione Residente

Modello dimensionale (DM)

Page 41: Sistemi Informativi Statistici

M. C. Escher

Relativity

Page 42: Sistemi Informativi Statistici
Page 43: Sistemi Informativi Statistici
Page 44: Sistemi Informativi Statistici
Page 45: Sistemi Informativi Statistici
Page 46: Sistemi Informativi Statistici
Page 47: Sistemi Informativi Statistici
Page 48: Sistemi Informativi Statistici
Page 49: Sistemi Informativi Statistici
Page 50: Sistemi Informativi Statistici
Page 51: Sistemi Informativi Statistici
Page 52: Sistemi Informativi Statistici
Page 53: Sistemi Informativi Statistici
Page 54: Sistemi Informativi Statistici
Page 55: Sistemi Informativi Statistici
Page 56: Sistemi Informativi Statistici

Client

HTTP

Architettura

Linux RedHatApache HTTP ServerPHP4PostgreSQLPostGISMapserverMapscript

Spatial and Statistical DataData Warehouse

PHP pages

PHP interpreter

PostgreSQL

PHP pages

PHP interpreter

PostgreSQL

PostGIS

MAPSCRIPT

MAPSERVER

Server

Page 57: Sistemi Informativi Statistici

Marina VenturiISTAT - Direzione centrale per le statistiche e le indagini sulle istituzioni sociali Viale Liegi n. 13 00198 [email protected]

Vincenzo PatrunoISTAT - Direzione centrale per le metodologie statistiche e le tecnologie informatiche Via C. Balbo,16 00184 [email protected]