Basi di dati database - · PDF fileBasi di dati (database): archivi di dati, organizzati in...

Click here to load reader

  • date post

    14-Feb-2019
  • Category

    Documents

  • view

    218
  • download

    0

Embed Size (px)

Transcript of Basi di dati database - · PDF fileBasi di dati (database): archivi di dati, organizzati in...

DATABASE

Basi di dati (database): archivi di dati, organizzati in modo integrato attraverso tecniche di modellazione dei dati e gestiti sulle memorie di massa dei computer attraverso appositi software (DBMS), con lobiettivo di raggiungere una grande efficienza nel trattamento e nella gestione dei dati. Il database una collezione di archivi di dati ben organizzati e ben strutturati, in modo che possano costituire il supporto per utenti diversi e programmi diversi. Es: i dati relativi agli articoli del magazzino di unazienda possono essere utilizzati dal programma che stampa le fatture e dal programma che stampa i listini di magazzino.

Efficienza e produttivit di unorganizzazione di archivi: possibilit di ritrovare facilmente le informazioni desiderate (anche attraverso criteri di ricerca diversi) in termini di velocit nellelaborazione, di sicurezza dei dati e integrit delle registrazioni. Devono essere garantite: Consistenza degli archivi: i dati in essi contenuti devono essere significativi ed essere effettivamente utilizzabili nelle applicazioni dellazienda. Sicurezza: impedire che il database venga danneggiato da interventi accidentali o non autorizzati. Integrit: le operazioni effettuate sul database da utenti autorizzati non devono provocare perdita di consistenza ai dati.

Caratteristiche delle basi di dati

DBMS (DataBase Management System): prodotti software per la gestione di database. Gli archivi che costituiscono la base di dati possono risiedere: su un unico computer; su computer diversi, facenti parte di una rete, i cui nodi possono anche essere fisicamente lontani (database distribuiti).

Gli utenti della base di dati distribuita: elaborano localmente gli archivi che hanno a disposizione nel proprio sistema; nello stesso tempo accedono in maniera remota a sistemi centrali attraverso le linee di comunicazione.

DBMS

Le tecniche di gestione delle basi di dati nascono per superare i problemi e i limiti insiti nelle tradizionali organizzazioni degli archivi in modo non integrato.

Limiti degli archivi convenzionali

Si vogliono gestire i conti correnti di unazienda bancaria appartenenti alle diverse filiali e i movimenti contabili che vengono effettuati sui conti. Nella sede centrale della banca si vogliono organizzare le informazioni riguardanti i conti delle filiali.

Esempio di applicazione pratica

Per ciascun conto occorre registrare il numero di conto, il nome dellintestatario, lindirizzo, il codice della filiale e la descrizione della filiale.

I/V

Le informazioni vengono organizzate in un archivio i cui record hanno il seguente tracciato:

NUMCONTO NOME INDIRIZZO CODFILIALE DESCRIZ

9 40 30 5 20

NUMCODICE DESCRIZ CITTA DATA IMPORTO CAUSALE

9 40 20 8 10 3

Al contempo, nelle filiali bisogna registrare le informazioni sui movimenti effettuati sui conti: numero del conto, nome del correntista, citt, data del movimento, importo e causale. Il record del file corrispondente possiede il seguente tracciato:

Limiti degli archivi convenzionali

Soluzione del problema con lapproccio tradizionale

II/V

Quando si vogliono associare tra loro i dati contenuti nei due archivi possono nascere problemi di questo tipo:

Limiti degli archivi convenzionali

NUMCONTO NOME INDIRIZZO CODFILIALE DESCRIZ

9 40 30 5 20

NUMCODICE DESCRIZ CITTA DATA IMPORTO CAUSALE

9 40 20 8 10 3

ci sono due campi con nomi diversi che rappresentano lo stesso dato (NumConto e NumCodice);

ci sono due campi con lo stesso nome che rappresentano dati diversi (Descriz nel primo archivio rappresenta la filiale e nel secondo lintestatario del conto);

lo stesso dato viene rappresentato in formati diversi (Indirizzo nel primo tracciato e Citt nel secondo);

III/V

c ridondanza di dati (la descrizione della filiale ripetuta per ogni conto nel primo tracciato, il nome e la citt del correntista vengono ripetuti per ogni movimento);

Limiti degli archivi convenzionali

NUMCONTO NOME INDIRIZZO CODFILIALE DESCRIZ

9 40 30 5 20

NUMCODICE DESCRIZ CITTA DATA IMPORTO CAUSALE

9 40 20 8 10 3

Quando si vogliono associare tra loro i dati contenuti nei due archivi possono nascere problemi di questo tipo:

il fatto che gli stessi dati compaiano in due archivi diversi pu causare anomalie in fase di aggiornamento e quindi problemi di inconsistenza (se il dato viene modificato in un archivio e non nellaltro).

III/V

Tutto ci deriva dal fatto che i dati sono organizzati in archivi diversi, in maniera non integrata.

Limiti degli archivi convenzionali

Quali sono le cause?

RIDONDANZA DEI DATI

(Gli stessi dati compaiono in maniera duplicata)

INCONGRUENZA

(se il dato viene aggiornato in un archivio

e non in un altro, oppure se sono presenti

valori diversi per lo stesso dato)

INCONSISTENZA DEI DATI

(i dati a disposizione non sono pi affidabili, perch non si

sa in modo certo quale dei diversi valori sia quello corretto)

IV/V

Individuare con precisione quali sono gli elementi che caratterizzano lapplicazione. Associamo a ciascuno di essi un archivio, il cui tracciato contiene i campi che individuano lelemento e una chiave (tipicamente un codice). La chiave identifica univocamente il record allinterno dellarchivio e consente di stabilire legami con gli altri archivi.

Soluzione

archivio delle filiali, con codice filiale e descrizione filiale; archivio dei conti, con codice conto, nome del correntista, indirizzo, citt, codice filiale di appartenenza; archivio dei movimenti, con numero del movimento, data, importo, causale, codice del conto sul quale stato effettuato il movimento.

Limiti degli archivi convenzionali

V/V

NUMCONTO NOME INDIRIZZO CITTA FILIALE

9 40 30 20 5

NUMMOV DATA IMPORTO CAUSALE CODICE

6 8 10 3 9

CODFILIALE DESCRIZ

5 20

archivio delle filiali, con codice filiale e descrizione filiale; archivio dei conti, con codice conto, nome del correntista, indirizzo, citt, codice filiale di appartenenza; archivio dei movimenti, con numero del movimento, data, importo, causale, codice del conto sul quale stato effettuato il movimento.

Limiti degli archivi convenzionali

V/V

La teoria dei database introduce una nuova metodologia di organizzazione degli archivi di dati, con lobiettivo di superare i limiti visti.

Caratteristiche fondamentali: indipendenza dalla struttura fisica dei dati: i programmi applicativi sono indipendenti dai dati fisici; indipendenza dalla struttura logica dei dati: i programmi applicativi sono indipendenti dalla struttura logica con cui i dati sono organizzati negli archivi; utilizzo da parte di pi utenti: i dati organizzati in un unico database possono essere utilizzati da pi utenti con i loro programmi, consentendo anche una visione solo parziale del database da parte del singolo utente; eliminazione della ridondanza: gli stessi dati non compaiono pi volte in archivi diversi;

Archivi integrati

I/II

facilit di accesso: il ritrovamento dei dati facilitato e svolto velocemente; integrit dei dati: vengono previsti controlli per evitare anomalie ai dati causate dai programmi e dalle applicazioni degli utenti; sicurezza dei dati: sono previste procedure di controllo per impedire accessi non autorizzati ai dati contenuti nel database e di protezione da guasti accidentali; uso di linguaggi per la gestione del database: il database viene gestito attraverso comandi per la manipolazione dei dati in esso contenuti e comandi per effettuare interrogazioni alla base di dati, al fine di ottenere le informazioni desiderate.

Archivi integrati

II/II

AGENTE CLIENTE

ORDINI RIGHE ARTICOLI

Rappresenta il database come un insieme di tabelle. E considerato attualmente il modello pi semplice ed efficace, perch: pi vicino al modo consueto di pensare i dati; si adatta in modo naturale alla classificazione e alla strutturazione dei dati.

Modello relazionale

Modello relazionale: concetti di base

Il modello relazionale si basa sul concetto matematico di relazione tra insiemi di oggetti.

Cos una relazione?

Dati n insiemi A1, A2,, An, si dice relazione un sottoinsieme dellinsieme di tutte le n-uple a1, a2, , an che si possono costruire prendendo nellordine un elemento a1 dal primo insieme A1, a2 dal secondo insieme A2, e cos via.

Definizione matematica

n = grado della relazione Ai = dominio i-esimo della relazione a1, an = tupla Linsieme delle tuple si chiama cardinalit della relazione.

I/III

a1 a2 an

tupla

grado

cardinalit

A1 A2 AN Domini

Modello relazionale: concetti di base

La relazione (collezione di tuple) unentit, ogni tupla unistanza dellentit, le colonne sono gli attributi dellentit, il dominio linsieme dei possibili valori di un attributo.

La relazione rappresentata con una tabella, avente tante colonne quanti sono i domini (grado) e tante righe quante sono le n-uple (cardinalit).

I nomi dei domini sono i nomi delle colonne, i valori che compaiono in una colonna sono omogenei tra loro (appartengono allo stesso dominio).

II/III

CLIENTI

PAGAMENTI

FATTURE

RIGHE FATTURE

Modello relazionale: concetti di base La chiave della relazione un attributo o una combinazione di attributi che identificano univocamente le tuple: ogni riga della tabella possiede valori diversi