Formati multimediali e metadati: Immagini - Intranet...
Transcript of Formati multimediali e metadati: Immagini - Intranet...
Applicazioni di informatica
Formati multimediali e metadati:
Immagini
Marco Tagliasacchi
Formati multimediali e metadati
Sommario
� Immagini• Rappresentazione digitale• Compressione di immagini• Formati• Metadati
2
Applicazioni di informatica
� Video• Rappresentazione digitale• Compressione di dati video• Formati video
Immagini digitali
Immagini raster e vettoriali
� In generale le immagini sono un ‘continuo’ di informazioni (formato ‘analogico’)
� Bisogna quindi prima ‘discretizzarle’ ovvero trasformarle in un insieme di parti distinte che possono essere codificate separatamente come numeri (formato ‘digitale’)
Applicazioni di informatica
(formato ‘digitale’)
� Tipologia:• Immagini scalari o raster• Immagini vettoriali
Immagini digitali
Immagini raster e vettoriali
• Immagini scalari o raster,
– Fotografie
– Scansioni
– Immagini biomediche (raggi-X, risonanza magnetica, ecc.)
– ...
Applicazioni di informatica
Immagini digitali
Immagini raster e vettoriali
� Tipologia:• Immagini vettoriali,
– Disegno geometrico (CAD)
– Illustrazioni
– Loghi
Applicazioni di informatica
Immagini digitali
Immagini raster e vettoriali
rastervettoriale
Applicazioni di informatica
Immagini digitali
Rappresentazione di immagini digitali
� Il calcolatore non può direttamente rappresentare in memoria informazione in formato analogico
� L’acquisizione digitale di una immagine raster prevede di eseguire due operazioni:
Applicazioni di informatica
• Campionamento: scomposizione dell’immagine in un reticolo di punti (pixel, picture element)
• Quantizzazione: codifica di ogni pixel con un valore numerico all’interno di un ben peciso intervallo
Immagini digitali
Rappresentazione di immagini digitali
� Per rappresentare il disco
� Lo si sovrappone ad una griglia
Applicazioni di informatica
� Si identificano i quadratini (in blu) che campionano (o discretizzano) il disco
� Ogni quadratino prende il nome di pixel (o picture element)
Immagini digitali
Rappresentazione di immagini digitali
� Chiamiamo risoluzione dell’immagine la dimensione della griglia usata per il campionamento dell’immagine• Esempio: 640x480
� Aumentando la risoluzione (ovvero il numero di pixel) e quindi diminuendo la dimensione del singolo pixel, la rappresentazione approssima meglio l’immagine
Applicazioni di informatica
rappresentazione approssima meglio l’immagine originaria
Immagini digitali
Rappresentazione di immagini digitali
� Esempio:
Applicazioni di informatica
Immagini digitali
Rappresentazione di immagini digitali
� La risoluzione è spesso il parametro di riferimento usato nel mercato delle fotocamere digitali (anche se non sempre è il fattore determinante per la qualità dell’immagine prodotta)
� Spesso espresso in Megapixel (= 1 milione di pixel)
Applicazioni di informatica
Immagini digitali
Rappresentazione di immagini digitali
� Dopo aver campionato l’immagine occorre rappresentare ogni pixel con un numero
� Tale numero dovrà rappresentare il colore associato al pixel, usando un certo range: si parla di quantizzazione
Applicazioni di informatica
� La rappresentazione ottenuta è nota come codifica bitmap
� Nel caso di immagini in bianco e nero senza sfumature sono sufficienti due soli bit per ogni pixel:• 0 per rappresentare i pixel più bianchi• 1 per rappresentare i pixel più neri
Immagini digitali
Rappresentazione di immagini digitali
� Nel caso di immagini in bianco e nero senza sfumature è sufficiente un solo bit per ogni pixel:
� Il valore del pixel è pari a • 1 per rappresentare i pixel bianchi• 0 per rappresentare i pixel neri
Applicazioni di informatica
0 0 0 0 0
0 1 0 0 0
0 1 0 0 0
0 1 0 0 0
0 1 1 1 0
0 0 0 0 0
Immagini digitali
Rappresentazione di immagini digitali
� Nel caso di immagini in scala di grigio si utilizzano bbit per ogni pixel
� Il numero b determina il numero di livelli di grigio che è possibile rappresentare
Applicazioni di informatica
#livelli di grigio = 2b
Immagini digitali
Rappresentazione di immagini digitali
� Esempio: b = 2, è possibile rappresentare 4 livelli di grigio
00 � 0 (nero)
01 � 1 (grigio scuro)
10 � 2 (grigio chiaro)
11 � 3 (bianco)
Applicazioni di informatica
11 � 3 (bianco)
0 0 0 0 0
0 1 0 0 0
0 2 0 0 0
0 2 0 0 0
0 3 3 3 0
0 0 0 0 0
00 00 00 00 00
00 01 00 00 00
00 10 00 00 00
00 10 00 00 00
00 11 11 11 00
00 00 00 00 00
Rappresentazione binaria Rappresentazione decimale
Immagini digitali
Rappresentazione di immagini digitali
4 bpp 3 bpp
Applicazioni di informatica
2 bpp 1 bpp
Immagini digitali
Rappresentazione di immagini digitali
� Tipicamente, per immagini in scala di grigio, è sufficiente utilizzare b = 8 bit per pixel
� In questo modo è possibile rappresentare fino a 256 livelli di grigio
Applicazioni di informatica
� Questa scelta è determinata dall’analisi del sistema visivo umano, che non è difficilemente in grado di distinguere un numero maggiore di livelli di grigio
� In applicazioni biomediche e/o professionali, è comune utilizzare un numero maggiore di bit per pixel (ad es. 10-12 bit per pixel)
Immagini digitali
Rappresentazione di immagini digitali
� Tipicamente, per immagini a colori, vengono utilizzati b = 24 bit per pixel
� In questo modo è possibile rappresentare fino a
224 = 16777216 colori distinti
Applicazioni di informatica
� Esistono diversi modi di rappresentare una immagine a colori (detti anche colorspace o spazi colore)
Immagini digitali
Rappresentazione di immagini digitali
� Lo spazio colore più comunemente utilizzato per l’acquisizione e la visualizzazione delle immagini è
RGB = Red, Green, Blue
� Per ciascun pixel vengono utilizzati 24 bit
• 8 bit (1 byte) per il rosso [0-255]
Applicazioni di informatica
• 8 bit (1 byte) per il rosso [0-255]• 8 bit (1 byte) per il verde [0-255]• 8 bit (1 byte) per il blu [0-255]
Immagini digitali
Rappresentazione di immagini digitali
Applicazioni di informatica
RedGreen Blue
Immagini digitali
Rappresentazione di immagini digitali
� L’acquisizione di immagini a colori utilizza una griglia di filtri (Bayer filter)
� Ciascun pixel registra l’intensità luminosa di una sola componente (rosso, verde o blu)
Applicazioni di informatica
� Per i pixel “rossi”, viene calcolata l’intensità della componente blu e verde sulla base dei pixel vicini (e viceversa)
Immagini digitali
Rappresentazione di immagini digitali
� Esempio: fotocamera a 12.2 Mpixel
• 4272 x 2848 = 12166656 pixel
• 3 byte / pixel x 12.2 Mpixel = 36.6 Mbyte
� Questa è la dimensione del file che
Applicazioni di informatica
si ottiene scattando in modalità raw
Compressione di immagini
Tecniche di compressione di immagini
� In fase di codifica esiste la necessità di adottare tecniche di compressione per ottimizzare:
• Occupazione di spazio di memoria
• Velocità di trasmissione attraverso la rete
Applicazioni di informatica
� Tecniche di compressione
• senza perdita di informazione (lossless)
• con perdita di informazione (lossy)
Compressione di immagini
Compressione basata su oracolo
� Consideriamo il numero di bit necessari a rappresentare le immagini acquisite dal sistema visivo umano nel corso della nostra vita
� Approssimiamo per eccesso le immagini acquisite
30 immagini / sec x
3600 sec / ora x
Applicazioni di informatica
3600 sec / ora x
24 ore/giorno x
365 giorni / anno x
90 anni =
-------------
8.5 1010
Compressione di immagini
Compressione basata su oracolo
� Per enumerare 8.5 1010 immagini abbiamo bisogno di soli log2(8.5 1010 ) = 37 bit
� Se consideriamo l’intera popolazione mondiale
log2(6.8 109 x 8.5 1010) = 69 bit
Applicazioni di informatica
cioè 1.2 10-19 = 0.00000000000000000012 bit/immagine
� Una macchina digitale utilizza circa 20.000.000 bit/immagine, previa compressione
Compressione di immagini
Compressione lossless
� Compressione senza perdita d informazione (lossless)
• Reversibili
– l’immagine compressa è identica a quella originale
– Il numero di bit necessari per memorizzare l’immagine è inferiore
• Ne esistono di due tipi:
Applicazioni di informatica
• Ne esistono di due tipi:
– Ad hoc per le immagini � ad es. PNG
– Applicabili a qualsiasi tipo di dato � ad es. ZIP
Compressione di immagini
Compressione lossy
� Algoritmi con perdita di informazione (lossy)
• Sfruttano meccanismi di mascheramento del rumore propri del sistema visivo umano
– L’occhio è più sensible al rumore quando l’immagine è caratterizzata da un basso contrasto locale
Applicazioni di informatica
Compressione di immagini
Compressione lossy
� Algoritmi con perdita di informazione (lossy)
• Sfruttano il fatto che pixel vicini hanno intensità e colore spesso simili tra loro
• Scartano quella parte di contenuto dell’immagine non visibile dall’occhio umano
• Generalmente è possibile specificare quanto siamo
Applicazioni di informatica
• Generalmente è possibile specificare quanto siamo disposti a perdere attraverso alcuni parametri
– Compromesso qualità vs. Dimensioni
Compressione di immagini
Compressione lossy 29
Applicazioni di informatica
Compressione di immagini
Compressione lossy
� Algoritmi con perdita di informazione (lossy)
• Scartano quella parte di contenuto dell’immagine non visibile dall’occhio umano
• Irreversibili
– l’immagine compressa è diversa da quella originale
– Compromesso qualità vs. dimensioni
Applicazioni di informatica
• Generalmente è possibile specificare quanto siamo disposti a perdere attraverso alcuni parametri
Compressione di immagini
Compressione lossy
� JPEG (Joint Picture Expert Group) è lo standard più comunemente utilizzato per la compressione lossy di immagini
� Esempio: • 682x511 pixel = 348502 pixel• 348502 pixel x 3 byte/pixel = 1045506 byte (circa 1Mb)
Applicazioni di informatica
Compressione di immagini
Compressione lossy
� JPEG (Quality = 90) – 97.8Kb – 10.7:1
Applicazioni di informatica
Compressione di immagini
Compressione lossy
� JPEG (Quality = 50) – 40.1 Kb – 26:1
Applicazioni di informatica
Compressione di immagini
Compressione lossy
� JPEG (Quality = 10) – 16.4 Kb – 64:1
Applicazioni di informatica
Compressione di immagini
Compressione lossy
� JPEG (Joint Picture Expert Group) è lo standard più comunemente utilizzato per la compressione lossy di immagini
� Esempio: • 800x600 pixel = 480000 pixel• 480000 pixel x 3 byte/pixel = 1440000 byte (c.a.
1.44Mb)
Applicazioni di informatica
Compressione di immagini
Compressione lossy
� JPEG (Quality = 90) – 107 Kb – 13.4:1
Applicazioni di informatica
Compressione di immagini
Compressione lossy
� JPEG (Quality = 50) – 49.7 Kb – 29:1
Applicazioni di informatica
Compressione di immagini
Compressione lossy
� JPEG (Quality = 10) – 25.2 Kb – 57:1
Applicazioni di informatica
Formati
JPEG
� JPEG (Joint Picture Expert Group)• Codifica con perdita (lossy)
– Immagini a colori, 24 bit/pixel
• E’ il formato di compressione più utilizzato al mondo
• Buon rapporto di compressione
– c.a. 10:1 per immagini percettivamente indistinguibili dall’originale
Applicazioni di informatica
dall’originale
• A forti rapporti di compressione (> 30:1) introduce artefatti:
– Blocchettizzazione
– “Contouring”
• Attenzione: ogni modifica e salvataggio dell’immagine degrada la qualità della stessa
Formati
TIFF
� TIFF (Tagged Image File Format)• Supporta un insieme di algoritmi di compressione
– Non tutti i sistemi supportano tutti gli algoritmi
• Codifica sia lossless che lossy
– Immagini a colori, 8-16 bit/pixel/colore (24-24 bit/pixel)
Applicazioni di informatica
Formati
TIFF
� TIFF (Tagged Image File Format)• Il formato non è comunemente supportato dai web
browser
• E’ ancora il formato di riferimento per lo scambio di immagini nel mercato editoriale
• Supporta spazi colore alternativi al RGB
– ad esempio CMYK per la rappresentazione di immagini per
Applicazioni di informatica
– ad esempio CMYK per la rappresentazione di immagini per la stampa
Formati
TIFF
� Raw• E’ un formato supportato da alcune fotocamere digitali
(tipicamente di fascia medio-alta)
• Ciascuna casa produttrice ha un proprio formato proprietario
• Rappresenta i valori RGB letti direttamente dal sensoredella fotocamera, prima di qualsiasi operazione di elaborazione
Applicazioni di informatica
della fotocamera, prima di qualsiasi operazione di elaborazione
– Ridimensionamento
– Bilanciamento del bianco
– Correzione automatica del contrasto/luminosità
– Compressione JPEG
• E’ utile quando
– Si cerca la massima qualità dell’immagine
– Si vuole mantenere la possibilità di bilanciamento del bianco in fase di editing
Formati
PNG
� PNG (Portable Network Graphics)• Codifica senza perdita (lossless)
– Immagini a colori (24 bit/pixel)
• E’ supportato da tutti i web browser
• E’ particolarmente adatto per la codifica di immagini non naturali, che presentano aree uniformi e contorni molto ben definiti
Applicazioni di informatica
ben definiti
– Ideale per loghi, scritte, rappresentazione raster di immagini vettoriali
• Supporta la trasparenza
• In molte applicazioni, è una valida alternativa a TIFF
Formati
PNG
� Esempio: PNG vs. JPEG
PNG – 24Kb JPEG – 13Kb
Applicazioni di informatica
Metadati
Metadati
� I metadati sono dati supplementari, che aggiungono informazioni ad un file multimediale (immagini, audio o video)
� Alcuni metadati sono associati ad ogni tipo di file, incluse le immagini:• Nome del file• Data di creazione• Data di modifica
Applicazioni di informatica
• Data di modifica• Dimensione del file• Ecc.
� Ciascun metadato è caratterizzato da• Un etichetta o tag, che individua la caratteristica
descritta. Ad es “filesize”• Un valore associato al tag. Ad es. 14532 byte
Metadati
Exif
� Alcuni formati di immagini supportano la definizione di metadati specifici.
� Uno sistema comunemente adottato dalle fotocamere commerciali è Exif, Exchangeable file format
� Le informazioni descritte da Exif sono:• Data e ora• Impostazioni della fotocamera
Applicazioni di informatica
• Impostazioni della fotocamera
– Produttore e modello
– Orientazione
– Apertura
– Tempo di esposizione
– Lunghezza focale
– Sensibilità ISO
– Bilanciamento del bianco
Metadati
Exif
� Esempio di metadati Exif
Applicazioni di informatica
Metadati
Geotagging
� Nei metadati possono essere incluse informazioni relative alla locazione degli scatti (geotagging)• Tagging manuale, l’utente indica la posizione in cui è
stata scattata la fotografia• Tagging automatico, tramite ricevitore GPS connesso
alla fotocamera
Applicazioni di informatica
Metadati
User tagging
� Molti sistemi di sharing di immagini consentono agli utenti di aggiungere tag descrittivi
Applicazioni di informatica
Questo tipo di tag sono estremamente utili nella
ricerca di immagini in grandi collezioni
Formati multimediali e metadati
Sommario
� Immagini digitali• Compressione di immagini• Formati• Metadati
� Video digitali
50
Applicazioni di informatica
� Video digitali• Compressione di dati video• Formati video
Rappresentazione di dati video
Caratteristiche di un segnale video
� Risoluzione spaziale• Numero di pixel lungo la direzione orizzontale e verticale– Ad es. 640x480 pixel
� Aspect ratio
51
Applicazioni di informatica
� Aspect ratio• rapporto tra la dimensione orizzontale e verticale dell’immagine– Ad es. 4:3, 16:9, ecc.
� Risoluzione temporale (o frame rate)• Numero di immagini visualizzate per secondo
– Ad es. 30 fps (frame per secondo)
Rappresentazione di dati video
Caratteristiche di un segnale video
� Esempio conversione frame rate
52
25 fps 8 fps
Applicazioni di informatica
Rappresentazione di dati video
Scansione progressiva/interallacciata
� Video a scansione progressiva• Per ciascun istante temporale viene
rappresentata una intera immagine a risoluzione piena
� Utilizzata da• La maggior parte dei monitor CRT per PC
53
Applicazioni di informatica
• La maggior parte dei monitor CRT per PC• Tutti i monitor LCD• Alcune televisioni HDTV
– 720p
– 1080p
Rappresentazione di dati video
Scansione progressiva/interallacciata
� Video a scansione interallacciata• Per ciascun istante temporale è disponibile una
immagine che rappresenta le sole righe pari/dispari dell’immagine
54
Applicazioni di informatica
• E’ utilizzata da– Monitor CRT dei televisori tradizionali
– Alcuni monitor HDTV
- 1080i
Rappresentazione di dati video
Scansione progressiva/interallacciata
� Video a scansione interallacciata• E’ la modalità utilizzata nella trasmissione del
segnale televisivo analogico (ma anche digitale, in alcuni casi)– Ogni secondo vengono mostrati 50 semi-quadri
- 25 semi-quadri rappresentano le righe pari
- 25 semi-quadri rappresentano le righe dispari
55
Applicazioni di informatica
Rappresentazione di dati video
Scansione progressiva/interallacciata
� I limiti del sistema visivo umano fanno sì che l’occhio non sia in grado di percepire le righe mancanti, se la risoluzione temporale è sufficientemente alta (ad es. 50 semi-quadri al secondo)
56
Applicazioni di informatica
� Il sistema di scansione interallacciata nasce storicamente per poter trasmettere un numero maggiore di canali televisivi nella stessa banda
Rappresentazione di dati video
Scansione progressiva/interallacciata
� Il formato di scansione del video può differiredal formato supportato dal dispositivo di visualizzazione
� Video interallacciato � Monitor progressivo• Si esegue una operazione di de-interlacing, per
57
Applicazioni di informatica
• Si esegue una operazione di de-interlacing, per interpolare le righe mancanti
� Video progressivo � Monitor interallacciato• Viene scartata parte dell’informazione
Rappresentazione di dati video
Scansione progressiva/interallacciata
� La conversione da scansione interallacciata a progressiva può introdurre artefatti in presenza di oggetti in movimento e/o cambi di scena
58
Applicazioni di informatica
Compressione di dati video
Compressione di dati video
� Come per le immagini, i dati video vengono spesso compressi per• Ridurre la dimensione dei file memorizzati su
disco– VideoCD
– DVD/BlueRay
– DivX,Xvid,ecc.
59
Applicazioni di informatica
– DivX,Xvid,ecc.
– Ecc.
• Consentire la trasmissione di dati video– Televisione Digitale Terrestre
– Televisione Digitale Satellitare
– Video streaming (YouTube)
– VideoOnDemand (VoD)
– IPTV
Compressione di dati video
Compressione di dati video
� Codec video: • sistema hardware o software costituito da due
componenti:
• Encoder– ricevere in ingresso una sequenza di immagini
– produce in uscita un bitstream, ovvero una sequenza
60
Applicazioni di informatica
– produce in uscita un bitstream, ovvero una sequenza di bit che rappresenta il video compresso
• Decoder– Riceve in ingresso un bistream
– Produce in uscita la sequenza di immagini ricostruita
Encoder Decoder
00110001...
Compressione di dati video
Compressione di dati video
� Per la visualizzazione di dati video compressi è sufficiente avere a disposizione un decoder
� Per la creazione di bitstream, è necessario avere a disposizione un encoder
61
Applicazioni di informatica
� Per garantire l’interoperabilità, ovvero che lo stesso bitstream possa essere letto correttamente da più dispositivi, si definisce uno standard
Compressione di dati video
Compressione di dati video
� In assenza di compressione, la dimensione dei file video è notevole. Ad esempio:
� Video a scansione interallacciata (ad. es TV)• 720 punti / linea • 576 linee (288 linee pari, 288 linee dispari)• 50 semiquadri al secondo• 3 byte / pixel (RGB)
62
Applicazioni di informatica
• 3 byte / pixel (RGB)• 720 x 288 x 50 x 3 = 31.104.000 byte / sec
� c.a. 31 Mbyte/sec � c.a. 250 Mbps
• 2h di film occupano (se non compressi)
– 2x60x60x31 = 223.200 Mbyte � c.a. 223 Gbyte
• Un DVD ha una capacità di c.a. 4.5 Gb � per memorizzare un film a risoluzione standard su DVD c’è la necessità di un fattore di compressione pari a 223 / 4.5 = 50
Compressione di dati video
Compressione di dati video
� Video a scansione progressiva (ad. es cellulare o fotocamera)• 320x240 pixel• 15 frame / secondo• 3 byte / pixel (RGB)• 320 x 240 x 15 x 3 = 3.456.000 byte / sec
� c.a. 3.5 Mbyte/sec � c.a. 28 Mbps
63
Applicazioni di informatica
• 1 minuto di video registrato occupa (se non compresso)
– 60x3.5 = 210 Mbyte
Compressione di dati video
Compressione di dati video
� Codifica intra-frame: codifico ogni frame come un immagine fissa
� E’ la tecnica usata da molte fotocamere compatte, che salvano i filmati ripresi in formato Motion-JPEG (ogni frame è compresso con JPEG)
64
Applicazioni di informatica
� Si è in grado di ottenere rapporti di compressione dell’ordine 10-20 senza eccessiva perdita di qualità• Per mettere un film su DVD abbiamo bisogno di un
rapporto di c.a. 50...
Compressione di dati video
Compressione di dati video
� Codifica inter-frame: codifico ogni frame utilizzando la conoscenza delle immagini precedenti
� Frame consecutivi in una sequenza di immagini sono simili l’uno all’altro
65
Applicazioni di informatica
� Codifico solo ciò che c’è di nuovo in un frame rispetto al frame precedente
� E’ possibile ottenere rapporti di compressione di 50:1 fino a anche a 100:1 senza un degrado eccessivo della qualità
Compressione di dati video
Compressione di dati video
� Frame originale (da codificare)
66
Applicazioni di informatica
Compressione di dati video
Compressione di dati video
� Frame precedente (di riferimento)
67
Applicazioni di informatica
Compressione di dati video
Compressione di dati video
� Immagine differenza tra frame originale e di riferimento
68
Grigio � = 0
Nero� < 0
Bianco� > 0
Applicazioni di informatica
Compressione di dati video
Compressione di dati video
� Codificare questa immagine richiede molti meno bit rispetto a codificare l’immagine originale
69
Applicazioni di informatica
70
Compressione di dati video
Compressione di dati video
Applicazioni di informatica
Compressione di dati video
Compressione di dati video
� E’ possibile fare di meglio, stimando il movimento degli oggetti
71
Applicazioni di informatica
Formati video
Video codec
� Un codec video è un sistema costituito da due componenti:
• Un video encoder, che riceve in ingresso una sequenza di immagini non compressa, e produce in uscita una sequenza di bit
• Un video decoder, che riceve in ingresso una sequenza
72
Applicazioni di informatica
• Un video decoder, che riceve in ingresso una sequenza di bit, e produce in uscita la sequenza di immagini
� Esistono molteplici codec sul mercato
� Un decoder è in grado di interpretare solo le sequenze di bit prodotte dall’encoder corrispondente
Formati video
Video codec
� I codec che hanno trovato maggiore diffusione sono stati sviluppati da due organismi di standardizzazione:
• MPEG (Movie Picture Expert Group)
• ITU-T (International Telecomunication Union -Telecommunication Standardization Sector)
73
Applicazioni di informatica
� Sia MPEG e ITU-T hanno sviluppato nel corso degli ultimi 20 anni diversi standard, con l’obiettivo di massimizzare la compressione per un certo livello di qualità dell’immagine.
� Ciascuno standard definisce una “lingua” con una sua sintassi ben precisa, che può essere compresa solo da un decoder che la supporti
Formati video
Video codec
� Standard MPEG• MPEG-1: (1992)
– VideoCD (l’equivalente digitale del VHS), supportato dalla maggior parte dei lettori DVD
• MPEG-2: (1994)
– DVD, SVideoCD, TV broadcasting (satellitare, terrestre, cavo)
• MPEG-4 Part 2 (1998)
74
Applicazioni di informatica
– Internet streaming, broadcast
– DivX, Xvid, FFMpeg sono diverse implementazioni software di MPEG-4 Part 2
• MPEG-4 Part 10 (2003)
– Noto comunemente come AVC (Advanced Video Coding) oppure H.264
– Tenderà a sostituire tutti gli standard precedenti
– Adottato in innumerevoli prodotti commerciali:
- BlueRay Disc, iPhone, PSP, QuickTime, etc.
Formati video
Video codec
� Standard ITU-T• H.261: (1990)
– Sistemi obsoleti di video-conferenza su reti telefoniche
• H.263: (1996)
– Videoconfernenza, Videotelefonia, video streaming su internet
• H.264: (2003)
– E’ uguale a MPEG-4 Part 10
75
Applicazioni di informatica
– E’ uguale a MPEG-4 Part 10
� Esistono poi codec proprietari, sviluppati individualmente da aziende private per i propri prodotti
Formati video
Video codec
� Esistono poi codec proprietari, sviluppati individualmente da aziende private per i propri prodotti
• Microsoft WMV (Windows Media Video)
– WMV7,8,9 (Windows Media Player)
– VC-1 (BlueRay Disc)
76
Applicazioni di informatica
• RealNetworks RealVideo
– RealPlayer
• Xiph.org foundation Theora
– Part of the Ogg project
– Opensource, royalty free codec inspired to (and competing with) MPEG-4
• ...
Formati video
Multimedia Container
� Il video è quasi sempre accompagnato dall’audio
� Il Container è un formato di file
• Descrive cosa può essere immagazzinato nel file• Definisce come viene codificato il suo contenuto (ma per
lo stesso container, i dati possono essere codificati con codec diversi)
� Il Multimedia container (ad es. Il formato .AVI)
77
Applicazioni di informatica
� Il Multimedia container (ad es. Il formato .AVI) descrive cosa può esserre immagazzinato in un file• Dati video• Dati audio• Sottotitoli• Ecc.
Formati video
Multimedia Container
� E’ possibile che un programma che sia in grado di aprire un file scritto in un certo formato non sia capace di decodificare i dati contenuti
• Capita, ad esempio che il lettore multimediale sia in grado di aprire un file, ma di riprodurre solo l’audio o il video.
• Ciò significa che un il lettore riconosce correttamente il
78
Applicazioni di informatica
• Ciò significa che un il lettore riconosce correttamente il tipo di file, lo apre, ma non ha a disposizione il codec in grado di interpretare i dati audio o video in esso contenuti
Formati video
Multimedia Container
� I più comuni multimedia container sono:• 3GP (.3gp, .3g2): usato nel campo della telefonia• AVI (.avi): il formato standard nei sistemi operativi
Windows• MOV (.mov): usato da Apple QuickTime• OGM: Ogg Media, standard video container usato dai
codec Xiph.org • RealMedia (.rm): usato da RealPlayer• VOB (.vob): usato nei DVD
79
Applicazioni di informatica
• VOB (.vob): usato nei DVD• DMF (.divx): DivX Media Format