OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi...

214
Visoka škola elektrotehnike i ra unarstva Dr Zoran Bojkovi Dr Dragoljub Martinovi OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA -udžbenik- Beograd 2011.

Transcript of OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi...

Page 1: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Visoka škola elektrotehnike i ra unarstva

Dr Zoran Bojkovi Dr Dragoljub Martinovi

OSNOVE MULTIMEDIJALNIH

TEHNOLOGIJA -udžbenik-

Beograd 2011.

Page 2: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Autori: dr Zoran Bojkovi i dr Dragoljub Martinovi

Recenzenti: dr Bratislav Milovanovi , dr Dušan Star evi

Lektor: Slavica Baji , dipl. filolog

Tehni ki urednik: mr Milica Miši , dipl. inž. elektr.

Izdava : Visoka škola elektrotehnike i ra unarstva strukovnih studija

Za izdava a: dr Dragoljub Martinovi

Štampa: MST Gaji , Beograd

Tiraž: 30

Nastavno ve e Visoke škole elektrotehnike i ra unarstva strukovnih studija na sednici održanoj 22.09.2011. godine odobrilo je izdavanje i koriš enje ovog udžbenika u nastavi.

CIP – Katalogizacija u publikaciji Narodna biblioteka Srbije, Beograd 004.4'27(075.8) BOJKOVI , Zoran Osnove multimedijalnih tehnologija / Zoran Bojkovi , Dragoljub Martinovi . - Beograd : Visoka škola elektrotehnike i ra unarstva strukovnih studija, 2011 (Beograd: MST Gaji ). - XVIII, 196 str. : ilustr. ; 30 cm Tiraž 30. - Bibliografija uz svako poglavlje. ISBN 978-86-7982-102-7 1. Martinovi , Dragoljub, [koautor] a) Multimediji COBISS.SR-ID 186443532

Page 3: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

PREDGOVOR

Rukopis Osnove multimedijalnih tehnologija, posle pozitivne recenzije, Nastavno ve e Visoke škole elektrotehnike i ra unarstva u Beogradu odobrilo je za koriš enje kao udžbenik za predmete Digitalne multimedije 1 i Digitalne multimedije 2. Pisan je s namerom da bude koristan svim studentima koji izu avaju multimedije na visokim školama i fakultetima.

U prvih sedam poglavlja autor dr Zoran Bojkovi izložio je fundamente ove oblasti koja se neprekidno razvija. Koautor dr Dragoljub Martinovi izložio je, u osmom i devetom poglavlju, aplikativni aspekt multimedijalnih tehnologija.

Autori su zahvalni recenzentima dr Bratislavu Milovanovi u i dr Dušanu Star evi u na korisnim primedbama, mr Milici Miši na pomo i, redakciji i tehni koj obradi, i Slavici Baji , profesoru, na lekturi. Beograd, septembar, 2011. godine Autori

iii

Page 4: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

iv

Page 5: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

SADRŽAJ

1. Uvod ……………………………………………………………………………….... 1

1.1 Klasifikacija medija…………………………………………………………... 2 1.2 Osobine multimedijalnih sistema……………………………………………... 3 1.3 Konvergencija telekomunikacija i ra unara………………………………….. 4 1.4 Multimedijalni komunikacioni model………………………………………... 5 1.5 Korisni ki zahtevi…………………………………………………………….. 6 1.6 Mrežni zahtevi………………………………………………………………... 7 1.7 Multimedijalni terminali……………………………………………………… 7 1.8 Paketski transfer………………………………………………………………. 8 1.9 Rezime………………………………………………………………………... 10 Pitanja………………………………………………………………………………… 11 Literatura……………………………………………………………………………... 11

2. Osnovi audia………………………………………………………………………. 13

2.1 Karakteristike zvuka………………………………………………………….. 13 2.2 Neke karakteristike ove ijeg slušnog sistema……………………………….. 15 2.3 Registrovanje audia…………………………………………………………… 16 2.4 Predstavljanje audio signala………………………………………………....... 16 2.5 Rezime………………………………………………………………………... 18 Pitanja………………………………………………………………………………… 18 Literatura……………………………………………………………………………... 19

3. Vizuelni efekti…………………………………………………………………….. 20

3.1 Neke karakteristike ula vida…………………………………………………. 21 3.2 Vidljivost šuma……………………………………………………………….. 23 3.3 ove iji vizuelni sistem………………………………………………………. 24 3.4 Vizuelni modeli……………………………………………………………….. 26 3.4.1 Monohromatski vizuelni model……………………………………... 26 3.4.2 Vizuelni model u boji………………………………………………... 28 3.4.3 Opšti model vizuelnog komunikacionog sistema……………………. 29 3.5 Rezime………………………………………………………………………... 31 Pitanja………………………………………………………………………………… 31 Literatura……………………………………………………………………………... 32

4. Audio-vizuelne integracije……………………………………………………... 33

4.1 Interakcija medija…………………………………………………………….. 33 4.2 Bimodalnost ljudskog govora………………………………………………… 34 4.3 O itavanje sa usana…………………………………………………………… 35

v

Page 6: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

4.4 Pra enje usana………………………………………………………………… 37 4.5 Audio-vizuelno preslikavanje………………………………………………… 37 4.5.1 Konverzija na bazi klasifikacije……………………………………... 37 4.5.2 Audio i vizuelna integracija kod primena za o itavanje sa usana…… 38 4.6 Združeno audio-video kodovanje…………………………………………….. 38 4.7 Bimodalna personalna verifikacija…………………………………………… 39 4.8 Rezime………………………………………………………………………... 40 Pitanja………………………………………………………………………………… 40 Literatura……………………………………………………………………………... 41

5. Multimedijalna akvizicija podataka……………………………………….... 43

5.1 Diskretizacija kontinualnog signala…………………………………………... 43 5.2 Odmeravanje………………………………………………………………….. 44 5.2.1 Odmeravanje audio signala………………………………………….. 46 5.2.2 Odmeravanje dvodimenzionalnih (2-D) slika……………………….. 51 5.2.3 Niskopropusni anti-aliasing filtri……………………………………. 52 5.3 Digitalizacija audio signala…………………………………………………... 53 5.3.1 Analogno-digitalna konverzija……………………………………..... 54 5.3.2 Kriterijumi vernosti audio signala…………………………………… 55 5.4 Digitalizacija slika……………………………………………………………. 57 5.4.1 Vizuelna vernost……………………………………………………... 57 5.5 Rezime………………………………………………………………………... 58 Pitanja………………………………………………………………………………… 59 Literatura……………………………………………………………………………... 61

6. Kompresija teksta……………………………………………………………….. 62

6.1 Predstavljanje teksta u digitalnoj formi………………………………………. 62 6.2 Principi kompresije teksta, statisti ka suvišnost……………………………… 64 6.3 Shannon-ova teorema kodovanja za bešumni izvor………………………….. 67 6.4 Huffman-ovo kodovanje…………………………………………………….... 69 6.5 Aritmeti ko kodovanje……………………………………………………….. 71 6.6 Rezime………………………………………………………………………... 74 Pitanja………………………………………………………………………………… 75 Literatura……………………………………………………………………………... 76

7. Standardi u multimedijalnim komunikacijama………………………….. 77

7.1 Zna aj standardizacije………………………………………………………… 78 7.2 MPEG prilaz multimedijalnoj standardizaciji………………………………... 79 7.3 MPEG-1 standard…………………………………………………………….. 80

vi

Page 7: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

7.4 MPEG-2 standard…………………………………………………………….. 82 7.5 MPEG-4 standard…………………………………………………………….. 84 7.5.1 Delovi MPEG-4 standarda…………………………………………... 86 7.5.2 MPEG-4 standard: vizuelni deo……………………………………... 89 7.5.3 MPEG-4 standard: audio…………………………………………...... 90 7.5.4 H.264/AVC MPEG-4 (Part 10) standard……………………………. 91 Kodovanje i dekodovanje kod H.264/AVC standarda…................. 93 Entropijsko kodovanje kod H.264/AVC standarda……….............. 95 7.6 Kratak pregled standarda za kodovanje mirnih slika…………………………. 96 7.7 Standard JPEG 2000………………………………………………………….. 97 7.8 MPEG-7 standard…………………………………………………………...... 98 7.9 MPEG-21 standard…………………………………………………………… 101 7.10 ITU-T proces standardizacije kod audio-vizuelnih komunikacionih sistema… 104 7.10.1 Standardi za video kodovanje……………………………………...... 108 7.10.2 Standardi za kodovanje govora……………………………………… 112 7.10.3 Standardi za multimedijalno multipleksiranje i sinhronizaciju……… 113 7.11 Rezime………………………………………………………………………... 116 Pitanja………………………………………………………………………………… 117 Literatura……………………………………………………………………………... 119

8. Aplikativni aspekt multimedija………………………………………………. 124

8.1 Aplikativni aspekt osnovnih informaciono-komunikacionih pojmova………. 126 8.2 Osnove multimedijalne delatnosti……………………………………………. 129 8.2.1 Multimedijalna preprodukcija……………………………………….. 130 Prethodna analiza u preprodukciji………………………………… 130 Pri a na tabli – Storyboard………………………………………... 132 Procena troškova………………………………………………….. 133 Radni tim za multimedijalnu produkciju………………….............. 133 8.2.2 Multimedijalna produkcija…………………………………………... 134 8.2.3 Multimedijalna postprodukcija……………………………………… 136 8.3 Slika u multimediji……………………………………………………………. 137 8.3.1 Memorisanje, prenos i prikazivanje slike……………………………. 137 8.3.2 Senzori slike…………………………………………………………. 138 8.3.3 Osnovne obrade slike………………………………………………... 139 8.3.4 Bitmapirana slika…………………………………………………….. 141 8.3.5 Vektorski generisane slike…………………………………………... 143 8.3.6 Promenljive slike u multimediji……………………………………... 146 8.4 Tekst u multimediji…………………………………………………………… 148 8.4.1 Standardi za digitalnu prezentaciju karaktera……………………….. 149

vii

Page 8: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

8.4.2 Font…………………………………………………………………... 150 8.4.3 Prikazivanje teksta na monitoru……………………………………... 151 8.4.4 Veli ina, razmera i tip fontova………………………………………. 152 8.5 Animacija……………………………………………………………………... 154 8.5.1 Tradicionalna animacija……………………………………………... 155 8.5.2 Kompjuterska animacija……………………………………………... 157 8.5.3 Animacija u multimedijalnim sistemima……………………………. 160 Trodimenzionalni objekti u animaciji – 3D animacija……………. 160 Virtualna realnost u animaciji…………………………………….. 160 8.6 Zvuk u multimediji…………………………………………………………… 161 8.7 Dodir u multimediji…………………………………………………………... 163 8.8 Miris u multimediji…………………………………………………………… 165 8.9 Interakcija u multimediji……………………………………………………… 167 8.10 Rezime………………………………………………………………………... 168 Pitanja………………………………………………………………………………… 170 Literatura……………………………………………………………………………... 171

9. Aplikativni softver za multimedije…………………………………………... 172

9.1 Softverski alati za izradu multimedijalnih prezentacija………………………. 173 9.2 Softverski alati za obradu slika……………………………………………….. 174 9.2.1 Softverski alati za obradu bitmapiranih slika………………………... 174 9.2.2 Softverski alati za obradu vektorskih slika………………………….. 175 9.2.3 Softverski alati za editovanje pokretnih slika……………………….. 176 Program Adobe Premiere………………………………………..... 178 Program Final Cut Pro…………………………………………….. 179 9.2.4 Softverski alati za kreiranje animacija………………………………. 181 Program Adobe Flash…………………………………….............. 181 Program Autodesk Maya………………………………………….. 182 9.3 Programi za snimanje, obradu i editovanje zvuka……………………………. 186 9.3.1 Obrada zvuka pomo u Sound Forge-a………………………………. 187 Spektralna analiza u Sound Forge………………………………... 188 Uklanjanje šuma u Sound Forge-u……………………….............. 188 Dinami ka kompresija u Sound Forge-u…………………………. 191 Promena u estanosti u Sound Forge-u……………………………. 193 9.4 Rezime………………………………………………………………………... 194 Pitanja………………………………………………………………………………… 195 Literatura……………………………………………………………………………... 196

Spisak skra enica…………………………………………………………………….. 197

viii

Page 9: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

1. UVOD Prema standardu ISO/IEC JTC1 SC29/WG12, multimedija predstavlja sposobnost postupanja sa razli itim vidovima prezentacionih medija koji ine tip podataka sa zadatkom da definišu prirodu informacije u njenom kodiranom formatu. Komunikacione tehnologije imaju veliki uticaj na razvoj savremenog društve. Pre pojave ra unara, novine, radio, bioskop i televizija bile su primerena sredstva za masovne komunikacije. Kada su ranih osamdesetih godina uvedeni personalni ra unari, malo ljudi bilo je u stanju da pretpostavi njihov ogroman uticaj na našu svakodnevnicu. Da bi se što efikasnije koristili ra unarski potencijali, prezentacija informacija treba da bude efikasno strukturirana kroz memorisanje, prenos i pretraživanje. Medijum je sredina (vazduh, voda) kroz koju se nešto prenosi. Pošto skra enica “multi” predstavlja multipl, multimedija se odnosi na sredstva komunikacije sa više od jednog medijuma [1.1]. Multimedijalne tehnologije su glavna pokreta ka snaga za uvo enje itavog niza pogodnosti i primena sa ta ke gledišta korisnika. Radi se o interaktivnom predstavljanju govora, audija, videa, grafike, teksta, uz injenicu da informacione tehnologije povezuju komunikacije, ra unarsku tehniku, i procesiranje signala u jednu interdisciplinarnu celinu. Pri razmatranju problematike multimedijalnih tehnologija, pored ostalog, treba uzeti u obzir [1.2]:

Kontinualni trend u digitalizaciji, Brzo širenje digitalnih mreža i naro ito interneta, Konvergenciju razli itih tehnologija, uklju uju i komunikacije, distribuciju digitalnih

medija, informacione tehnologije, Pojavu novih komunikacijskih servisa i primene koje poti u od interneta i beži nih

tehnologija, Zahtev za multimedijalnim komunikacijama u realnom vremenu kao proširenje

monomedijalnih sistema. Sa ta ke gledišta multimedijalnih komunikacija, cilj je da se najpre obezbede one

primene kojima se integrišu tekst, zvuk i video informacija, a da se pri tome omogu i u svakom trenutku, interakcija. Pre svega, aplikacije Me unarodne unije za telekomunikacije (eng. International Telecomunications Union – ITU) i Grupe eksperata za obradu pokretne slike (eng. Motion Picture Expert Group – MPEG) treba da budu uzete u obzir. One podrazumevaju integracije, interaktivnosti, memorisanja, striminga, pretraživanja i distribucije digitalnih medija, kao i odgovaraju u infrastrukturu. S ta ke gledišta aplikacionog sloja zna ajni su i mobilni servisi, korisni ki intrerfejsi i mobilni pristupi bazama podataka. Sa druge strane, na mrežnom

1

Page 10: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

sloju, naglasak je na kontroli pristupa, alokaciji resursa i širine propusnog opsega, kontroli zagušenja saobra aja, i modeliranju saobra aja. Jednako je zna ajan i kvalitet servisa (eng. quality of service – QoS) u mrežnim multimedijalnim sistemima. Zahtev za kvalitet servisa i odgovaraju i parametri moraju biti u skladu sa garancijama QoS [1.3].

Nagli razvoj multimedijalnih tehnologija, i mogu nosti razmene multimedijalnih sadržaja preko interneta, doprineli su zna aju pove anja koli ine multimedijalnih podataka i to kako broja dokumenata, tako i veli ine pojedinih fajlova. Uz to, pojavila se i potreba za efikasnim tehnikama kompresije, pretraživanja i pronalaženja željenih multimedijalnih dokumenata. Treba ista i da se u srcu širokopojasnih mreža nalaze tehnologije koje omogu avaju brzi prenos podataka prenosnim putevima velikog kapaciteta izme u razli itih ta aka u mreži.

1.1 Klasifikacija medija

Naglašeno je da multimedija predstavlja raznolikost medija. Mediji se mogu klasifikovati prema kriterijumima: percepciji, predstavljanju, prikazivanju, memorisanju, prenosu, sadržaju, itd.

U tipi nom multimedijalnom okruženju, informacija se prenosi zainteresovanim korisnicima putem naših ula sluha, vida, mirisa, dodira i ukusa. Me utim, naj eš e se u multimedijalnim sistemima koriste audio i vizuelne informacije. Tehnologije za uklju enje ostalih ula: mirisa, dodira i ukusa zahtevaju dodatna istraživanja [1.4]. U okviru teku ih multimedijalnih tehnologija tekst, mirne slike – image i pokretne slike – video, pripadaju vizuelnom mediju, dok se muzika i govor tretiraju kao auditorni medijum.

Što se ti e predstavljanja (eng. representation), medijum je okarakterisan internim ra unarskim predstavljanjem. Na primer, slova iz nekog teksta mogu se predstaviti koriš enjem Ameri kog standardnog koda za razmenu informacija (eng. American standard code for information interchange – ASCII), audio signali putem impulsno kodno modulisanih (eng. pulse code modulation – PCM) odbiraka, podaci o mirnoj slici memorisanjem PCM ili Grupe eksperata za fotografiju (eng. Joint Photographic Experts Group - JPEG) formata, dok se video podaci mogu predstaviti, na primer u obliku PCM ili MPEG formata.

Prikazivanje (eng. presentation) se odnosi na alate i ure aje koji prikazuju ulaznu i izlaznu informaciju. Tako na primer, novine, ekrani, i zvu nici su izlazni mediji, dok tastatura, miš, mikrofon i kamera ine ulazne medije.

Memorisanje se ti e prenosioca podataka koji objedinjuje memorisanje informacije. Novine, mikrofilmovi, magnetni i opti ki diskovi služe za memorisanje informacija.

Kontinualni prenos podataka omogu avaju mediji kao što su opti ki kablovi, koaksijalni kablovi, slobodan vazdušni prostor (za beži ni prenos).

Najzad, poznata je klasifikacija medija na diskretne i kontinualne. Diskretni mediji su vremenski nezavisni, dok su kontinualni vremenski zavisni. Za diskretne medije (na primer tekst, grafika) obrada podataka nije vremenski kriti na, dok su kod kontinualnih medija predstavljanje i obrada podataka vremenski zavisni. Na Slici 1.1.1 prikazano je nekoliko primera podataka za diskretne i kontinualne medije kao i karakteristi ne primene.

I neki drugi signali mogu tako e da se tretiraju kao multimedijalni podaci. To su, na primer, izlazi iz razli itih senzora kao što su detektori dima, vazdušnog pritiska, temperature (kontinualni mediji).

2

Page 11: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

MULTIMEDIJALNI PODACI

DISKRETNI KONTINUALNI

PODACI: TEKST MIRNA SLIKA AUDIO VIDEO

NEINTER- AKTIVNI

INTERAK-TIVNI

KNJIGE SLAJDOVI

RAZGOVORI U MREŽI

DVD FILMOVI TV/AUDIO DISTRIBUCIJA

VIDEO KONFER. INTERAKTIVNA TELEVIZIJA

NEINTER- AKTIVNI

INTERAK-TIVNI

INTERAK- TIVNOST:

PRIMENE, PRIMERI:

Slika 1.1.1—Primeri podataka za diskretne i kontinualne medije i karakteristi ne primere

1.2 Osobine multimedijalnih sistema

Formalno gledano, svaki sistem koji podržava dva ili više medija mogao bi se nazvati multimedijalni. Dnevne novine, na primer, predstavljaju multimedijalnu prezentaciju, jer obuhvataju tekst i mirnu sliku kao ilustraciju. Bez obzira na sve, multimedijalni sistem treba da obuhvati i kombinaciju medija, nezavisnost, ra unarski podržanu integraciju i mogu nost komuniciranja.

Kombinacija medija podrazumeva dva ili više medija pri emu se ide na specifikaciju tipova medija. Neki istraživa i predlažu da postoji najmanje jedan kontinualan (vremenski zavisan) i jedan diskretan (vremenski nezavisan) medij [1.5]. U tim uslovima, sistem za obradu teksta, koji može da inkorporira mirne slike, ne bi predstavljao multimedijalni sistem (oba medija su diskretna). Pojedini istraživa i prihvataju opštije definicije multimedija.

Razli iti mediji u multimedijalnom sistemu treba da poseduju visok stepen nezavisnosti. Ovaj kriterijum obezbe uje nezavisno procesiranje razli itih tipova medija i fleksibilnost prilikom kombinacije ovakvih medija.

Da bi se postigla nezavisnost medija potrebno je nezavisno procesiranje. Što se ti e multimedijalnih sistema, kompjuteri obezbe uju još jednu važnu osobinu – mogu nost integracije. Razli iti mediji u multimedijalnom sistemu trebalo bi da budu integrisani. Visok stepen integracije obezbe uje da promene sadržaja jednog medija dovode do odgovaraju ih promena u drugom mediju. U današnjem visokoumreženom svetu, multimedijalni sistemi mogu

3

Page 12: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

komunicirati me usobno tako što se kroz mrežu prenose multimedijalni podaci u diskretnom ili kontinualnom obliku.

1.3 Konvergencija telekomunikacija i ra unara

Konvergencija telekomunikacija i ra unara, iji smo svedoci ve duže vreme, ima veliki uticaj na tehnologiju, industriju i šire slojeve društva [1.6]. Da bi se ovo bolje shvatilo, usvoji emo model sa tri nivoa za mrežu koja služi za prenos informacija, uz mogu nost pružanja odgovaraju ih servisa. Pogodan model prikazan je na Slici 1.3.1. pri emu emo za sada samo navesti middleware i transportni sloj.

APLIKACIJE

MIDDLEWARE

TRANSPORTNI SLOJ

Slika 1.3.1—Model sa tri nivoa mreže

Middleware sloj služi za stvaranje multimedijalnih aplikacija na brz i robusan na in.

Transportni sloj obezbe uje pouzdan transparentan prenos multimedijalnih podataka izme u krajnjih ta aka u mreži.

Aplikacije tretiramo kao skup funkcija koje obezbe uju zahteve korisnika. Primeri mrežnih aplikacija su elektronska pošta, telefonija, pristup bazi podataka, transfer fajla, video konferencija. Primeri servisa odnose se na audio ili video transport, upravljanje sistemom fajla, štampanje, mehanizme elektronskog pla anja, kao i na enkripciju uz pouzdan prenos podataka.

Svaki korisnik u slu aju umrežene aplikacije nalazi se u interakciji sa lokalnim terminalom koji komunicira sa udaljenim ra unarima ili drugim korisnicima u mreži. Mrežne aplikacije podrazumevaju interakciju korisnika sa serverom ili sa drugim korisnikom. Na Slici 1.3.2 dati su primeri arhitektura za multimedijalne mrežne aplikacije i to: korisnik – korisnik na Slici 1.3.2-a, korisnik – dva korisnika na Slici 1.3.2-b, više korisnika – server na Slici 1.3.2-c, i korisnik – server – korisnik na Slici 1.3.2-d.

Slika 1.3.2—Primeri arhitekture za mrežne multimedijalne aplikacije

a) b) KORISNIK KORISNIK KORISNIK

c) d) KORISNIK

KORISNIK

KORISNIK

S E R V E R

KORISNIK

KORISNIK

KORISNIK

SERVER

KORISNIK

4

Page 13: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

1.4 Multimedijalni komunikacioni model

Na multimedijalni komunikacioni model strogo uti u rešenja proizvo a a opreme za personalne ra unare i radne stanice, uklju uju i odgovaraju i aplikacioni softver sa jedne, i koncept intiligentne mreže sa druge strane [1.7]. Slojeviti model za današnje i budu e multimedijalne komunikacije obuhvata pet komponenata:

Deobu kompletnih informacionih objekata prema razli itim vrstama informacija (podaci,

audio, video) radi lakšeg komuniciranja, memorisanja i obrade, pri emu se vodi ra una o mogu nosti integracije razli itih tipova multimedija,

Standardizaciju servisnih komponenata zavisno od vrste informacije, po mogu nosti sa nekoliko nivoa kvaliteta,

Stvaranje platforme za dva nivoa: platforme za mrežni servis i multimedijalne komunikacione platforme,

Definisanje opštih aplikacija za višestruku namenu u razli itim multimedijalnim okruženjima,

Specifi ne primene: elektronske kupovine, u enje na daljinu, pri emu se koristi platforma za mrežni servis i multimedijalna komunikaciona platfoma.

S obzirom na mogu nost dostupnosti resursa u svakom pojedina nom slu aju,

multimedijalne komunikacione aplikacije moraju biti skalabilne. Generalno, multimedijalni komunikacioni model koristi dve vrste komunikacija, kao što

je prikazano na Slici 1.4.1.

KORISNI KI INTERFEJS

KORISNI KI INTERFEJS

KORISNI KI INTERFEJS

TRANSPORT

TRANSPORT PROCESIRANJE, MEMORISANJE,

TIP A

TIP B

PRETRAŽIVANJE

Slika 1.4.1— Dva tipa multimedijalnih komunikacijskih modela

Kod tipa A postoji korisni ki interfejs koji obezbe uje da svi korisnici budu me usobno povezani dok transportni sloj prenosi multimedijalni signal od jednog do drugog korisnika, ili ka svim korisnicima u komunikaciji. Korisni ki interfejs kreira multimedijalni signal i omogu ava korisnicima interakciju na najlakši na in. Transportni sloj uva kvalitet multimedijalnog signala kako bi ga svaki od korisnika primio na što kvalitetniji na in. Neki od primera za tip A su telekonferencija, radiodifuzija, videofoni, u enje na daljinu, kao i scenarija koji se odnose na deobu radnog prostora.

Kod tipa B, postoji korisni ki interfejs za interakciju, i transportni sloj za prenos multimedijalnog signala od memorije do korisnika. Tako e, postoji i mehanizam za memorisanje i pretraživanje multimedijalnih signala koje kreira, ili zahteva korisnik. Pored memorisanja i pretraživanja postoje ih multimedijalnih podataka, od najve eg zna aja su memorisanje i

5

Page 14: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

ažuriranje ovih podataka. Neki primeri za tip B uklju uju difuziju, video, arhive dokumenata iz digitalne biblioteke, pristup poslovnim sastancima, itd.

1.5 Korisni ki zahtevi

Korisniku je potreban multimedijalni informacioni sistem koji priprema i predstavlja informaciju od interesa, dozvoljava dinami ku kontrolu aplikacija i obezbe uje prirodan interfejs. Sa ta ke gledišta korisnika najvažniji zahtevi multimedijalnih komunikacija su slede i:

Brze pripreme i prezentacije razli itih tipova informacija od interesa, vode i ra una o sposobnosti i dostupnosti terminala i servisa,

Dinami ka kontrola multimedijalnih primena, s obzirom na interakcije konekcije i kvalitet na zahtev kombinovan sa interfejsima ovek – mašina,

Podržavanje korisnika imaju i u vidu njihove individualne mogu nosti, Standardizacija.

Sa ta ke gledišta korisnika, njihovi zahtevi u pogledu servisa su definisani putem medija, sadržaja koji se prenose, tipa komunikacija, kao i mogu nosti da se kombinuju ova tri faktora. S druge strane multimedijalni korisni ki servisi mogu se podeliti na tri kategorije: lokalni (neinteraktivni i interaktivni), udaljeni neinteraktivni i udaljeni interaktivni. Tako e se mogu podeliti na servise za rezidencijalnu, mobilnu i biznis upotrebu. U Tabeli 1.5.1 prikazan je kontekst u kome se mogu koristiti multimedijalni servisi [1.8].

Uslovi koriš enja servisa definišu se zavisno od njihove hitnosti, mesta, nezavisnosti. Terminali i servisi obi no se koriste u kancelarijama, kod ku e, u prevoznim sredstvima, ili na javnim mestima. Nezavisnost se može definisati kao mogu nost prenošenja terminala i njegove nezavisnosti od date infrastrukture, sa ta ke gledišta korisnika. Stepen nezavisnosti varira od jednog do drugog terminala. S druge strane, stepen hitnosti odre uje da li e servis biti obezbe en u realnom vremenu, ili je dovoljno oflajn servis.

Tabela 1.5.1—Kontekst u kome se mogu koristiti multimedijalni servisi

Lokalni Udaljeni neinteraktivni Udaljeni interaktivni Rezidencijalni: zabava (TV), umetnost, podu avanje, igre

Difuzija Telefonija, videofoni, kupovina od ku e, igre, konsultacije na daljinu, video na zahtev

Mobilni: prezentacije, demonstracije

Difuzija, bezbednost na daljinu, monitoring

Upravljanje, ugovaranje

Biznis: multimedijalna prezentacija, vežbanje, konsultacija baze podataka

Telekonferencija, vežbanje na daljinu, nadgledanje na daljinu

Video sastanak, videokonferencije, u enje na daljinu, upravljanje, bezbednost na daljinu, monitoring, daljinska dijagnostika

Postoje mnogobrojni klju ni zahtevi zajedni ki za sve multimedijalne servise: trenutna dostupnost, prenos informacija u realnom vremenu, servis onlajn, pristup terminala bilo kom servisu, itd.

6

Page 15: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

1.6 Mrežni zahtevi Sa ta ke gledišta mreže, najvažniji zahtevi multimedijalnih tehnologija ogledaju se u slede em:

Velike brzine i promene bitskih protoka, Nekoliko konekcija koje koriste isti pristup, Sinhronizacija razli itih tipova konekcija, Pogodni standardizovani servisi i dodatni servisi koji podržavaju multimedijalne

aplikacije. Zahtevi za primenama u komunikacijskim servisima mogu se podeliti na saobra ajne i finkcionalne zahteve. Saobra ajni zahtevi uklju uju širinu propusnog opsega, kašnjenja i pouzdanost. Mogu se zadovoljiti koriš enjem upravljanja resursom. Uspostavljaju relaciju izme u prenošenja podataka i resursa, i obezbe uju prenos audio-vizuelnih podataka. Informacija o potrebnim resursima zato mora biti dostupna u svim vorovima koji u estvuju u distribuiranim aplikacijama, krajnjim i centralnim sistemima, tokom prenosa podataka. Stoga, resursi treba da budu nezavisni, a u vorovima se uspostavlja takvo stanje koje ozna ava da je veza uspostavljena. Funkcionalni zahtevi podrazumevaju višedifuzni prenos, i sposobnost definisanja koordiniranih nizova podataka.

Postoje e fiksne i mobilne mreže karakterisane su takvom arhitekturom koja obezbe uje upravljanje saobra ajem, razli itim konfiguracionim mogu nostima, servisnim platformama i dobro definisanim ta kama interkonekcije izme u mreže razli itih operatora. Klju ni zahtev svodi se na to da bi isti visokokvalitetni mrežni servisi trebalo da postoje kada se grade integrisane mrežne platforme za govor, podatke i multimedijalne servise [1.9]. Budu a multimedijalna mreža mora da bude tako organizovana da podrži intenzivan saobra aj, široku lepezu servisa i razli ite oblike saobra aja, kada je re o efikasnom rutiranju saobra aja i preoptere enju u mreži. Mreža se mora, tako e, brzo adaptirati na stalne promene saobra ajnih uslova.

1.7 Multimedijalni terminali Multimedijalni terminali služe za pretraživanje, memorisanje i difuziju pisanog sadržaja (podaci), zvuka i vizuelnog sadržaja. Arhitektura ovih sistema može se definisati na osnovu razli itih prilaza na bazi obrade telekomunikacionih podataka i audio-vizuelnih tehnologija. Uklju ivanjem glasa i podataka, kao i mirne i pokretne slike u komunikacije, raste sofisticiranost u pogledu pristupa distribuiranim resursima, uz zna ajnu uštedu vremena u procesu odlu ivanja. Dijalog na daljinu, diskusija, proizvodnja informacija, održavanje i nadzor, omogu eni su uvo enjem multimedijalnih sistema po ceni koja stalno opada. Postoje a rešenja nude, na primer, multimedijalnu kancelariju, ili kompjutersku radnu stanicu sa strogo namenskom opremom, kao što su telefonski terminali, videofoni, ili telekonferencijski sistemi. Multimedijalna radna stanica u ku nom i kancelarijskom okruženju prikazana je na Slici 1.7.1 na nivou blok-šeme. Set – top box je ure aj koji se primenjuje na standardni TV prijemnik i omogu ava prijem digitalnih TV signala, pristup internetu, itd. Sabirna magistrala predstavlja jednu ili više provodnika koji služe kao zajedni ka veza za prenos signala izme u odre ene grupe ure aja. Eternet mreža koristi tzv.

7

Page 16: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

postupak višestrukog pristupa uz detekciju (eng. carrier sence multiple access with collision detection – CSMA/CD).

BRZA EKSTERNA MREŽA

LAN, KABLOVSKA, SATELITSKA

Slika 1.7.1—Blok-šema multimedijalne radne stanice u ku nom i kancelarijskom okruženju

Današnji terminali osposobljeni su za širokopojasne multimedijalne aplikacije. Radi se o personalnim ra unarima uz dodatne telekomunikacione i video – audio mogu nosti, kao i o inteligentnim TV prijemnicima uz dodatne mogu nosti interaktivnosti. Istovremeno, televizija visoke rezolucije (eng. high-definition television – HDTV) utrla je put digitalnoj televiziji. Obezbedila je memorisanje, procesore za mirnu sliku i video, kao i ravne ekrane [1.10]. Oprema za multimedijalni terminal sadrži, tako e, odgovaraju e kamere, skenere, štampa e i memoriju. Pored toga, potrebna je i specijalna oprema za editovanje multimedijalnih informacija što podrazumeva kreiranje, naizmeni no ponavljanje i poništavanje struktura sadržaja. Ure aji za trodimenzionalni (eng. three-dimesional – 3D) displej i sistem za prepoznavanje govora olakša e bržu i lakšu interakciju oveka sa multimedijalnim promenama. Radi se o tome da se postigne što lakša integracija svih oblika informacija, uz obezbe enje odgovaraju ih bitskih brzina.

1.8 Paketski transfer

U pore enju sa komutacijom kanala, paketska komutacija pruža dinami ku alokaciju (raspored) širina propusnog opsega i komutacionih resursa. Paketske mreže omogu avaju transport integracionog servisa. One prenose glas, video i podatke koriste i iste hardverske protokole. Uz to, paketska komutacija ne zahteva od korisnika da alocira kanal ili širinu propusnog opsega prenosa podataka. Pošto više korisnika može da šalje pakete po zajedni kom kanalu, resursi u paketskim mrežama koriste se efikasnije nego u mrežama sa komutacijom

KANCELARIJSKO/ KU NO OKRUŽENJE

INTERAKTIVNA TV

TF LINIJA

LAN/ETERNET MREŽA

Set – Top Box MODEM

VIDEO RIKORDER

KAMERA

RA UNAR

SABIRNA MAGISTRALA

KU NO OKRUŽENJE

8

Page 17: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

kanala. Video signali su naro ito pogodni za paketsku komutaciju. Slike obi no sadrže oblasti sa više ili manje detalja, kao i periode bržih i sporih pokreta. Otuda, video kanali treba da budu u stanju da daju nizove podataka sa promenljivim bitskim protokom [1.11], [1.12]. Paketske mreže prenose direktno signale promenljivih bitskih brzina (eng. variable bit rate – VBR). Na strani predajnika nije potrebna bafer memorija niti kontrola bitskog protoka u povratnoj sprezi. Pod bafer memorijom podrazumeva se mesto za skladištenje podataka koji se koriste u toku obrade i prenosa. U principu, bafer se koristi i pri povezivanju mreža za kompenzaciju razlike u brzini obrade signala izme u mrežnih ure aja. Treba naglasiti i to da paketske mreže koje obezbe uju prioritet paketima istovremeno omogu avaju video koderima da zaštite kriti nu informaciju. Tako e, paketski video-transfer kroz mrežu za asinhrono multipleksiranje sa vremenskom raspodelom kanala (eng. asynchronous time division multiplexing – ATDM) – vremenski multipleks ili internet, podrazumeva kodovanje i prenos digitalnog video signala pri emu se vodi ra una o kvalitetu prijemnog signala. U principu, ATDM podrazumeva tehniku multipleksiranja kod koje se prenos ostvaruje u obliku nezavisnih vremenskih intervala koji se popunjavaju ozna enim paketima saglasno realnim trenutnim potrebama svake aplikacije. U tom slu aju, terminalna oprema (tj. korisni ka aplikacija) definiše trenutni bitski protok, bez obzira na to koliko on iznosi, a koji se može menjati u toku trajanja same komunikacije. Na Slici 1.8.1 dat je jedan primer za transfer digitalnog video signala.

VIDEO SIGNAL

KODER - TRANSFORMACIJA - KVANTIZACIJA - ENTROPIJSKO KODOVANJE - KONTROLA BINARNOG PROTOKA

APLIKACIJA - STRUKTURIRANJE PODATAKA

MREŽNO MULTIPLEKSIRANJE/RUTIRANJE

- KOREKCIJA GREŠAKA UNAPRED

- DETEKCIJA GREŠAKA - DETEKCIJA GUBITAKA - KOREKCIJA GREŠKE

APLIKACIJA - RESINHRONIZACIJA

DEKODER - ENTROPIJSKO DEKODOVANJE - INVERZNA TRANSFORMACIJA - PRIKRIVANJE GUBITAKA - POSTPROCESIRANJE - DEKVANTIZACIJA

KORISNIK

Slika 1.8.1—Operacije prilikom paketskog transfera digitalnog video signala

U mrežama sa internet protokolom, paketi su promenljive dužine i ne postoji prethodno

uspostavljanje putanje – ruta. Kašnjenje i paketski gubici neizbežni su [1.13], [1.14]. Internet protokol (eng. internet protocol – IP) služi za me umrežni rad koji obezbe uje nekonektivni

9

Page 18: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

servis kroz više mreža sa komutacijom paketa. IP obezbe uje funkcije adresiranja, specifikacije tipa servisa, rastavljanje i ponovno sastavljanje i zaštite. IP je specificiran u dokumentu “Zahtev za komentar REC791” (eng. request for comment – REC). REC-ovi predstavljaju standarde i preporuke na osnovu kojih funkcioniše internet. Ove preporuke objavljuje Grupa za IP standarde (eng. Internet Engineering Task Force – IETF). Ova me unarodna organizacija za standarde sastoji se od preko 80 radnih grupa i bavi se oblastima vezanim za razvoj protokola kontrole prenosa/internet protokola (eng. transmission control protocol/internet protocol – TCP/IP). Protokol je razvijen u SAD od strane Ministarstva odbrane, za potrebe me unarodnog rada na sloju 3(IP) i pouzdanog prenosa na sloju 4 za dvoslojno bezbedno rutiranje (eng. two-level secure re-routing – TSR) zasnovan na klize em prozoru i retransmisijama. Danas se ova skra enica koristi za referenciranje na itavu grupu protokola na internetu.

Najbolji izbor za video-transfer je statisti ko multipleksiranje uz garanciju kvaliteta. Novi spojni putevi u mreži su obezbe eni ukoliko se može unapred garantovati traženi kvalitet, imaju i u vidu optere enje mreže na bazi utvr enog saobra ajnog toka.

1.9 Rezime Trend u multimedijalnim komunikacijama ogleda se u obezbe enju servisa koji integrišu tekst, zvuk, mirnu i pokretnu sliku, uz jednostavnost upotrebe i odgovaraju u interaktivnost. S druge strane, termin multimedijalne komunikacije odnosi se na predstavljanje, memorisanje, pretraživanje i širenje vremenski obra ene informacije u obliku teksta, mirne i pokretne slike, grafike, govora, zvuka, animacije, rukom pisanog teksta, fajlova podataka, kao što je to prikazano na Slici 1.9.1.

AUDIO KOMUNIKACIJA (TELEFONIJA, PRENOS ZVUKA)

MULTIMEDIJALNA KOMUNIKACIJA

PRENOS TEKSTA I MIRNE SLIKE

MULTIMEDIJALNAKOMUNIKACIJA

PRENOS PROMENLJIVIH

SLIKA

Slika 1.9.1—Multimedijalna komunikacija

Osnovni elementi komunikacionih modela su: obrada, memorisanje, pretraživanje,

transport i korisni ki interfejs. Što se ti e korisnika, njemu je potreban sistem koji priprema i predstavlja informaciju, omogu uje dinami ko upravljanje odgovaraju im informacijama i obezbe uje interfejs. S ta ke gledišta mreže, najvažniji zahtevi odnose se na velike bitske protoke, sinhronizaciju razli itih tipova informacija i na odgovaraju e standardizovane servise. Opšte funkcije mreže kod paketskog transfera od izvora do korisnika su rutiranje i multipleksiranje. Rutiranjem se obezbe uje povezanost vorova u mreže nezavisno od tipa informacije koja se prenosi. Multipleksiranjem se obezbe uje kvalitet prenosa. Pri tome treba uzeti u obzir saobra ajne karakteristike i kvalitet aplikacija koje zahteva korisnik.

10

Page 19: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Pitanja

1. Šta je to multimedija? 2. Koje faktore treba uzeti u obzir pri razmatranju problematike multimedijalnih

tehnologija? 3. Kakva je funkcija aplikacionog i mrežnog sloja u multimedijalnim komunikacijama? 4. Navesti i analizirati kriterijume prema kojima se sprovodi klasifikacija medija. 5. Koje elemente treba da obuhvati jedan multimedijalni sistem? 6. Šta su to kontinualni mediji i kako se uklju uju u multimedijalni sistem? 7. U emu se ogleda zna aj nezavisnosti medija u okviru multimedijalnog sistema i kako

se ona postiže? 8. Nacrtati etiri blok-šeme arhitekture za mrežne multimedijalne aplikacije. 9. Koje komponente sadrži slojeviti model za multimedijalne komunikacije?

10. Oblici multimedijalnih komunikacionih modela: uloga i zna aj pojedinih elemenata. Navesti odgovaraju e blok-šeme.

11. Koji su najavažniji zahtevi multimedijalnih komunikacija sa ta ke gledišta korisnika? 12. Koje su sve kategorije multimedijalnih komunikacionih servisa? 13. Koji su uslovi koriš enja multimedijalnih servisa? 14. Šta su osnovni zajedni ki zahtevi kod uvo enja multimedijalnih servisa? 15. Koji su najvažniji mrežni zahtevi multimedijalnih komunikacija? 16. Koja je razlika izme u saobra ajnih i funkcionalnih zahteva u multimedijalnoj mreži? 17. Koje uslove u pogledu organizovanosti treba da ispuni jedna multimedijalna mreža? 18. Koje su funkcije multimedijalnih terminala? 19. Navesti neophodnu opremu za multimedijalne terminale. 20. Koje su karakteristike paketskog transfera multimedijalnih podataka? 21. ime se karakteriše paketski video transfer kroz mrežu za asinhrono multipleksiranje

sa vremenskom raspodelom kanala?

Literatura [1.1] M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003. [1.2] K. R. Rao, Z. S. Bojkovi , and D. A. Milovanovi , Introduction to Multimedia

Communications: Applications, Middleware, Networking. Wiley, 2006. [1.3] N. Chapman and J. Chapman, Digital Multimedia. Wiley, 2000. [1.4] T. N. Ryman, “Computers learn to smell and taste,” Expert Syst., vol. 12, no. 2, pp.

156–161, May 1995. [1.5] R. Steinmetz and K. Nahrstedt, Multimedia: Computing, Communications and

Applications. Prentice Hall, 1996. [1.6] D. G. Messerschmitt, “The convergence of telecommunications and computing: what

11

Page 20: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

are the implications today”? Proc. IEEE, vol. 84, pp. 1167–1186, 1996. [1.7] K. Watabe et al., “Distributed desktop conferencing system with multiuser multimedia

interface,” IEEE J. Sel. Areas Commun., vol. 9, pp. 531–539, May 1991. [1.8] K. R. Rao, Z. S. Bojkovi , and D. A. Milovanovi , Multimedia Communication

Systems; Techniques, Strandardes, and Netwoks. Prentice Hall, 2002. [1.9] E. Fouques, “Switching and routing: providing value with multimedia services,” Alcatel

Telecommun. Rev., no. 3, pp. 198–204, 1999. [1.10] Z. S. Bojkovi , “Digital HDTV system compression,” J. Commun., vol. 45, pp. 2–10,

May–Jun. 1994. [1.11] L. Chiariglione and L. Corgnier, “System consideration for picture communications,” in

Proc. IEEE Int. Conf. on Communications, ICC '84, Amsterdam, Netherlands, pp. 245–249.

[1.12] Z. S. Bojkovi , “Some issues in packet video: Modeling, coding and compression,” in 2nd Int. Workshop Image and Signal Processing: Theory, Methodology, Systems and Applications, Budapest, Hungary, Nov. 1995, pp. 2–23.

[1.13] G. Karlsson, “Asynchronous transfer of video,” Swedish Institute of Computer Science, Kist, Sweden, Res. Rep. R95:14, 1997.

[1.14] P. White and J. Groweroft, “The integrated services in the Internet: State of the Art,” Proc. IEEE, vol. 85, pp. 1934–1946, Dec. 1997.

12

Page 21: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

2. OSNOVI AUDIA

2.1 Karakteristike zvuka Kada proizvedeni zvu ni talas do e do uha i obradi ga mozak, ujemo zvuk. Zvuk, kao i

svaki talas, ima osobine koje uklju uju refleksiju, refrakciju i difrakciju. Zvu ni talas ima svoju frekvenciju, amplitudu (glasnost) i anvelopu (talasni oblik). Audio sistemi su uneli mnogo specifi nih karakterisitka koje su rezultat izuzetnih zahteva ula sluha kao krajnjeg korisnika zvu nih informacija. Izvesne specifi nosti proizilaze kao posledica velikog informacionog polja koje je odre eno rasponom dinami kog opsega reda veli ine 100 dB i više, uz frekvencijski opseg širine od 20 Hz do 20 kHz. Treba dodati i injenicu da ulo sluha ima veliku osetljivost i detekciju razli itih vrsta izobli enja signala. Frekvencijski opseg zvuka može se podeliti u etiri kategorije:

Infra zvuk: od 0 Hz do 20 Hz, Zvuk koji se uje: od 20 Hz do 20 kHz (audio opseg), Ultrazvuk: od 20 kHz do 1 GHz, Hiperzvuk: od 1 GHz do 10 GHz.

Audio opseg se razlikuje od osobe do osobe, a reakcija uha na zvuk visoke frekvencije

pogoršava se starenjem. Srednjove ni ljudi, sa dobro o uvanim slušnim sistemom, uju zvuke frekvencije iznad 15 kHz. Zvu ni talasi prostiru se brzinom od 340 m/s pri sobnoj temperaturi (20 °C). Stoga, talasna dužina varira od 17 m (odgovara frekvenciji od 20 Hz) do 1.7 cm (odgovara frekvenciji od 20 kHz). Spektar audio signala sadrži frekvencije, njihove harmonike, mogu e je i modulacione produkte. Najve i broj osnovnih frekvencija zvu nih talasa je ispod 5 kHz. Zvu ni talasi u opsegu 5 kHz do 15 kHz uglavnom se sastoje od harmonika. Harmonici i njihove amplitude odre uju kvalitet zvuka. To omogu uje da se razlikuju zvuci koji dolaze iz razli itih izvora (glas, muzi ki instrument, npr. klavir ili gitara). Intezitet ili amplituda zvuka odgovara glasnosti kojom ga uho registruje. Za zvuk ili audio-registrovanje i reprodukciju, intezitet zvuka se izra unava na dva na ina. Najpre se može izraziti na akusti nom nivou, što predstavlja intezitet koji uho registruje. Drugo, može se izraziti na elektri nom nivou, jer je zvuk konvertovan u elektri ni signal. U oba slu aja, intezitet se izra unava u dB. Akusti ki, intezitet zvuka meri se preko nivoa zvu nog utiska, tj.,

13

Page 22: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

10ref

Intenzitet zvuka dB 20 logP

=P

(2.1.1)

gde je P akusti na snaga zvuka, Pref intenzitet zvuka na pragu ujnosti. Utvr eno je da je karakteristi na vrednost za Pref = 0.0002 dyn/cm2 [2.1] ili Pref = 2 × 10 5 Pa. Ova vrednost se koristi u (2.1.1) za obra ivanje intenziteta zvuka. Treba ista i da je uho neosetljivo na nivoe zvu nog pritiska manje od Pref . Intezitet audio signala izražava se preko nivoa elektri ne snage, tj.,

100

Intenzitet zvuka dBm 10 logP

=P

(2.1.2)

gde je P snaga audio signala, P0 1 mW. Sufiks “m” u dB stavljen je zato što se intezitet zvuka menja u odnosu na snagu od 1 mW. Na Slici 2.1.1 prikazane su granice ujnosti i podru ja govora i muzike.

Slika 2.1.1—Granice ujnosti i podru ja govora i muzike

Važna karakterisitka zvuka je njegova anvelopa. Tipi na anvelopa sastoji se iz etiri sekcije: porast, opadanje, podrška i vra anje na po etnu vrednost amplitude. Jedan primer za muzi ku notu dat je na Slici 2.1.2.

U toku porasta anvelope, intezitet zvuka raste do najvišeg nivoa, zatim opada do nekog srednjeg nivoa na kome je podešen u odre enom vremenskom periodu. Posle odre enog vremena, intezitet zvuka opada na po etnu vrednost.

14

Page 23: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Slika 2.1.2—Anvelopa za muzi ku notu

Za efikasnu analizu govora kao jedne od najvažnijih multimedijalnih kategorija, treba poznavati principe ljudskog vokalnog sistema. Me utim to izlazi iz okvira ove knjige, pa emo se više baviti efikasnim predstavljanjem govora i s tim u vezi najpre emo razmotriti osobine ove ijeg slušnog sistema.

2.2 Neke karakteristike ove ijeg slušnog sistema

Uho i njemu pridružni nervni sistem kompleksan je interaktivni sistem. S jedne strane, uho je osetljivo na mala izobli enja u signalu. S druge strane, zanemaruju se izobli enja za koje se pretpostavlja da su irelevantna. Ove osobine omogu uju da se postigne dobra kompresija radi efikasnog memorisanja audio signala. Treba naglasiti i to da kod slušnog sistema postoji izbalansiranost izme u frekvencijske i vremenske razlike.

Utv eno je da zvuk treba da postoji najmanje 1 ms pre nego što bi se mogao uti. Osetljivost zvuka smanjuje se u prisustvu drugog zvuka sa sli nim frekvencijskim sadržajem. Ovaj efekat je poznat kao maskiranje i prikazan je na Slici 2.2.1.

Slika 2.2.1—Efekat maskiranja

15

Page 24: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Jak ton pri zadatoj frekvenciji može da maskira slabije signale koji odgovaraju susednim frekvencijama, što je prikazano na Slici 2.2.1. Dakle, ovde jak ton maskira druge blisko rasprostranjene slabije tonove.

Frekvencijska rezolucija uha nije uniformna u celom audio-spektru od 20 Hz do 20 kHz. Osetljivost je najviša na niskim frekvencijama i opada na višim frekvencijama. Na niskim frekvencijama uho može da razlikuje izdvojene tonove od nekoliko Hz. Me utim, na višim frekvencijama, tonovi se moraju razlikovati za stotine Hz da bi se mogli registrovati.

Kombinovanjem frekvencijske osetljivosti i šuma maskiranja dobija se prag ujnosti. Svaki audio signal ija je amplituda ispod praga maskiranja ne uje se.

2.3 Registrovanje audia

Zvuk se generiše i procesira na razli ite na ine. U toku govora, zvu ni talas generiše osoba, a uje je slušalac. U tom slu aju, nije potrebna automatska obrada zvuka. Me utim, obrada i memorisanje zvuka potrebni su kod mnogobrojnih primena, na primer, radiodifuzija i muzi ka industrija. U ovim primenama proizvedeni audio signali su memorisani za pretraživanja u budu nosti i tzv. “playback”. Registrovanje zvuka podrazumeva izvor, slušaoca i okruženje. Zvuk se reflektuje od okolnih objekata. Slušalac uje zvuk direktno iz izvora kao i reflektovani zvuk. Ostale komponente zvuka doprinose tzv. zvu nom ambijentu. Ambijent se stvara refleksijama u zatvorenim prostorima kao što su to, na primer, koncertne dvorane. U manjim prostorijama može biti više refleksija, a nijedna od njih ne kasni toliko da bi proizvodila eho koji predstavlja diskretno ponavljanje dela zvuka, koji i dalje postoji u prostoriji, sve dok se postepeno ne izgubi, usled parcijalne apsorpcije koja nastaje prilikom svake refleksije. Na primer, kada se u praznoj dvorani vikne “zdravo”, najverovatnije e se uti “zdravo-o-o-o-o”. Ovaj fenomen naziva se reverberacija i doprinosi ose aju prostora. Zna ajan je kod reprodukcije zvuka. Na primer, ako zvuk dolazi direktno sa muzi kog instrumenta bez reverberacije ini e se kao da zvuk ne postoji. Kada uho primi zvuk, mozak dekoduje dva rezultuju a signala i odre uje direktivnost zvuka. Registrovanje i reprodukcija zapo eti su preko jednog audio-kanala (mono-audio). Ubrzo se pokazalo da se direktivnost zvuka može zna ajno poboljšati koriš enjem dva audio-kanala (stereo zvuk). Više audio-kanala dalje poboljšava prostorni ose aj zvuka. Utv eno je da se realnija reprodukcija zvuka dobija sa jednim ili više kanala reprodukcije koji emituju (proizvode) zvuk iza slušaoca. To je princip tzv. “okružuju eg” zvuka (eng. surround sound) koji se široko primenjuje kod bioskopskih i pozorišnih predstava.

2.4 Predstavljanje audio signala

Postoje dva na ina za prikazivanje audio signala: pomo u talasnog oblika i parametarski. U prvom slu aju važno je ta no predstaviti proizvedeni audio signal, dok se pri parametarskom predstavljanju vrši modulisanje procesa generisanja signala. Tu postoje dve metode:

Sinteza govora modulisanjem ljudskog vokalnog sistema i Muzi ka sinteza.

16

Page 25: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Prva metoda primenjuje se u najve em broju slu ajeva kako bi se postigao što manji bitski protok. Druga metoda se koristi u okviru standarda za digitalni interfejs za muzi ki instrument (eng. musical instrument digital interface – MIDI).

REGISTROVANJE AUDIA

(MIKROFON)

ODMERAVANJE I KVANTOVANJE

(DIGITALIZACIJA)

MEMORISANJE ILI

PRENOS

PRIJEMNIK

DIGITALNO – ANALOGNA

KONVERZIJA

PLAYBACK GOVORNIK

Audio izvor Uho

Slika 2.4.1—Generisanje audia i playback-a

Karakteristi na blok-šema za generisanje audio signala i “playback” data je na Slici 2.4.1. Jedan ili više mikrofona koristi se za konverziju akusti ne energije (nivoa zvu nog pritiska) u elasti nu energiju (u vatima). Napon proizveden na izlazu iz mikrofona odmeravan je i kvantovan. Digitalni audio signal proizveden na taj na in memorisan je kao audio fajl ili je prenesen do prijemnika za “playback” postupak. Digitalni audio je konvertovan u vremenski promenljivi analogni napon koji se dovodi ka jednom ili više govornika. Da bi se postigao željeni kvalitet reprodukovanog audio signala, elementi blok-šeme za generisanje audia i playback moraju biti pažljivo odabrani, u skladu sa odgovaraju im standardima. O samom postupku digitalizacije, kasnije e biti više re i. Muzi ki zvuci razlikuju se od ostalih po na inu na koji se mogu generisati. Na primer, muzi ke zvuke može kreirati više muzi ara. To je doprinelo uvo enju MIDI standarda [2.3], [2.4]. U ovom standardu je deo muzike predstavljen nizom brojeva. MIDI sistem sastoji se iz etiri podsistema: kontroler, sintisajzer, sekvencer i zvu ni modul. Muzi ki ure aj generiše MIDI

signal. Sintisajzer kreira zvuke elektronskim putem. Sekvencer je ure aj ili kompjuterski program koji registruje MIDI signal koji odgovara muzi kom performansu. Zvu ni modul proizvodi prethodno registrovane odzive koje stvara MIDI kontroler. Na Slici 2.4.2 prikazan je MIDI sistem. Muzi ar svira na tastaturi MIDI kontrolera [2.5].

Kada se aktivira tastatura kontrolera, on šalje odgovaraju i kod za kreiranje muzike. Ovaj kod prihvata zvu ni modul koji ima nekoliko ton-generatora. Ovi ton-generatori stvaraju zvuke koji odgovaraju razli itim instrumentima (na primer klavir, gitara, bubnjevi). Zvu ni modul je povezan sa sekvencerom koji registruje MIDI signal koji može biti sa uvan na flopi disku, CD-u, ili hard disku.

Muzika se efikasno predstavlja koriste i MIDI standard. Me utim, MIDI fajl može da pruži razli ite kvalitete zvuka zavisno od playback hardvera. Na primer, deo MIDI sekvence može da odgovara odre enoj noti na klaviru. Ukoliko je kvalitet klavira loš, ili ako klavir nije naštimovan, zvuk sa klavira može da ne bude visokog kvaliteta.

17

Page 26: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

ZVU NI MODUL

KONTROLER

SEKVENCER

MIDI SIGNAL

MIDI SIGNAL

Slika 2.4.2—Uproš ena blok šema MIDI sistema Još jedan problem sa MIDI standardom je u tome što se izgovoreni dijalozi ili pesme teško mogu predstaviti u parametarskom obliku. Otuda, ljudski glas treba predstaviti odmerovanim podacima u MIDI fajlu. To pove ava veli inu MIDI fajla.

2.5 Rezime

Zvuk ima osobine koje uklju uju refleksiju, refrakciju i difrakciju. Audio sistemi imaju mnogo specifi nih karakteristika koje proizilaze iz zahteva ula sluha kao krajnjeg korisnika zvu nih informacija. Na primer, uho ima veliku osetljivost na percepciju razli itih vrsta izobli enja signala. Audio opseg kre e se od 20 Hz do 20 kHz. Zvu ni talasi u opsegu 5 kHz do 15 kHz sastoje se iz harmonika. Harmonici i njihove amplitude odre uju kvalitet zvuka. Uho i njemu pridružni nervni sistem predstavljaju kompleksan interaktivni sistem. Uho je osetljivo na mala izobli enja u signalu, a zanemaruje one za koje se predpostavlja da su izobli eni. Ove osobine omogu uju da se postigne dobra kompresija radi kvalitetnijeg memorisanja audio signala. Osetljivost na zvuk se smanjuje u prisustvu drugog zvuka sa sli nim frekvencijskim sadržajem. Ovaj efekat je poznat kao maskiranje. Frekvencijska rezolucija uha nije uniformna u celom audio spektru. Osetljivost je najviša na niskim frekvencijama i opada na višim frekvencijama. Obrada i memorisanje zvuka potrebni su u mnogim primenama (radiodifuzija, muzi ka industrija, itd.). Za registrovanje zvuka potrebni su izvor, slušaoci i okruženje. Zvuk se reflektuje od okolnih objekata. Slušalac uje zvuk direktno iz izvora, kao i reflektovani zvuk. Ostale komponente zvuka doprinose tzv. zvu nom ambijentu. Eho predstavlja diskretno ponavljanje dela zvuka u odre enoj prostoriji koji se postepeno gubi usled parcijalne apsorpcije nastale prilikom svake refleksije zvuka. Fenomen reverberacije zvuka doprinosi ose aju prostora i zna ajan je kod reprodukcije zvuka. Audio signal se može prikazati pomo u talasnog oblika parametarski (sintezom govora i muzi kom sintezom). Muzika se predstavlja koriste i MIDI standard. Što se ti e MIDI sistema on se sastoji iz kontrolera, sintisajzera, sekvencera i zvu nog modela.

Pitanja

1. Koje su osobine zvuka? 2. ime se karakteriše zvu ni talas? 3. Kako se deli frekvencijski opseg zvuka?

18

Page 27: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

4. U kojim granicama varira talasna dužina zvuka i kako se ona odre uje? 5. Šta uti e na kvalitet zvuka? 6. Kako se izra unava intezitet zvuka? 7. Skicirati dijagram granice ujnosti i podru ja govora i muzike. 8. Navesti sekcije iz kojih se sastoji anvelopa zvuka. Skicirati mogu i grafik. 9. Objasniti efekat maskiranja zvuka.

10. Kako se postiže efikasno memorisanje audio signala? 11. Kako se ponaša uho u pogledu registrovanja tonova na niskim i visokim

frekvencijama? 12. Šta je to reverberacija zvuka i kako se manifestuje? 13. Na koji na in se poboljšava prostorni ose aj zvuka? 14. Kako se može prikazati audio signal? 15. Šta je to MIDI? 16. Kako izgleda blok-šema za generisanje audio signala i “playback”? 17. Nacrtati uproš enu blok-šemu MIDI sistema i opisati najvažnije funkcionalne delove. 18. Koji su nedostaci MIDI standarda?

Literatura [2.1] M. T. Smith, Audio Engineer's Reference Book. 2nd ed. Oxford, Focal Press, 1999. [2.2] D. R. Begault, 3-D Sound for Virtual Reality and Multimedia. Cambridge, MA:

Academic Press, 1994. [2.3] B. Bartlett and J. Bartlett, Practical Recording Techniques. 2nd ed. Focal Press, 1998. [2.4] J. Rothstein, MIDI: A Comprehensive Introduction. 2nd ed. Madison, WI, A-R Editions,

1995. [2.5] M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003.

19

Page 28: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

3. VIZUELNI EFEKTI Kada udaljeni objekat vibrira, stvara kontrakciju i ekspanziju medijima u okruženju. Pri tome nastaje zvu ni talas koji detektuje ljudsko uho da bi se osetilo prisustvo objekta. Me utim, kada objekat ne vibrira, ili ne postoji medijum kroz koji se prenose vibracije, uho ne e biti u stanju da oseti prisustvo objekta. Sre om, priroda nas je podarila još jednim senzorom – okom koje može da detektuje elektromagnetne (eng. elektromagnetic – EM) talase koji dolaze sa objekta. Od svih naših ula, oko je najefikasniji prijemnik informacija. Savremeni industrijski svet veoma je orijentisan prema vizuelnoj komunikaciji. Široko je rasprostranjeno mišljenje da se 70 % informacija koje dobijamo, prenosi posredstvom ula vida. Otuda je oko najvažniji senzor u pore enju sa ostalim senzorima, kao što su ulo sluha, mirisa, dodira ili ukusa. Uzimaju i u obzir da se kao krajnji korisnik video informacije pojavljuje ulo vida, naveš emo najpre neke njegove karakteristike. Kako u procesu digitalne obrade slike izvesnu pažnju treba posvetiti vidljivosti šuma, pojasni emo i ovaj problem. Poznato je da multimedijalne aplikacije sadrže ili generišu slike koje e posmatrati ovek [3.1], [3.15]. Me utim, ljudsko ulo vida nije dovoljno ispitano. Tako e, ne postoji objektivna mera kvaliteta koja odgovara ljudskoj proceni o kvalitetu slike. Sre om, istraživanja u oblasti perceptualne psihologije obezbe uju neka važna saznanja o vizuelnom sistemu. Na Slici 3.1 prikazana je gra a ljudskog oka.

Slika 3.1—Gra a ljudskog oka Mrežnja a (retina) je prekrivena fotoreceptorskim elijama. One apsorbuju svetlost od slike koju na mrežnja i fokusiraju le a i rožnja a. Fotoreceptorske elije generišu elektri ne impulse koji

20

Page 29: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

putuju ka mozgu kroz opti ke nerve, od kojih se svaki sastoji od oko milion vlakana. Ove elije su najguš e u podru ju žute mrlje (fovea). Kad je svetlost slaba, otvor zenice je ve i, pa je svetlost rasuta po ve em delu mrežnja e i slika je lošije fokusirana. Postoje dve vrste fotoreceptorskih elija, štapi i (eng. rods) i uni i (eng. cones). Nazive su dobile po njihovom izgledu. Štapi i su mnogo osetljiviji i omogu avaju monohromatski vid no u. S druge strane, uni i omogu avaju gledanje u boji, ali samo pri jakom nivou osvetljaja. Postoje tri vrste uni a.

Oni dele vidljivi spektar u tri opsega: crveni, zeleni i plavi. Zbog toga su ove tri boje ozna ene kao osnovne boje ljudskog vida. Oko opisuje boju upore uju i odzive svih tipova uni a. Zbog razli ite gustine uni a osetljivih na crvenu, plavu i zelenu boju, ukupna osetljivost oka je najve a na zelenu, a najslabija na plavu svetlost. Me utim, ova osetljivost dolazi po cenu slabijeg raspoznavanja u opsegu zelene boje. Na primer, u mikroskopiji se koriste filteri da bi se izdvojila samo zelena boja, jer je oko najosetljivije na zelenu boju. Grubo govore i, oko može da vidi boje u opsegu od 400 nm do 700 nm. Pitanje koje se esto postavlja je: koja proporcija crvene, plave i zelene boje odgovara svetlosti jedinstvene talasne dužine. Na to pitanje nema odgovora zbog nekoliko razloga. Pre svega, ose aj boje zavisi od percepcije oveka i opsega promena od osobe do osobe, a tako e zavisi od ambijenta posmatranja. Od uticaja su i širina i preklapanja opsega osetljivosti tri navedena tipa uni a što zna i da se isti ose aj boje može dobiti sa mnogo razli itih kombinacija talasnih dužina.

3.1 Neke karakteristike ula vida

ove ije ulo vida može se smatrati diskretnim sistemom koji karakterišu odre eni pragovi razlikovanja, gradacije sjaja kriti ne dužine trajanja nadražaja. Zbog strukture mrežnja e koja se sastoji od oko 800 000 receptivnih polja obrazovanih od grupe foto-receptora u okviru kojih oko ne može da razlikuje prostornu konfiguraciju svetlosnog nadražaja, kao i zbog prenosa informacije od oka do moždanih centara, kontinualna površina slike se razlaže u oku na diskretne elemente. Neprekidnost površine slike je samo iluzija ula vida. Gledalac ne e biti u stanju da primeti razliku ako se slike realnih predmeta zamene diskretnim slikama sastavljenim od elemenata razli itih gradacija slike. Vizuelna percepcija oka nije podjednaka za komponente visokih i niskih u estanosti. Oko je veoma osetljivo na komponente niskih u estanosti i ta osetljivost opada sa porastom u esanosti. Pored toga, oko nije podjednako osetljivo na sve komponente vidnog spektra [3.1]. Krive a) i b) na Slici 3.1.1 predstavljaju relativnu osetljivost oka pri normalnoj i pri vrlo slaboj svetlosti u funkciji od talasne dužine . Pri dnevnoj svetlosti, kao što se vidi, oko je najosetljivije za radijacije talasne dužine od 555 nm. Prelaženje sa jedne krive osetljivosti na drugu vrši se automatski i naziva se prilago enje oka. Da bi gledalac imao utisak da gleda prirodnu sliku, dovoljno je da odnos maksimalnog i minimalnog sjaja na ekranu bude isti kao i u originalu.

Najmanja promena sjajnosti Bp koju oko meže da zapazi, zavisi od apsolutne sjajnosti B. Pri pove anju B, pove ava se i Bp, Pa stoga odnos Bp/B ostaje konstantan. Odnos B/ Bp predstavlja meru osetljivosti oka za zapažanje kontrasta. Prag kontrasta Bp/B menja svoju vrednost sa promenom površine i vremena trajanja nadražaja. Ukoliko promena sjaja jednog ili više elemenata mozaika slike na ekranu ne premašuje prag kontrasta ula vida, gledalac ne prime uje izobli enje.

Oko ne reaguje trenutno na promene osvetljaja. Kada se svetlosni fluks koji pada na mrežnja u naglo pove a, potrebno je da pro e izvesno vreme pa da se u mozgu stvori utisak

21

Page 30: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

odgovaraju e sjajnosti. Produženje ose aja po prestanku pobude ili persistencija predstavlja zna ajnu karakteristiku oka. Pri odre enoj adaptaciji, persistencija je kra a ako je intenzitet pobude ve i.

Slika 3.1.1—Relativna osetljivost oka u funkciji talasne dužine, a) svetlost normalne ja ine, b) vrlo slaba svetlost

Slede a zna ajna karakteristika vida je mo razlaganja oka tj. sposobnost raspoznavanja

sitnih detalja. Na raspoznavanje detalja, osim kontrasta i oštrine, uti e i adaptacija oka kao i dinamika slike. Broj detalja nekog objekta mnogo je ve i kada je objekat stacionaran, nego kada se brzo kre e. Kada postoji mala razlika u nivou sjaja izme u podešenih elemenata slike, mogu se uo iti veoma male razlike u sjaju. S druge strane kada su razlike u nivou sjaja velike, osetljivost se znatno smanjuje [3.2] . Na Slici 3.1.2-a prikazan je test, dok je na Slici 3.1.2-b data osetljivost kontrasta.

Slika 3.1.2— Test i osetljivost kontrasta Neka je B1 sjaj pozadine, a B2 i B2 + B sjaj leve i desne polovine malog kruga, respektivno. Razlika u sjaju B, koja je potrebna da bi se razlikovala promena od B2 do B2+ B varira zavisno od razlike u sjaju |B2 B1|.

22

Page 31: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Naime, kada je ova razlika mala, neznatna veli ina B je dovoljna da bi se promena razlikovala. Sa pove avanjem |B2 B1|, B raste, kao što je to prikazano na Slici 3.1.2-b. Me utim treba naglasiti da je stvarna osetljivost kompleksnija, jer ona zavisi od funkcije |B2 B1|, od vrednosti B1 ili B2, a tako e i od veli ine kruga i trajanja izloženih slika.

Što se ti e osetljivosti oka, ona se može posmatrati sa tri aspekta. Prvo, kada su varijacije osetljivosti nezavisne od slike i kada prag detekcije šuma raste sa porastom frekvencije šuma, to je tzv. frekvencijska zavisnost. Drugo, kada su varijacije osetljivosti zavisne od slika i kada prag detekcije šuma raste sa porastom broja detalja na slici, to je tzv. zavisnost od detalja. I najzad, tre e, kada su varijacije osetljivosti zavisne od slike i kada prag detekcije šuma raste sa porastom osvetljaja, to je tzv. zavisnost od osvetljaja [3.3].

Na kraju, treba ista i da oko ima sposobnost usrednjavanja na one delove slike koji sadrže bitnu informaciju. Pošto je prenosni sistem složeniji ukoliko je broj opti kih informacija koje treba prenositi ve i, ne treba ni prenositi one opti ke informacije koje oko pod normalnim uslovima ne može da primi.

3.2 Vidljivost šuma

Ukoliko je šum pridodat slici on je vidljiviji ako je korelisan sa slikom, nego ako je slu ajan. Prisustvo šuma znatno smanjuje kontrast i oštrinu slike. Na prijemnoj strani, prisustvo šuma u signalu slike pogoršava direktno kvalitet prijema. Na primer, TV šum na ekranu izaziva kod gledalaca zamor, jer posmatra stalno ide za tim da otkrije fine detalje slike koji su maskirani šumom. Da bi šum bio uo ljiv, mora biti ve i od odre ene vrednosti koja zavisi od praga vidljivosti. Ovaj prag je znatno ve i u blizini ivica, i u oblastima sa malim detaljima, nego u delovima slike bez detalja, jer se šum maskira sadržajem slike. Osetljivost oka na izobli enje na slici zavisi od sadržaja elemenata slike koji neposredno okružuju onaj deo gde se izobli enje pojavilo. Vidljivost nekorelisanih smetnji na slici može se predstaviti izrazom:

0

W

n nV = V S d (3.2.1)

gde je Sn ( ) spektralna gustina signala smetnji unutar propusnog opsega W prenosnog sistema, V( ) težinska funkcija koja predstavlja relativnu osetljivost oka na pojedine frekventne

komponente. Težinska funkcija V( ) uklju uje uticaj prenosne funkcije sistema za prenos slike, kao i vizuelnog sistema posmatra a.

Eksperimentalno je dokazano da oko slabije uo ava šum pridodat video signalu u trenutku znatnih promena, nego u oblastima slike gde se video signal relativno malo menja. Odnos vidljivosti šuma i brzine promene video signala zavisi od ukupnog sadržaja slike.

23

Page 32: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

U vezi sa problemom vidljivosti šuma, stoji pitanje kvaliteta pogoršane slike. On je definisan subjektivnim nalazima i može se upore ivati na osnovu subjektivnih odgovora posmatra a. U literaturi se esto koristi kriterijum srednje kvadratne greške [3.4]. Ako se sjajnost ulazne slike predstavi funkcijom f(x, y) a sjajnost izlazne slike funkcijom g(x, y), gde su (x, y) prostorne koordinate, greška je data izrazom

(x, y) = f(x, y) – g(x, y). (3.2.2) Kada je sa F (u, v) ozna ena Fourier-ova transformacija greške, pri emu su “u” i “v” prostorne frekvencije, tada je srednja kvadratna greška data relacijom:

22, ,+ + + +

D f g = x, y dx dy = F u v du dv . (3.2.3)

Vidi se da kvalitet pogoršane izlazne slike g(x, y) ne zavisi samo od greške (x, y) ve i

od originalne slike f(x, y).

3.3 ove iji vizuelni sistem Pošto je izlaz iz multimedijalnog sistema, u opštem slu aju, naj eš e baš vizuelni sistem, važno je poznavati karakteristike ove ijeg vizuelnog sistema (eng. human visual system – HVS) radi što efikasnijeg koriš enja multimedijalnih tehnologija [3.5]. Elektromagnetni talasi imaju razli ite talasne dužine u širokom dijapazonu, od dugih do ekstremno kratkih talasa (gama zraci). Me utim, oko može da detektuje talase uskog spektra od približno 400 nm do 700 nm. Sun eva svetlost ima spektar u ovom talasnom opsegu i ona predstavlja glavni izvor zemaljskih EM talasa.

Na Slici 3.3.1 prikazan je karakteristi an proces detekcije objekta.

Slika 3.3.1—Dolazna svetlosna struja u procesu detekcije objekta

24

Page 33: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Ako je L ( ) ulazna raspodela energije koja dolazi iz svetlosnog izvora, svetlost koju prima posmatra nekog objekta može se izmeriti u obliku:

I( ) = ( ) L( ) (3.3.1) gde je ( ) refleksija od objekta.

Ukoliko su svetlosni izvor, objekat i posmatra stacionarni, spektar od I( ) ima e isti frekvencijski opseg kao i L( ), ali e im spektri biti razli iti, što odre uje ( ). Kada posmatra primi svetlosnu energiju raspodele I( ) po inje kompleksan proces u vizuelnom sistemu koji se odnosi na formiranje slike. Radi efikasnijeg projektovanja prenosnog sistema, važno je prou iti karakteristike HVS. To je zna ajno i zbog displeja informacija o slici. Da bi se smanjila cena prenosa i displej ure aja, važi princip da ne treba prenositi niti prikazivati informaciju koju oko ne može da vidi. ove iji vizuelni sistem tretira se kao opti ki sistem. Naime, kada svetlost objekta padne na oko, zenica oka deluje kao jedan prorez, slika se stvara na mrežnja i, a gledalac vidi objekat. Uo ena veli ina objekta zavisi od ugla pod kojim se ovaj stvara na mrežnja i. Mrežnja a može bolje da razlu i detalje kada je slika na mrežnja i ve a i kada se širi na više foto receptora. Zenica kontroliše koli inu svetlosti koja pada na oko. Ona je pre nika 2 mm. Pri slabijem osvetlenju, veli ina raste kako bi se omogu ilo da dolazi više svetlosti, dok pri ja em osvetljenju njena veli ina opada da bi se ograni ila koli ina svetlosti. U cilju uproš enja HVS modela na injeno je nekoliko predpostavki. Pre svega, predpostavljeno je da je HVS linearni sistem što je u opštem slu aju ta no za slike sa malom kontraš u. Zatim, može se predpostaviti da je HVS izotropan u prostornom domenu, tj. da o i nemaju ni jedan preferencijalni pravac (prema horizontalnom, vertikalnom ili dijagonalnom). Tako e, utvr eno je da je osetljivost o iju u dijagonalnom pravcu manja nego u horizontalnom ili vertikalnom, pa se ta injenica koristi kod mnogih modela.

Najzad, HVS se može tretirati kao sistem koji se sastoji iz nekoliko podsistema. Istakli smo da kada svetlost pada na oko, zenica se ponaša kao jedan prorez. To je ekvivalentno niskopropusnom filtru. Zatim, spektralni odgovor oka (a to je funkcija efikasnosti osvetljaja V( )) se primenjuje na dolaznu svetlost, pa se dobija osvetljaj slike. Osetljivost ove ijeg vizuelnog sistema je mala na visokim prostornim frekvencijama. Ova osobina koristi se u mnogim primerima obrade slike. U slu aju videa, kamera cilja slike (ili video kadrove) koje brzo slede jedna za drugom. Displej ure aj (TV, kompijuterski monitor) prikazuje individualne kadrove istom brzinom. Ukoliko je brzina prikazivanja individualnih kadrova iznad izvesnog praga, HVS ne može da opaža individualne kadrove, pa zato izgleda kao da se pokretna slika menja kontinualno. Kriti na brzina promene kadra zavisi od faktora kao što su uslovi gledanja i video sadržaj. Danas postoji veliki broj istraživanja koja se bave odre ivanjem kriti ne brzine kadra i njene zavisnosti od eksperimentalnih rezultata. Naveš emo jedan primer. Ta kasti izvor svetlosti menja osvetljaj prema zakonu:

L + Lcos(2 ft) gde je L amplituda promene,

25

Page 34: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

f frekvencija u Hz. Ukoliko L ima dovoljno veliku vrednost, a frekvencija nije suviše visoka, opaža se tzv. fliker efekat. Za bilo koju datu vrednost frekvencije, vrednost L koja prizvodi prag ose aja flikera odre ena je eksperimentalno. Ozna imo tu vrednost sa LT.. Odnos L/ LT poznat je kao osetljivost na kontrast ove ijeg vizuelnog sistema. Oko je osetljivije na fliker efekat pri visokom osvetljaju. Osetljivost na fliker je zanemarljiva iznad (50 do 60) Hz. Ova osobina služi kao polazna osnova za projektovanje TV sistema i kompjuterskih displej ure aja.

3.4 Vizuelni modeli

Razli iti vizuelni modeli prikazani su, do danas, u literaturi. Najpre, u tom smislu bilo je mnogo pokušaja da se koncepcija linearnih sistema primeni na ove iji vizuelni sistem. S druge strane, neka istraživanja su pokazala da je ove iji vizuelni sistem nelinearan [3.6]. Na ovom mestu bi e govora o monohromatskom vizuelnom modelu kao i o vizuelnom modelu u boji. Na kraju, u okviru vizuelnih modela, bi e dat prikaz nekih opštih modela vizuelnog komunikacionog sistema. 3.4.1 Monohromatski vizuelni model

U principu jedan opti ki sistem može se tretirati kao dvodimenzionalni linearni sistem koji se karakteriše 2D transfer funkcijom [3.7]. Posmatrajmo opti ki sistem prikazan na Slici 3.4.1.1.

OPTI KI SISTEM H( x, y)

Iu(x, y) Ii(x, y)

Slika 3.4.1.1—Uproš ena blok šema opti kog sistema

Ozna imo sa Iu(x, y) polje objekta na ulazu u sistem, sa H( x, y) transfer funkciju posmatranog sistema, dok Ii(x, y) predstavlja polje slike na izlazu iz sistema. Ovde su x i y prostorne frekvencije. Frekvencijski spektri signala na ulazu u sistem u ( x, y) i na izlazu iz sistema i ( x, y), definisani su, respektivno, na sledeci na in:

exp+ +

u x y u x y, = I x, y i x+ y dx dy (3.4.1.1)

exp+ +

i x y i x y, = I x, y i x+ y dx dy . (3.4.1.2)

Ovi spektri povezani su relacijom:

26

Page 35: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

i ( x, y) = H( x, y) u ( x, y). (3.4.1.3)

Polje slike na izlazu iz posmatranog sistema dobija se iz izraza (3.4.1.2) kada se primeni inverzna Fourier-ova transformacija, tj.,

2

1exp

4

+ +

i i x y x yI x, y = , i x+ y d dx y . (3.4.1.4)

Što se ti e transfer funkcije, to je u opštem slu aju kompleksna veli ina koja se može predstaviti preko modula |H( x, y)| i faze ( x, y), tj.,

H( x, y) = |H( x, y)| exp[i ( x, y)]. (3.4.1.5) Moduo |H( x, y)| naziva se modulaciona transfer funkcija, dok se ( x, y) po neki put sre e u literaturi pod nazivom fazna transfer funkcija [3.8]. Na Slici 3.4.1.2 prikazana je blok-šema monohromatskog vizuelnog modela logaritamskog tipa. Ako je odziv ula na ulazni signal logaritamskog tipa, tada ukoliko signal ima oblik jednog eksponencijalnog sinusnog talasa, tj. exp[sin Iu(x, y)], ove iji vizuelni sistem može biti linearizovan [3.6].

LINEARNI SISTEM H( x, y)

SIGNAL RECEPTOR

LOG

Slika 3.4.1.2—Monohromatski vizuelni model logoritamskog tipa

Osnovni logaritamski monohromatski vizuelni model predpostavlja da je polje slike na

izlazu iz sistema oblika

yxIkkkyxI ui ,log, 321 (3.4.1.6) gde ki , i = 1, 2, 3 predstavljaju konstante, Iu (x, y) predstavlja polje objekta na ulazu u sistem. Jedan drugi monohromatski vizuelni model predložio je Cornsweet [3.9]. Kod ovog modela, odziv je oblika

1

2

u

iu

K I x, yI x, y =

K + I x, y (3.4.1.7)

gde

27

Page 36: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

K1 i K2 predstavljaju konstante. Mannos i Sakrison [3.10] su prou avali uticaje nelinearnosti razli itog tipa koje su primenjivane u proceni mere vrednosti na prijemu slike. Oni su pokazali da je nelinearnost oblika

S

uiI x, y = I x, y (3.4.1.8)

gde je S konstanta koja pruža solidno slaganje mere vizuelne vernosti sa subjektivnom

procenom. 3.4.2 Vizuelni model u boji U svetu su vršeni mnogi eksperimenti radi utvr ivanja vizuelnog modela u boji. Prvu grupu eksperimenata izvršio je Thomas Young sa saradnicima, a zatim Newton i Maxvell. Na ovom mestu bi e prikazan vizuelni model koji je predložio Frei [3.11]. Njegova uproš ena blok- šema prikazana je na Slici 3.4.2.1.

Kod ovog modela, tri receptora sa spektralnim osetljivostima S1 ( ), S2 ( ), i S3 ( ) daju signale:

1 1e = c S d (3.4.2.1)

2 2e = c S d (3.4.2.2)

3 3e = c S d (3.4.2.3)

gde je c( ) raspodela spektralne energije svetlosnog izvora.

Kada se na tri napred navedena signala primeni logaritamska transfer funkcija, dobijaju

se originali:

1 logd = e1 (3.4.2.4)

22 2 1

1

log log loge

d = e e =e

(3.4.2.5)

33 3 1

1

log log loge

d = e e =e

. (3.4.2.6)

28

Page 37: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Na kraju, signali d1, d2 i d3 prolaze kroz linearne sisteme ije su transfer funkcije H1( x, y), H2( x, y) i H3( x, y) respektivno. Signali g1, g2 i g3 na izlazu iz odgovaraju ih linearnih sistema pružaju osnovu za percepciju boje u mozgu.

e1 d1

APSORPCIJA PLAVE BOJE

g2 H2 ( x, y)

e2

APSORPCIJA ZELENE BOJE

Log

d2 +

g3 H3 ( x, y)

e3

Log

d3 +

g1 H1 ( x, y)

APSORPCIJA ŽUTO- -ZELENE BOJE

Log

Slika 3.4.2.1—Blok-šema Frei-ovog vizuelnog modela u boji

Navedeni model karakteriše se time što zadovoljava osnovne zakone kalorimetrije. Na primer, ukoliko se spektralna energija obojene svetlosti menja za konstantan multiplikativni faktor, boja i zasi enje svetlosti ostaju invarijantni u širem dinami kom opsegu. 3.4.3 Opšti model vizuelnog komunikacionog sistema

Kao što je poznato, opšti model komunikacionog sistema dao je Shannon. Posle toga, neki drugi istraživa i modifikovali su ovaj opšti model. Na predajnoj strani uvode se izvorni i kanalni koder, a na prijemnoj strani uvode se odgovaraju i dekoderi. Kod vizuelnih komunikacionih sistema, karakteristike izvora odre ene su metodom razlaganja, brojem elemenata u slici, prisustvom ili odsustvom slike u boji. Izvorni koder prepoznaje srodne predmete. Oni se koduju standardnim simbolima. Nesrodni objekti odre uju se element po element. Dekoder služi za prevo enje kodovane poruke u oblik koji koristi korisnik [3.12]. Na Slici 3.4.3.1 prikazan je Fano-ov opšti model vizuelnog komunikacionog sistema [3.13]. Vizuelni svet je onakav kakav je vi en pomo u kamere. Funkcija izvornog kodera je da predstavi vizuelni svet, odnosno ulazni signal kao slu ajan signal binarnog oblika.

Izvorni koder je obi na TV kamera. Ona grupiše vizuelne scene sa malim percepcionim razlikama i svaku grupu predstavlja jednom kodnom re i.

Kanalni koder uzima povorku izvornih binita i koduje je u druge nizove kanalnih binita, tako da prenos do prijemnika bude obavljen na najefikasniji na in bez pogoršanja zbog šuma.

Ure aji na prijemu služe za obavljanje operacija inverznih onima na predaji. To su obnavljanje izlaza iz izvornog kodera pomo u kanalnog dekodera i obnavljanje predstave vizuelnog sveta pomo u izvornog dekodera. Pri svemu ovome ne može se zanemariti uticaj šuma

29

Page 38: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

u kanalu, a time i izobli enje slike. U principu, kod kodovanja video signala cilj može da bude da se poboljša kvalitet slike, a da se kapacitet kanala održava konstantnim, zatim da se smanji kapacitet kanala da bi se održavao dati kvalitet slike, najzad da se pogoršava kvalitet slike da bi kapacitet kanala bio optimalan.

VIZUELNI SVET

IZVORNI KODER

KANALNIKODER

KANALKANALNI DEKODER

IZVORNI DEKODER

PRIJEMNIK

KRITERIJUM VERNOSTI ŠUM

U X Y

Slika 3.4.3.1—FANO-ov model vizuelnog komunikacionog sistema

Da bi uveo kriterijum vernosti, Pearson je proširio Fano-ov model vizuelnog komunikacionog sistema. Pearson-ov model vizuelnog komunikacionog sistema, prikazan na Slici 3.4.3.2, sastoji se iz kola sa povratnom spregom od prijemnika – posmatra a do izvornog i kanalnog kodera.

VIZUELNI SVET

IZVORNI KODER

KANALNIKODER

KANALKANALNI DEKODER

IZVORNI DEKODER

PRIJEMNIK

ŠUM

U X Y V

Slika 3.4.3.2—Pearson-ov model vizuelnog komunikacionog sistema Optimizacija parametara izvedena je na jedan od sledeca dva na ina. Prvo, kriterijum

vernosti na prijemu je fiksiran prema nameni komunikacionog sistema, a to zna i da je izvestan minimum kvaliteta na prijemu unapred odre en. Poželjno je prona i metode izvornog i kanalnog kodovanja koje e smanjiti traženi kapacitet kanala na najmanju mogu u vrednost, a da se u isto vreme zadovolje kriterijumi vernosti. Ona kombinacija izvornog i kanalnog kodovanja koja zadovoljava kriterijum vernosti pri najmanjem iznosu koli ine informacija u kanalu predstavlja optimalnu metodu kodovanja. Drugo, kada se za kapacitet kanala smatra da je unapred fiksiran, cilj je da se maksimizira vernost na prijemu, tj. da se prona e takva kombinacija izvornog i kanalnog kodovanja koja e omogu iti prenos datim kanalom, a da se u isto vreme kao rezultat dobije najbolji mogu i kvalitet slike na prijemu.

Problemi koji se pojavljuju kada je u pitanju Pearson-ov model vizuelnog komunikacionog sistema odnose se na funkciju izvornog kodera i na odre ivanje kriterijuma vernosti [3.14]. Izvorni koder treba da izdvoji iz vizuelne okoline one oblike koje je i sam ovek – gledalac u stanju da izdvaja. Naše sadašnje znanje o tome kako gledalac reaguje na razli ite vrste slika i na izobli enja u tim slikama je veoma oskudno. Prilikom izvornog kodovanja može

30

Page 39: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

u principu da bude kapacitet kanala C minimiziran pri emu je izobli enje D manje ili jednako odre enom maksimumu Dmax, tj. D Dmax, ili da izobli enje D bude minimizirano pri emu je kapacitet kanala C < Cmax, gde je Cmax maksimalni kapacitet kanala.

3.5 Rezime Od svih naših ula, oko je najefikasniji prijemnik informacija. Oko 70 % informacija koje dobijamo, prenosi se posredstvom ula vida. ove ije ulo vida može se smatrati diskretnim sistemom koji karakterišu odre eni pragovi razlikovanja, gradacije sjaja i kriti ne dužine trajanja nadražaja. Oko je veoma osetljivo na komponente niskih u estanosti i ta osetljivost opada sa porastom u estanosti. Oko ne reaguje trenutno na promene osvetljaja. Kada se svetlosni fluks koji pada na mrežnja u naglo pove a, potrebno je izvesno vreme da se u mozgu stvori utisak odgovaraju e sjajnosti. Na raspoznavanje detalja, osim kontrasta i oštrine, uti e i adaptacija oka kao i dinamika slike. Osetljivost oka može se posmatrati sa tri aspekta: frekvencijska zavisnost, zavisnost od detalja i zavisnost od osvetljaja. Prisustvo šuma znatno smanjuje kontrast i oštrinu slike. Šum je vidljiviji ako je korelisan sa slikom nego ako je slu ajan. Osetljivost oka na izobli enje u slici zavisi od sadržaja elemenata slike koji neposredno okružuju onaj deo gde se izobli enje pojavilo. Kvalitet slike je definisan subjektivnim nalazima i može se upore ivati na osnovu subjektivnih odgovora posmatra a. Radi što efikasnijeg koriš enja multimedijalnih tehnologija važno je poznavati karakteristike ove ijeg vizuelnog sistema. On se tretira kao opti ki sistem. U literaturi su do danas prikazani razli iti vizuelni modeli: monohromatski vizuelni modeli, vizuelni modeli u boji, kao i opšti modeli vizuelnog komunikacionog sistema. Prvi opšti model dao je Shannon. Neki drugi istraživa i (Fano, Pearson) modifikovali su ovaj model. Na prednjoj strani uvode se izvorni i kanalni koder, dok se na prijemnoj strani uvode odgovaraju i dekoderi. Kod vizuelnih komunikacionih sistema, karakteristike izvora odre ene su metodom razlaganja, brojem elemenata u slici, prisustvom ili odsustvom slike u boji.

Pitanja

1. U emu se ogleda uloga ula vida kao senzora? 2. ime se karakteriše ulo vida? 3. Skicirati dijagram relativne osetljivosti oka u funkciji talasne dužine i to pri svetlosti

normalne ja ine i pri vrlo slaboj svetlosti. 4. Kako se definiše mera osetljivosti oka? 5. Šta je to persistencija oka? 6. Šta uti e na raspoznavanje detalja od strane ula vida? 7. Sa kojih se aspekata može posmatrati osetljivost oka? 8. Kako se može predstaviti vidljivost nekorelisanih smetnji na slici? 9. Kako se definiše svetlost koju prima posmatra od nekog objekta?

10. Opisati na in rada ove ijeg vizuelnog sistema? 11. Od ega zavisi osetljivost ove ijeg vizuelnog sistema? 12. Šta je to fliker efekat i kako on uti e na osetljivost oka?

31

Page 40: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

13. Nacrtati uproš enu blok-šemu opti kog sistema i nazna iti sve potrebne elemente za njegovu analizu?

14. Iz kojih se elemenata sastoji monohromatski vizuelni model logaritamskog tipa? Nacrtati odgovaraju u blok-šemu.

15. Kako se odre uje odziv kod Cornsweet-ovog vizuelnog modela? 16. ime se karakteriše Mannos-Sakrison-ov model vizuelnog sistema? 17. Nacrtati i opisati blok-šemu Frei-ovog vizuelnog modela u boji. 18. Kako izgleda opšti model Fano-ovog vizuelnog komunikacionog sistema? 19. Koje su osobine Pearson-ovog modela vizuelnog komunikacionog sistema? 20. Od ega zavisi osetljivost oka na izobli enje u slici? 21. Koja proporcija crvene, zelene i plave boje odgovara svetlosti jedinstvene talasne

dužine?

Literatura [3.1] B. Nasti , Osnovi Televizijske Tehnike. Beograd, Nau na knjiga, 1986. [3.2] T. Fukinuki, “Optimization of D-PCM for TV signals with consideration of visual

property”, IEEE Trans. Commun., vol. COM-22, pp. 821–826, Jun. 1974. [3.3] D. J. Connor, R. C. Brainard, and J. O. Limb, “Intraframe coding for picture

transmission,” Proc. IEEE, vol. 60, no.7, pp. 779–791, Sep. 1972. [3.4] T. S. Huang, W. F. Schreiber, and O. J. Tretiak, “Image processing”, Proc. IEEE, vol.

59, no. 11, pp. 1586–1609, Nov. 1971. [3.5] M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003. [3.6] W. K. Pratt, Digital Image Procesing. New York: John Wiley and Sons, 1978. [3.7] J. W. Goodman, Introduction to Fourier Optics. New York: McGraw-Hill, 1968. [3.8] K. D. Baker, “Basic image concepts in Digital Signal Processing,” N. B. Jones, Ed.,

1982. [3.9] T. N. Cornsweet, Visual Perception. New York, NY: Academic Press, 1970.

[3.10] J. L. Mannos and D. J. Sakrison, “The effect of a visual fidelity criterion of the encoding of images,” IEEE Trans. Inf. Theory, vol. IT-20, pp. 525–536, Jul. 1974.

[3.11] W. Frei, “A new model of color vision and some practical limitations,” University of Southern California, Image Processing Institute, Los Angeles, USCEE Rep. 530, Mar. 1974, pp. 128–143.

[3.12] Z. Bojkovi , Digitalna Obrada Slike. Beograd, Nau na knjiga, 1989. [3.13] D. E. Pearson, “A realistic model for visual communication systems,” Proc. IEEE, vol.

55, no. 3, Mar. 1967. [3.14] T. Berger, Rate-Distortion Theory: A Mathematical Basis for Data Compression.

Englewood Cliffs, NJ: Prentice-Hall, 1971. [3.15] J. C. Russ, The Image Processing Hand Book. 5th ed. Boca Raton, FL: CRC Press,

2007.

32

Page 41: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

4. AUDIO-VIZUELNE INTEGRACIJE U multimedijalnim komunikacijama gde je uklju en ove iji govor, audio-vizuelna integracija je posebno zna ajna. Ne samo da je važno zanemariti verbalnu i univerzalnu informaciju, ve je interesantno pitanje interakcije izme u razli itih medija. U ovom poglavlju pozabavi emo se pitanjem zašto su multimedijalne komunikacije više nego prosto objedinjivanje teksta, audia, slike i videa. Da emo pregled trendova u multimedijalnom istraživanju radi koriš enja audio-vizuelne informacije, pre svega radi uspostavljanja veze izme u obrade audio i video signala. Koriste i tehnologiju poznavanja govora, analiziraju se govorni talasni oblici kako bi se otkrio izgovoreni tekst. Na osnovu re enice u tekstu, integriše se glava govornika (eng. talking head) na osnovu audio-vizuelnog niza i to koriš enjem kompleksne grafike za analizu facijalnog modela kao i sintezu teksta i govora kako bi se proizveo sinteti ko akusti ni govor [4.1], [4.2]. Isto tako, za komunikaciju osoba–osoba koja je uklju ena u multimedijalne aplikacije (videotelefonija, videokonferencija) od interesa je audio i vizuelna interakcija. S druge strane, audio-vizuelna integracija tako e obuhvata automatsko o itavanje sa usne, primenu kod prepoznavanja govora animacijom lica govornika, sinhronizaciju usana, pra enje crta lica, audio-vizuelno preslikavanje, združeno audio-vizuelno kodovanje, itd.

4.1 Interakcija medija

Integracija i interakcija razli itih vrsta medija predstavljaju interesantnu oblast istraživanja [4.3]. Interakcija medija prikazana je na Slici 4.1.1. Kao što se vidi, medijumi su kategorisani u tri klase. Prva se odnosi na tekstualne informacije, druga je audio uklju uju i govor i muziku, dok tre a predstavlja mirnu sliku i video.

Cilj prepoznavanja govora je da obezbedi mašinu da bude u stanju da prisluškuje govorne ulaze i individualne re i. Istraživanje razumevanja govornog jezika podrazumeva izdvajanje zna enja iz svega onoga što je nepoznato [4.4]. Jedan dobar primer za audio-video (a/v) interakciju pri govornoj komunikaciji je o itavanje sa usana koje se naziva još i govorno o itavanje. O itavanje sa usana se široko koristi u videotelefoniji i video konferenciji. Karakteristi na situacija nastaje kod video-konferencijske opreme kada brzina promene kadra nije adekvatna za percepciju sinhronizacije usana. Jedno rešenje je da se izdvoji informacija iz akusti nog signala koji odre uje odgovaraju e pokrete usta, pa da se onda obradi slika usta govornika kako bi se postigla sinhronizacija usana. Tako e je mogu e izvršiti jedno takvo prilago enje da akusti ni signal daje zvuk sinhronizovan sa pokretom usana. Ovakav prilaz je koristan kod primene u nerealnom vremenu.

33

Page 42: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

MIRNA SLIKA/VIDEO

AUDIO

MULTIMEDIJA

TEKST

KOMPRESIJA SINTEZA 3D ZVUK

PREPOZNAVANJE GOVORA: TEKST-GOVOR SINHRONIZACIJA USANA

ANIMACIJA LICA ZDRUŽENO A/V KODOVANJE

PREVOD PRIRODAN JEZIK

JEZIK O ITAVANJE SA USANA KOMPRESIJA, GRAFICI

INDEKSIRANJE/PRETRAŽIVANJE BAZE PODATAKA

Slika 4.1.1—Interakcija medija

Proizvo enje vizuelnog govora iz auditornog, podrazumeva generisanje glave govornika [4.4], [4.5]. Glavne primene ove tehnike uklju uju interfejse ovek–ra unar, instrukcije koje podržava ra unar, video igre, multimedijalnu telefoniju za osobe sa ošte enim sluhom, itd.

4.2 Bimodalnost ljudskog govora Zbog bimodalnosti u percepciji govora, audio–vizuelna interakcija postaje važan faktor kod projektovanja multimedijalnih komunikacionih sistema, kao što su, na primer, videotelefonija i video konferencija. Bimodalnosna priroda percepcije ove ijeg govora prikazana je u [4.6]. U slu aju konfliktnih audio i vizuelnih stimulansa, registrovani zvuk ne postoji ni u jednom modalitetu.

Primer 4.2.1

Kada “ ujemo” zvuk (ba) i “vidimo” govornika kako kaže (ga), on ne opaža ni (ga) ni (ba). Umesto toga, ono što je generisano je nešto što je blisko sa (da). Neki drugi primeri audio-vizulenih kombinacija su prikazani u Tabeli 4.2.1. Tabela 4.2.1—Primeri za McGurk-ov efekat

AUDIO + VIZUELNO PERCEPIRANO

BA GA DA

PA GA TA

MA GA NA

34

Page 43: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Do izražaja dolazi tzv. McGurk-ov efekat, što zna i da govor koji registruje ovek zavisi ne samo od akusti nih znakova, ve i od vizuelnih, kao što su, na

primer, pokreti usana. Ukoliko rezultati vizuelne percepcije govora uti u na audio govor, radi se o tzv. inverznom McGurk-ovom efektu [4.6].

Produkcija i percepcija govora su po svojoj prirodi bimodalni. U akusti nom sistemu,

osnovna jedinica je fonem. Sli no, u vizuelnom domenu, osnovna jedinica za meru pokretanja usne je vizem. To je najmanja uo ljiva jedinica za govor.

Primer 4.2.2

Fonemi (p), (b) i (m) su proizvedeni sa zatvorenim ustima i vizuelno nisu uo ljivi. Stoga, oni formiraju jednu grupu vizema. Sli no, (f) i (v) pripadaju istoj grupi vizema koji nastaju tako što gornji zubi dodiruju donju usnu.

4.3 O itavanje sa usana

Osoba vi na o itavanju sa usana (eng. lip reading) u stanju je da razume zna enje izgovorenih re enica posmatraju i konfiguraciju i pokret vidljivih artikulatora govornika kao što su jezik, usne, zubi, itd. Poznavaju i položaje ovih artikulatora obezbe ujemo informaciju o sadržaju koji sobom nosi govorni signal. Pošto ovi artikulatori nisu vidljivi, informacija može po neki put da bude nekompletna. Kombinovanjem vizuelnog sadržaja sa leksi kim, sintakti kim, semanti kim i programskim informacijama, ljudi se mogu obu iti da razumeju govorni jezik posmatranjem pokreta govornikovog lica. Predstavljanje o itavanja sa usana zavisi od više faktora. Uslovi gledanja mogu da uti u na kvalitet vizuelne informacije. Na primer, slabo osvetljenje može da oteža utvr ivanje položaja i pomeranje usana, kao i detekciju zuba i jezika. Faktori kao što je ugao gledanja mogu tako e da budu od uticaja na prikazivanje. Direktno gledanje govornika doprinosi bržem prepoznavanju nego pod uglom. Poboljšanje o itavanja sa usne postiže se treningom [4.8], [4.9]. Poznavanje procesa prema kome ljudi izdvajaju i ugra uju vizuelnu informaciju u govornu percepciju može biti od koristi. Isto tako, važno je znati informaciju koja je dostupna vizuelnom kanalu, koje ljudi koriste za prepoznavanje i koja se sredstva koriste za integrisanje akusti ne i vizuelne informacije. Akusti ne i vizuelne komponente nisu samo redundantne. One su isto tako i komplementarne.

Primer 4.3.1

Fonemi (p) i (k) imaju sli ne akusti ke karakterisitke, ali se mogu lako razlikovati na osnovu zatvaranja usta. Za uzvrat (p) i (b) fonemi imaju sli ne vizuelne karakterisitke ali se akusti ki razlikju na osnovu glasnosti.

Jedno od najvažnijih pitanja u videotelefoniji i videokonferenciji je sinronizacija usne obzirom na to da je percepcija ove ijeg govora bimodalna. Tipi na situacija u

35

Page 44: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

videokonferencijskoj opremi sa ograni enjima u širini propusnog opsega nastaje kada je brzina kadra takva da nije u sukobu sa percepcijom sinhronizacije usana. Rešenje bi mogli biti da se izdvoji informacija iz akusti nog signala koja se odnosi na odgovaraju e pomeranje usana, pa da se zatim obradi slika koja prikazuje usta govornika kako bi se postigla odgovaraju a sinhronizacija usana. Mogu e je i izobli iti akusti ni signal tako da njegov zvuk bude sinhronizovan sa pokretom ove ijih usana. Ovaj prilaz je koristan za promene u nerealnom vremenu. Da bi se obezbedila sinhronizacija usana, analizator spektra ispituje audio iz studija kao i originalni zapis. Rezultati se dovode na ulaz u procesor kako bi se modifikovala vremenska skala za redosled originalnog ubeležavanja. Video kodek esto preska e neke kodove kako bi se udovoljilo zahtevu za širinom propusnog opsega, što daje kao rezulatat manju brzinu kadra na dekoderskoj strani. Izostavljanje kadra dovodi do pojave pruga, podrhtavanja i gubitka sinhronizacije usne. Da bi se rešio ovaj problem možemo izdvojiti informaciju iz govornog signala i obraditi sliku usta tako da se postigne sinhronizacija usne [4.10]. Blok-šema jednog ovakvog prilaza data je na Slici 4.3.1. Modul za pra enje kadra analizira ulazne kadrove kako bi pronašao lokaciju i oblik usta [4.11]. Audio-vizuelni model preslikavanja analizira audio signal i proizvodi niz odgovaraju ih oblika usta koji su izostavljeni u video kadru. Izostavljanje slike se zatim koristi kod ulaznih kadrova kako bi se modifikovao oblik usta radi proizvo enja novih kadrova koje treba uneti u originalni video. Uo ava se interakcija izme u analize slike i analize govora. Rezultat analize slike može se iskoristiti za poboljšanje ta nosti sa kojom se prepozanje govor, kao što je to u injeno iz automatskog o itavanja sa usne. S druge strane, govorna informacija se može iskoristiti za poboljšanje rezultata analize slike.

OBLICI USTAAUDIO-VIZUELNO PRESLIKAVANJE

PRA ENJE KADRA

IZOBLI ENJE SLIKE

VREMENSKO IZGLA IVANJE

ULAZNA SLIKA (MALA BRZINA KADRA)

OBLICI I POLOŽAJ USTA

AUDIO

IZLAZNI VIDEO

(VELIKA BRZINA KADRA)

Slika 4.3.1—Blok-šema sistema za izdvajanje informacije iz govornog signala i obradu slike usta radi

postizanja sinhronizacije usne

Pored male brzine kadra, i prenos prouzrokuje gubitak sinhronizacije usne kod video-konferencije. Kašnjenje kod prenosa u slu aju videa je duže nego kod audio kašnjenja. Tehnika obrade videa uz pomo govora rešava problem izobli enjem slike usta govornika koja je sada u sinhronizaciji sa audio signalom. Otuda je mogu e smanjiti ukupno kašnjenje.

36

Page 45: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

4.4 Pra enje usana

Do danas su razvijeni mnogi postupci za parametarsko predstavljanje govora. Primera radi, linerani prediktivni koeficijent koristi se u postupku kodovanja, dok se izlazi iz filtera koriste u postupku prepoznavanja govora. U skladu sa tim, esto se postavlja pitanje kako analizirati vizuelni signal, tj. u ovom slu aju pomeranje usana. Za razliku od govornog signala koji je u suštini jednodimenzionalni (eng. one-dimensional – 1D), vizuelni izlaz je predstavljen 3D video signalom sa dve prostorne dimenzije i jednom vremenskom domenzijom. Sistem za vizuelnu analizu treba da konvertuje ovaj niz slika u zna ajan parametar. Sistemi za vizuelnu analizu mogu se podeliti u dve glavne klase. Prva klasa razvrstava sliku usta u jednu od sedam kategorija, na primer u vizeme. Druga klasa meri parametre ili dimenzije na osnovu ulazne slike, na primer, visinu i širinu usana. Što se ti e prve klase, vektorska kvantizacija i neuralne mreže su standardne metode za klasifikaciju ulaznih slika u nekoliko kategorija. Kod druge klase, traže se parametri ili dimenzije koji imaju neko fizi ko zna enje. Tako, na primer, može se meriti visina izme u usana, kao i razmak izme u uglova usana kao i da se odrede parametri tog modela koji blisko povezuju model i slike. Na bazi kompjuterskog vi enja (engl. computer-vision) za pra enje pokreta usana govornika, ra unar može da bude tako podešen da je u stanju da razume vizuelni govor [4.12]. U bimodulnoj analizi i sintezi govora, klju no je pitanje uspostavljanja preslikavanja akusti nih parametara i onih koji se odnose na oblik usta. To zna i da za zadate akusti ne parametre, kao što su, na primer, banke filtara, treba proceniti odgovaraju i oblik usta. Otuda, u nastavku pažnju treba posvetiti audio-vizuelnom preslikavanju, kao i konvertovanju akusti nih govornih parametara u parametre koji karakterišu oblik usta.

4.5 Audio-vizuelno preslikavanje Problem konverzije govora u parametre koji koriste oblik usta može se rešiti na taj na in što se uzima u obzir injenica da je govor lingvisti ki entitet. Naime, govor je najpre segmentiran u niz fonema. Zatim je svaki fonem preslikan u odgovaraju i vizem. Prisustvo ovakvog prilaza ogleda se u tome što je akusti ni signal istražen u potpunosti tako da su sve informacije uzete u obzir. Otuda, ovakav prikaz pruža najta niju analizu govora. Pri tome ne postoji potreba za prepoznavanjem izgovorenih re i ili re enice da bi se sprovelo audio-vizuelno preslikavanje. Pošto postoji fizi ka relacija izme u oblika vokalnog trakta i proizvedenog zvuka, može da postoji funkcionalna relacija izme u govornih i vizuelnih parametara. Problem konverzije sastoji se u pronalaženju najbolje funkcionalne aproksimacije za zadati niz podataka. Danas se mnogi algoritmi mogu modifikovati da bi se obavio taj zadatak (vektorska kvantizacija, neuralne mreže, kao i skriveni Markovi modeli (eng. hidden Markov model – HMM) [4.13]). 4.5.1 Konverzija na bazi klasifikacije

Konverzija na bazi klasifikacije data je blok-šemom prikazanom na Slici 4.5.1.1. Tu postoje dva dela. U prvom, akusti ni signal se klasifikuje na jednom od mnogobrojnih ulaza. U drugom delu, preslikava se svaka akusti na klasa u odgovaraju i vizuelni izlaz. U prvom delu, koristi se vektorska kvantizacija (eng. vector quantization – VQ) da se podele akusti ni podaci u

37

Page 46: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

jedan broj izlaza. Za svaku akusti nu klasu ugra ene su odgovaraju e vizuelne kodne re i kako bi se proizveo vizuelni efekat.

KLASIFIKACIJA

PRESLIKAVANJE

AUDIO ULAZ

VIZUELNI IZLAZ

Slika 4.5.1.1—Konverzija na bazi klasifikacije Jedan drugi problem unešen primenom metode na bazi klasifikacije je u tome što se ne proizvodi kontinualno preslikavanje ve se dobija razli iti broj izlaznih nivoa. Postoji nekoliko primena gde se koriste tzv. neuralni moduli za konverziju ili sinhronizaciju uklju uju i HMM model za audio-vizuelno preslikavanje. Mogu no je koristiti i tzv. neuralne mreže sa vremenskim kašnjenjem (eng. time-delayed neural network – TDNN ). 4.5.2 Audio i vizuelna integracija kod primena za o itavanje sa usana

Zbog naglog razvoja digitalne video tehnologije, danas je mogu e uklju iti i vizuelnu informaciju u proces razumevanja govora preko o itavanja sa usne. Ovo nudi efektivnu integraciju vizuelne informacije u današnje sisteme za prepoznavanje govora, kao i to da se dobije poboljšano potiskivanje šuma bez pogoršanja govora. Kompletan audio-vizuelni sistem za o itavanje sa usne može se razložiti u tri glavne komponente [4.14]:

Prethodna obrada audio-vizuelne informacije (ekstrakcija karakterisitka iz audio i video podataka).

Strategija prepoznavanja oblika (skriveno Markovsko modeliranje, podešavanje oblika sa dinami kim ili linearnim izobli enjem u vremenu i razli iti oblici neuralnih mreža).

Integracija strategije (odlu ivanje na osnovu prepoznavanja audio i video signala). Svaka od navedenih komponenti ima odogovaraju u strategiju koja izlazi iz okvira ovog poglavlja.

4.6 Združeno audio-video kodovanje

Audio-vizuelna informacija može se iskoristiti na više na ina. Na primer, relacija izme u audia i videa može se primeniti da se postigne efikasnije kodovanje kako audia tako i videa. Jedan na in da se iskoristi ta relacija je prediktivno kodovanje. Ovaj tip kodovanja videa koristi informaciju iz prethodnog video kadra da bi se na inila procena teku eg kadra. Radi omogu avanja da se na prijemnoj strani obnovi originalni video kadar, prenosi se razlika izme u originalnog i procenjenog signala. Ovim postupkom otklanja se vremenska suvišnost u video signalu. Tako e, potrebno je sprovesti predikciju na unakrsni modalni na in kako bi se istraživala unakrsna modalna suvišnost. Tu se radi o predikciji u akusti nom signalu koji se može iskoristiti da se prediktuje kako e izgledati video signal. Pošto se tako e prenose akusti ni

38

Page 47: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

podaci, prijemnik je u stanju da obnovi video uz vrlo malu informaciju sa strane. Postupak unakrsno-modalne predikcije prikazan je na Slici 4.6.1. Jedan ovakav sistem je skalabilan u širokom opsegu bitskih brzina.

VIZUELNA ANALIZA

AUDIO-VIDEO PRESLIKAVANJE

VIDEO SIGNAL

MODEL ODLU IVANJA

(R-D)

AUDIO SIGNAL

PARAMETAR

X

X

(X X)

X

Slika 4.6.1—Blok-šema unakrsno modalnog prediktivnog kodovanja

Izmereni parametri upore uju se sa akusti nim parametrima, a model odlu uje o informaciji koja može biti poslata. Odluka se zasniva na kriterijumu funkcije stepena ošte enja (eng. rate distortion function – RDF) informacije.

4.7 Bimodalna personalna verifikacija

Audio-vizuelna interakcija može se tako e primeniti i kod personalne verifikacije. Postoje e metode za personalnu verifikaciju zasnivaju se na slici lica ili glasu. Koriste i svaki modelitet uvode se ograni enja, kako u bezbednosti, tako i u robustnosti. Na primer, personalna verifikacija samo na bazi mirne slike dovodi do pojave pruga pri kodovanju i varijacija u uslovima razli itog osvetljaja. S druge strane, upotreba glasa samo za personalnu verifikaciju nije pouzdana jer je mogu e preurediti foneme na osnovu prethodno registrovanog govora osobe za sintetizovanje razli itih re enica. Uz to, govorni sistemi mogu da otkažu ukoliko je akusti no okruženje u šumovima ili postoji eho kao u slu aju kancelarijskog okruženja. Ove probleme može da reši združena primena govora i videa. Kombinovanjem ova dva modaliteta mogu e je dobiti bezbednije i robustnije sisteme za personalnu verifikaciju. Brojne tehnike koriste pokretanje usne zajedno sa akusti nim govorom da bi se identifikovala ili verifikovala osoba. Mogu nosti multimedijalnih personalnih ra unara sa kamerama i mikrofonom ine ove tehnike atraktivnim. U toku faze registracije korisnik izgovara odre enu re enicu, dok se glas i pomeranje usne ubeležava u bazu podataka. U toku faze verifikacije, od korisnika se zahteva da pro ita i prikaže re enicu na displeju. Korisnikov glas i video podaci se zatim upore uju sa onima iz baze podataka kako bi se verifikovao odre eni korisnik [4.15]. Pri tome se pomeranje usana koristi uglavnom za prepoznavanje govora, a ne za verifikaciju govornika. U [4.16] je pokazano da pomeranje usne tako e sadrži informaciju o identitetu osobe.

39

Page 48: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

4.8 Rezime U multimedijalnim komunikacijama gde je uklju en ljudski govor, audio-vizuelna integracija je od posebnog zna aja. Ovaj zna aj ogleda se ne samo zbog razmatranja verbalne i univerzalne informacije u multimedijalnim komunikacijama, nego i zbog razlike informacija i integracija izme u razli itih medija. U ovom poglavlju utvr eno je da multimedijalna komunikacija predstavlja esto više od prostog objedinjavanja teksta, audia, slike i videa. Kroz audio-vizuelnu interakciju data je veza izme u obrade audio i video signala. Naglasak je stavljen na o itavanje sa usne, sinhronizaciju, audio-video preslikavanje, kao i bimodalnu personalnu verifikaciju osobe. Združena obrada audio i video signala pruža dodatne mogu nosti koje nisu prihvatljive ukoliko se audio i video prou avaju posebno. U današnjim komunikacijama, uglavnom se ne integrišu mediji u komunikaciji me u ljudima. Multimedijalni sistemi dolaze do izražaja kada je integracija sprovedena na tri klju na na ina: integracija sadržaja, integracija korisnika i integracija sa drugim medijima [4.17]. Primer audio-vizuelne integracije zbog bimodalnosti percepcije govora je o itavanje sa usana. Ono se naro ito koristi u okruženju šuma. Na bazi tehnika kompjuterskog vi enja za pra enje pomeranja usne u toku govora, kompjuter može da razume vizuelni govor. Uz to, automatsko o itavanje sa usana se tako e koristi za akusti no prepoznavanje govora. Ukoliko brzina promene kadra nije adekvatna za percepciju sinhronizacije usana, jedno rešenje je da se izdvoji informacija iz akusti nog signala koji objedinjuje odgovaraju e pokrete usta. Potom se obra uje slika govornikovih usta, kako bi se postigla sinhronizacija usana. Klju na stvar u analizi i sintezi govora je preslikavanje izme u akusti nih parametara i parametara koji odgovaraju obliku usta. Drugim re ima, to zna i da za date akusti ne parametre treba proceniti odgovaraju i oblik usta i obratno. Za ovaj postupak postoje mnoge procedure kao što su koriš enje vektorske kvantizacije, neuralne mreže i skriveni Markovski modeli. Audio-vizuelna informacija može se koristiti i za verifikaciju osobe. Postoje e relacije izme u audio i video signala koriste se za efikasnije kodovanje kako audia tako i videa. Neke druge aplikacije uklju uju segmentaciju slike, interfejs ovek-ra unar, itd. Tako e, zajedni ka primena audia i videa može poslužiti za klasifikaciju multimedijalnih sadržaja.

Pitanja

1. U emu se ogleda zna aj audio-vizuelnih integracija u multimedijlanim komunikacijama? Gde se danas koristi tehnologija prepoznavanja govora? 2. Šta sve obuhvata audio-vizuelni interfejs? 3. Nacrtati blok-šemu koja prikazuje interakciju medija i nazna iti sve potrebne elemente. 4.

5. Navesti primer audio-vizuelne interakcije pri govornoj komunikaciji. 6. Opisati pojavu audio-vizuelne interakcije kod videokonferencije. 7. Šta je to McGurk-ov efekat? 8. Šta je fonem, a šta vizem? 9. Od ega zavisi o itavanje sa usana govornika?

40

Page 49: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

10. Nacrtati blok-šemu sistema za izdvajanje informacije iz govornog signala i obradu slike usta radi postizanja sinhronizacije usana. Kako se vrši vizuelna analiza vezana za pokretanje usne? 11.

12. Opisati na in na koji se vrši audio-vizuelno preslikavanje. Iz kojih se elmenata sastoji audio-video konverzija na bazi klasifikacije? Nacrtati odgovaraju u blok-šemu.

13.

Navesti glavne komponente koje sadrži audio-video sistem za o itavanje sa usana. 14. Kako izgleda blok šema unakrsno modalnog prediktivnog kodovanja? 15.

16. Šta je bimodalna personalna verifikacija?

Literatura [4.1] K. R. Rao, Z. S. Bojkovi , and D. A. Milovanovi , Multimedia Communication

Systems: Techniques, Standards and Networks. Prentice-Hall, 2002. [4.2] Z. S. Bojkovi and D. A. Milovanovi , “Audiovisual integration in multimedia

communications based on MPEG-4 facial animation,” Circuits Systems Signal Processing, vol. 20, no. 3, pp. 311–339, 2001.

[4.3] T. Chen and R. R. Rao, “Audio-visual integration in multimodal communication,” Proc. IEEE, vol. 86, no. 5, pp. 837–852, May 1998.

[4.4] L. R. Rabiner and B. H. Juang, Fundamentals of Speech Recognition. Englewood Cliffs, NJ: Prentice Hall, 1993.

[4.5] F. Lavagetto, “Converting speech into lip movements: A multimedia telephone for hard of hearing people“, IEEE Trans. Rehabil. Eng., vol. 3, no.1, pp. 90–102, Mar. 1995. H. McGurk and J. MacDonald, “Hearing lips and seeing voices,” Nature, vol. 264, pp. 746–748, Dec. 1976.

[4.6]

[4.7] D. Burnham and B. Dodd, “Auditory-visual speech perception as a direct process: The McGurk effect in infants and across languages,” in Speechreading by Humans and Machines. Stork D. G. and Hennecke M. E., Eds. Berlin: Springer-Verlag, 1996, pp. 103–114. K. Neely, “Effect of visual factors on the intelligibility of speech,” J. Acoust. Soc. Am., vol. 28, pp. 1275–1277, Nov. 1956.

[4.8]

B. Walden, “Effects of training on the visual recognition of consonants,” J. Speech Hear. Res., vol. 20, pp. 130–145, Mar. 1977.

[4.9]

[4.10] T. Chen, H. P. Graf, and K. Wang, “Lip synchronization using speech-assisted video processing,” IEEE Signal Process. Lett., vol. 2, no. 4, pp. 57–59, Apr. 1995.

[4.11] R. Rao and R. Mersereau, “On merging Hidden Markov models with deformable templates,” in IEEE Proc. 1995 Int. Conf. Image Processing, vol. 3.Washington, DC, pp. 556–559.

[4.12] R. Chellappa, T. Chen, and A. K. Katsaggelos, “Audio-visual interaction in multimodal communication,” IEEE Signal Processing Mag., vol. 14, pp. 37–38, Jul. 1997

[4.13] S. Voran and S. Wolf, “Proposed framework for subjective audiovisual testing,” ANSI

41

Page 50: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Working group T1A1.5, vol. T1.A1.5, pp. 93–151, Nov. 1993. [4.14] P. L. Silsbee and A. C. Bovik, “Computer lipreading for improved accuracy in

automatic speech recognition,” IEEE Trans. Speech Audio Process., vol. 4, pp. 337–351, Sept. 1996.

[4.15] M. R. Civanlar and T. Chen, “Password-free network security through joint use of audio and video,” Proc. SPIE Photonic, pp. 120–125, Nov. 1996. J. Luettin, N. A. Thacker, and S. W. Beet, “Speaker identification by lipreading,” Proc. Int. Conf. Spoken Language Processing, Philadelphia, Oct. 1996, pp. 62–65.

[4.16]

C. L. Nikias, “Riding the new integrated media systems wave,” IEEE Signal Processing Mag., vol.14, pp. 32–33, Jul. 1999.

[4.17]

42

Page 51: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

5. MULTIMEDIJALNA AKVIZICIJA PODATAKA

Da bi se sprovela analiza i obrada multimedijalnih podataka, potrebno je digitalizovane audio ili video podatke smestiti u ra unar. Posle obrade digitalni signal se rekonstruiše, odnosno konvertuje u analogni oblik. Audio izvori (mikrofoni) ili izvori slike (kamere) u opštem slu aju proizvode analogne signale kontinualne u vremenu. Da bi prikupili audio ili video podatke, moramo ih odmeravati i digitalizovati. U ovom poglavlju zadrža emo se pre svega na primerima odmeravanja i digitalizacije multimedijalnih podataka.

5.1 Diskretizacija kontinulanih signala Pri diskretizaciji kontinualnog signala, za ceo postupak koriste se dve operacije: diskretizacija signala po vremenu (odmeravanje) i diskretizacija signala po trenutnim vrednostima (kvantovanje) [5.1]. Kada treba izvršiti još i digitalizaciju kontinualnog signala, obavlja se još i tre a operacija – kodovanje, odnosno predstavljanje digitalnih vrednosti signala grupom cifara ili impulsa. Digitalizovani signal se obi no predstavlja pomo u dijagrama ili pomo u tabele. Na Slici 5.1.1 predstavljen je jedan digitalizovani signal pomo u dijagrama i tabelarno.

Slika 5.1.1—Predstavljanje digitalizovanog signala pomo u dijagrama a) i b)

i tabelarno c)

O igledno je da je prikaz pomo u dijagrama na Slici 5.1.1-b pregledniji od prikaza na Slici 5.1.1-a.

43

Page 52: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

5.2 Odmeravanje Signali koji odgovaraju realnim porukama su kona nog trajanja i imaju beskona no širok spektar. Me utim, glavni deo spektra koncentrisan je u nekom kona nom opsegu u estanosti. Izvan datog opsega, spektralna gustina amplituda signala poruka postaje toliko mala da e pri realnim radnim uslovima prakti no uvek biti prekrivena šumom. Zavisnost frekvencijskog opsega signala od nivoa šuma data je na Slici 5.2.1. Smatra se da signali poruka imaju ograni eno trajanje i ograni enu širinu spektra. Vidi se da nema razloga da se pri prenosu signala prenosi i deo spektra iznad u estanosti ozna ene sa g. Zbog toga, kontinualnim razlikama dovodimo u korespodenciju kontinualne vremenske funkcije koje imaju strogo ograni en spektar.

Slika 5.2.1—Zavisnost frekvencijskog opsega signala od nivoa šuma Na primer, za rad telefonskog signala dovoljno je preneti sve komponente koje se nalaze u opsegu u estanosti od 300 Hz do 3400 Hz, a da se pri tome sa uva razumljivost i snaga signala. injenica da realni informacioni signali ne sadrže spektralne komponente iznad neke grani ne u estanosti fg, omogu ava diskretizaciju signala po vremenu.

Postupak odmeravanja kontinualnog signala prikazan je na Slici 5.2.2. Ova slika se sastoji iz: a) kontinualnog signala, b) povorke impulsa s0(t) dobijene odmeravanjem signala s(t) u intervalima t i c) kola za odmeravanje kontinulanog signala.

Ako u jednakim vremenskim intervalima t uzmemo trenutne vrednosti signala, što je prikazano na Slici 5.2.2-b, odnosno ako u tim ta kama generišemo impulse ija je visina jednaka amplitudi kontinualnog signala, dobi emo povorku pravougaonih impulsa ije amplitude pripadaju jednom kontinuitetu mogu ih trenutnih vrednosti signala. Postupak uzimanja trenutnih vrednosti kontinulanog signala u odre enim vremenskim intervalima naziva se odmeravanje. Kolo za odmeravanje sastoji se iz dvopolnog prekida a na koji se priklju uje signal koji se odmerava. Prekida ravnomernom brzinom f0 = 1/ t naizmeni no spaja jedan od dva kontakta. Neuzemljeni kontakt ostaje uklju en sekundi, a uzemljeni kontakt je aktivan preostali period vremena od t sekundi. Na izlazu kola pojavljuje se povorka impulsa širine , periode T = t i promenljive amplitude. Diskretne vrednosti dobijene odmeravanjem nazivaju se odmerci. Teorijski, odmerci treba da budu beskona no uski.

44

Page 53: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Slika 5.2.2—Odmeravanje kontinualnog signala: a) kontinualni signal, b) povorka impulsa s0(t) dobijena odmeravanjem signala s(t) u intervalima t, c) kolo za odmeravanje

Na ovom mestu pomenu emo tzv. teoremu o odmeravanju. Ona kaže da se svaki

kontinualni vremenski signal iji je frekvencijski opseg ograni en i nalazi se u intervalu od 0 Hz do fg može jednozna no definisati kona nim brojem svojih diskretnih vrednosti u kona nom vremenskom intervalu pod uslovom da se odmeravanje vrši u vremenskim intervalima

0g

1

2T t

f (5.2.1)

Recipro na vrednost periode odmeravanja T0 naziva se u estanost odmeravanja:

00

12 gf f

T (5.2.2)

Koli nik trajanja odmerka i intervala odmeravanja naziva se faktor težine odmeravanja:

00 0 0

0

2 g 0f fT

(5.2.3)

45

Page 54: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Postupak odmeravanja može se shvatiti kao množenje signala s(t) i funkcije odmeravanja h0(t) u vremenskom domenu, tj.,

s0(t) = s(t)h0(t). (5.2.2)

Objašnjenje procedure odmeravanja kao množenje dve vremenske funkcije prikazano je na Slici 5.2.3.

h0(t)

MNOŽENJE s(t) s0(t)

Slika 5.2.3—Procedura odmeravanja 5.2.1 Odmeravanje audio signala Posmatrajmo talasni oblik jednog audio signala prikazanog na Slici 5.2.1.1, gde je predstavljena normalizovana amplituda signala u funkciji vremena. Signal se brzo menja.

Slika 5.2.1.1—Talasni oblik jednog audio signala Da bi se signal memorisao fizi ki je nemogu e odrediti vrednost signala u svakom trenutku i tu vrednost memorisati. Stoga je potrebno odmeravati signal u regularnim vremenskim intervalima. Kada je odmeravanje sprovedeno, vrednosti signala u vremenima koja se ne poklapaju sa trenucima odmeravanja se o igledno za uvek izgubljena. Koli ina informacije koja se izgubi zbog odmeravanja pove ava se sa intervalom odmeravanja. Na Slici 5.2.1.2 prikazan je amplitudni spektar jednog audio signala.

46

Page 55: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Uo ava se da je spektar zanemarljiv iznad 12 kHz. Pošto su visoko frekvencijske komponente vrlo male, može se re i da se signal ne menja velikom brzinom. U tom slu aju, mogu e je odmeravati signal i obnoviti ga kompletno primenom interpolacije ukoliko je frekvencija odmeravanja dovoljno visoka. Tražena frekvencija odmeravanja odre uje se primenom Nyquist-ovog kriterijuma.

Slika 5.2.1.2—Amplitudni spektar audio signala

Primer 5.2.1.1

Ako je periodi ni signal dekomponovan u pet sinusnih talasa sa frekvencijama 100 Hz, 300 Hz, 500 Hz, 700 Hz i 900 Hz treba odrediti širinu propusnog opsega i nacrtati spektar signala uz predpostavku da su sve komponente maksimalne amplitude od 10 V.

U odgovoru na ovaj primer, ozna i emo sa fh najvišu a sa fl najnižu frekvenciju, dok je B širina propusnog opsega. Tada je

B = fh fl = 900 Hz – 100 Hz = 800 Hz. Odgovaraju i spektar signala dat je na Slici 5.2.1.3.

Slika 5.2.1.3 Spektar signala uz primer 5.2.1.1

47

Page 56: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Primer 5.2.1.2

Signal ima širinu propusnog opsega od 20 Hz. Najviša frekvencija je 60 Hz. Koja je najniža frekvencija? Nacrtati spektar signala koji sadrže sve frekvencije iste amplitude.

Ako je sa fh ozna ena najviša, a sa fl najniža frekvencija, tada je širina propusnog opsega:

B = fh fl

tj.

fl = fh – B = 60 Hz – 20 Hz = 40 Hz.

Spektar koji sadrži sve integralne frekvencije prikazan je na Slici 5.2.1.4

Slika 5.2.1.4—Spektar signala

Primer 5.2.1.3

Posmatrajmo neki audio signal predstavljen funkcijom g(t). Fourier-ova transformacija signala je oblika:

+j tG = g t e dt (5.2.1.1)

Ukoliko je G( ) = 0 za | | > 2 B, za g(t) se može re i da je opsega ograni enog na {B}Hz, signal g(t) se može predstaviti u obliku:

sk

g t g t s t g kT s t kT (5.2.1.2)

gde je s(t) funkcija odmeravanja definisana na slede i na in:

48

Page 57: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

t

kTtts (5.2.1.3)

Fourier-ova transformacija od gs(t) je [5.2]

12

+

s st=

G = G kfT

(5.2.1.4)

Primer 5.2.1.4

Na Slici 5.2.1.5 prikazan je vremenski i frekvencijski domen signala koji ilustruju proces odmeravanja u ograni enom opsegu. Ovde g(t) predstavlja ulazni signal, fs je frekvencija odmeravanja, s(t) predstavlja talasni oblik prilikom odmeravanja, dok je gs(t) odmeravani signal.

Slika 5.2.1.5—Proces odmeravanja u ograni nom opsegu

49

Page 58: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

S druge strane, G( ), S( ) i Gs( ) su Fourier-ove transformacije od g(t), s(t) i gs(t) respektivno. Uo imo da je Gs( ) periodi ko proširenje za G( ). Dva uzastopna perioda od Gs( ) ne e se preklapati ako je:

fs > 2B (5.2.1.5) Ovaj uslov je poznat kao Nyquist-ov kriterijum [5.3] Na osnovu Nyquist-ovog kriterijuma, signal g(t) širine propusnog opsega {B}Hz može se ta no obnoviti iz g(kT) ukoliko je frekvencija odmeravanja fs = 1/T > 2B. Minimalna frekvencija odmeravanja za perfektnu rekonstruciju signala (u našem slu aju to je 2B odmeraka/s) naziva se Nyquist-ova frekvencija. Da bi rekonstruisali originalni signal, odmeravani signal mora da se dovede idealnom niskopropusnom filtru sa grani nom frekvencijom fs/2. To e usloviti visokofrekventne komponente iz Gs( ), pa se dobija originalni signal sa Fourier-ovim spektrom. Kao alternativa, audio signal se može rekonstruisati direktno iz odmeraka koriste i slede u formulu iz vremenskog domena:

sin+s

k= s

f t kg t = g kt

f t k (5.2.1.6)

Ova relacija ukazuje na to da vrednosti signala izme u neodmeravanih trenutaka moraju da se ta no odrede koriste i težinsku sumu svih odmeravanih vrednosti. Treba uo iti da oba prilaza i u frekvencijskom i u vremenskom domenu, mada prividno razli iti, u suštini su ekvivalenti jer sin funkcija na desnoj strani predstavlja impulsni odgovor idealnog niskopropusnog filtra. Kada je audio signal odmeravan sa fs odmeraka/s frekvencijski opseg koji može biti ta no rekonstruisan je:

0 f fs/2 (5.2.1.7)

Frekvencije ve e od fs/2 se preklapaju, frekvencija odmeravanja audio signala zavisi od primene. Pošto je širina audio-opsega 20 kHz, frekvencija odmeravanja od 40 kHz je dovoljna kod visokokvalitetnih audio aplikacija. Za audio CD aplikacije, frekvencija odmeravanja je 44.1 kHz. U tom slu aju margina od 4.1 kHz ini da je projektovanje ulaznog filtra (eng. antialising filter) olakšano. Tako, na primer, za telefonske sisteme koristi se frekvencija odmeravanja od 8 kHz.

50

Page 59: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

5.2.2 Odmeravanje dvodimenzionalnih (2D) slika Nyquist-ova teorija odmeravanja može se proširiti na diskretizaciju slika. Neka je slika predstavljena funkcijom i(x, y) gde su x i y dve prostorne dimenzije. Dvodimenzionalna (eng. two-dimensional – 2D) formirana transformacija slike može se predstaviti u obliku:

dydxeyxiI yxjvh

vh,, (5.2.2.1)

gde je

h horizontalne prostorna frekvencija, v vertikalna prostorna frekvencija.

Treba naglasiti da je h = 2 fh i v = 2 fv, gde su fh i fv horizontalne i vertikalne frekvencije. Uz predpostavku pravougaone rešetke odmeravanja i ako je slika odmeravana u prostornom intervalu ( x, y), odmeravana slika može se izraziti kao:

, , , ( , ) ,sm n

i x y i x y s x y i m x n y x m x y n y (5.2.2.2)

gde je s(x, y) 2D funkcija odmeravanja definisana relacijom

m n

ynyxmxyxs ,, . (5.2.2.3)

2D funkcija odmeravanja prikazana je na Slici 5.2.2.1. Frekvencije odmeravanja u horizontalnim i vertikalnim pravcima su 1/ x i 1/ y, respektivno.

Slika 5.2.2.1—Dvodimenzionalna funkcija odmeravanja

51

Page 60: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Proširuju i Nyquist-ovu teoriju na dve dimenzije, može se pokazati da se slika i(x, y) može dobiti ako su ispunjeni slede i uslovi:

1/ x 2fm i 1/ y 2fv. (5.2.2.4)

Jedan zna ajan parametar u stvaranju digitalne slike je rezolucija slike. Tako na primer, kada je slika skenirana, treba navesti rezoluciju skenirane slike. Pogodna rezolucija se odre uje na osnovu (5.2.2.4) i osobina ove ijeg vizuelnog sistema. S druge strane, detalji slike koje vidimo o ima zavise od ugla koji slika formira na retini. 5.2.3 Niskopropusni anti-aliasing filtri

U praksi, signal nije ta no ograni enog opsega mada su višefrekvencijske komponenete u opštem slu aju veoma male. Ove komponente unose preklapanja (alias) i mogu se smatrati kao izobli enja u odmeravanom signalu. Da bi se obezbedilo da audio signal ili signal slike bude dovoljno ograni enog opsega, signal se propušta kroz niskipropusni anti-aliasing filtar kako bi se znatno smanjile visokofrekvencijske komponente tako da tzv. alias komponente imaju vrlo malu energiju. Tipi na karakteristika 1D niskopropusnog/anti-aliasing filtra prikazana je na Slici 5.2.3.1. gde je sa fs ozna ena frekvencija odmeravanja.

Slika 5.2.3.1—Karakteristike niskopropusnog/anti-aliasing filtra: a) idealni uskopropusni filter sa ravnim poja anjem u propusnom opsegu, b) realizabilni niskopropusni filter sa postepenim prelaskom od propusnog

ka nepropusnom opsegu Jedan idealni nisko-propusni filtar ima opštu grani nu (eng. cut-off) frekvenciju od fs/2 što je prikazano na Slici 5.2.3.1-a. U praksi je me utim nemogu e realizovati jedan takav filtar. Na Slici 5.2.3.1-b prikazan je frekvencijski odziv tipi nog filtra koji se može realizovati. Ovde je poja anje u propusnom opsegu blisko jedinici, dok je poja anje u nepropusnom opsegu blisko nuli. Prelazni opseg omogu uje postupno opadanje poja anja i to od 1 ka 0. Projektovanje 1D niskopropusnog/anti-aliasing filtra može se proširiti na projektovanje 2D niskopropusnog/anti-

52

Page 61: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

aliasing filtra za Slike. U tom slu aju filtar e imati dve grani ne (cut-off) frekvencije i to po jednu u horizontalnom i vertikalnom pravcu.

5.3 Digitalizacija audio signala Uproš ena blok-šema digitalizacije audio signala data je na Slici 5.3.1. Naveš emo glavne funkcije svakog bloka.

Na Slici 5.3.1-a prikazan je proces odmeravanja i digitalizacije audio signala. Analogni audio signal iz mikrofona ima mali dinami ki opseg. Otuda se on poja ava pre bilo kakve obrade. Naime, audio signal e biti poja an pre unošenja bilo kakvog šuma (šum zbog ditera ili šuma kvantovanja). Diter generator unosi malu koli inu slu ajnog šuma koji se pridodaje audio signalu na izlazu iz poja ava a. Anti-aliasing filter je niskopropusni filtar koji obezbe uje da audio signal bude ograni enog opsega. Pored toga, on eliminiše komponentu preklapanja posle odmeravanja [5.4].

DISKRETNIDIGITALNI

AUDIO

POJA AVA

ANALOGNI AUDIO SIGNAL IZ MIKROFONA

GENERATORDITERA

ANTI-ALIASING FILTER

A/D KONVERTOR +

SH

ANALOGNI AUDIO (C – N)

MULTIPLEKSER

SKLADIŠTENJE

PODATAKA

ODMERAVANJE I

DIGITALIZACIJA

ODMERAVANJE I

DIGITALIZACIJA

KOMPRESIJA I KOREKCIJA

GREŠKE

DIGITALNI AUDIO

ANALOGNI AUDIO (N – 1)

DIGITALNI AUDIO

a)

b)

Slika 5.3.1—Digitalizacija audio signala: a) odmeravanje i digitalizacija, b) N-kanalno registrovanje i skladištenje audio podataka

Uzorak i zadržavanje (eng. sample and hold – SH) blok služi za držanje amplitudne

vrednosti odmeraka od trenutka odmeravanja audio signala do trenutka nailaska slede eg odmerka. Zatim se vrši odmeravanje audio signala u svakom trenutku odmeravanja. Analogno– digitalni (eng. analog to digital – A/D) konvertor služi za ekvivalentno digitalno predstavljanje

53

Page 62: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

analognog signala. Multipleksiranje niza bita koji dolaze iz razli itih kanala vrši se pomo u multipleksera. Komprimovanjem se smanjuje suvišnost i komprimuje veli ina audio fajla pri emu se održava prihvatljiv nivo kvaliteta audio signala.

Kada je audio signal kvantovan koriste i mali broj bita po odmerku, kvalitet audio signala je loš. Utvr eno je da ako se pre kvantizacije pridoda mala koli ina diter šuma subjektivni kvalitet se poboljšava. Ukoliko audio sistem ima više kanala (na primer 7 – 8 kanala), gornja procedura se primenjuje posebno na svaki kanal. To zna i da se odmerci iz razli itih audio kanala multipleksiraju, komprimuju i skladište za budu i tzv. “playback”, što je prikazano na Slici 5.3.1-b. 5.3.1 Analogno-digitalna konverzija Ulaz u A/D konvertor je diskretni vremenski signal ija je amplituda realni broj koji može da zahteva jedan beskona an broj bita/digita radi vernog predstavljanja. Za obradu na digitalnom ra unaru, signal u svakom trenutku treba da bude konvertovan u 8, 16 ili 32 bita. To realizuje kvantizer koji ustvari preslikava kontinualnu promenljivu u diskretnu promenljivu. Ulazno– izlazna relacija za tipi an kvantizer je stepenasta funkcija kao što je prikazano na Slici 5.3.1.1.

Slika 5.3.1.1—Proces kvantizacije, (a) uniformni kvantizer, (b) neuniformni kvantizer Predpostavimo sada da nam je potreban kvantizer sa N izlaznih nivoa. Nivoi odlu ivanja i

izlazni (rekonstruisani) nivoi ozna eni su sa (dk, 0 k N) i (rk, 0 k N 1), respektivno, gde je dk rk < dk+1. Izlaz iz kvantizera za zadati ulaz u kvantizer ozna en sa g(nT) može se izra unati primenom relacije:

Q [g(nT)] = rk, ako je dk g(nT) < dk+1. (5.3.1.1)

54

Page 63: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Ukoliko su nivoi odlu ivanja ekvidistantni, tj. ako je (dk-1 – dk) konstantno za svako k, radi se o uniformnom kvantizeru, što je prikazano na Slici 5.3.1.1-a. Ulazno–izlazna funkcija i greška kvantovanja za neuniformni kvantizer su dati na Slici 5.3.1.1-b. Kvantovane vrednosti signala mogu se predstaviti koriš enjem razli itih metoda. Najviše rasprostranjena metoda je tzv. metoda PCM. Tu se svaki odmerak predstavlja koriš enjem fiksnog broja bita i kodovan je nezavisno od drugih. Ukupan broj mogu ih amplitudnih nivoa u PCM je povezan sa brojem bita koji se koriste za predstavljanje svakog odmerka. Ako je N broj nivoa izlaza iz kvantizera a B broj bita po odmerku, tada je:

N = 2B. (5.3.1.2) Vidi se da ukoliko je upotrebljen ve i broj bita B za predstavljanje odmerka, broj izlaznih nivoa N e se pove avati. To e smanjivati grešku kvantovanja pa e se dobiti bolji kvalitet audio signala. Bitski protok kvantnog audio signala dobija se iz izraza:

BITSKI PROTOK = fsB (bita/kanal/sekundi) (5.3.1.3) gde je sa fs ozna ena frekvencija odmeravanja, dok je B, kao i pre, broj bita po odmerku. Za stereo audio, kanali se mogu posmatrati kao nezavisni [5.5]. Otuda, bitski protok za stereo audio bi e dva puta od onoga za mono audio, tj. 2fsB bita u sekundi. 5.3.2 Kriterijum vernosti audio signala Kvalitet audio signala postiže se ako se veliki broj bita koristi za reprezentovanje svakog odmerka. S druge strane, to e pove ati bitski protok audio signala. Dakle, kaže se da postoji veza bitskog protoka i kvaliteta digitalizovanog audio signala. Izbor bitskog protoka i kvaliteta audio signala zavisi od odgovaraju e primene audio signala. U cilju postizanja objektivnosti ocene, važno je da se definišu kriterijumi vernosti audio signala. Koriste se dva kriterijuma za procenu kvaliteta analize signala: subjektivni (kvalitativni) i objektivni (kvantitativni). Kod subjektivne procene, vernost audio signala predstavlja se pomo u tzv. skale pogoršanja koja ima pet nivoa od 1 do 5 što je prikazano u TabelI 5.3.2.1 [5.6].

Tabela 5.3.2.1—Skala pogoršanja za procenu vernosti audio signala

Vrlo neugodna smetnja 1

Neugodna smetnja 2

Neznatno neugodna smetnja 3

Smetnja se ose a ali nije neugodna 4

Smetnja se ne ose a 5

55

Page 64: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Na skali pogoršanja meri se kvalitet ujnosti obzirom na izobli enje u signalu. Za zadati audio signal grupe ispitanika (nazvani subjekti) su ispitivani da procene kvalitet audio signala daju i odgovaraju e ocene na skali od pet opcija. Mišljenja su subjektivna, a rezultati variraju od subjekta do subjekta. Prose an rezultat (srednja vrednost) se naziva srednja vrednost mišljenja (eng. mean opinion score – MOS). MOS zahtev zavisi od oblasti primene. Tako, na primer ocena tri može biti zadovoljavaju a u telefoniji. S druge strane, za kvalitetan audio, vrednost ocene za MOS treba da bude bliska pet (ve a od 4.5). Subjektivni kvalitet audio signala na osnovu ljudskog auditornog sistema je složena procedura koja uklju uje eksperimente uz prisustvo eksperata i/ili neekspertnih subjekata. Uz to, na subjektivne procene uti e izbor subjekata i pravilno obavljanje eksperimenta. Iz tog razloga razvijeno je nekoliko kvantitativnih mera da bi se procenio objektivni kvalitet audio signala. Izbor objektivne (kvantitativne) mere izobli enja zavisi od više faktora. Pre svega, ovakva mera se može prikazati u prirodnom analiti kom obliku, a onda biti prilago ena za lako izra unavanje. Odnos signal–šum (eng. signal-to-noise ratio – SNR) i srednja kvadratna greška (eng. mean square error – MSE) su dva parametra za utv ivanje izobli enja audio signala. Oni su dati slede im izrazima:

1

2

01

2

0

ˆ

ˆ

N

nN

n

f nSNR

f n f n (5.3.2.1)

1010 logSNR dB SNR (5.3.2.2)

21

0

N

n

MSE f n f nN

(5.3.2.3)

gde su

f n odmerci originalnog audio signala,

odmerci kvantitativnog audio signala i ˆf n

N predstavlja broj audio odmeraka. Tradicionalno, SNR je najpoznatija mera za grešku. Pored toga što pruža korisne informacije, ovaj odnos je matemati ki prilagodljiv, pa je iz tog razloga naišao na najširu primenu. Nažalost, vrednosti SNR nisu u dobroj koleraciji sa subjektivnim ocenama, naro ito pri velikim odnosima kompresije. Kvalitet digitalnog audio odmerka je odre en brojem bita po odmerku. U procesu kvatizacije, ulazna vrednost odmerka je predstavljena najbliže mogu im izlaznim nivoom. U tom procesu, unosi se šum u kvantovani signal. Greška (šum) kvantovanja je razlika izme u stvarne vrednosti analognog signala i njegove kvantovane vrednosti. Drugim re ima

ˆe nT f nT g nT g nT Q g nT (5.3.2.4)

56

Page 65: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

gde je g nT ulazni signal,

g nT izlaz iz kvantizera,

e nT signal greške u trenutku odmeravanja nT.

Ukoliko se za grešku e(nT) predpostavi da je statisti ki nezavisna i sa uniformnim redosledom u intervalu [-Q/2, Q/2], srednja kvadratna vrednost šuma kvantovanja za signal sa dinami kim opsegom od 1 (tj. Q = 2 –B) može se izraziti u obliku

/ 2 2 22

/ 2

1

12 12

Q

Q

QE = e de = =

Q

B2 (5.3.2.5)

gde je

B broj bita upotrebljen za predstavljanje svakog odmerka. Izraženo u dB, srednja kvadratna vrednost šuma može se predstaviti u obliku:

2 2B

10 10

210log 10log 6B 10.8

12 12

QE = = = . (5.3.2.6)

Jednakost (5.3.2.6) pokazuje da svaki dodatni bit u postupku A/D konverzije smanjuje šum za oko 6 dB i na taj na in pove ava SNR za isti iznos. Tako, na primer, SNR za 16 bitni kvantovani audio signal e biti reda veli ine 96 dB. Za jedan audio signal koji ima SNR ve i od 90 dB se smatra da je odli nog kvaliteta za najve i broj primena.

5.4 Digitalizacija slika Osetljivost ljudskog vizuelnog sistema je skromnija nego kod auditivnog sistema. Dok auditivni sistem može da razlikuje na hiljade nivoa zvu nog pritiska, HVS može da razlikuje samo oko 200 nivoa sjaja [5.7]. Slika sivog nivoa može se opistai kao slika odli nog kvaliteta sa 8-bitnom rezolucijom koja odgovara vrednosti od 256 nivoa sivog [5.8]. Što se ti e slike u boji, njene tri osnovne komponente R, G i B zajedno se koriste. Svaka od tri komponente posebno se kvantuje [5.9]. Na primer, senzori visoke rezolucije u opštem slu aju koriste 8 bita/kanal/piksel. Stoga je ukupno 24 bita potrebno za predstavljanje piksela u boji. Uo imo da 24 bita po pikselu odgovara broju od 224 boja, što je mnogo više od nego što ljudske o i mogu da razlikuju. Otuda, mnogi elementarni ure aji koriste displej sa nižom rezolucijom (tj. 8 bita ili 16 bita). 5.4.1 Vizuelna vernost

U procesu kvantizacije piksela pogoršava se kvalitet vizuelnih podataka. Uz to, može se pojaviti izobli enje usled kompresije slike. Kao i u slu aju audio signala, postoje dva tipa mere

57

Page 66: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

vernosti: subjektivni i objektivni. U slu aju subjektivnih mera, koristi se sli na skala kao i kod audio signala za procenu kvaliteta slike. Me utim vizuelno testiranje sa realnim subjektima predstavlja glomaznu proceduru. Otuda, kada je u pitanju vizuelna vernost, u praksi se naj eš e koriste objektivne mere vernosti. Ove naj eš e koriš ene mere su SNR i MSE. Ovim merama treba pridodati vršni odnos signal–šum (eng. peak-signal-to-noise ratio – PSNR), kao i srednju apsolutnu grešku (eng. mean absolute error – MAE). Ako su ,f m n i ˆ ,f m n originalna i

izobli ena slika, respektivno, dimenzija M × N, vizuelna vernost može se oceniti primenom slede ih parametara [5.10], [5.11]:

1 1 2

0 010 1 1 2

0 0

ˆ ,10 log

ˆ , ,

M N

m nM N

m n

f m nSNR dB

f m n f m n (5.4.1.1)

1 1

2

0 010 1 1 2

0 0

vršna vrednost signala10log

ˆ , ,

M N

m nM N

m n

PSNR dBf m n f m n

(5.4.1.2)

21 1

0 0

1 ˆ , ,M N

m n

MSE f m n f m nMN

(5.4.1.3)

1 1

0 0

1 ˆ ,M N

m n

,MAE f m n f m nMN

(5.4.1.4)

Mada ove objektivne mere omogu uju da se brzo proceni izobli enje, one nisu dobro korelisane sa subjektivnim procenama, naro ito kada se radi o velikom izobli enju.

5.5 Rezime U današnjim telekomunikacionim sistemima, analiza i obrada multimedijalnih podataka predstavlja vrlo aktuelan problem. Kod analognih sistema javljaju se problemi šuma, nestabilnost, velike potrošnje energije. Da bi se audio ili video podaci smestili u ra unar moraju se digitalizovati. Digitalni sistemi omogu avaju jednostavan prenos i skladištenje podataka. Pored toga, široke mogu nosti programiranja ine digitalne sisteme superiornim u odnosu na analogne. Digitalizacija multimedijalnih signala je opšta tema koja se pojavljuje u više nau nih disciplina. injenica je da su audio i video sistemi uneli mnogo specifi nih zahteva koji se postavljaju prema digitalizovanom signalu, a koji su posledica izuzetnih zahteva ula sluha u ula vida kao krajnjih korisnika informacija.

Da bi se analogni audio adekvatno digitalizovao njegov spektar mora biti ograni en u skladu sa teoremom odabiranja. Spektar audio signala možemo ograni iti na dva na ina. Prvi na in je da ga ograni imo samo sa ulaznim filtrom. Drugi na in je da koristimo ulazni filtar u

58

Page 67: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

kombinaciji sa tzv. “oversampling-om”. Pojam “oversampling” podrazumeva odmeravanje koje se obavlja na mnogo višoj frekvenciji od Nyquist-ove granice. Pošto je frekvencija odmeravanja dovoljno velika, ne e do i do preklapanja u spektru.

Kvantovanje je proces koji trajno unosi grešku kako u audio tako i u video signal. Veli ina greške zavisi od broja nivoa kvantovanja. Zbog nelinearnosti karakteristike kvantizera dolazi do izobli enja koja prouzrokuju harmonike (granulacioni šum). Efikasna metoda za uklanjanje granulacionog šuma je diterovanje. To je nezaobilazni proces kod A/D konvertora audio signala.

Greška kvantovanja može se smanjiti na dva na ina: da se pove a broj nivoa kvantovanja, odnosno broj bita po odmerku ili da se koristi “oversampling”. Kako je danas isplativije da se pove ava brzina odmeravanja nego broj bita, treba se opredeliti na primenu “oversampling-a”.

Ukoliko audio signal dolazi iz više kanala odmerci iz razli itih audio kanala se multipleksiraju, komprimuju i skladište za budu i “playback”.

Da bi se digitalizovala slika treba poznavati osobine ljudskog vizuelnog sistema. Odmeravanje slike vrši se pomo u više rešetki. Heksagonalno odmeravanje bolje formira frekvencijsku ravan što rezultuje manjom frekvencijom odmeravanja. Nedostatak ovih tipova odmeravanja je u tome što nisu skalabilna. Za kvantovanje slike koriste se dve vrste kvantizacije: skalarna i vektorska. Skalarno kvantovanje koristi uglavnom osam bita, jer više bita ne e generalno poboljšati kvalitet slike, osim ako se ne vrše neka dodatna ispitivanja. Prednost skalarne kvantizacije u odnosu na vektorsku je u tome što je skalarna kvantizacija brža.

Radi postizanja ocene kvaliteta audio signala definišu se dva kriterijuma i to subjektivni (kvalitativni) i objektivni (kvantitativni). Subjektivni uklju uje procene na osnovu eksperimenata sa ispitanicima. Objektivni kriterijum, s druge strane, uzima u obzir odnos signal–šum i srednju kvadratnu grešku nastalu u procesu kvantizacije signala.

U procesu kvantizacije piksela pogoršava se kvalitet vizuelnih podataka. Kada je re o vizuelnoj vernosti, dva naj eš e koriš ena parametra za procenu kvaliteta su opet odnos signal– šum i srednja kvadratna greška. Me utim, u ovom slu aju kao parametri se još pridodaju vršni odnos signal–šum i srednja apsolutna greška.

U skoroj budu nosti od ure aja za akviziciju audia o ekuje se: pove anje frekvencije odmeravanja, zamena analognih komponenti i na taj na in poboljšanje performansi sistema za akviziciju. Koriš enjem vektorske kvantizacije treba pove ati kvalitet i kompresiju digitalnog audio signala. Treba imati u vidu i to da je zbog porasta kompleksnosti integracije i trenda smanjenja napona napajanja sve teže realizovati konverziju visoke rezolucije sa klasi nim A/D konvertorima. Što se ti e akvizicije slike, potrebno je pove anje gustine odmeravanja i na taj na in poboljšanje performansi sistema za akviziciju, koriš enje vektorske kvantizacije, kao i rad na usavršavanju poluprovodni kih senzora i otklanjanju njihovih nedostataka.

Napretkom tehnologije sve više se prelazi na digitalne sisteme za akvizaciju slike. Na primer, razvoj silicijumskih senzora i odgovaraju ih ipova osnovni su razlog za široku eksploataciju digitalnih kamera.

Pitanja

Koji se postupci koriste pri diskretizaciji, a koji pri digitalizaciji kontinualnog signala?1. 2. Šta je to odmeravanje kontinulanog signala i kako se ono vrši?

59

Page 68: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

3. Šta je to kontinualno odmeravanje? 4. Nacrtati blok-šemu kola za odmeravanje signala i objasniti kako radi ovo kolo. 5. Kako glasi teroema o odmeravanju? 6. Šta je to faktor režima odmeravanja?

Nacrtati blok-šemu koja ilustruje proceduru odmeravanja u vremenskom domenu. 7. 8. Šta predstavlja Nyquist-ov kriterijum? 9. Kako se Nyquist-ova teorija odmeravanja može proširitu na diskretizaciju slike?

10. U emu se ogleda uloga tzv. anti-aliasing filtra kod multimedijalne akvizicije podataka?

11. Nacrtati karakteristiku anti-aliasing filtra koji se može realizovati u praksi i nazna iti odgovaraju e parametre. Nacrtati blok-šemu za digitalizaciju audio signala, nazna iti i objasniti funkciju svakog elementa.

12.

Na koji se na in vrši N-kanalno registrovanje audio podataka? 13. 14. Šta je to uniformni, a šta neuniformni kvantizer?

Na koji na in se može poboljšati kvalitet audio signala kada se primeni impulsno kodovana modulacija?

15.

Kako se odre uje bitski protok kvantovanog audio signala za monoaudio i za stereoaudio?

16.

Koji se kriterijumi koriste za procenu kvaliteta audio signala? 17. Kada se koristi subjektivni, a kada objektivni kriterijum za procenu kvaliteta audio signala?

18.

19. Predstaviti tabelarno skalu pogoršanja za procenu vernosti audio signala. 20. Šta uti e na subjektivne procene kvaliteta audio signala?

Kako glase izrazi za utvr ivanje odnosa signal-šum u dB i srednju kvadratnu grešku nastalu u toku obrade audio signala?

21.

22. Predpostavljaju i da je šum kvantovanja statisti ki nezavisan i sa uniformnom raspodelom u intervalu [-Q/2, Q/2] odrediti srednju kvadratnu vednost šuma u dB.

23. U emu se ogleda uloga dodatnog bita u postupku analogno-digitalne konverzije? Kada se smatra da je za najve i broj primena audio signal odli nog kvaliteta? 24.

25. Uporediti osetljivost ljudskog auditivnog i vizuelnog sistema. Šta je potrebno za opisivanje digitalne slike sivog nivoa, a šta za opisivanje kada je ista u boji?

26.

Koji se parametri koriste za utvr ivanje vizuelne vernosti digitalizovane slike? 27. Kako se definiše vršni odnos signal-šum za odre ivanje vizuelne vernosti digitalizovane slike?

28.

29. Napisati analiti ki izraz za srednju kvadratnu grešku nastalu u procesu digitalizacije slike.

30. U emu se razlikuju subjektivne i objektivne mere za procenu vernosti digitalizovane slike?

60

Page 69: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Literatura

Z. Uroševi i M. Savi , Telekomunikacije: Elementi Teorije, Analize i Obrade Signala. Beograd, Nauka, 1995.

[5.1]

M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003. [5.2] B. P. Lahti, Signal Processing and Linear Systems. Carmichael, CA: Berkeley-Cambridge Press, 1998.

[5.3]

N. S. Jayant and P. Noll, Digital Coding of Waveforms: Principles and Applications to Speech and Video. Englewood Cliffs, N. J: Prentice Hall, 1984.

[5.4]

K. C. Pohlmann, Principles of Digital Audio. New York, McGraw-Hill, 2000. [5.5] Methods for the Subjective Assessment of Small Impairments in Audio Systems, Including Multichannel Sound Systems, ITU-R REC. BS.1116, 1994.

[5.6]

Z. S. Bojkovi , C. I. Toma, V. Gui, and R. Vasiu, Advanced Topics in Digital Image Compression. Timisoara, Romania: Politechnica, 1997.

[5.7]

M. Rabbani and P. W. Jones, Digital Image Compression Techniques. Bellingham, Washington, USA, SPIE-The International Society for Optical Engineering, 1991.

[5.8]

R. W. G. Hunt, The Reproduction of Colour. England, Fountain Press, 1987. [5.9] A. K. Jain, Fundamentals of Digital Image Processing. Englewood Cliffs, New Jersey, Prentice Hall, 1989.

[5.10]

K. R. Rao and J. J. Hwang, Techniques and Standards for Image, Video, and Audio Coding. Upper Saddle River, NJ: Prentice Hall, 1996.

[5.11]

61

Page 70: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

6. KOMPRESIJA TEKSTA Tekst je još jedan zna ajan medium za predstavljanje multimedijalnih informacija. Ustvari, to je najstariji medijum za skladištenje i prenos informacija. Najve i broj današnjih informacija jos uvek se uva u tekstualnom obliku. U ovom poglavlju da emo najpre kratak uvod u predstavljanje teksta u digitalnoj formi, a zatim e biti re i o nekim tehnikama kompresije teksta.

6.1 Predstavljanje teksta u digitalnoj formi Za razliku od audio i video podataka, kod teksta nema odmeravanja u vremenskom domenu niti kvantizacije. Za podatke o tekstu može se pretpostaviti da su stvoreni iz diskretnog informacionog izvora koji emituje simbole, a ovi predstavljaju slova koja odgovaraju nekoj azbuci (alfabetu). Pošto se tekstualni podatak široko koristi za predstavljanje mnogih dokumenta (knjige, novine, periodike), važno je sprovesti efikasno predstavljanje kako bi se smanjio zahtev za skladištenim prostorom (memorijom). Pošto izvor ima svoju azbuku, to zna i da on može da emituje bilo koji simbol (poruku) koji pripada datoj azbuci. Da bi opisali izvor, možemo uzeti u obzir sve mogu e simbole koje izvor može da emituje. To zna i da e izvor biti mnogo bolje opisan nekom srednjom koli inom informacije koju on emituje. Ova srednja koli ina informcije naziva se entropija izvora. Entropija predstavlja prose nu koli inu informacija po simbolu kojom izvor snabdeva posmatra a, odnosno prose ni izvor neizvesnosti koju posmatra poseduje pre nego sto izvrši ispitivaje izlaza iz izvora. Neka diskretni izvor informacija emituje simbole iz azbuke tj. skupa simbola S

S = {s1, …, si, …, sj …, sq} pri emu se svaki simbol pojavljuje sa izvesnom verovatno om

P(s1), …,P(si), …,P(sj)…,P(sq). Ukoliko pojava datog simbola ne zavisi od prethodnih simbola, entropija ovakvog izvora informacije data je izrazom

62

Page 71: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

2

1logi

S iiH s = P s , s S

P s. (6.1.1)

Maksimalnu entropiju ima e izvor kod koga su verovatno e emitovanja svih simbola date azbuke jednako verovatne. Tada je neizvesnost najve a pošto nijedan simbol nema prioritet. Ako azbuka ima q simbola ija je verovatno a pojavljivanja p = 1/q onda je maksimalna entropija

max 2 2 21 1

1 1log log log

q

ii= i=i

H = P s = q = qP s q

(6.1.2)

jer je o igledno 11

1

q

i q .

Kao što se vidi, maksimalna entropija brojno je jednaka koli ni informacija.

Minimalna entropija nastaje kada izvor ne emituje nikakvu informaciju. To je slu aj kada izvor emituje samo jedan simbol, tj. kada je verovatno a pojavljivanja jednog simbola jednaka jedan, a svih ostalih je nula. Na Slici 6.1.1 prikazana je entropija binarnog izvora informacija u funkciji verovatnoce pojave 0 ili 1.

Slika 6.1.1—Entropija binarnog izvora informacija Funkcija H(p) naziva se entropijska funkcija. Izvori koji emituju simbole koji su me usobno statisti ki nezavisni nazivaju se izvori bez memorije. Najzad na osnovu svega do sada naloženog može se izvu i zaklju ak da je izvor informacija definisan: azbukom (listom simbola) koju emituje, verovatno om pojavljivanja simbola, brzinom emitovanja simbola i prose nom brzinom emitovaja informacije.

63

Page 72: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Primer 6.1.1

Odrediti entropiju diskretnog izvora bez memorije sa etiri izvorna simbola S = { A, B, C, D} ije su verovatno e pojavljivanja: P(A) = 0.60, P(B) = 0.30, i P(C) = P(D) = 0.05.

Tražena entropija dobija se iz izraza:

21

21

2 2 2

10 10 10

1log

log

0.60log 0.60 0.30log 0.30 0.05log 0.05 0.05log 0.05

3.33 0.60log 0.60 0.30log 0.30 2 0.05log 0.05

1.40 bita/simbol

ii= i

q

i ii=

H s = P sP s

= P s P s

=

= + +

=

2

6.2 Principi kompresije teksta, statisti ka suvišnost Tipi ni podaci o tekstu nose suvišnu informaciju. Tehnike kompresije teksta smanjuju ili eliminišu tu suvišnost ime se postiže kompresija. Neka je izvor informacija pisani jezik. On se kao i govorni može posmatrati kao stohasti ki proces u kome su nizovi slovnih znakova determinisani zakonima verovatno e. Me utim opisivanje jezika kao stohasti kog procesa je otežano zbog toga sto su razli iti elementi jezika (slova, grupe slova i re i u jeziku ) me usobno zavisni. To zna i da upravo emitovanje simbola zavisi od niza prethodno emitovanih simbola. Ukoliko verovatno a pojavljivanja datog slova zavisi od “m” prethodnih simbola, tj ako je uslovna verovatno a da e posle sj1, sj2, …, sjm biti emitovan simbol si data izrazom

P (si |sj1, sj2, …, sjm) gde je i = 1, 2, … , q, jp = 1, 2, … , q, kažemo da se radi o Markovljenim izvorima m-tog reda koji generišu simbole sa liste s = (s1, s2,… sq), pri emu su pored ve opisanih uslovnih verovatno a poznate i verovatno e P(si), dok se entropija ovog izvora odre uje pomo u izraza

1

21

1log

m+q

j1 jm ii= i j1 j2 jm

H S = P s , ,s ,sP s | s ,s , ,s

. (6.2.1)

Niz od prethodno emitovanih “m” simbola predstavlja stanje izvora. Ukupan broj stanja iznosi qm, pa je broj uslovnih verovatno a qm+1. Postojanje statisti ke zavisnosti isme u simbola

64

Page 73: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

smanjuje neizvesnost pa, prema tome, i koli inu informacije. To zna i da e entropija izvora koji emituje statisti ki zavisne impulse uvek biti manja od entropije istog takvog izvora, ali koji emituje statisti ki nezavisne impulse. Ozna imo sa Hp vrednost entropije neke azbuke pod pretpostavkom da je verovatno a pojavljivanja svih slova (simbola) date azbuke jednaka i da ne postoji nikakva statisti ka zavisnost pri pojavi slova (H0 = Hmax). Neka je H stvarna vrednost entropije u slu aju da su uzete u obzir sve statisti ke zavisnosti jezika koje se izrazavaju pomo u date azbuke. Tada odnos H /H0 predstavlja stepen iskoriscenja simbola (slova) ili relativnu entropiju. Statisti ka suvišnost odnosno redundantnost predstavlja meru za ograni enja koju tekstu name e statisti ka struktura jezika. Definiše se preko stepena iskoriš enja slova, tj.,

0

1H

RH

(6.2.2)

ili u procentima

R (%) = 100 (H0 H )/H0. (6.2.3)

Primer 6.2.1

Koliki je stepen iskoris enja slova ruske azbuke (32 slova) i kolika je redundantnost ruskog jezika ako se zna da stvarna entropija ove azbuke (H ) iznosi 1.4 bita po slovu?

Najpre treba odrediti entropiju nultog reda koja iznosi:

0 2 232

1 1 1log log 32 32 5 log 2

32 32

= 5 bita po slovu

is i

2H = H s = P s = = =P s .

Sada je stepen iskoris enja slova ove azbuke:

28.05

4.1

0H

H.

Primer 6.2.2

Koliku koli inu informacije nosi televisijska slika koja se sastoji od 625 linija a svaka linija od 500 elementarnih ta aka pri emu svaka ta ka može da ima 16 nivoa osvetljenosti u rasponu od belog do crnog?

Posmatrana TV slika sastoji se od

65

Page 74: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

625 linija × 500 ta aka = 312 500 ta aka. Svaka ta ka može da ima 16 nivoa osvetljenosti. To zna i da ukupan broj razlil itih slika koje se mogu pojaviti iznosi 625 50016 slika. Pošto je pojava svake slike jednako verovatna, bi e

625 500

1

16P E = .

Koli ina informacije koji nosi TV slika iznosi

625 500 42 2 2

1log log 16 312 500 log 2 312 500 4

1 250 000 1.25Mb

I = = = =P E

=.

Teorija izvornog kodovanja bavi se kompresijom podataka generisanih iz informacionih izvora koji emituje niz simbola odabranih iz kona nog alfabeta. U teoriji izvornog kodovanja, entropija i funkcija stepena ošte enja informacije (eng. grade distortion function – GDF) su dva osnovna koncepta. Kao sto smo videli, entropija pruža meru za informaciju sadržanu u izvoru podataka i otuda odre uje minimum prose nog bitskog protoka potrebnog za perfektnu reprodukciju izvornih simbola. Teorija ošte enja informacije daje nižu granicu za prose an broj bita za dato izobli enje u obnovljenim simbolima [6.1].

Primer 6.2.3

Posmatrajmo povorku slova X = “aaabbbbbbbccaaabbcbbbb”. Alfabet zadatog izvora sadrži tri slova {a, b, c}. U povorci slova postoji 6a, 13b i 3c. Histogram e biti: h(a) = 6 , h(b) = 13 i h(c) = 3. Pošto ima ukupno 22 slova bi e: p(a) = 6/22 = 0.27, p(b) = 13/22 = 0.59 i p(c) = 3/22 = 0.14. Zbir svih verovatno a je 1.

Mada izvor informacije može imati K simbola, informacija koju nosi svaki simbol nije podjednako verovatna. Prose na informacija koju nosi simbol povezana je sa recipro nom vrednos u njegove verovatno e i data je u obliku

1logiI s =

p k. (6.2.4)

Iako svaki simbol može biti analiziran posebno, korisno je razmotriti velike blokove simbola pre nego pojedina ne simbole. Izlaz iz izvora se grupiše u blokove od N simbola, a za simbole se može predpostaviti da su generisani iz izvora SN sa alfabetom dimenzije KN. U tom slu aju izvor SN predstavlja N-to proširenje izvora S.

66

Page 75: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Entropija izvora definisana je kao prose na koli ina informacija “po izvornom simbolu”, tj.,

K

kk

K

k

kpkpsIkpSH1

21

log (6.2.5)

i izražava se u bitima po simbolu. Ovo je esto koris ena tzv. entropija prvog reda (eng. first order entropy – FOE). Sa p[k] ozna ena je verovatno a nastajanja k-tog simbola. FOE se esto zove entropija bez memorije jer daje minimalni bitski protok za reprodukciju diskretnog niza podataka bez gubitaka.

Primer 6.2.4

Neka je data povorka slova iz izvora “aaabbbbbbbccaaabbcbbbb”. Treba odrediti entropiju prvog i drugog reda.

Prema datim podacima u povorci postoji ukupno 22 slova. Od toga postoji: 6a, 13b, i 3c. Stoga je: p(a) = 6/22 = 0.27, p(b) = 13/22 = 0.59 i p(c) = 3/22 = 0.14.

Sa ovim, entropija prvog reda iznosi H1 = (0.27 log20.27 + 0.59 log20.59 + 0.14 log20.14) = 1.36 bita/simbol. Da bi smo izra unali verovatno u drugog reda, treba uzeti u razmatranje dva slova. U tom slu aju alfabet e se sastojati iz devet simbola: {aa, bb, cc, ab, ba, ac, ca, bc, cb}. Pošto imamo 22 simbola u startu, može se smatrati da povorka (niz) sadrži 11 parova od dva simbola {aa, ab, bb, bb, bb, cc, aa, ab, bc, bb, bb}. Verovatno e razli itih simbola su: p(aa) = 2/11 = 0.18, p(ab) = 2/22 = 0.18, p(bb) = 5/11 = 0.45, p(cc) = 1/11 = 0.09 i p(bc) = 1/11 = 0.09. Entropija drugog reda izra unava se na slede i na in: H2 = (2 · 0.18 · log2 0.18 + 0.45 · log2 0.45 + 2 · 0.09 · log2 0.09) = 2.03 bita/simbol, (1 simbol = 2 slova).

6.3 Shannon-ova teorema kodovanja za bešumni izvor Funkcija gustine verovatno e i entropija izvora informacija mogu se primeniti kod komprimovanja teksta. U tom cilju pomo i e nam Shannon-ova teorema kodovanja za bešumni izvor [6.2]. Neka je S izvorni tekst sa alfabetom veli ine K i entropijom H(S). Posmatrajmo blokove kodovanja od N izvornih simbola u binarne kodne re i. Shannon-ova teorema kodovanja za bešumni izvor kaže da je za bilo koje S > 0, mogu e za N dovoljno veliko konstruisati kod tako da prose an broj bita po originalnom izvornom simbolu R zadovoljava slede u relaciju:

67

Page 76: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

H S R H S S (6.2.6)

Drugim re ima izvor može biti kodovan bez gubitaka sa prose nim brojem bita bliskim njihovoj entropiji ali ne manjoj od entropije. Entropija izvora ograni ena je sa 0 i log2K. To zna i, drugim re ima da je

0 H(S) log2 K. (6.2.7) U ovoj relaciji leva strana važi ako je p[k] nula za sve izvorne simbole sk izuzev jedinice. U tom slu aju je izvor apsolutno prediktabilan. Desna strana važi kada svaki izvorni simbol sk ima istu verovatno u pojavljivanja. Redundansa izvora je definisano kao

REDUNDANSA = log2K – H(S). (6.2.8) Ova relacija pokazuje da ukoliko izvor ima alfabet velicine K, maksimalna entropija izvora je log2K. Ako je entropija iznosi log2K za izvor se može kazati da je nulte suvišnosti. U najve em broju slu ajeva informacija sadrži suvišnost.

Primer 6.3.1

Posmatrajmo izvor informacija sa alfabetom {a, b, c, d}. Simboli imaju podjednaku verovatno u nastajanja. Treba odrediti entropiju i redundansu izvora. Tako e treba prona i broj bita potreban za prenos simbola iz izvora a zatim i koder pogodan za kodovanje simbola.

Pošto je p(a) = p(b) = p(c) = p(d) = 0.25, entropija izvora iznosi: 4 · 0.25 · log2 0.25 ili 2 bita/simbol. Imaju i u vidu da je veli ina alfabeta K = 4, redundansa je nula, pošto je entropija jednaka log2 K = 2. Prose an broj bita potreban za prenos simbola je 2 bita/simbol. U tom slu aju, projektovanje kodera je trivijalno. Naime bi e a: 00, b: 01, c: 10 i d:11.

Primer 6.3.2

Koliki je prose an broj bita potreban za izvor od tri simbola? Koliki je minimalan broj bita potreban za kodovanje izvora od tri simbola koji je ina e oblika {aaabbbbbbbccaaabbcbbbb}. Tako e treba odrediti redundansu izvora. Kada je redundansa izvora jednaka nuli?

Broj bita potreban za jedan izvor informacije od tri simbola je log2 3 = 1.59 bit/simbol. U primeru 6.2.4 pokazali smo da je entropija za zadati izvor informacija 1.36 bit/simbol. Suvišnost u datom izvoru informacije sa 3 simbola je: log2K – H(S) = 1.59 – 1.36 = 0.23 bit/simbol. Suvišnost izvora je nula kada je entropija H(S) jednaka log2K. To e se dogoditi

68

Page 77: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

samo u slu aju da svi simboli imaju podjednaku verovatno u tj. 1/K.

Treba uo iti da Shannon-ova teorema pruža donju granicu zahteva za brojem bita. U praksi je vrlo teško posti i broj bita jednak entropiji. Ukoliko se želi da projektujemo koder sa tri simbola, lako možemo dobiti koder prenošenjem dva bit/simbol. Pri tome se pojavljuje bitski iznos od 0.64 (2 – 1.36) bit/simbol ve i od nivoa entropije S = 0.64. Ukoliko se S smanjuje, znatno se pove ava kompleksnost kodera.

6.4 Huffman-ovo kodovanje Prema Shannon-ovoj teoremi o bešumnom kodovanju, prose an broj bita R za kodovanje izvorne informacije je ograni en sa donje strane entropijom izvora. Me utim Shannon-ova teorema ne utvr uje na in projektovanja kodera koji e korigovati izvornu informaciju sa prose nim brojem bita R . Huffman je dao prakti nu metodu za projektovanje kodera koji daje broj bita blizak entropiji. Ovaj metod daje kod promenljive dužine (eng. variable length code – VLC) za svaki izvorni simbol i to tako da je broj bita u kodu približno obrnuto proporcionalan verovatno i nastajanja simbola [6.3]. Tabela 6.4.1 prikazuje alfabet izvora zajedno sa verovatno ama individualnih simbola. Izvor informacija sa 6 simbola zahteva najviše log2 6 = 2.58 bita. Entropija izvora je u ovom slu aju H = (0.3·log2 0.3 + 2·0.2 log2 0.2 + 3·0.1 log2 0.1) = 2.44 bit/simbol. To drugim re ima zna i da je mogu e projektovati koder koji e obavljati svoju funkciju sa 2.44 bit/simbol u proseku.

Tabela 6.4.1—Primena modela za alfabet {a, b, c, d, e, !}

Simboli Verovatno a Huffman-ov kod a 0.2 10 b 0.1 011 c 0.2 11 d 0.2 0100 e 0.3 00 ! 0.1 0101

Huffman-ov kod za izvor informacije je generisan u dva koraka: redukcija izvora i naznaka koda. Proces redukcije izvora za informacioni izvor koji odgovara Tabeli 6.4.1. objasni emo koriš enjem Slike 6.4.1. Postoji nekoliko koraka. U prvom koraku simboli su pore ani po opadaju oj verovatno i nestajanja. Na primer ovde je p(b) = p(d) = p(!) = 0.1. Izabrali smo redosled “b, d, !”, ali je mogu an bilo koji redosled.

Proces redukcije izvora za informacioni izvor koji odgovara Tabeli 6.4.1 objasni emo koris enjem Slike 6.4.1. Tu postoji nekoliko koraka. U prvom koraku simboli se pore aju po opadaju em verovatnoci i nastajanja. Na primer, ovde je p(b) = p(d) = p(!) = 0.1. Odabran je redosled “b, d, !” ali mogu an bilo koji redosled. Kada se simboli razvrstavaju, u slede em koraku novi simbol je kreiran kombinacijom dva najmanja verovatna simbola. U našem primeru stavili smo “d” i “!”. Stoga, novi simbol ima

69

Page 78: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

verovatno u nastajenja 0.2 (0.1 i 0.1). Sada vidimo da se broj simbola smanjio za jedan. U koloni dva, izvor ima etiri simbola umesto pet. Verovatno e ta etiri simbola su raspore ene po opadanju, kao što je to prikazano u koloni tri. U slede em koraku dva najmanje verovatna simbola su ponovo spojena, pa su zatim nove verovatno e ponovo raspore ene po opadanju. Proces se ponavlja dok se izvor ne svede na dva simbola. U našem primeru dve poslednje verovatno e su 0.6 i 0.4.

ORIGINALNI IZVOR DODELJIVANJE KODA

Simbol Verovatno a 1 2 3 4

e 0.3 0.3 0.3 0.4 0.6

a 0.2 0.2 0.3 0.3 0.4

c 0.2 0.2 0.2 0.3

b 0.1 0.2 0.2

d 0.1 0.1

! 0.1

Slika 6.4.1—Huffman-ov proces redukcije izvora

Pošto je završen proces redukcije izvora, zapo inje proces dodeljivanja Haffman-ovog

koda koji je prikazan na Slici 6.4.2.

ORIGINALNI IZVOR DODELJIVANJE KODA

Simbol Verovatno a KOD 1 2 3 4

e 0.3 00 0.3 00 0.3 00 0.4 1 0.6 0

a 0.2 10 0.2 10 0.3 01 0.3 00 0.4 1

c 0.2 11 0.2 11 0.2 10 0.3 01

b 0.1 001 0.2 010 0.2 11

d 0.1 0100 0.1 011

! 0.1 0101

Slika 6.4.2—Proces dodeljivanja Huffman-ovog koda

Za prva dva simbola dodeljene su kodne re i 0 i 1. U tom slu aju dodeljujemo “0” simbola sa verovatno om pojavljivanja 0.6 i “1” simbolu sa verovatno om pojavljivanja 0.4. Verovatno a pojavljivanja 0.6 dobijena je spajanjem dve verovatno e 0.3 i 0.3. Kodovi dodeljeni ovim verovatno ama su “0 pra ena 0” i “0 pra ena 1”. Posle tog dodeljivanja postoje tri simbola sa verovatno ama 0.4, 0.3 i 0.3 i kodovima 1, 00 i 01 respektivno. Verovatno a 0.4 dobijena je spajanjem dve verovatno e 0.2 i 0.2. Na tom koraku kodovi dodeljeni ovim verovatno ama (0.2 i 0.2) su “1 pra en 0” i “1 pra en sa 1”.

70

Page 79: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Posle tog dodeljivanja postoje 4 simbola sa verovatno ama 0.3, 0.3, 0.2 i 0.2 i kodovima 00, 01, 10 i 11 respektivno. U slede em koraku, druga verovatno a 0.3 dobijena je spajanjem dve verovatno e 0.2 i 0.1. Kodovi dodeljeni ovim verovatno ama (0.2 i 0.1) su “01 pra en 0” i “01 pra en sa 1”. Posle tog dedeljivanja postoji pet simbola sa verovatno ama pojavljivanja 0.3, 0.2, 0.2, 0.2 i 0.1 sa kodovima 00, 10, 11, 010 i 011 respektivno. etvrta verovatno a 0.2 dobijena je spajanjem dve verovatno e 0.1 i 0.1. U ovom koraku kod dodeljen ovim verovatno ama (0.1 i 0.1) je “010 pra en sa 0” i “010 pra en sa 1“. Posle tog dodeljivanja postoji šest simbola sa verovatno ama 0.3, 0.2, 0.2, 0.1, 0.1 i 0.1 i odgovaraju im kodovima 00, 10, 11, 011, 0100 i 0101 respektivno. Na taj na in dobili smo Huffman-ove kodove za sve originalne izvorne simbole. Iako dosta koriš eno još od otkri a 1952 godine, Huffman-ovo kodovanje ima nedostatke. Pre svega, ono zahteva najmanje jedan bit za predstavljanje pojavljivanja svakog simbola. Stoga, ako je entropija izvora manje od jednog bita po simbolu, Huffman-ovo kodovanje nije efikasno. Dalje, ovo kodovanje se ne može efikasno prilagoditi ukoliko se menjaju statistike izvora. Najzad, ni ure aji koji koriste Huffman-ov koder nisu jednostavni za implementaciju.

6.5 Aritmeti ko kodovanje Da bi se postigla razumna efikasnost primenom Huffman-ovog kodovanja, niz koji generiše izvor deli se na blokove, a svakom bloku se dodeljuje kodna re promenljive dužine. Na strani dekodera, primenjeni niz je raš lanjen na blokove razli ite dužine koji odgovaraju individualnim kodnim re ima. Pri tome, postoji korespondencija jedan prema jedan izme u blokova kodne reci i blokova koji se odnose na izvorni niz. Kod aritmeti kog kodovanja, neznatno razli iti izvorni nizovi daju zna ajno razli ite kodne nizove [6.4], [6.5]. Kao entropijska kodna tehnika, aritmeti ko kodovanje postiže ve u kompresiju nego Haffman-ovo kodovaje. Za razliku od Huffman-ovog kodovanja, kod aritmetickog kodovanja prose an broj bita se približava teorijskoj granici, entropiji, za bilo koji proizvoljan izvor. Kod Huffman-ovog kodovanje svakom simbolu se pripisuje kodna re promenljive dužine. U procesu kodovanja, simboli su nezavisno kodovani. Kod aritmeti kog kodovanja, kodnoj re i je pripisana cela ulazna poruka [6.6]–[6.11] .

Primer 6.5.1

Posmatrajmo englesku azbuku sa 26 slova. Treba odrediti maksimalan broj razli itih tekstualnih povorki dužine 1, 2 i 100.

Tekstualnu povorku dužine 1 ine “a”, “b”, “c”, … i “z”. Stoga je maksimalan broj mogu ih povorki 26. Tekstualnu povorku dužine 2 ine “aa”, “ab”, …”az”, “ba”, “bb”, “bc”,…, “bz”,… “zz”. Maksimalan broj razli itih povorki je 262 ili 676. Na sli an na in postoji 26100 razli itih povorki sa 100 znakova.

71

Page 80: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Primer 6.5.1 pokazuje da ako izvor ima azbuku dimenzije K postoji Km razli itih mogu ih poruka dužine m. Ukoliko je poznata funkcija gustine verovatno e individualnih simbola, može se izra unati verovatno a nastajanja date poruke sm dužine m. Pošto postoji Km razli itih mogu ih poruka, može se izra unati verovatno a p(sm) nastajanja tih individualnih poruka, pri emu je

10

mK

mmsp . (6.5.1)

Ukoliko se želi da se koduje celokupna poruka odjednom, pove ava se efikasnost kodera. Huffman-ov kod obezbedi e prose an broj bita blizak entropiji ak i kada je to manje od jednog bita po simbolu. Me utim, generisanje Huffman-ove tabele od Km simbola bilo bi vrlo teško, ak i gotovo nemogu e. Sre om aritmeti ko kodovanje obezbe uje pogodan na in da se ostvari taj cilj pod optimalnim uslovima.

Predspostavimo sad da su poznate verovatno e p(sm) razli ito mogu ih poruka. Njihova ukupna suma je 1. Podeli emo interval [0, 1] na realnoj osi na Km podintervala, tako da širina svakog podinternala odgovara verovatno i nastajanja poruka. Neka su podintervali [Ll, Rl], (l = 1, 2, … , Km). Kada su jednom podintervali utvr eni, bilo koji realan broj u tom podintervalu odgovara e jednoj poruci, pa se stoga može dekodovati cela ulazna poruka. Pošto se podintervali ne preklapaju kodna re za Sm može se konstruisati pomeranjem bilo koje ta ke u intervalu u binarnom obliku i zadržavaju i samo ni = [ log2p(sm)] bita posle decimalne ta ke. Pošto bi gornja procedura mogla biti komplikovana može se primeniti jednostavna rekurzivna tehnika. Sada emo tehniku kodovanja objasniti na konkretnom primeru. Posmatra emo informacioni izvor dat u Tabeli 6.5.1. Primeni emo više koraka.

Tabela 6.5.1—Simboli, njihove verovatno e pojavljivanja i opseg za aritmeti ki koder

Simboli Verovatno a Opseg za aritmeti ki koder a 0.2 [ 0, 0.2 ] b 0.1 [ 0.2, 0.3 ] c 0.2 [ 0.3, 0.5 ] d 0.1 [ 0.5, 0.6 ] e 0.3 [ 0.6, 0.9 ] ! 0.1 [ 0.9, 1.0 ]

Korak 1: Simboli i njihove verovatno e pojavljivanja pore aju se kao što je to pokazano u Tabeli 6.5.1. Korak 2: Podeliti inteval [0, 1] na 6 ( = K) podintervala pošto postoji 6 simbola. Širina svakog podintervala jednaka je verovatno i nastajanja individualnog simbola. Korak 3: Predpostavimo da želimo da prenesemo simbol baad! Pošto je prvi simbol “b” biramo interval [0.2, 0.3]. To je prikazano u Tabeli 6.5.2 (tre i red), kao i na Slici 6.5.1.

72

Page 81: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Tabela 6.5.2—Generisanje niza bita pri aritmeti kom kodovanju

Podinterval Binarni interval Generisani niz bita

START [ 0, 1.0]

b [ 0.2, 0.3 ] [ 0.0, 0.5 ] 0

a [ 0.2, 0.22 ] [ 0.0, 0.25 ] 0

a [ 0.2, 0.204 ] [ 0.125, 0.25 ] 1

d [ 0.2020, 0.2024 ] [ 0.1875, 0.25 ] 1

! [ 0.20236, 0.2024 ] [ 0.1875, 0.21875 ] 0

Slika 6.5.1—Proces aritmeti kog kodovanja Kada je podinterval odabran, on je podeljen na 6 podintervala drugog nivoa, kao što je to prikazano na Slici 6.5.1.

Korak 4: Drugi simbol je “a”. Otuda biramo podinterval koji odgovara “a” u intervalu [0.2 do 0.3]. To je [0.2, 0.22], kao što je to dato na Slici 6.5.1. Podinterval je [0.2 do 0.22] je podeljen na 6 podintervala tre eg nivoa. Korak 5: Tre i simbol je opet “a”. Otuda je odabran podinterval [0.2, 0.204]. Podinterval je opet izdeljen na 6 podintervala etvrtog nivoa. Korak 6: etvrti simbol je “d”. Stoga, odabran je podinterval [0.2020, 0.2024]. Podinterval je podeljen na 6 podintervala petog nivoa. Korak 7: Poslednji, peti simbol je “!”. Zbog toga je uzet podinterval [0.20236, 0.2024].

Pošto više nema drugih simbola, proces kodovanja je sada kompletiran. Predajnik može da šalje proizvoljan broj u intervalu [0.20236 do 0.2024], a dekoder e biti u stanju da rekonstruiše ulazni niz. Razume se, dekoder treba da zna informaciju koja postoji u Tabeli 6.5.1.

73

Page 82: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Dosadašnja opisana procedura proizvodi realne brojeve koji se mogu poslati dekoderu. Realni brojevi su predstavljeni nizom bita koji se generišu kada jednom znamo kona an realan broj. Niz bita se generise posle nailaska ulaznih simbola i pošto su podintervali segmentirani kao što je prikazano u Tabeli 6.5.2. Za simbol “b” koder zadržava opseg na [0.2, 0.3]. Pošto je odre eno da je interval [0.0, 0.5], dekoder zna da je prvi simbol “0”. Stoga, on sada može da otpo ne sa slanjem ulaznih bita. Posle drugog simbola, koder dalje sužava opseg na [0.2, 0.22]. Tada koder zna da je drugi simbol “0”, jer je interval u opsegu [0, 0.25]. Na sli an na in, tre i simbol e biti ''1'', jer se interval nalazi u opsegu [0.125, 0.25]. etvrti simbol je “1”, itd. Šema dekodovanja je vrlo jednostavna. Predpostavimo da je poslat broj 0.20238. Dekoder prepoznaje da je prvi simbol “b” pošto leži u opsegu [0.2, 0.3] kao što je prikazano u Tabeli 6.5.2. Drugi simbol je “a” jer leži u opsegu [0.2, 0.22]. Zatim se proces nastavlja. U navedenom primeru koriš en je fiksni model koji nije pogodan za kodovanje nestacionarnih izvora kod kojih se statistike izvora menjaju se vremenom. U tim slu ajevima trebalo bi primeniti adaptivni model. Tako, na primer, u [6.12] je predložen efikasan model za primenu adaptivnog aritmeti kog kodovanja koji daje broj bita vrlo blizak entropiji izvora.

6.6 Rezime Najve i broj informacija još uvek se danas uva u tekstualnom obliku. Podaci o tekstu stvoreni su iz diskretnog informacionog izvora koji emituje simbole a ovi predstavljaju slova koja odgovaraju nekoj azbuci. Pošto se tekstualni podaci još uvek koriste kao razli iti dokumenti, važno ih je predstaviti u najprihvatljivijoj formi kako bi se smanjili zahtevi za skladištenim prostorom. Prose na koli ina informacija po simbolu kojom izvor snabdeva posmatra a predstavlja entropiju. Maksimalnu entropiju ima e izvorni kod kod koga su verovatno e emitovanja svih simbola date azbuke podjednako verovatne. Ujedno tada je i neizvesnot najve a, pošto nijedan simbol nema prioritet. Minimalna entropija nastaje kada izvor ne emituje nikakvu informaciji. To je slu aj kada izvor emituje samo jedan simbol ije je verovatno a pojavljivanja jednaka jedan, a svih ostalih je nula. Izvori koji emituju simbole koji su medjusobno statisti ki nezavisni nazivaju se izvori “bez memorije”. S druge strane, izvor informacije je definisan: azbukom (listom simbola) koji emituje, verovatno om pojavljivanja simbola i prose nom brzinom emitovanja informacija (simbola). Podaci o tekstu nose suvišnu informaciju. Tehnika kompresije teksta smanjuje ili eliminiše tu suvišnost ime se postiže kompresija. Entropija izvora koji emituje statisti ki zavisne impulse uvek e biti manja od entropije istog takvog izvora koji emituje statisti ki nezavisne impulse. Statisti ka suvišnost odnosno redundantnost predstavlja meru ograni enja koju tekstu name e statisti ka struktura jezika. Dva ogromna koncepta u teoriji izvornog kodovanja su entropija i funkcija stepena oste enja informacije. Entropija pruža meru za informaciju izvornih simbola sadržanu u izvoru podataka i odre uje minimum prose nog bitskog protoka potrebnog za perfektnu reprodukciju izvornih simbola. S druge strane, teorija oste enja informacije pruža nižu granicu za prose an broj bita za dato izobli enje u obnovljenim simbolima. Ukoliko izvor ima alfabet veli ine K, maksimalna entropija izvora je log2 K. Ako entropija iznosi log2 K, za izvor se kaže da je nulte suvišnosti. U najve im broj slu ajeva informacija sadrži suvištnost.

74

Page 83: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Prema Shannon-ovoj teoremi o bešumnom kodovanju, prose an broj bita R za kodovanje izvorne informacije ograni en je sa donje strane entropijom izvora. Me utim Shannon-ova teorema ne utvr uje na in projektovanja kodera koji e korigovati izvornu informaciju sa prose nim brojem bita R Huffman-ova metoda pruža mogu nost projektovanja kodera koji daje broj bita blizak entropiji. Ova metoda daje kod promenljive dužine za svaki izvorni simbol i to tako da je broj bita u kodu približno obrnuto proporcionalan verovatno i nastajanja simbola. Me utim, Huffman-ovo kodovanje zahteva najmanje jedan bit za predstavljanje svakog simbola. Stoga, ako je entropija izvora manja od jednog bita po simbolu, Huffman-ovo kodovanje nije efikasno. Dalje, ovo kodovanje se ne može efikasno prilagoditi ukoliko se menjaju statistike izvora. Najzad, ni ure aji koji koriste Huffman-ov koder nisu jednostavni za implementaciju. Dok se kod Huffman-ovog kodovanja svakom simbolu pripisuje kodna re promenljive dužine, kod aritmeti kog kodovanja kodnoj re i je pripisana cela ulazna poruka. Primenom aritmeti kog kodovanja postiže se ve a kompresija nego kod Huffman-ovog kodovanja. Metode entropijsnog kodovanja koriste statisti ki model za kodovanje simbola sadržanih u ulaznim podacima. Kompresija je postignuta uklanjanjem statitisti ke suvišnosti prisutne u podacima. U tu srvrhu koristi se kodovanje simbola kodovima koji sadrže manje bita za ove simbole koji se eš e pojavljaju. Mada su za kodovanje podataka o tekstu prikazane neke kodne tehnike koje ne unose gubitke, ove tehnike se tako e koriste za kodovanje audio signala i slike. Druga grupa tehnika koje su predložili Lempel i Ziv zasniva se na kompresiji na bazi re nika [6.13], [6.14]. Me utim ta materija izlazi iz okvira ove knjige.

Pitanja

ime se karakteriše predstavljanje teksta u digitalnoj formi? 1. 2. Šta je to entropija izvora informacija? 3. Po emu se tekstualni podaci razlikuju od audio i video podataka? 4. Kada izvor informacija ima maksimalnu, a kada minimalnu entropiju? 5. Šta su to izvori informacija bez memorije? 6. Šta je to relativna entropija?

Kako se definiše statisti ka suvišnost nekog jezika? 7. 8. Jedna azbuka sastoji se iz 32 slova. Stvarna entropija ove azbuke iznosi 1.4 bita po slovu.

Odrediti entropiji nultog reda, kao i stepen iskoriš enja slova ove azbuke. 9. ime se bavi teorija izvornog kodovanja?

10. Šta prou ava teorija ošte enja informacije? 11. Kako glasi Shannon-ova teorema kodovanja za bešumni izvor? 12. Kada se za izvor informacija kaže da je nulte suvišnosti? 13. ime se karakterise Huffman-ova metoda za projektovanje kodera?

Kako se generiše Huffman-ov kod za izvor informacija? 14. 15. U emu se ogledaju nedostaci nastali u procesu Huffman-ovog kodovanja?

Koja je glavna karakteriska aritmeti kog kodovanja? 16.

75

Page 84: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

17. U emu se razlikuje aritmeti ko od Huffman-ovog kodovanja? Koji parametri definišu izvor informacija koji emituje simbole? 18.

ime se karakterišu metode entropijskog kodovanja?

19.

Literatura [6.1] D. Draji , Teorija Informacija i Prenos Podataka. Elektrotehni ki fakultet, Beograd,

1982. [6.2] C. E. Shannon and W. Weaver, The Mathematical Theory of Communication. Urbana,

IL: University of Illinois Press, 1949. [6.3] D. A. Huffman, “A Method for the construction of minimum-redundancy codes,” Proc.

Inst. Radio Eng., vol. 40, pp. 1098–1101, Sept. 1952. [6.4] A. N. Netravali and B. Prasada, “Adaptive quantization of picture signals using spatial

masking,” Proc. IEEE, vol. 65, no. 4, pp. 536–548, Apr. 1947. [6.5] S. P. Lloyd, “Least squares quantization in PCM,” IEEE Trans. Inf. Theory, vol. IT-28,

pp. 129–137, 1982. N. S. Jayant and P. Noll, Digital Coding of Waveforms: Principles and Applications to Speech and Video. Englewood Cliffs, NJ: Prentice Hall, 1984.

[6.6]

K. R. Rao and P. Yip, Discrete Cosine Transform: Algorithms, Advantages, Applications. New York, NY: Academic Press, 1990.

[6.7]

K. R. Rao and J. J. Hwang, Techniques and Standards for Image, Video, and Audio Coding. Upper Saddle River, NJ: Prentice Hall, 1996.

[6.8]

[6.9] G. G. Langdon and J. Rissanen, “Compression of black-white images with arithmetic coding,” IEEE Trans. Commun., vol. COM-29, pp. 858–867, 1981. A. K. Jain, Fundamentals of Digital Image Processing. Englewood Cliffs, New Jersey, Prentice Hall, 1989.

[6.10]

M. Rabbani and P. W. Jones, Digital Image Compression Techniques. Bellingham, Washington, USA, SPIE-The International Society for Optical Engineering, 1991.

[6.11]

[6.12] I. H. Witten, R. M. Neal, and J. G. Cleary, “Arithmetic coding for data compression,” Commun. of ACM, vol. 30, pp. 520–540, Jun. 1987. J. Ziv and A. Lempel, “A universal algorithm for sequential data compression,” IEEE Trans. Inf. Theory, vol. IT-23, pp. 337–342, 1977.

[6.13]

[6.14] J. Ziv and A. Lempel, “Compression of individual sequences via variable-rate coding,” IEEE Trans. Inf. Theory, vol. IT-24, pp. 530–536, 1978.

76

Page 85: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

7. STANDARDI U MULTIMEDIJALNIM KOMUNIKACIJAMA

Za razmatranje standarda u oblasti multimedijalnih komunikacija postoje dva pristupa. Jedan od pristupa se fokusira na bit-niz sintaksu u nameri da se razume šta predstavlja svaki sloj sintakse i na šta ukazuje svaki bit u jednom odre enom nizu bita. Ovakav pristup je važan za proizvo a e opreme u skladu sa standardima. Drugi pristup je usredsre en na algoritme za kodiranje koji se koriste za generisanje nizova bita, u skladu sa odgovaraju im multimedijalnim kodnim standardom. Isto tako, ovaj pristup zasniva se na istraživanju, razvoju, modernizaciji i implementaciji razli itih tipova algoritama za kodovanje multimedijalnog sadržaja kako bi se podržao veliki broj razli itih i sve zahtevnijih multimedijalnih aplikacija i servisa.

Predstavljanje neobra enih video signala zahteva veliki kapacitet pa se, u vezi sa tim, moraju definisati manje kompleksni video kodni algoritmi radi efikasnije kompresije video sekvenci kako bi se iste memorisale i prenosile. Pravilni izbor algoritma za video kodovanje multimedijalnih aplikacija je zna ajan faktor koji zavisi od raspoloživog kapaciteta i multimedijalnih zahteva za kvalitetom. Bitski prenos i brzina frejmova su faktori sa kojima se selektovani video koder može adaptivno birati, a sve to u skladu sa raspoloživim propusnim opsegom medijuma za komunikaciju. Sa druge strane, stalni napredak u tehnologiji daje kao rezultat pove anje svoga procesora digitalnih signala i zna ajno smanjuje cene opreme. U oblasti audio-vizuelnih komunikacija takvi video kodni algoritmi se koriste za kompresiju video signala sa visokom efikasnoš u kodovanja i maksimalnim perceptualnim kvalitetom. Kod video komunikacija zahtevi korisnika obi no su konfliktni te se mora i i na kompromis kako bi se obezbedio kvalitet servisa koji je korisnik zahtevao. Korisni ki zahtevi za digitalne video servise definišu se preko kvaliteta i širine opsega video signala, kompleksnosti, sinhronizacije i kašnjenja. Sa jedne strane, kompleksnost video-kodnih algoritama odnosi se na logaritamska izra unavanja koja se izvrše tokom kodovanja i dekodovanja. Sa druge strane, sinhronizacija izme u razli itih nizova bita mora se održavati da bi se obezbedile zadovoljavaju e performanse. Što se ti e kašnjenja, kod aplikacija koje se odvijaju u realnom vremenu, važno je da je vreme kašnjenja izme u frejma koji se koduje i posle toga dekoduje, minimalno. Sve ukazuje na to da je veoma zna ajno razmotriti aspekte multimedijalnih kodnih standarda i odgovaraju ih algoritama. Od ne manjeg zna aja je svakako smanjenje implementirane kompleksnosti multimedijalnih algoritama, a da se pri tome ne naruše njihove performanse.

77

Page 86: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

7.1 Zna aj standardizacije Sa neprekidnim pove anjem brzine prenosa, o igledno je da su kapacitet memorisanja hard diskova, fleš memorija i opti kih medija ve i nego ranije. Savremene tehnike kompresije multimedijalnih podataka pružaju mogu nost memorisanja ili prenosa velike koli ine informacija neophodnih za prezentaciju digitalnog sadržaja na efikasan na in. Sa neprekidnim pove anjem kapaciteta prenosa i memorisanja, kompresija postaje jedna od osnovnih komponenata za multimedijalne servise [7.1]. Što se ti e videa, kompresija ima važne prednosti. Pre svega, ona omogu ava da se digitalni video koristi u okruženju za prenos ili memorisanje koji ne podržava nekompresovani video. Zatim, video kompresor omogu ava da se efikasnije koriste resursi za prenos i memorisanje. Na primer, ako je raspoloživ kanal sa velikim bitskim protokom, tada je opšteprihvatljivo da se pošalje komprimovani video signal velike rezolucije ili ve i broj komprimovanih video signala, nego da se pošalje jedan nekomprimovani tok ili niz niže rezolucije. Signal koji nosi informaciju može se komprimovati da bi se odstranila redundansa. Kod sistema za kompresiju bez gubitka statisti ka redundansa je odstranjena na taj na in da se komprimovani signal može perfektno rekonstruisati na prijemniku. Me utim, ve ina prakti nih tehnika za video kompresiju, na primer, zasniva se na kompresiji sa gubicima, tako da signal koji je dekodovan nije identi an originalnom. Cilj algoritma za kompresiju je da se postigne što efikasnija kompresija uz minimiziranje izobli enja koje nastaje u tom procesu. Na primer, algoritmi za video kompresiju rade tako što odstranjuju redundansu u prostornom, vremenskom, statisti kom i psihovizuelnom domenu. Odstranjivanjem redundanse u razli itim oblicima, mogu e je zna ajnije komprimovati podatke. Na primer, ljudski vizuelni sistem (oko i mozak) više je osetljiv na niže, nego na više frekvencije pa ako se odstrani iz slike sadrzaj sa nižim frekvencijama, slika e i dalje biti prepoznatljiva uprkos injenici da je deo informacija odstranjen. Videli smo, tako e, da se kompresija može posti i tako što se podaci koji se prenose koduju primenom entropijskog kodovanja (Huffman-ovo kodovanje, aritmeti ko kodovanje).

Kompresija slike i videa je alternativno polje za istraživanje i razvoj oblasti multimedijalnih komunikacija. Predloženi su mnogi razli iti algoritmi za kompresiju i dekompresiju. U cilju podsticaja medijumskog rada, konkurencije i pove anja mogu nosti izbora, neophodno je bilo da se definišu neophodne metode za kompresiju, kako bi se obezbedilo da ure aji razli itih proizvo a a budu kompatabilni. Ovo je dovelo do razvoja drugih klju nih multimedijalnih standarda. Što se ti e tehnike kompresije slike i videa, one se razvijaju intenzivno od pre dvadesetak i više godina uz razvoj prate e tehnologije. Po etni algoritmi su bili bazirani na pikselima, a nešto kasniji algoritmi su koristili grupe piksela ili osobine vida, kao i redundantna svojstva slike u prostornom, vremenskom i frekvencijskom domenu. U postupku standardizacije kompresije slike i video signala pojavljuju se dve organizacije i to:

Me unarodna unija za telekomunikacije–telekomunikacioni sektor (eng. International Telecomunication Union–Telecomunication sector – ITU–T) za standardizaciju sa svojom Ekspertskom grupom za video kodovanje (eng. Video Coding Expert Group – VCEG)

Me unarodna organizacija za standardizaciju Me unarodni elektrotehni ki komitet (eng. International Standard Organization/International Electrotechnical Committee – ISO/IEC) sa grupom MPEG.

78

Page 87: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Mada deluju odvojeno, u mnogim slu ajevima dolazi do konkurencije nekih njihovih rezultata, kao što je to prikazano na Slici 7.1.1.

Slika 7.1.1—Razvoj standarda za kompresiju video signala

ISO/IEC MPEG standardi video kodovanja su namenjeni za arhiviranje i distribuciju kvalitetnog video materijala u komercijalne svrhe. Ciljnu grupu ine proizvo a i, provajderi, i korisnici zabavnog video materijala. Sa druge strane, ITU standardi su pretežno koncentrisani na telekomunikacionu industriju. Standardi video kodovanja koje razvija ova organizacija pretežno su namenjeni komunikaciji u realnom vremenu i to od jednog ka drugom korisniku, ili od jednog ka ostalim korisnicima. Ovi standardi su poznati kao H.26x standardi. Sa x je obeležena odgovaraju a ta ka generacije standarda.

7.2 MPEG prilaz multumedijalnoj standardizaciji Grupa eksperata za obradu pokretne slike MPEG formirana je 1988 godine sa zadatkom da razvije standarde za kodovanje pokretne slike, audia, i njihove kombinacije. Ova grupa radi u okviru združenog ISO/IEC tehni kog komiteta (eng. technical committee – TC) TC 1 na informacionim tehnologijama, kao radna grupa (eng. working group – WG) WG11 pri podkomitetu (eng. sub-committee – SC ) SC 29. U zavisnosti od prirode standarda, donose se razli iti dokumenti. Za audio i kodne standarde, prvi dokument je nazvan Verifikacioni model (eng. Verification model – VM). U standardma MPEG-1 i MPEG-2, on nosi naziv Simulacioni i Test model, respektivno. VM opisuje rad kodera i dekodera. Kada MPEG stekne poverenje u pogledu stabilnosti standarda, izdaje se tzv. radni draft (eng. working draft – WD). On je izra en ve u formi standarda, ali zbog postojanja revizije, ostaje interni akt u MPEG-u. U planirano vreme, kada postane dovoljno stabilan WD postaje dodeljeni draft (eng. committee draft – CD). Pre prelaska u CD stadijum, WD je podvrgnut na još nekoliko revizija. Razli ite tehni ke opcije prou avaju najmanje dva razli ita partnera. Pri tome je, pri svakoj reviziji, angažovan veliki broj eksperata iji je zadatak da ukažu na eventualno mogu e greške sadržane u dokumentu. Lista radnih pojedinosti u procesu multimedijalne standardizacije je slede a:

79

Page 88: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

ISO/IEC, 11172 – Kodovanje pokretnih slika sa pridruženim audiom do oko 1.5 Mbit/s (MPEG-1)

ISO/IEC, 13818 – Kodovanje pokretne slike i pridruženje audia (MPEG-2) ISO/IEC, 14496 – Kodovanje audio-vizuelnih objekata (MPEG-4) ISO/IEC, 15938 – Intefejs za opis multimedijalnog sadržaja (MPEG-7) ISO/IEC, 21000 – Multimedijalni okvir (MPEG-21)

Iako je MPEG-3 bio predvi en da se bavi velikim binarnim protocima (binarni protok se

uobi ajeno izražava kao broj bita u sekundi (eng. bits per second) bit/s, b/s, bps), nikada nije razvijen, jer su se ovi zahtevi mogli sresti kod MPEG-2. Što se ti e MPEG-5 i MPEG-6, oni nisu nikada ni definisani. Najzad, treba ista i da je MPEG-21 prvi standard uspostavljen u 21. veku.

MPEG sledi princip da standard treba da obezbedi interoperabilnost. To produžava životni vek standarda i obezbe uje istovremeno uvo enje novih tehnologija. Na primer, MPEG standardi kodovanja specificiraju samo sintaksu i semantiku tokova bita (eng. bit stream) i proces dekodovanja. Ništa se ne govori o tome kako kodovi kreiraju tokove bita. To ostavlja istraživa ima više slobode oko optimizacije izbora kodera (estimacija pokreta, upravljanje protokom bita kod psihoakusti nih modela), a sve se to radi zbog minimiziranja performansi za ciljane aplikacije i sadržaje. Istraživa i koriste primene novih tehnologija u MPEG standardima radi što boljeg koriš enja sredstava primenjenih u procesu kodovanja. Time se postiže konkurencija u kvalitetu i ceni uz stalno obezbe ene uzajamne interoperebilnosti.

7.3 MPEG-1 standard

MPEG-1 standard predstavlja prvu generaciju iz grupe MPEG standarda koja je uvedena u periodu od 1988 do 1991 godine [7.3]. MPEG-1 je u stvari originalni MPEG standard za kodovanje (kompresiju) audija i videa, protokom do 1.5 Mbit/s. Standard ne specificira parametre za prenos signala.

MPEG obi no razvija audio i video kodne standarde paralelno, zajedno sa specifikacijama za multipleksiranje i sinhronizaciju. Mada pripremljene da se koriste zajedno, mogu e su i individualne specifikacije koje se mogu koristiti nezavisno. Na primer, jedan razli iti video format može se koristiti zajedno sa MPEG-1 rešenjima za sisteme i audio. To je razlog zbog ega su MPEG standardi organizovani po delovima, od kojih svaki definiše neki deo tehnologije. MPEG-1 se sastoji iz pet Delova.

a) Deo 1: Sistemi

Odnosi se na kombinaciju jednog ili više strimova podataka (MPEG-1 Video, Audio) sa vremenskom informacijom koja formira jedinstveni strim, optimiziran za digitalno memorisanje ili prenos.

b) Deo 2: Video

Specificira kodni format (video strim i odgovaraju i proces dekodovanja) za video sekvence pri binarnim protocima od oko 1.5 Mbit/s. Ciljano radno okruženje je memorija pri kontinualnoj brzini prenosa, ali je modni format uopšten i može se koristiti u širem smislu. Omogu ena je interaktivnost. Kao rešenje za koder ustanovljeno je hibridno kodovanje na bazi diskretne kosinusne transformacije (eng. discrete cosine transform –

80

Page 89: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

DCT) u bloku primenjeno na jednoj slici ili na grešku predikcije dobijenu posle predikcije po vremenu (na bazi jedne ili dve slike) sa kompenzacijom pokreta. DCT je pra ena kvantizacijom, cik–cak smenjivanjem i kodovanjem primenom promenljive dužine kodne re i, kao što je prikazano na Slici 7.3.1. MPEG-1 video podržava samo progresivne formate, a broj linija je fleksibilan.

Slika 7.3.1—Arhitektura uproš enog MPEG-1 video kodera

c) Deo 3: Audio

Specificira kodne formate (audio strim i odgovaraju i proces dekodovanja) za monofonski od 32 kbit/s do 192 kbit/s i stereofonski od 128 kbit/s do 134 kbit/s zvuk. Ovaj standard specificira tri hijerarhijska sloja kodovanja: I, II i III koji su pridruženi zbog kompleksnosti, kašnjenja i efikasnosti. Sloj III je poznatiji pod oznakom MP3. Ova kodna rešenja su namenjena za opšti audio i koriste perceptualna ograni enja ove ijeg auditornog sistema sa krajnjim ciljem koji je vezan za uklanjanje parcijalnih nevažnih delova signala.

d) Deo 4: Prilago eno ispitivanje

Odre uje testove za proveru da li su strimovi bita (sadržaj) i dekoderi korektni u odnosu na specifikacije u delovima 1, 2 i 3.

e) Deo 5: Softverska simulacija

Sastoji se iz softvera koji primenjuje alate specifi ne u Delovima 1, 2 i 3. To je tehni ki izveštaj koji ima samo informativnu vrednost. U kasnijim MPEG standardima tzv. Referentni softver postaje deo standarda. MPEG-1 je još uvek popularan kod internet video striminga i downloading-a. Isto tako, poznato je da je u oblasti distribucije digitalne muzike zna ajan standard Grupe eksperata za obradu pokretne slike-1 audio sloj 3 (eng. Motion Picture Experts Group-1 Audio Layer 3 – MP3), odnosno MPEG-1 audio sloj 3.

BINARNI NIZ

ORIGINALI

ENTROPIJSKO KODOVANJE

DCT +

KVANTIZER KREACIJA SIMBOLA

IZLAZNI BAFER

ENTROPIJSKO KODOVANJE

INVERZNA KVANTIZACIJA

INVERZNA DCT

+

Kompenzacija pokreta

Prethodni kadar

81

Page 90: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

7.4 MPEG-2 standard MPEG-2 je ISO/IEC 13818 standard koji specificira kompresiju audia i videa. Po pravilu MPEG-2 komprimovani signal višeg je kvaliteta nego u slu aju MPEG-1 kompresije. Ovaj standard specificira parametre prenosa i ini centralni deo digitalne video difuzije (eng. digital video broadcasting – DVB). Glavni cilj MPEG-2 video standarda je definisanje formata koji e se koristiti za opis kodovanog video signala. MPEG-2 standard definiše rezultuju i strim bita. Kada je MPEG-2 razvijen, jedini zahtev je bio da se formira tako da bude dovoljno fleksibilan za upotrebu kod šireg spektra video aplikacija, koje zahtevaju binarne protoke do Mbit/s, kao što su HDTV, DVD, interaktivna memorija (eng. interactive storage media – ISM), širokodifuzni (eng. broadcast) servisi, kablovska TV distribucija i interaktivni TV servisi pogodni za fleskibilne mogu nosti mreže, ograni enja u širini mrežnog opsega i kvalitetu slike [7.4]. U odnosu na MPEG-1 standard, MPEG-2 je uveo slede e razlike:

Pretraživanje u poljima, a ne samo u kadrovima, Generisanje makroblokova tipa 4:2:2 i 4:4:4, Veli ina kadra može biti do 16 383 × 16 383 piksela, Može se koristiti nelinearna kvantizacija trakta makrobloka.

Kodni algoritmi i metode predikcije u MPEG-2 skoro su isti kao kod MPEG-1. Me utim,

MPEG-2 sadrži više mogu nosti, na primer, analiza sa proredom i skalabilnost [7.5]. MPEG-2 sistemi, audio i video specifikacije su bazirani na odgovaraju im MPEG-1

specifikacijama [7.6]. Kasnije je pridodat još jedan Audio Deo, sa novim audio kodekom koji pripada naprednom audio kodovanju (eng. advanced audio coding – AAC). Danas standard MPEG-2 sa injavaju razli iti Delovi [7.7]–[7.11].

a) Deo 1:Sistemi Ovde važe iste karakteristike kao i za MPEG-1 sisteme s tim što se još podržavaju:

1) Okruženje kao što je difuzija, 2) Hardverski orijentisano procesiranje pored softverski orijentisanog procesiranja, 3) Prenos više programa simultano bez zajedni ke vremenske baze, 4) Prenos u asinhronom transfer modu (eng. asynchronous transfer mode – ATM)

[7.12].

Ovi zahtevi daju kao rezultat specifikaciju dva tipa sistema strimova: Programski strim sli an i kompatibilan sa MPEG-1 sistemima strimova i novi Transportni strim za prenos više nezavisnih programa.

b) Deo 2: Video Odre uje opšti domet kodovanja (video strim i odgovaraju i proces dekodovanja) za video sekvence sve do HDTV rezolucije. Osnovna kodna arhitektura je ista kao i za MPEG-1 Video, uz podršku za isprepletane video formate i skalabilne/ hijerarhijske kodne formate (vremenski, prostorni, SNR). MPEG-2 Video podrazumeva više alata. U nekim primenama neki, od ovih alata suviše su komplikovani za primenu. MPEG-2

82

Page 91: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Video definiše, tzv. profile koji su u stanju da obezbede kodna rešenja uz odgovaraju u kompleksnost. Profili su podnizovi alata koji se odnose na potrebe specifi nih klasa aplikacija. Tako e, izvestan broj nivoa je definisan za svaki profil kako bi se ograni ila memorija i ra unarski zahtevi za primenu dekodera. Nivoi obezbe uju donju granicu kompleksnosti strimova bita i minimum mogu nosti za dekoder. MPEG-2 Video dekoder je u stanju da dekoduje MPEG-1 video strimove. Kompatibilnost, koja se ogleda u tome da je MPEG-2 Video mogu e kodovati pomo u MPEG-1 Video dekodera, je obezbe ena preko specifi nih profila kroz skalabilnost [7.13], [7.14].

c) Deo 3: Audio

Odre uje kodni fomat (audio strim i odgovaraju i proces dekodovanja) za višekanalni audio. Deo 3 obezbe uje kompatibilnost sa MPEG-1 Audio strimovima. Na primer, MPEG-1 Stereo dekoder bio bi u stanju da reprodukuje zna ajnu verziju originalnog vušekanalnog MPEG-2 Audio strima. MPEG-2 Audio je u tehni kom pogledu sli an sa MPEG-1 Audio sa ista tri sloja.

d) Deo 4: Prilago eno ispitivanje

Obuhvata specifi ne testove koji omogu avaju da se proveri da li su strimovi bita (sadržaj) i dekoderi takvi da odgovaraju specifikacijama i tehni kim delovima MPEG-2. Za video strimove prilago avanje je definisano za strimove odre enog nivoa i odre enog profila.

e) Deo 5: Softverska simulacija

Sastoji se iz softvera i koristi alate specificirane u delovima 1, 2, i 3. Opis je dat u obliku informativnog Tehni kog Izveštaja.

f) Deo 6: Digitalna memorija-komanda i kontrola (eng. digital storage media- command

and control – DSM-CC) Obuhvata specifi ne opšte komande i kontrole nezavisno od vrste DSM, kako bi se predstavile funkcije specifi ne za MPEG strimove bez potrebe da se znaju detalji o DSM. Ove komande se primenjuju na MPEG-1 Sisteme, kao i na MPEG-2 Programske i Transportne strimove.

g) Deo 7: AAC

Pošto je MPEG-2 Audio (Deo3) specifi an sa ograni enjem u pogledu kompatibilnosti, odre uje multikanalni kodni format, bez zahteva u pogledu kompatibilnosti. Na taj na in postiže se sli an kvalitet na znatno nižim bitskim brzinama nego kod MPEG-2 audio dela 3.

h) Deo 8:

Povu en (u po etnom stadijumu odnosi se na 10-bitno video kodovanje). i) Deo 9: Interfejs u realnom vremenu

Odre uje dodatne alatke za koriš enje MPEG-2 sistema za razmenu podataka u realnom vremenu, što je prakti an zahtev u telekomunikacionim primenama.

83

Page 92: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

j) Deo 10: DSM-CC prilago eno proširenje Specificira testove za proveru da li strimovi bita (sadržaj) i dekoderi odgovaraju specifikaciji u Delu 6.

k) Deo 11: Upravljanje intelektualnom svojinom i zaštita (eng. intellectual property

management and protection – IPMP) u MPEG-2 sistemima To je dodatak uveden radi daljeg specificiranja alata u sistemu koji obezbe uje da IPMP mogu nosti i karakteristike budu razvijene i sklopu standarda MPEG-4 koji bi se koristio sa strimovima MPEG-2 Sistema [7.14].

Završavaju i ovaj kratak prikaz MPEG-2 standarda, može se re i da se on bavi tehnologijama kompresije i sintakse bit strimova, u cilju obezbe ivanja prenosa audia i videa u širokopojasnim mrežama. U mnogim slu ajevima MPEG-2 se pripisuje samo video kompresiji. Me utim, MPEG-2 standardi ne uklju uju samo video. Razli iti delovi ovog standarda prikazuju više aspekata predstavljanja, prenosa i predaje kako digitalnog videa tako i digitalnog audia.

7.5 MPEG-4 standard MPEG-4 je standard koji specificira postupke simultanog kodovanja (kompresije) sinteti kih i prirodnih objekata i zvuka [7.15], [7.16]. Radi se, dakle, o standardu za audio-vizuelno kodovanje radi zadovoljenja razli itih potreba komunikacionih, interaktivnih i difuznih modela servisa, kao i potreba mešovitih modela servisa. To daje kao rezultat tehnološku konvergenciju [7.17]. MPEG-4 standard obezbe uje skup tehnologija da bi zadovoljio potrebe autora, provajdera servisa i krajnjih korisnika. Autorima MPEG-4 obezbe uje produkciju sadržaja koji ima ve u mogu nost da se ponovo koristi i ve u fleksibilnost nego što je to mogu e primenom pojedina nih tehnologija kao što su to digitalna televizija, animirana grafika, web strane itd. Provajderima servisa MPEG-4 nudi transparentne informacije koje mogu biti interpretirane i prevedene u odgovaraju e signalne poruke za svaku mrežu, kao i pomo i od strane relevantnih tela za standardizaciju. Krajnjim korisnicima MPEG-4 obezbe uje visoki nivo interaktivnosti sa sadržajem unutar ograni enih skupova od strane autora. Generalno, MPEG-4 omogu ava:

Prikazivanje audio, vizuelnog i audio-vizuelnog sadržaja koji se nazivaju medija objekti. Ovi objekti mogu biti prirodnog ili sinteti kog porekla, što zna i da mogu biti snimljeni kamerom ili mikrofonom ili biti generisani pomo u ra unara;

Opisivanje kompozicije objekata da bi se kreirao složeni medija objekat koji formira audio-vizuelne scene;

Multipleksiranje i sinhronizaciju podataka koji su povezani sa medija objektima, tako da se mogu prenositi kanalom u mreži obezbe uju i pri tome QoS koji odgovara prirodi specifi nih objekata;

Interakcije sa audio-vizuelnim scenama generisanim na prijemnom sloju. Audio-vizuelna scena je prikazana na Slici 7.5.1. Slika sadrži složene medija objekte koji grupišu zajedno osnovne medija objekte. Glavna razlika, na bazi novih funkcionalnosti u odnosu na prethodne standarde, je na objektu baziran audio-vizuelni model prikazivanja koji je osnova MPEG-4.

84

Page 93: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Slika 7.5.1—Jedan primer za audio-vizuelnu scenu

Na Slici 7.5.2 prikazana je MPEG-4 arhitektura koja se zasniva na objektima [7.18].

Slika 7.5.2—MPEG-4 arhitektura zasnovana na objektima

85

Page 94: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

MPEG-4 audio-vizuelne scene sastoje se od nekoliko medija objekata koji su organizovani na hijerarhijski na in. U odsustvu hijerarhije mogu se prona i osnovni medija objekti (slike, video objekti, audio objekti itd.).

MPEG-4 standardizuje brojne osnovne medija objekte i u mogu nosti je da prikaže i prirodne i sinteti ke tipove sadržaja koji mogu biti 2D ili 3D. Tako e, MPEG-4 definiše i prikazivanje podataka o objektu. Medija objekti u svojoj kodovanoj formi sastoje se od deskriptivnih elemenata koji omogu avaju rukovanja objektima u audio-vizuelnim scenama [7.19]. Svaki medija objekat se može prikazati u sopstvenoj kodovanoj formi, nezavisno od sopstvenog okruženja i pozadine.

MPEG-4 je tako koncipiran da obezbedi uspešnu podršku na polju digitalne televizije [7.20], na polju interaktivnih grafi kih aplikacija (sintetizovan sadržaj), kao i na polju interaktivne multimedije (World Wide Web, distribucija i pristup sadržaju). MPEG-4 obezbe uje standardizovane tehnološke elemente omogu avaju i integraciju proizvodnje, distribucije i pristup sadržajima u okviru navedena tri polja. 7.5.1 Delovi MPEG-4 standarda MPEG-4 standard se sastoji iz slede ih delova [7.21]:

a) Deo 1: Sistemi

Odre uju arhitekturu sistema i alate koje treba pridružiti kako za binarne oblike scena (eng. binary format for scenes – BIFS), tako i za proširene MPEG-4 tekstualne (eng. eXtensible MPEG-4 textual – XMT) formate. Od ne manjeg zna aja su, tako e, i multipleksiranje, sinhronizacija, upravljanje baferom, kao i IPMP. Tako e ovaj deo specificira fajl format Grupe eksperata za obradu pokretne slike-4 (eng. Motion Picture Experts Group-4 File Format – MPEG-4, MP4) koji je tako sa injen da je nezavisan od bilo kog posebnog protokola za predaju informacija, pri emu je omogu ena efikasna podrška za predaju, razmenu, upravljanje, emitovanje i prezentaciju ure aja. Isto tako, tzv. MPEG-J (MPEG-Java) definiše kako aplikacije mogu biti realizovane na korisni kom terminalu.

b) Deo 2: Vizuelni

Odre uje kodne alate pridružene vizuelnim objektima prirodnog i sinteti kog porekla. Na primer, to podrazumeva specifikaciju rešenja za video kodovanje i to od vrlo malih bitskih brzina do vrlo zahtevnih uslova uklju uju i dinami ke 3D objekte. O vizuelnom MPEG-4 Delu bi e kasnije više govora.

c) Deo 3: Audio

Specifira sve kodne alate koji se pridružuju objektima kako prirodnog tako i sinteti kog porekla (na primer kodna rešenja za muzi ke i govorne podatke za vrlo širok opseg bitskih brzina i sinteti kog audia uklju uju i tu i 3D audio prostore). O MPEG-4 audio- komunikaciji bi e još re i.

d) Deo 4: Prilago eno ispitivanje

86

Page 95: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Definiše testove koji omogu avaju da se proveri da li strimovi (sadržaj) i dekoderi odgovaraju tehni kim specifikacijama propisanim prema Delovima MPEG-4 standarda. Pri tome je za video i audio strimove profil definisan kao niz objekata.

e) Deo 5: Referentni softver

Uklju uje softver koji odgovara najve em broju Delova MPEG-4, naime video i audio koderima i dekoderima. Za razliku od MPEG-1 i MPEG-2, MPEG-4 referentni softver za dekodere pomaže da se razumeju tekstualni delovi poruka.

f) Deo 6: Okvir za isporuku multimedijalnih integracija (eng. delivery multimedia

integration framework – DMIF) Specificira isporuku formata nezavisno od medija i omogu ava da se transparentno prevazi u granice razli itih predajnih okruženja.

g) Deo 7: Optimizirani softverski alati za MPEG-4

Uklju uje optimizirane kodne softvere za vizuelne kodne alate kao što su estimacija pokreta i brza globalna estimacija pokreta.

h) Deo 8: Prenos MPEG-4 sadržaja po IP mrežama

Specificira preslikavanje MPEG-4 sadržaja u nekoliko IP protokola. i) Deo 9: Referentno opisivanje hardvera

Uklju uje hardverski opisni jezik za vrlo brzo integrisano kolo (eng. very high speed integrated circuit hardware description language – VHDL). Ovi MPEG-4 alati su prenosivi.

j) Deo 10: Napredno video kodovanje (eng. advanced video coding - AVC)

Specificira napredne video-kodne alate na bazi kodera koji obezbe uju do 50 % ve u kodnu efikasnost nego najbolji profil video kodovanja u MPEG-4 Deo 2 za široki opseg bitskih brzina i video rezolucija. Me utim, u pore enju sa prethodnim standardima, kompleksnost dekodera je oko etiri puta ve a nego kod MPEG-2 Videa i dva puta ve a u pore enju sa jednostavnim MPEG-4 Vizuelnim profilom. Ovaj deo razvio je Združeni video tim (eng. Joint Video Team - JVT) koji je osnovan u cilju formalizovanja saradnje izme u ISO/IEC MPEG i ITU-T VCEG za razvoj ovog kodeka. Standard MPEG-4 združeno video kodovanje (eng. joint video coding – JVC) je ve poznat u ITU-T kao Preporuka H.264.

k) Deo 11: Ure aj za opis scene i primenu

Uklju uje alate koji su ve specificirani u Delu 1 u vezi sa kompozicijom scene i to kako u binarnom BIFS, tako i u tekstualnim formatima XMT, MPEG-J i multi-korisni kom svetu.

l) Deo 12: Medija fajl format

Ovaj format je opšti format koji ini osnovu za druge brojne specifi ne fajl formate. Sadrži vreme, strukturu, i informacije o medijima za vremenske serije podataka o

87

Page 96: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

medijumu kao što su to, na primer, audio-vizuelne prezentacije. Ovaj deo je primenjiv na MPEG-4, a tako e i na JPEG-2000 (združena specifikacija) [7.22].

m) Deo 13: IPMP procesiranje

Odre uje alate za upravljanje i zaštitu intelektualne svojine u audio-vizuelnom sadržaju i algoritmima tako da samo autorizovani korisnici imaju pristup do njih.

n) Deo 14: Fajl format

Definiše MP4 fajl format kao poseban slu aj medija fajl formata (Deo 12). Ovaj deo je ranije bio uklju en u Deo 1, ali je sada izdvojen.

o) Deo 15: AVC fajl format

Definiše oblik memorije za video strimove komprimovane primenom AVC. Ovaj format se zasniva i kompatibilan je sa ISO medija fajl formatom (Deo 12).

p) Deo 16: Proširenje okvira animacije (eng. animation framework eXtension – AFX)

Odre uje alate za interaktivni 3D sadržaj koji radi na geometrijskim modeliraju im i biometri kim nivoima i obuhvata alate prethodno definisane u MPEG-4 i to u kontekstu sinteti kog prirodnog hibridnog kodovanja (eng. sinthetic natural hybrid coding – SNHC). AFX nudi jedinstveni standardizovani 3D okvir obezbe uju i zna ajne osobine kao što su kompresija, striming, i integracija sa drugim audio-vizuelnim medijima i omogu avaju i uvo enje visoko kvalitetnih kreativnih unakrsnih aplikacija preko medijuma.

q) Deo 17: Striming tekstualni format

Odre uje strimove teksta, vezu izme u pristupnih jedinica teksta, format strimova teksta pristupne jedinice za tekst, signalizaciju i dekodovanje strimova teksta. Što se ti e pristupnih formata, ovaj Deo upotpunjuje alate ve specificirane u Delu 1.

r) Deo 18: Kompresija fonta i striming

Odre uje alate koji obezbe uju komunikaciju podataka o fontu kao deo MPEG-4 kodovane audio-vizuelne prezentacije.

s) Deo 19: Strim sintetizovane teksture

Specificira sinteti ke teksture koje proizilaze iz animacije foto-realisti kih tekstura opisivanjem informacija u boji. Pri tome se koriste vektori koji proizvode pokrete vrlo malih bitskih brzina i koji se nazivaju sinteti ke teksture. t) Deo 20: Svetlosne primene kod scenskog predstavljanja (laser)

Obezbe uje scensko predstavljanje sa ciljem da se uspostavi veza izme u brzine, efikasnosti kompresije, dekodovanja.

u) Deo 21: Proširenja okvira grafike (eng. graphics framework eXtensions - GFX)

Obezbe uje potpuni programski okvir uklju uju i tu i operacije prirodnog i sinteti kog kodovanja. GFX koristi interfejs za programske aplikacije (eng. application

88

Page 97: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

programming interface – API), omogu avaju i široki opseg aplikacija na prijemniku od mobilnih ure aja do stacionarnih ra unara.

Završavaju i kratak prikaz delova MPEG-4 standarda koji se još uvek proširuje, treba

re i da tehni ka specifikacija ne predstavlja poslednji kodek na široko rasprostranjenom usvajanju i primeni. U nastavku emo se, najpre, malo opširnije pozabaviti Vizuelnim delom MPEG-4 standarda. 7.5.2 MPEG-4 standard: vizuelni deo ISO/IEC standard 14 496 Deo 2 tj., MPEG-4 vizuelni deo, unapre uje MPEG-2 standard kako po pitanju efikasnosti kompresije (bolja kompresija za isti vizuelni kvalitet) i po pitanju fleksibilnosti (mnogo širi opseg primena). To je omogu eno na dva na ina : koriš enjem naprednih algoritama za kompresiju i obezbe enjem seta alata za kodovanje i manipulaciju sa digitalnim medijumom. Vizuelni deo se sastoji iz video-koder/dekoder modela kao i iz brojnih dodatnih alata za kodovanje [7.23]. Model se zasniva na dobro poznatom hibridnom modelu kodovanja – diferencijalna impulsno kodovana modulacija/diskretna kosinusna transformacija (eng.differential pulse code modulation /discrete cosine transform –DPCM/DCT) [7.24], ija je osnovna funkcija poboljšanje efikasnosti kodovanja, pouzdan prenos, kodovanje specijalnih oblika i objekata, kao i poboljšanje kompresije. Zna ajne karakteristike po kojima se MPEG-4 vizuelni kodni standarad razlikuje od prethodnih su:

Efikasno kodovanje progresivnih i isprepletanih (eng. interlaced) “prirodnih’’ video sekvenci (kompresija frekvenci sa pravougaonim video frejmovima);

Kodovanje video objekata (video scene sa neregularnim regionima). Ovo predstavlja

novu koncepciju za video kodovanje i omogu ava nezavisno kodovanje objekata i video scena;

Podrška za prenos preko postoje ih mreža. Alati za otpornost uz greške pomažu dekoderu

da se oporavi od grešaka u prenosu i održi uspešnu video konekciju u mrežnom okruženju. Treba imati u vidu da i skalabilni alati za kodovanje mogu pomo i u podršci za fleksibilniji prenos kodiranih bitskih protoka;

Kodovanje animiranih vizuelnih objekata kao što su 2D i 3D poligonalne mreže

animiranih lica i animiranih ljudskih tela;

Kodovanje specijalnih aplikacija koje su video-studijskog kvaliteta. Kod ovog tipa aplikacije vizuelni kvalitet je važniji nego velika kompresija.

Vizuelni deo MPEG-4 standarda obezbe uje kodne funkcije kroz kombinaciju alata,

objekata i profila. Alat predstavlja podskup kodnih funkcija za podršku specifi ne funkcije (na primer, video kodovanje oblika objekta). Objekat je video element (na primer sekvenca sa pravougaonim frejmovima, mirna slika itd) koji je kodovan koriš enjem jednog ili više alata. Profil je skup tipova objekata za koji se o ekuje da koder-dekoder (eng. coder-decoder –

89

Page 98: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

CODEC) ima mogu nosti da ih obra uje. Ovaj vizuelni deo MPEG-4 standarda obuhvata profile za kodovanje prirodnih video scena. Pored podskupa alata za kodovanje, profili definišu i nivoe. Nivoi definišu ograni enja u parametarskom bitstrimu. Svaki nivo postavlja ograni enja u maksimalnim performansama za dekodovanje MPEG-4 kodovane sekvence. Definicije nivoa postavljaju ograni enja na veli inu memorije bafer, veli inu dekodovanog frejma i brzinu procesiranja. U okviru ovog dela MPEG-4 standarda, video sekvenca se posmatra kao kolekcija jednog ili više objekata. Objekti se definišu kao frekvencijske celine koje korisniku omogu avaju pristup, prezentovanje i manipulaciju. Video objekat (eng. video object - VO) je oblast video scene koja može zauzimati region proizvoljnog oblika i može postojati proizvoljno vreme. Trenutni video objekat u odre enemo trenutku vremena predstavlja video objektnu ravan (eng. video object plane - VOP). Na Slici 7.5.2.1 prikazan je video objekat koji se sastoji od tri pravougaone video objektne ravni. Video scena može biti kreirana od objekata u drugom planu (eng. background object) i posebnih objekata u prvom planu (eng. foreground object).

Slika 7.5.2.1—Video objektne ravni i video objekat (pravougaonik) Ovaj pristup je fleksibilniji nego fiksna pravougaona struktura frejma kod prethodnih standarda. Posebni objekti se mogu kodovati sa razli itim vizuelnim kvalitetom i vremenskom rezolucijom da bi prikazali svoju važnost u kona noj sceni. Objekti sa više izvora (uklju uju i i sinteti ke i prirodne objekte) mogu se kombinovati u jednu scenu. Preko visoke interaktivne aplikacije krajnji korisnik može da reguliše kompoziciju i ponašanje scene. Svaki objekat koduje se posebno. 7.5.3 MPEG-4 standard: audio Kao što smo videli, MPEG-4 standardizacija razvila se sa ciljem da definiše fleksibilan okvir za audio/video multimediju uz prilago enje specifi nim aplikacijama, kao što su: efikasno kodovanje, pristup i prenos prirodnog i ra unarski generisanog audio/video signala za mobilne i internet komunikacije [7.25]. Zahvaljuju i aktivnosti ISO MPEG organizacije, perceptualna kompresija audio signala je postala de-facto standard za distribuciju muzike [7.26]. Primenom MPEG-4 naprednog kodera AAC ostvaruje se kompresija u odnosu 16:1 sa kvalitetom veoma bliskim kompakt disku (eng. compact disc – CD) i transparentni kvalitet prema normama koje propisuje Me unarodna unija za telekomunikacije–Radio sektor za standardizaciju (eng. International Telecommunication Union–Radio Standardization Sector – ITU-R) sa kompresijom 11:1.

90

Page 99: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Me utim, sa pove anjem kvaliteta kodera, pove ava se kompleksnost kao i kašnjenje signala. Pove anje kašnjenja ne predstavlja problem u aplikacijama difuzije i striminga zato što pojedini servisi dozvoljavaju kašnjenje reda veli ine desetak sekundi. Sa druge strane, tipi ne implementacije audio kodera na procesorima za digitalnu obradu signala (eng. digital signal procesing – DSP) imaju kašnjenje sa kraja na kraj od 290 ms: kašnjenja ovog reda veli ine su neprihvatljiva za aplikacije sa dvosmernom komunikacijom kao što su telekomunikacije i telefonija visokog kvaliteta. Za sve aplikacije razvijeni su kodovi od strane ITU (6.711, 6.722, 6.728, 6.729) i GSM6.10 sa algoritamskim kašnjenjem od 20 ms [7.27]. Ovi koderi su projektovani za kompresiju ljudskog govora, tako da se pri kodovanju audio signala u opštem slu aju ostvaruje nedovoljan kvalitet. Idealno rešenje je algoritam koji je sposoban da ostvari AAC i MP3 kvalitet sa algoritamskim kašnjenjem tipi nim za ITU-T kodere govora. Postoje dve grupe alata za kodovanje audia kod MPEG-4 i to: Prirodni alati koji omogu avaju da digitalni audio bude komprimovan i prenešen i sinteti ki alati koji koji omogu avaju parametarsko opisivanje zvuka koji se prenosi i koristi za sintezu na prijemnoj strani [7.28]–[7.31]. Prirodni audio alati omogu avaju prenos komprimovanog govora i širokopojasni audio u opsezima od 6 kbit/s za kodovanje govora za male bitske brzine do 64 kbit/s po kanalu za niskokvalitetni višekanalni zvuk. MPEG-4 ima tri glavne alatke za audio kodovanje. Generalni audio (eng. general audio – GA) koder obezbe uje prenos visoko-kvalitetnih širokopojasnih multikanalnih signala kao što je muzika pri bitskim brzinama od 16 kbit/s do 64 kbit/s u kanalu. Ovaj koder predstavlja skalabilnu verziju dobro poznatih perceptuelno kompresovanih tehnika [7.32]. Zasniva se na MPEG-2 naprednom audio kodnom standardu sa dodatnim poboljšanjima u kvalitetu i fleksibilnosti [7.33]. MPEG-4 ima dva sinteti ka audio kodera. Jedan obezbe uje interfejs sa sistemima tekst-govor. Tzv. interfejs tekst-govor (eng. text-to-speech interface – TTSI) prihvata strim bita koji sadrži potrebne podatke o fenomenima kao i podatke o dužini slojeva i kontroliše eksterni govorni sintisajzer. U standardu nije specificifiran poseban metod za sintezu govora. Standardizovani su samo format interfejsa i bit strima u delu MPEG-4 TTSI. Drugi je opšti alat za sintezu muzi kih i zvu nih efekata nazvan strukturni audio (eng. structured audio – SA). SA koder omogu ava prenos algoritma za sintezu zvuka na novom tzv. Muzi kom V jeziku nazvanom strukturni jezik audio orkestra (eng. structured audio orchestra language – SAOL) [7.34]. MPEG-4 je prvi standard za prenos zvuka preko algoritama za sintezu [7.35]. Muzi ki jezik SAOL je tako e važan za audio alate. Konvergencija izme u kodnih tehnika za strukturni audio i efekte procesiranja u MPEG-4 je jedan od važnih aspekata ovog standarda. 7.5.4 H.264/AVC MPEG-4 (Part 10) standard H.264/AVC je video kodni standard koji su zajedni ki razvili eksperti iz JVT, odnosno ITU-T VCEG i ISO/IEC MPEG komiteta za standardizaciju [7.36]–[7.38]. U pore enju sa prethodnim standardima H.264/AVC obezbe uje ve u kompresiju, efikasnije kodovanje video sadržaja, kao i niže bitske protoke uz mnogo prihvatljiviji perceptualni kvalitet. Tako e, standard podržava fleksibilnost u kodovanju, kao i organizaciju kodovanih podataka tako da je pove ana otpornost na greške i gubitke. Poboljšanje kodnih performansi produkt je uglavnom dela za predikciju. Osnovni funkcionalni elementi H.264/AVC standarda su: transformacija za redukciju prostorne korelacije i kvantizacije za kontrolu bitskog protoka. Od ne manje važnosti su

91

Page 100: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

predikcija kompenzacije pokreta za redukciju vremenske korelacije, kao i entropijsko kodovanje za redukciju statisti ke korelacije. Sa pove anjem kodne efikasnosti i fleksibilnosti dolazi i do pove anja kompleksnosti samog kodera. Za odre ene aplikacije, H.264/AVC definiše sedam Profila. Profili definišu skup kodnih alata i algoritama koji se mogu koristiti pri generisanju odgovaraju eg toka bita. Tako e, za svaki profil H.264/AVC definiše i skup nivoa i podnivoa. Arhitektura H.264/AVC standarda se bazira na dva sloja: mrežnom apstraktnom sloju (eng. network apstraction layer – NAL) i video kodnom sloju (eng. video coding layer – VCL) [7.39], kao što je to prikazano na Slici 7.5.4.1.

Slika 7.5.4.1—Veza izme u mrežnog apstraktnog sloja i video kodnog sloja u strukturi standarda H.264/AVC

Mrežni apstraktni sloj omogu ava efikasno prilago enje VCL za koriš enje u širokom spektru sistema. NAL obezbe uje mapiranje H.264/AVC podataka u transportne nivoe kao što su to ži ni i beži ni internet servisi, razli iti formati fajlova (ISO MP4 za arhiviranje, na primer), H.32 x standardi za ži ne i beži ne konverzacijske servise, MPEG-2 sisteme za širokodifuzne (eng. broadcasting) servise itd. NAL sloj definiše interfejs izme u video kodera i spoljašnjeg mrežnog okruženja. NAL jedinice su logi ne celine uvedene da olakšaju prenos video sadržaja ka nivou koji odgovara pojedinim mrežama. Jedinice ine paket sa celobrojnim bitovima u kome prvi (zaglavlje) opisuje da li je re o prenosu paketskog tipa ili o strimingu. Preostali bajtovi sadrže podatke o korisnom sadržaju (eng. payload). Struktura NAL jedinice definiše specifi an opšti format koji se može koristiti kako u paketski orijentisanim tako i u bitskim sistemima. NAL apstrahuje VCL podatke u nameri da ih pripremi za isporuku po razli itim komunikacionim kanalima i medijumima za arhiviranje. VCL sloj specificira efikasnu prezentaciju komprimivanog video signala [7.40]. Video kodni nivo je dizajniran na blok beži nom hibridnom video koderu na kome je svaka kodovana slika predstavljena makroblokovima piksela. VCL jedinica sadrži slede e video kodovane podatke: video sekvencu, sliku, ise ak (eng. slice), makroblok i blok. Elementi VCL prikazani su na Slici 7.5.4.2.

92

Page 101: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Slika 7.5.4.2—Elementi VCL Video sekvence se sastoje od okvira (eng. frame) ili polja (eng. field). H.264/AVC standard podržava progresivnu ili analizu sa proredom koje mogu biti u istoj sekvenci. Slike su izdeljene u ise ke. Ise ak je sekvenca makroblokova i ima fiksnu veli inu. Postoje tri osnovna tipa ise ka: I unutar (eng. intra - I), P prediktivni (eng. predictive - P) i B dvosmerno prediktivni, biprediktivni (eng. bidirectionally-predictive - B) ise ci. Kod H.264/AVC standarda, I-ise ci makroblokova su komprimovani bez koriš enja neke predikcije pokreta od ise ka u drugim slikama. P-ise ci sadrže makroblokove koji se mogu komprimovati sa koriš enjem predikcije pokreta. P-ise ci mogu sadržati i intra makroblokove. B-ise ci sadrže makroblokove koji se mogu komprimovati koriš enjem predikcije pokreta i sli no kao kod P-ise aka mogu imati intra makroblokove. KODOVANJE I DEKODOVANJE KOD H.264/AVC STANDARDA Na Slici 7.5.4.3 prikazan je koder sa dva dela za prenos podataka ’’unapred“ (sa leva u desno) i ’’deo za rekonstrukciju“ (sa desna u levo). Kod kodera (deo unapred) ulazni frejm ili polje je procesirano u makroblok jedinice. Svaki makroblok je kodovan u Inter ili Intra modu i za svaki blok u okviru makrobloka predikcija PRED (ozna eno sa P) se formira na osnovu rekonstruisanih odbiraka slike. Kod Intra moda, PRED je formirana od odbiraka aktuelnog ise ka koji je perthodno kodovan, dekodovan i rekonstruisan što je ozna eno sa “uF'n“. Kod Inter moda PRED je formirana pomo u predikcije kompenzacije pokreta od jedne ili dve referentne slike koje su selektovane iz skupa liste 0 i/ili liste 1 referentnih slika. Referentna slika je prikazana kao prethodno kodovana slika F'n-1. Predikcija referentne slike za svaki deo makrobloka (kod Intra moda) mora se izabrati izme u selektovanih prošlih ili budu ih slika koje su ve kodovane, rekonstruisane i filtrirane. Predikcija PRED se oduzima od aktuelnog bloka da bi se dobio rezidualni (razlika) Dn blok koji se transformiše (koriste se blok transformacija T) i kvantuje Q da bi se dobio skup kvantovanih koeficijenata tranformacije X koji su ponovo ure eni i entropijski kodovani. Koeficijenti entropijski kodovani, zajedno sa ostalim informacijama zahtevaju da se dekoduje svaki blok unutar makrobloka (modovi predikcije, parametri kvantizacije, informacije o vektoru pokreta itd.) komprimovanog toka koji je posle

93

Page 102: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

prosle en mrežnom apstraktnom sloju NAL radi prenosa ili memorisanja. Dekoder (deo za rekonstrukciju) dekoduje (rekonstruiše) svaki blok u makrobloku da bi obezbedio referencu za dalje predikcije. Koeficijenti X se skaliraju (Q^-1) i inverzno transformišu (T^-1) da bi se dobio blok razlike D'n. Predikcije bloka PRED se dodaje da bi se dobio rekonstruisani blok ’’nF'n“ (dekodovane verzije originalnog bloka). Oznaka “n“ ukazuje na to da rekonstruisani blok nije filtriran. Filter se primenjuje da se redukuju efekti debloking izobli enja. Rekonstruisana referentna slika je kreirana iz serije F'n blokova.

P

Inter

X

NAL

Fn trenutni

F'n 1 referenca

F'n rekonstruisani

Estimacija pokreta

Kompenzacija pokreta

Izbor Intra predikcije

Intra predikcija

Filter

Q

T

Preraspodela Entropijsko kodovanje

T^ 1 Q^ 1

Intra

+

1 ili 2 prethodno kodovana frejma

uF'nD'n

+

+

Dn

Slika 7.5.4.3—Blok-šema kodera za prenos podataka i rekonstrukciju

Blok šema dekodera prikazana je Slici 7.5.4.4

X Preraspodela Entropijsko kodovanje

NAL Inter

Slika 7.5.4.4—Blok-šema dekodera

P

F'n 1 referenca

Kompenzacija pokreta

F'n rekonstruisani

Intra predikcija

Filter

T^ 1 Q^ 1

Intra

1 ili 2 prethodno kodovana frejma

D'n+uF'n

+

94

Page 103: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Dekoder prima komprimovani tok bita od NAL i entropijski dekoduje elemente sa podacima da bi se dobio skup koeficijenata kvantizacije X [7.41]. On ima mogu nost skaliranja i inverzne transformacije za dobijanje D'n. Koriste i informacije iz dekodovanog zaglavlja toka bita, dekoder kreira blok za predikciju PRED koji je identi an originalnom PRED kod kodera. PRED je pridodat D'n da bi se dobio “uF'n“ koji se filtrira kako bi se dobio svaki dekodovani blok F'n.

Što se ti e metoda entropijskog kodovanja, postoje alternativne metode o kojima e biti re i u nastavku. ENTROPIJSKO KODOVANJE KOD H.264/AVC STANDARDA H.264/AVC standard specificira dve alternativne metode entropijskog kodovanja: adaptivno kodovanje sa promenljivom kodnom re i (eng. context adaptive variable length coding – CAVLC) i ra unarski zahtevniji algoritam binarnog aritmeti kog adaptivnog kodovanja konteksta (eng. context adaptive binary arithmetic coding – CABAC). Obe metode predstavljaju bitno poboljšanje efikasnosti kodovanja u pore enju sa tehnikama statisti kog kodovanja koje su koriš ene kod prethodnih standarda. Dodavanjem modelovanja konteksta u njihov entropijski kodni okvir, obe metode kod H.264/AVC nude visoki stepen adaptacije osnovnog okvira. Koriš enjem CAVLC mogu e je redukovati bitski protok.

Za poboljšanje efikasnosti kodovanja kod H.264/AVC, CABAC je odobren kao alternativni entropijski na in kodovanja. Blok-dijagram za CABAC prikazan je na Slici 7.5.4.5 CABAC postiže dobre performanse kompresije preko:

Selekcije metode verovatno a za svaki element sintakse prema sadržaju elemenata, Adaptacije procenjenih verovatno a zasnovanoj na statistici, Koriš enja aritmeti kog kodovanja [7.42].

Slika 7.5.4.5—Blok-dijagram za CABAC

Kodovanje simbola obuhvata slede a stanja: binarizaciju, selekciju modela konteksta, aritmeti ko kodovanje i ažuriranje verovatno a. Binarizacija podrazumeva da CABAC koristi binarno aritmeti ko kodovanje koje dozvoljava da se samo binarna odluka (0 ili 1) koduje. Simbol koji nema binarne vrednosti je binarizovan ili konvertovan u binarni kod pre aritmeti kog kodovanja. Model konteksta je model verovatno e za jedan ili više bita binarizovanog simbola i izabran je selekcijom raspoloživih modela zavisnih od statistika kodovanih simbola. Model konteksta memoriše verovatno e za svaki bit 1 ili 0. Aritmeti ki

95

Page 104: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

koder koduje svaki bit prema selektovanom modelu verovatno e. Selektovani model konteksta je baziran na ažuriranju aktuelne kodovane vrednosti. Završavaju i ovo izlaganje, treba ista i da je zahvaljuju i svojim unapre enim performansama H.264/AVC privukao pažnju industrije. Pored klasi nih aplikacionih domena kao što su videokonferencije i broadcasting TV sadržaji (satelitski, kablovski i zemaljski), sa poboljšanjem sposobnosti kompresije, H.264/AVC je obuhvatio i nove servise i tako otvorio nove tržišne mogu nosti u industriji. Druga oblast koja je privikla dosta interesovanja proizvo a a opreme je prenos i memorisanje sadržaja visoke definicije (eng. high definition – HD) [7.43]. H.264/AVC standard se može primeniti i kod korisne opreme (na primer digitalne kamere, celularni telefoni itd.), videa preko IP mreža [7.44], [7.45], digitalnog broadcasting-a visoke definicije (preko zemaljskih ili satelitskih kanala) i digitalnih sistema za memorisanje (digitalni video disk (eng. digital video disk – DVD ) visoke rezolucije). Danas H.264/AVC omogu ava i prenos preko IPTV preko digitalnih pertplatni kih linija i pasivnih opti kih mreža. H.264/AVC standard našao je primenu i kod mreža sa asinhronim na inom prenosa ATM.

7.6 Kratak pregled standarda za kodovanje mirnih slika Na ovom mestu treba pomenuti MPEG-4 standard za kodovanje vizuelne teksture (eng. visual texture coding – VTC), JPEG standard sa primenom od interneta do digitalne fotografije, JPEG standard za kodovanje mirnih slika bez gubitaka (eng. JPEG standard for image lossless coding – JPEG-LS) standard za kodovanje mirnih slika bez gubitaka, kao i preporuku za kodovanje mirnih slika koja se odnosi na pokretne mrežne grafike (eng. portable network graphics – PNG). O standardu JPEG 2000 bi e posebno govora. MPEG-4 VTC je algoritam koriš en u MPEG-4 standardu kako bi se komprimovala informacija o teksturi u foto-realisti nim 3D modelima. Pošto je tekstura u 3D modelima sli na kao i kod mirne slike, ovaj algoritam može se tako e primeniti za kompresiju mirnih slika. Zasniva se na diskretnoj wavelet transformaciji (eng. discrete wavelet transform – DWT), skalarnoj kvantizaciji i aritmeti kom kodovanju. MPEG-4 VTC podržava SNR skalabilnosti kroz primenu razli itih strategija kvantizacije: jednostruka kvantizacija (eng. single quantization – SQ), multipl kvantizacija (eng. multiple quantization – MQ) i dvostruka kvantizacija (eng. bi-level quantization – BQ). SQ ne obezbe uje SNR skalabilnost. MQ obezbe uje ograni enu SNR skalabilnost dok BQ pruža opštu SNR skalabilnost. Rezoluciona skalabilnost je podržana primenom skeniranja opseg po opseg (eng. band by band – BB). MPEG-4 VTC tako e podržava kodovanje objekata proizvoljnog oblika pomo u DWT adaptivnog oblika i nekoliko objekata može se kodovati posebno, sa mogu noš u postizanja razli itog kvaliteta. Zatim je na strani dekodera izvršeno spajanje kao bi se dobila kona na dekodovana slika. JPEG je dobro poznati ISO/ITU-T standard stvoren osamdesetih godina prošlog veka. Postoji nekoliko oblika modela JPEG standarda: osnovni (eng. base-line), bez gubitaka, progresivni i hijerarhijski. “Base-line“ je najpopularniji i podržava samo kodovanje sa gubicima. Zasniva se na diskretnoj kosinusnoj transformaciji DCT [7.46], pri emu se koristi blok tipa 8 × 8, cik-cak skeniranje, HVS težinska uniformna skalarna kvantizacija i Huffman-ovo kodovanje [7.47]. Progresivni i hijerarhijski modovi se sa gubicima. Oni se razlikuju samo po na inu na koji su DCT koeficijenti kodovani ili izra unavani, respektivno, kada se uporede sa “base-line“ modom. Oni omogu avaju rekonstrukciju nižeg kvaliteta ili verziju sa nižom rezolucijom i to parcijalnim dekodovanjem komprimovanog bitskog toka.

96

Page 105: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

JPEG-LS je ISO/ITU-T standard za kodovanje mirnih slika bez gubitaka. Zasniva se na adaptivnoj predikciji i modelovanju teksta. Uz to, ovaj standard ocrtava ravne oblasti da bi ih zatim kodovao. Fiksiranjem maksimalne greške odbiraka postiže se kompresija skoro bez gubitaka. Algoritam je namenjen za slu aj da se radi o maloj kompleksnosti uz veliki odnos kompresije. Me utim, nije obezbe ena podrška za skalabilnost i otpornost na greške. Pokretna mrežna grafika PNG je preporuka WWW Konzorcijuma (eng. World Wide Web Consortium – W3C) za kodovanje mirnih slika. Zasnovana je na predikciji i entropijskom kodovanju. PNG pruža kompresiju bez gubitaka i podržava sivu skalu, osnovnu boju, opcionu alfa ravan, preplitanje na slici.

7.7 Standard JPEG 2000 Standard JPEG 2000 pruža niz karakteristika koje su od vitalne važnosti za mnoge primene koje omogu avaju nove tehnologije. Jedna od najvažnijih karakteristika je da se definišu regioni od interesa (eng. region of interest – ROI) na jednoj slici. Od ne manje važnosti su svakako još i prostorna i SNR skalabilnost, otpornost na greške i mogu nost zaštite intelektualnih prava [7.48]. Što se ti e kodovanja ROI, to podrazumeva da se neki regioni od interesa na slici koduju tako što se postiže bolji kvalitet u pore enju sa ostatkom slike (pozadina). ROI metod na bazi skaliranja deli koeficijente tako da su biti koji pripadaju ROI oblasti postavljeni u više bitske ravni. U procesu kodovanja, ovi biti su smešteni u bitski tok pre delova slike koji ne pripadaju ROI. Otuda e ROI biti dekodovan ili otkriven pre ostatka slike. Bez obzira na skaliranje, dekodovanje toka bita daje kao rezultat rekonstrukciju celokupne slike sa što je mogu e ve om dostupnom vernoš u. Ako je tok bita prekinut, ili je pak proces kodovanja završen pre nego što je celokupna slika u potpunosti kodovana, ROI e imati ve u vernost nego ostatak slike [7.49]. ROI prikaz definisan u standardu JPEG 2000, Deo I, omogu ava ROI kodovanje u regionima proizvoljnog oblika bez potrebe za dodatnom informacijom o obliku i dekodovanju oblika.

Skalabilno kodovanje mirnih slika pruža mogu nost da se sprovede kodovanje i to simultano kada se radi o više od jedne rezolucije i/ili je u pitanju razli it kvalitet slike. Zna i, radi se o generisanju takvog kodovanog bitskog toka da se dobije slika sa više od jedne rezolucije i/ili mogu nosti uz razli itu skalu kvaliteta. Arhitektura JPEG 2000 podržava skalabilnost jer se u mnogim primenama traži da slike budu simultano dostupne za dekodovanje uprkos razli itim rezolucijama i/ili da su razli itog kvaliteta. Ako je tok bita skalabilan, koegzistiraju dekoderi razli ite složenosti i to od najmanje kompleksnih do najkompleksnijih. Najvažniji tipovi skalabilnosti su SNR skalabilnost i prostorna skalabilnost. SNR skalabilnost se primenjuje kod onih sistema gde je potrebno najmanje dva nivoa kvaliteta slike za istu prostornu rezoluciju kod odre enog nivoa slike. Niži nivo pruža osnovni kvalitet, dok viši nivo generiše viši kvalitet reprodukcije ulazne slike. Prostorna skalabilnost obuhvata generisanje najmanje dva nivoa prostorne rezolucije i to iz jedinstvenog izvora s tim da je niži nivo kodovan tako da obezbedi osnovnu prostornu rezoluciju. Viši nivo koristi prostorno interpolirani niži nivo i na taj na in prenosi se ulazna slika sa punom prostornom rezolucijom. Oba tipa skalabilnosti su vrlo važna za primene koje se odnose na internet i pristup bazi podataka, kao i za skaliranje širine propusnog opsega. SNR i prostorne skalabilnosti ogledaju se u njihovoj sposobnosti da omogu e otpornost na pojam grešaka nastalih u toku prenosa. Naime, najvažniji podaci iz nižeg

97

Page 106: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

sloja mogu biti poslati kanalom sa boljom performansom greške. Manje kriti an viši sloj šalje podatke kanalom sa smanjenom performanskom greške. Da bi se poboljšao prenos komprimovanih slika, u ovaj standard su uklju eni sinteza bita otpornog na greške i odgovaraju i alati. Kada se radi o otpornosti na greške, odgovaraju i alati koriste deobu podataka kao i resinhronizaciju, detekciju i snimanje greške uz QoS na bazi prioriteta. Mnoge primene zahtevaju isporuku podataka o slici kroz razli ite tipove komunikacionih kanala. Tipi ni beži ni komunikacioni kanali orijentisani su ka slu ajnim i sporadi nim bitskim greškama. I internet komunikacije su sli ne nastojanju gubitka usled nagomilavanja saobra aja/saobra ajnog preoptere enja. Što se ti e mogu nosti zaštite intelektualne svojine, standardom je definisan opcioni fajl format za JPEG 2000 (eng. optional file format for JPEG 2000 – JP2) kod komprimovanja podataka o slici. Format služi za mirnu sliku i meta podatke, a ima i mehanizam za naznaku tonske skale i boja na slici. To je mehanizam pomo u koga itaoci mogu da prepoznaju u fajlu postojanje informacije o zaštiti prava intelektualne svojine (eng. intelectual property rights – IPRS). Tako e, to je mehanizam pomo u koga metapodaci mogu biti uklju eni u fajl. Blok-šema kodera i dekodera za JPEG 2000 data je na Slici 7.7.1. Najpre je primenjena diskretna tranformacija na izvorne podatke o slici. Transformacioni koeficijenti su potom kvantovani i entropijski kodovani pre formiranja izlaznog toka bita. Zavisno od wavelet transformacije i primenjene kvantizacije, JPEG 2000 može biti sa gubicima i bez gubitaka. Na strani dekodera obavljaju se procesi entropijskog dekodovanja, dekvantizacije i inverzne transformacije kako bi se dobili rekonstruisani podaci o slici.

Slika 7.7.1—Blok-šema za JPEG 2000 arhitekturu kodera i dekodera

7.8 MPEG-7 standard Sa dostupnoš u standarda MPEG-1, MPEG-2, MPEG-4 i drugih digitalnih kodnih standarda bilo je lako pribaviti i raspodeliti audio-vizuelni sadržaj. Me utim, mnoštvo digitalnog sadržaja predstavljalo je ogroman izazov za upravljanje tim sadržajem. Što je više sadržaja, postaje teže da se njime upravlja, da se on pretražuje i filtrira kako bi se pronašlo ono što nam stvarno treba. Sa druge strane, sadržaj ima vrednost ukoliko može biti otkriven brzo i efikasno. Pošto su na injeni važni koraci na putu daljeg razvoja digitalnog audio-vizuelnog sadržaja, MPEG je prepoznao da je potrebno usmeriti problem ka upravljanju audio-vizuelnim sadržajem.

98

Page 107: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

1996 godine MPEG je pokrenuo MPEG-7 projekat pod nazivom “Opis interfejsa za multimedijalni sadržaj“ [7.50] sa ciljem da se specifira standard za opis razli itih tipova audio-vizuelnih informacija kao što su osnovni delovi, skladištenje informacija, bez obzira na njihov format, na in predstavljanja ili medijum. Poput drugih MPEG standarda, MPEG-7 se susre e sa nizom zahteva od prethodnih MPEG standarda, audio-vizuelna predstava ovde nema za cilj da komprimuje i reprodukuje podatke, ve se bavi tzv. metapodacima (podaci o podacima). MPEG-7 deskriptori obezbe uju rešenje za metapodatke kod velikog broja primena. Oni su nezavisni od medijuma i formata na bazi objekata i sa mogu noš u proširenja. Rade na razli itim nivoima i to po ev od opisa na niskom nivou automatskih i esto statisti kih karakteristika pa sve do predstavljanja istih na visokim nivoima gde se prenose semanti ka zna enja. Slede i princip da MPEG standardi moraju specificirati samo potreban minimum, MPEG-7 specificira format za deskripciju i njegovo dekodovanje. Na taj na in ostavljeno je mnogo slobode za istraživa e u oblasti aplikacija. MPEG-7 specificira dva osnovna tipa alata: deskriptori (eng. descriptor – D) i šeme za deskripciju (eng. descriptor scheme – DS). Deskriptor je predstavljanje karakteristika koje definišu sintaksu i semantiku. Kao primer može poslužiti vremenski kod za predstavljanje trajanja procesa ili momenti boja i histogrami za predstavljanje boje. Sa druge strane šema za deskripciju odre uje strukturu i semantike relacija izme u komponenti. To mogu biti odre eni deskriptori i šeme za deskripciju. Jednostavan primer je opis filma, struktuiranog kao scene i pucnjevi uklju uju i tekstualne deskriptore na scenskom nivou kao i aspekte pomeranja uz deskriptor audio amplitude na nivou pucnja. Deskripcije MPEG-7 mogu se predstaviti na dva na ina: tekstualni tipovi koji koriste opis definicije jezika (eng. desciption definition language – DDL) i binarne tokove koji koriste binarni format za metapodatke (eng. binary format for metadata – BiM) MPEG-7. To je u osnovi DDL alat za kompresiju.

MPEG-7 specifcira primenjenu tehnologiju kroz 11 Delova:

a) Deo 1: Sistemi Specificira alate za:

1) Transportovanje i memorisanje MPEG-7 deskripcije na efikasan na in koriste i BiM format za binarno predstavljanje;

2) Deo 2: Opis jezika po definiciji DDL Specificira jezik kod kreiranja novih šema za deskripciju kao i za proširenje i modifikaciju postoje ih. DDL je baziran na ozna enom jeziku za proširenje (eng. eXtensible markup language – XML) koji je deo W3C. Neka proširenja za XML su razvijena da bi se ispunili DDL zahtevi.

b) Deo 3: Vizuelni

Odre uje alate za deskripciju osnovne strukture i deskriptore ili deskripcione šeme za opis vizuelnih karakteristika i za lokalizaciju opisanih objekata na slici ili video sekvenci. MPEG-7 vizuelni deskriptor pokriva pet osnovnih vizuelnih karakteristika koji uklju uju boju, teksturu, oblik, pokret i lokalizaciju (deskriptor prepoznavanja lica je tako e definisan).

c) Deo 4: Audio

99

Page 108: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Specificira alate za audio deskripciju koji su organizovani kao melodija, tišina, govorni sadržaj i zvu ni efekti.

d) Deo 5: Šeme za multimedijalnu deskripciju (eng. multimedia description schemes –

MDS) Specificira deskripcione alate koji se bave opštim i multimedijalnim entitetima. Opšti entiteti su oni koji se mogu primeniti kod audio, vizuelnih i tekstualnih deskripcija pa se mogu tretirati kao opšti u svim medijima. Alati za multimedijalnu deskripciju mogu se grupisati u šest razli itih klasa prema svojoj funkcionalnosti kao što je to prikazano na Slici 7.8.1. Prva klasa sadrži deskripciju sadržaja: strukturne i semanti ke aspekte. Druga klasa sadrži upravljanjem sadržajem: medije, koriš enje, kreaciju i produkciju. Tre u ini organizacija sadržaja: kolekcija i modeli. etvrta klasa bavi se navigacijom i pristupom: rezimea, varijacije i gledišta. Sledi klasa koja se odnosi na korisnike: davanje prvenstva korisnicima i poreklo primene. Najzad šesta klasa bavi se bazi nim elementima: tipovima podataka i strukturama, šemama razli itih alata, linkovima i lokalizacijom medija kao i osnovnim deskripcionim šemama DS.

Slika 7.8.1—Pregled deskriptivnih alata kod multimedijalnih deskriptivnih šema e) Deo 6: Referentni softver

Sadrži softver za implementaciju alata specificiranih u Delovima 1–5. Kao i kod MPEG-4 standarda, ovaj softver koristi se za primene koje su prilago ene sa MPEG-7 standardom.

f) Deo 7: Prilago eno testiranje Specificira procedure koje obezbe uju da se proveri da li deskripcioni tokovi odgovaraju specifikacijama u Delovima 1–5.

100

Page 109: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

g) Deo 8: Ekstrakcija i primena MPEG-7 deskripcije Obezbe uje korisne informacije o ekstrakciji i upotrebi deskripcije.

h) Deo 9: Profili i nivoi

Specificira deskripciju profila i nivoa. Deskripcioni nivo u opštem slu aju opisuje podniz svih deskripcija i alata opisanih u MPEG-7. Deskripcija alata u deskripcionom profilu podržava niz funkcionalnosti za izvesnu klasu primena; nivo dispersije profila definiše dalja ograni enja u pogledu uskla enosti deskripcija sa ograni enjem koje postavlja maksimalna dozvoljena kompleksnost.

i) Deo 10: Definicija šeme

Specificira definiciju šeme kroz Delove MPEG-7. Prikuplja deskripciju alata specificiranih u MPEG-7 i specificira opis sintakse u šemi primenom opisa jezika po definiciji DDL.

j) Deo 11: Profil šema

Obuhvata šeme za razli ite profile. MPEG-7 je obiman, mo an i u suštini kompletan standard. On se odnosi na razli ite

ciljeve u pore enju sa prethodnim MPEG standardima gde je potreba za interoperabilnoš u manja.

7.9 MPEG-21 Standard Po etak rada na MPEG-21 standardu 1999 godine obeležen je pojavom da je, uprkos postojanju MPEG-1, MPEG-2, MPEG-4 i MPEG-7 standarda potpuna interoperabilnost u multimedijalnoj raspodeli i potrošnji, iako dobrodošla, bila još uvek daleko od krajnjeg cilja. Sa jedne strane u pitanju je bilo nepostojanje izgra ene infrastrukture za dostavljanje i potrošnju multimedijalnog sadržaja, a sa druge strane nije se moglo jasno sagledati kako opisati elemente ve spremne za eksploataciju i one u razvoju i kako ih povezati radi dobijanja multimedijalne infrastrukture [7.51], [7.52]. Na osnovu diskusije koje su pratile MPEG Forum, ciljevi u ranom stadijumu razvoja MPEG-21 Standarda bili su [7.53]:

Da se shvati kako razli ite dostupne komponente mogu biti uzajamno fitovane, Da se diskutuje o tome koji su to potrebni standardi ukoliko za to postoji prostor u

odgovaraju oj infrastrukturi, Kada se zadovolje prethodne dve ta ke da se sprovede integracija razli itih standarda.

Da bi se ostvarila ideja o jednom interoperabilnom okruženju, MPEG sara uje sa drugim telima koji tako e donose standarde. Kao rezultat te saradnje pojavila se lista od sedam delova–elemenata kao i prvo izdanje jednog finalnog dokumenta nazvanog Tehnicki izvestaj (eng. Tehnical report – TR) [7.54]. Ovih sedam delova formiraju osnovni koncept MPEG-21 standarda. U centru pažnje ovde se nalaze korisnik i Digitalni deo (eng. Digital item – DI). Korisnik je bilo koji entitet koji koristi Digitalni deo. Prema Tehni kom izveštaju, DI predstavlja

101

Page 110: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

struktuirani digitalni obejkat sa standardnom prezentacijom, identifikacijom i meta podacima u okviru MPEG-21 standarda. Ovaj entitet je, tako e, osnovna jedinica za raspodelu i transakciju.

Sedam delova u TR predstavljaju grupisane elemente arhitekture standarda MPEG-21. Granice izme u elemenata nisu striktne, a kasniji tok standardizacije je pokazao da primenjene tehnologije mogu obuhvatiti više elemenata. Ovi elementi su identifikovani slede im redom:

Deklaracija o digitalnim delovima (eng. digital item declaration – DID): obezbe uje uniformno i fleksibilno uopštavanje i interoperabilnu šemu za naznaku digitalnih delova;

Identifikacija i opis digitalnih delova predstavlja sposobnost da opiše bilo koji entitet bez obzira na njegovu prirodu ili tip;

Upravljanje sadržajem i primena podrazumeva interfejse i protokole koji omogu avaju kreiranje, rukovo enje, istraživanje i pristup, memorisanje, predaju i koriš enje sadržaja kroz distribuciju i potrošnju vrednosnog lanca;

Upravljanje intelektualnom svojinom i zaštita odnose se na omogu avanje prava na intelektualnu svojinu sadržaja kojom se upravlja postojano i pouzdano, dok se zaštita sprovodi kroz široki opseg u mreži i na ure ajima;

Terminali i mreže obuhvataju sposobnost da se obezbedi interoperabilnost i transportni pristup sadržaju kroz mreže i terminale;

Predstavljanje sadržaja bavi se predstavljanjem resursa ure aja; Izveštavanje o doga aju bavi se metrikama i interfejsima koji omogu avaju korisnicima

da upravljaju doga ajima u okruženju.

Sedam delova – elemenata vezanih za arhitekturu koji olakšavaju transakcije izme u korisnika kod standarda MPEG-21 dato je na Slici 7.9.1. U daljem delu izlaganja rezimira emo funkciju svakog navedenog alata.

a) Deklaracija o digitalnom delu To je osnovni element u MPEG-21 standardu. Koncept digitalnog dela ini kompletan skup tehnologija koje omogu avaju zaštitu standarda, adaptaciju i grupisanje formiranih digitalnih delova.

b) Identifikacija i opis digitalnog dela

Klju ni aspekt MPEG-21 standarda je potreba da se svi sadržaji mogu identifikovati i locirati. Cilj je da svi digitalni sadržaji i resursi medija u okviru MPEG-21 standarda prenose jedinstvene identifikatore. Broj zahteva za takvim identifikatorima i lokatorima je jasno izražen pa su uvedene mnoge scene za identifikaciju specifi nih medija [7.55]–[7.57]. Tako e su prepoznate neke inicijative za identifikaciju u unakrsnim domenima kao i u industrijskim sektorima. Stoga je zadatak MPEG-21 standarda bio da kreira zajedni ki prostor u kome korisnici mogu da objedine identifikatore na jedan interoperabilan na in.

c) Upravljanjem sadržajem i primena U ranoj fazi razvoja MPEG-21 standarda, utvr eno je da bi ga obavezno trebalo uvesti u oblasti mreže, servera i upravljanja multimedijalnim sadržajem od strane klijenta. Tako e je uo ena neophodnost ovog standarda kod personalizacije sadržaja kao i kod mogu nosti

102

Page 111: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

agenata da konzumiraju i filtriraju sadržaj za korisnike. Zato je ovaj deo standarda uvrš en u oblast koja se odnosi na personalizaciju korisnika.

Slika 7.9.1—Sedam delova–elemenata kod standarda MPEG-21

d) Upravljanje intelektualnom svojinom i zaštita Upravljanje digitalnim pravima (eng. digital rights managament – DRM) je oblast velikog interesovanja još od sredine devedesetih godina prošlog veka. MPEG je utvrdio da uklju ivanje DRM mehanizma u multimedijalni okvir može biti od vitalne važnosti, kao i da bi se prilaz sastojao u interoperabilnosti i prilagodljivosti. Ova oblast je poznata u MPEG standardizaciji kao IPMP. U standardu MPEG-21 ovaj element uklju uje koncepcije jezi kih prava kao i zaštitne mehanizme za sadržaj. Nešto kasnije MPEG-21 standard usvaja novi prikaz koji omogu ava višestruko upravljanje digitalnim pravima kroz tzv. ’’utika ke zaštitne mehanizme u standardu“. Dalje, MPEG je razvio ’’zašti enu verziju“ digitalnog dela koja može da koristi prikaz upravljanja digitalnim pravima na bazi utika ke jedinice [7.58].

e) Terminali i mreže

Cilj okvira ovog standarda bio je da kreira transparentni pristup za napredni multimedijalni sadržaj (onakav kakav je opisan u objektima sa digitalnim delovima). Zbog toga je shvatanje efektivne zaštite izme u korisnika i terminala sa jedne i mreže sa

103

Page 112: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

druge strane bilo od vitalne važnosti. Povezanost elemenata, širina propusnog opsega i kvalitet servisa predstavljaju važne komponente za adaptaciju okvira standarda [7.59].

f) Predstavljanje sadržaja

TR za standard MPEG-21 pokazao je da sadržaj može biti:

1) Predstavljen MPEG standardima, 2) Upotrebljen od strane MPEG ali da nije pokriven MPEG standardima, na primer

puni tekst, hipertekst sa ozna enim jezikom (eng. hyper text markup language – HTML) i standardni generalizovani jezik za markiranje (eng. standard generalized markup language – SGML),

3) Prikazan pomo u prethodna dva stava, 4) Predstavljen preko standarda za sezonske medije.

U TR-u se tako e kaže da okvir standarda treba da podrži predstavljanje sadržaja. Tako je potrebno da MPEG-21 standard podrži sinhronizovani i multipleksirani medijum.

g) Izveštavanje o doga aju U toku rane faze izrade ovog standarda ukazala se potreba za interakcijama sa digitalnim delovima. Naime, radilo se o tome da se standardizuju metrike i interfejsi za interakcije koje se o ekuju kod digitalnih delova. Dalje transport podataka pridružen raznim doga ajima-saopštenjima treba standardizovati.

Ovih sedam delova - elemenata mogu se preklapati. U svakom elementu identifikovane su oblasti standardizacije, generisani su zahtevi, a odgovaraju e tehnologije odabrane su na osnovu tih zahteva.

7.10 ITU-T proces standardizacije kod audio-vizuelnih komunikacionih sistema

Kod pripreme standarda za globalnu informacionu infrastrukturu (eng. global information infrastructure – GII) uklju en je ITU. Sprovedena je konvergencija tehnologija i industrije i obezbe ene su razli ite multimedijalne aplikacije. Globalna povezanost i interoperabilnost su neki od klju nih zahteva od strane GII što je zahtevalo uvo enje novih standarda. Prihva eno je da najvažniji globalni standardi moraju odgovarati tržišnim zahtevima, da ne smeju pogoršavati ili ograni avati kreativnost proizvo a a opreme, provajdera informacija kao i servisnih provajdera. Od ne manje važnosti bilo je svakako da se obezbedi realna i stabilna baza za informacionu infrastrukturu. Uvo enjem ovakvih standarda postignuta je interoperabilnost sistema uz mogu nost vo enja ra una o tržišnim zahtevima, troškovima i kvalitetu servisa. To, pored ostalog, pruža mogu nost povezivanja industrijski manje razvijenih sa visoko razvijenim industrijskim zemljama [7.60]. Što se ti e multimedijalnih komunikacija, postoje dve glavne organizacije u oblasti standardizacije: ITU i ISO. Tako na primer, neki standardi za video kodovanje definisani od strane tih organizacija dati su u Tabeli 7.10.1.

104

Page 113: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Navedeni standardi se razlikuju u pogledu bitskog protoka. Svi ovi standardi se mogu primeniti u širokom opsegu bitskih tokova. U zavisnosti od algoritama kodovanja, oni prate sli ne standardizacione okvire.

Tabela 7.10.1–Neki standardi za video kodovanje

Organizacije Video kodni

standard Tipi an opseg Tipi ne primene

standarda bitskog protoka ITU-T H.261 p × 64 kbit/s; ISDN VIDEOFON

p = 1, 2…, 30 ISO ISO/IEC 11172-2

MPEG-1 VIDEO 1.2 Mbit/s CD – ROM

ISO ISO/IEC 13818-2 MPEG-2 VIDEO

od 4 Mbit/s do 80 Mbit/s SDTV, HDTV

ITU-T H.263 64 kbit/s ili niže PSTN VIDEOFON ISO CD 14496-2

MPEG-4 VIDEO od 24 kbit/s do 1024 kbit/s Interaktivni

Audio-Video ITU-T H.263 Verzija 2 Manje od 64 kbit/s PSTN VIDEOFON ITU-T H.26L Manje od 64 kbit/s Mreža na bazi paketskog videa

Standard H.320

Za sve ITU standarde obavezna je interoperabilnost sa standardom H.320. Me utim, ova interoperabilnost je postignuta kroz mrežni prolaz koji u nekim slu ajevima mora da predstavlja prolaze izme u razli itih protokola, razli itih standarda za kompresiju i razli itih šema za multipleksiranje. Varijacije u signalizaciji i multipleksiranju za razli ite standarde nastaju usled razli itih karakteristika mreža na koji se svaki odgovaraju i standard primenjuje. Jedan aspekt standarda H.320 je centralizovan prikaz održavanja konferencije izme u više mesta. Standard H.320 definiše centralni konferencijski server nazvan kontrolna jedinica za više ta aka (eng. multipoint control unit – MCU). MCU obezbe uje poziv za više ta ke [7.61]. Svaki u esnik uspostavlja poziv direktno sa MCU. Ova kontrolna jedinica tada kontroliše tok konferencije. Dakle, postoji veza od ta ke do ta ke kao kod digitalne mreže integrisanih servisa (eng. integrated services digital network – ISDN). Radi se o mreži integrisanih servisa koja obezbe uje digitalnu vezu na relaciji korisnik – mreža. To je svetski telekomunikacioni servis koji koristi tehnologiju digitalnog prenosa i komutacije za podršku komunikacija glasom i digitalnim podacima, protocima koji su umnožak 64 kbit/s. Pri tome se koristi i komutacija kanala (kola) i komutacija paketa. ISDN je široko rasprostranjena mreža za interaktivne multimedijalne komunikacije. Za brojne poslovne korisnike H.320 familija ITU-T preporuka primenjuje se kod video-telefonskih i video-konferencijskih sistema. Preporuke H.310 i H.321 ITU-T Studijska grupa (eng. Study Group – SG) SG 15 razvila je slede e dve preporuke za audio-vizuelne komunikacione sisteme u ATM okruženjima:

H.321–Prilago enje standarda H.320 za vizuelne telefonske terminale na širokopojasno

105

Page 114: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

ISDN (eng. broadband ISDN – BISDN) okruženje [7.62], H.310–Širokopojasni audio-vizuelni komunikacioni sistem i terminali [7.63].

Preporuka H.321 specificira prilago enje H.320 za vizuelne terminale na BISDN

okruženje. Na taj na in zadovoljen je zahtev da ATM terminali mogu me usobno da rade sa onim terminalima koji su priklju eni na uskopojasnu digitalnu mrežu integrisanih servisa (eng. Narrow-band ISDN – NISDN). Preporuka H.310 obuhvata uzajamni rad H.320/H.321 pri emu se uzima u obzir preimu stvo koje obezbe uje ATM postupak u smislu postizanja ve eg kvaliteta kod audio-vizuelnih komunikacionih sistema. Iako NISDN omogu ava samo mali broj transfer protoka, kvantizacja multiplima od 64 kbit/s, 394 kbit/s, 1536 kbit/s i 1920 kbit/s omogu ava za BISDN široki opseg transfer protoka. To pruža izvesno preimu stvo koje se ogleda u fleksibilnosti, ali isto tako stvara potencijalni problem u pogledu interoperebilnosti. Naime, može se dogoditi da jedan terminal podržava jednu grupu transfer protoka, a da drugi terminal podržava drugu razli itu grupu transfer protoka, pri emu nemaju zajedni kih vrednosti. Preporukom H.310 rešava se ovaj problem na taj na in što se najpre transfer protoci tako definišu da protoci budu multipl od 64 kbit/s, a zatim se koriste dva protoka 96 × 64 kbit/s = 6114 kbit/s i 144 × 64 kbit/s = 9216 kbit/s. Drugi mogu i transfer protoci mogu se ugovoriti kroz primenu H.245 procedure [7.64]. ITU-T H.323 standard Primarna razmatranja u razvoju H.323 bila su slede a:

Interopereabilnost, naro ito sa NISDN i H.320, Kontrola pristupa LAN mrežama da bi se izbeglo nagomilavanje poziva, Modeli poziva za više ta aka, Skalabilnost po ev od mreža malih do srednjih veli ina.

H.323 terminali mogu se primeniti za konfiguracije sa više ta aka i mogu da me usobno

rade sa H.310 terminalima iz mreže tipa BISDN, sa H.320 terminalima iz mreže tipa NISDN, sa H.321 terminalima iz BISDN mreža, kao i sa H.322 terminalima koji garantuju kvalitet servisa u lokalnim ra unarskim mrežama (LAN local area network). Podsetimo se da LAN obezbe uje povezivanje itavog niza razli itih ure aja za komuniciranje (radne stanice, periferijski ure aji, terminali, drugi ure aji ) unutar male teritorije. Ovde se radi o velikom protoku i maloj verovatno i greške u prenosu podataka. Tako e H.323 terminali rade sa H.324 terminalima iz opšte komutacione telefonske mreže (eng. general switched telephone network – GSTN), kao i sa beži nim mrežama i V.70 terminalima u mreži tipa GSTN [7.65].

Zona H.323 sistema data je na Slici 7.10.1. H.323 ne uklju uje mrežu tipa LAN. U zoni je obezbe en nadzor prolaza radi pristupa kontroli H.323 terminala u okviru zone. Kriterijumi koji koriste nadzor prolaza da bi se omogu io jedan takav pristup nisu standardizovani. Uz to, nadzor prolaza ograni ava širinu propusnog opsega koji koristi terminal i može da kontroliše upotrebljeni model poziva koji tako e uti e na koriš enje širine propusnog opsega. Samo elementi potrebni za interakciju sa mrežom za komutaciju kanala (eng. switched circuit network

106

Page 115: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

– SCN) su vezani za H.323. Kombinacija mrežnog prolaza kod H.323, H.323 terminala i mreže tipa LAN pojavljuje se u SCN mreži kao H.320, H.310, ili H.324 terminal.

Slika 7.10.1—Zona H.323 sistema

H.323 opisuje ukupan sistem i komponente, uklju uju i terminale, mrežne prolaze (eng. gate way – GW), nadzore prolaza (eng. gate keeper – GK), kontrolore procesa za više ta aka i kontrolne jedinice za više ta aka MCUs. Zonom koju ini kolekcija svih terminala, mrežnih prolaza, i kontrolnih jedinica za više ta aka upravlja jedinstveni nadzor prolaza. Zona obuhvata najmanje jedan terminal i može a i ne mora, da obuhvati mrežne prolaze ili kontrolnu jedinicu za više ta aka. LAN segmenti koji su povezani primenom rutera ili drugih ure aja mogu biti u istoj zoni. H.324 standard Ukoliko se telefonske mreže koriste za multimedijalne konferencije, najve i broj komercijalnih proizvoda bazira se na H.324 protokolu da bi se obezbedila interoperabilnost. ITU-T preporuka H.324 pod nazivom ’’Terminali za multimedijalne komunikacije niskog bitskog protoka“ [7.66] daje pregled multimedijalnih terminala u mreži tipa PSTN i referencira sve druge ITU-T preporuke potrebne da se izradi jedan takav terminal na standardan na in. Sistemi na bazi H.324 ugovoraju vrednosti parametara kod protokola kao što su dimenzije paketa i omogu avaju kašnjenje prilikom prenosa u oba smera. Takve vrednosti i naro ito potrebne vrednosti kašnjenja u oba smera, zna ajno uti u na na ine za predstavljanje otpornosti na grešku. Da bi se minimiziralo kašnjenje paketa, obi no se ugovaraju paketi malih veli ina. Karakteristi an koristan sadržaj za video pakete u sistemu H.324 je 128 bajta. Ta vrednost se esto koristi kod razli itih interoperabilnih testova za komercijalne H.324 sisteme [7.67]. Na žalost, mnogi H.324 sistemi imaju zna ajno kašnjenje sa kraja na kraj najviše zbog integracije H.324 mehanizma protokola sa okruženjem operativnog sistema personalnog ra unara (eng. personal computer – PC) koje nije optimizirano za primene u realnom vremenu. Tipi no kašnjenje sa kraja na kraj u takvom sistemu je iznad 0.5 s. Odgovaraju i modemi omogu avaju da se optimizira veza izme u vrednosti grešaka i bitskog protoka.

107

Page 116: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

7.10.1 Standardi za video kodovanje Postoje dva prilaza za razumevanje standarda za video kodovanje. Jedan prilaz je da se fokusiramo na sintaksu niza bita i da se pokuša shvatiti šta predstavlja svaki sloj sintakse i šta svaki bit u nizu bita ozna ava. Ovaj prilaz je veoma zna ajan za proizvo a a opreme koji treba da sagleda opremu koja je prilago ena standardima. Drugi prilaz je da se koncentrišemo na algoritme kodovanja koji se mogu upotrebiti za generisanje niza bita prilago enih standardu, a zatim da se shvati da svaka komponenta ne specifira bilo koji od kodnih algoritama. Ovaj prilaz obezbe uje bolje razumevanje video kodnih tehnika u celini, a ne samo standardnu sintaksu niza bita. H.261 standard Ovaj standard bavi se slu ajevima u kojima postoji mali bitski protok i malo kodno kašnjenje. Ovde se radi o bitskim protocima od oko p × 64 kbit/s, gde p varira od 1 do 30. Kodni algoritam koriš en u H.261 je u osnovi hibrid kompenzacije pokreta, da bi se uklonila vremenska suvišnost, i transformacionog kodovanja DCT kako bi se redukovala prostorna suvišnost. Takva koncepcija formirala je bazu za sve standarde koji se odnose na video kodovanje. H.261 standard je imao zna ajan uticaj na mnoge postoje e i ostale standarde za video kodovanje u fazi razvoja. Digitalni video sastoji se od niza slika ili kadrova koji se odigravaju izvesnom brzinom. Svaka slika sadrži tzv. elemente slike piksele. Za standard kod video kodovanja važno je znati dimenzije slike na koju se standard primenjuje i položaj piksela-tela. H.261 bavi se sa dva formata slike: zajedni ki srednji format (eng. common intermediate format – CIF) i etvrtni zajedni ki srednji format (eng. quarter CIF – QCIF). Kod mirnih slika prema standardu H.261 koristi se etiri puta ve i format. Na primer ukoliko je video format CIF, odgovaraju i video format je 4CIF. Standard H.261 se primenjuje za video telefoniju i video konferenciju. Ovde je izvorni materijal sastavljen od scena osoba koje govore, tzv. nizova glave i ramena osobe, pre nego opštih TV programa koji sadrže dosta promena u pokretu i na sceni. Kod H.261, svaki odmerak sadrži luminentnu komponentu Y i dve hrominentne komponente ozna ene sa Cb i Cr. Posebno crna boja je predstavljena sa Y = 16, bela sa Y = 235, dok su Cb i Cr varirali izme u 16 i 240, pri emu 128 predstavlja sivo.

Kod standarda H.261 blok je definisan kao grupa od 8 × 8 pela. Jedan blok koji ine Cb peli i jedan blok sa Cr pelima odgovara vrednosti od etiri bloka Y pela. Kolekcija ovih šest blokova predstavlja makroblok (eng. macroblock – MB). Jedan makroblok sa redosledom blokova ozna enih od 1 do 6 dat je na Slici 7.10.2. MB se tretira kao jedna jedinica u procesu kodovanja.

Slika 7.10.2—Prikaz jednog makrobloka

108

Page 117: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Brojni makroblokovi grupisani zajedno predstavljaju grupu blokova (eng. group of blocks – GOB). Za H.261 GOB sadrži 33 makrobloka. Rezultuju e strukture za sliku u slu aju CIF formata, kao i u slu aju formata tipa QCIF prikazane su na Slici 7.10.3 [7.68].

Slika 7.10.3—GOB strukture u slu aju CIF i QCIF za standard H.261 Algoritam za kodovanje u standardu H.261 može se prikazati sa dve blok-šeme prikazane na Slici 7.10.4 i na Slici 7.10.5 [7.69]. Na strani kodera, ulazna slika je upore ena sa prethodno dekodovanim kadrom sa kompenzacijom pokreta. Diferencijalni signal je transformisan primenom DCT postupka, kvantovan, entropijski kodovan i prenesen.

Kompenzacija pokreta

DCT

Filter

video ulaz

Q

IDCT

+

+

Slika 7.10.4—Blok-šema video kodera u standardu H.261

+ IDCT

+

+

Kompenzacija pokreta

Filter

Slika 7.10.5—Blok-šema video dekodera u standardu H.261

Na strani dekodera, dekodovani DCT koeficijenti su inverzno DCT (eng. inverse DCT – IDCT) transformisani i zatim pridodati perthodno dekodovanoj slici sa kompenzacijom pokreta.

109

Page 118: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Pošto je predikcija teku eg kadra sastavljena od blokova na razli itim lokacijama u referentnom kadru, predikcija sama po sebi može da sadrži šum kodovanja i izobli enja zbog postojanja blokova, koja mogu da dovedu do pove anih grešaka usled predikcije. Da bi se smanjile te greške, prediktovani koder se propušta kroz niskopropusni filter pre nego što se upotrebi kao predikcija za teku i kadar. H.263 standard H.263 standard kombinuje osobine standarda H.261 zajedno sa MPEG i optimiziran je za vrlo niske bitske protoke. Što se ti e odnosa signal-šum SNR, H.263 može da obezbedi 3 dB do 4 dB poboljšanja u odnosu na H.261 pri bitskim protocima ispod 64 kbit/s. U stvari, H.263 daje ve u kodnu efikasnost u pore enju sa H.261 pri svim bitskim protocima. Tako na primer, u pore enju sa MPEG-1, H.263 daje uštedu od 30 % u pogledu bitskog protoka. Osnovna struktura H.263 standarda je u suštini ista kao i kod H.261. Me utim, glavne razlike izme u ova dva standarda ogledaju se u slede em:

H.263 podržava više formata slika i koristi razli itu strukturu za grupu blokova GOB, H.263 koristi polu-pikselsku kompenzaciju pokreta, ali ne koristi filtriranje ili polu

pokretne sprege kao kod H.261, H.263 koristi 3D VLC za kodovanje DCT koeficijenata, Uz osnovni kodni algoritam, opcije u H.263 koje se mogu ugovoriti izme u kodera i

dekodera mogu da pruže bolje performanse, H.263 standard obezbe uje da se veli ina koraka kvantizacije menja u svakom

makrobloku MB. Razlike izme u H.261 i H.263 ogleda se i u polupikselskoj predikciji u kompenzaciji

pokreta. Ova koncepcija se isto tako koristi i kod MPEG standarda. Vektori pokreta u H.261 mogu imati samo celobrojne vrednosti, dok H.263 omogu ava da vektori pokreta budu sa polovinom od vrednosti piksela. Tako, na primer, mogu e je imati vektore pokreta sa vrednostima izme u 4.5–2.5. Kada vektor pokreta ima necelobrojne vrednosti, koristi se bilinearna interpolacija da bi se pronašle odgovaraju e vrednosti tela za predikciju.

Kao i kod H.261, H.263 standard može se primeniti kod terminala u razli itom mrežnom okruženju. Jedan primer za ovo je H.324 standard koji definiše audio-vizuelne terminale za tradicionalne javne komutirane telefonske mreže (eng. public switched telephone network – PSTN). U ovom slu aju se kod H.324 standarda koristi kao video kodek terminal na bazi H.263 standarda. ITU-T H.261/H.263 standardi za video kompresiju namenjeni su za kodovanje i dekodovanje u realnom vremenu u slu aju video-konferencijskog sistema preko konekcije sa konstatnim bitskim protokom. H.263+ (H.263 version 2) standard H.263+ ( esto nazvan H.263 verzija 2) sadrži oko 12 novih karakteristika koje ne postoje u standardu H.263. One uklju uju nove na ine kodovanja za poboljšanje efikasnosti kompresije,

110

Page 119: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

podržavanje skalabilnog bitskog protoka, nekoliko novih karakteristika koje podržavaju paketske mreže, pridodatu funkcionalnost i podršku razli itim video formatima. Me u novim karakteristikama H.263+, jedna od nekoliko koja ta no isti e neefikasnost opriginalne H.263 preporuke je modifikovani na in kvantizacije. Ovaj na in ima etiri klju na elementa [7.70]:

Ozna avanje ve ih promena od makrobloka do makrobloka kod kvantizera kako bi se bolje sprovodila kontrola protoka;

Sposobnost koriš enja finijeg hrominentnog kvantizera kako bi se bolje o uvala hrominentna vernost;

Sposobnost da se podrži celokupni opseg kvantovanih vrednosti koeficijenata pre nego da se klipuju vrednosti ve e od 128;

Eksplicitno ograni enje prilikom predstavljanja kvantovanih transformacionih koeficijenata na one koji mogu sigurno nastati.

Najzad, H.263+ podržava širi opseg varijacija ulaznih video formata u pore enju sa

H.263. Jedna važna osobina H.263+ je koriš enje dodatnih informacija koje se mogu uklju iti u tok bita da bi se istaklo kašnjenje ili da bi se pridružila informacija za spoljašnu primenu. Dodatna informacija prisutna je u bitskom protoku i kada dekoder nije u stanju da je prihvati ili da je jasno interpretira. Drugim re ima, ukoliko zahtev za obezbe ivanjem tražene sposobnosti nije dogovoren unapred, dekoder može jednostavno da odbaci bilo šta u dodatoj informaciji. Druga uloga koriš enja dodatne informacije sastoji se u tome da se specificira hroma klju za predstavljanje transparentnih i semi transparentnih piksela [7.71]. Slede a runda koriš enja H.263 standada dala je tre u generaciju H.263 sintakse, koja se neformalno naziva H.263++. Identifikovane su etiri klju ne tehni ke oblasti za dalja istražiavanja: tip promenljive transformacije, adaptivno aritmeti ko kodovanje, tabele za kodove promenljive dužine otporne na grešku, kao i filtriranje za osloba anje od pravljenja prstenova oko slike. H.263++ standard Razvojni napor za H.263++ usmeren je ka standardizaciji tre e verzije H.263 video kodeka za komunikacije u realnom vremenu i sa tim u vezi ka nekonvencionalnim servisima [7.72]. Klju ne tehni ke oblasti koje pokazuju poboljšanje u pogledu dobitka kod performanse su slede e [7.73], [7.74]:

Deoba podatka otpornih na greške, Kompenzacija pokreta kod bloka dimenzije 4 × 4.

Deoba podatka otpornih na greške podrazumeva kreaciju podataka koji su podeljeni,

zatim i slojevitu zaštitu strukture kodovanih podataka. Tu je i duža resinhronizacija kodne re i radi poboljšanja detekcije i smanjenja verovatno e pogrešne detekcije. U drugom slu aju koji se odnosi na konpenzaciju pokreta kod bloka dimenzija 4 × 4 obuhva eni su: memorije slike, alternacije kod optimizacije stepena ošte enja, alternacije za optimizaciju pokreta, novi tip filtera za deblokiranje, novi tip predikcije unutar oblasti slike,

111

Page 120: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

izvesne alternacije kod kodova promenljive dužine VLC kada se radi o transformacionim koeficijentima, vektori pokreta i oblik kodovanog bloka. H.26L standard U pozivu za predloge, standard H.26L trebalo je da posluži za vrlo male bitske brzine, za rad u realnom vremenu, malo kašnjenje pri kodovanju od kraja do kraja veze za razli ite izvore [7.75]. Omogu ena je softverska implementacija, naglašena je robustnost na greške (naro ito kod mobilnih mreža), a zastupljeni su i mehanizmi za kontrolu brzine rada. U odgovoru na poziv za predloge za standard H.26L procenjeni su kao korisni i uzeti u obzir slede i tehni ki predlozi [7.76]:

Modifikovana metoda na bazi predikcije/transformacije, Vektorska kvantizacija sa blok aproksimacijom koriste i kodnu knjigu ili kompenzaciju

pokreta iz prethodnog kadra, Filtriranje u kolu povratne sprege radi smanjenja bloking efekta, ugaonih ocrtavanja i

prstenastog šuma, Adaptivna skalarna kvantizacija koja koristi kodne knjige na nivou razli itom od nule, Video koder na bazi DCT uz koriš enje preure ivanja DCT koeficijenata, Gruba segmentacija sli na šemi koja koristi kompenzaciju pokreta, vektorsku

kvantizaciju i DCT, Deoba podataka primenom algoritma s preure ivanjem podataka, Video kodovanje koje koristi memoriju za više referentnih kadrova sli no predikciji sa

kompenzacijom pokreta. Iz napred izloženog, proizašlo je da je primarni cilj za standard H.26L što jednostavnije

video kodovanje uz postojanje što efikasnije kompresije. Uz to, u govornom domenu uveden je u mrežu paketski video (video-telefonija), kao i negovorne aplikacije (memorisanje, difuzija). H.26L ima video kodni sloj VCL koji omogu ava video prezentaciju sa velikom kompresijom, kao i umrežen sloj NAL za isporuku video sadržaja preko specijalne mreže. Sa H.26L VCL, postignuto je zna ajno poboljšanje u pogledu efikasnosti stepena ošte enja u pore enju sa drugim standardima. H.26L NAL je razvijen sa ciljem da se transportuje video kroz razli ite mreže kao što su to, na primer IP mreže i beži ni sistemi tre e generacije (eng. third generation – 3G). 7.10.2 Standardi za kodovanje govora ITU je standardizovao kodere za govor koji se primenjuju u multimedijalnim komunikacijama. ITU preporuke G.729 8 kbit/s konjugovana struktura-algebarski kod pobu ene linerane predikcije (eng. conjugate structure - algebraic code excited linear prediction – CS-ACELP) ima kašnjenje od 15 ms za kodek i pruža kvalitetan govor u mreži [7.77]. Namenjen je za primene u beži nim komunikacijama, ali i u multimedijalnim komunikacijam. ITU preporuka G.723.1 za govorni koder od 6.3 kbit/s i 5.3 kbit/s za multimedijalne komunikacije bio je namenjen za videofone sa malim bitskim protokom. U primenama gde je malo kašnjenje važno,

112

Page 121: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

kašnjenje za G.723.1 može biti suviše veliko. Me utim, ukoliko je kašnjenje prihvatljivo, G.723.1 pruža alternativu za G.729 sa manjom kompleksnoš u po cenu neznatnog pogoršanja kvaliteta. Veliki broj govornih kodera je standardizovan. Na primer, davno u periodu 1995–1996 pojavila su se tri me unarodna standarda (ITU G.729, G.729 A, i G.723.1) i tri regionalna standarda (koderi za evropske i severnoameri ke mobilne sisteme). Kvalitet govora koji proizvodi govorni koder zavisi od bitskog protoka, kompleksnosti, kašnjenja i širine propusnog opsega. Otuda, prilikom analize govornih kodera važno je uzeti u obzir sve te parametre. Bitno je naglasiti da postoji stroga uzajamna povezanost izme u njih. Dodatni faktori koji uti u na izbor govornog kodera su uslovi dostupnosti i specificiranja radi specificiranja standarda. Najve i broj govornih kodera radi sa fiksnim bitskim protokom bez obzira na ulazne karakteristike signala. S obzirom da multimedijalni govorni koderi dele kanal sa drugim oblicima podataka, bolje je odabrati koder sa promenljivim protokom. Kod prikaza standarda za govorne kodere, vodi se ra una o tome da se specificiraju izrazi za reference (eng. terms of reference – ToR) pri emu se tu imaju u vidu: bitski protok, kašnjenje, kompleksnost i kvalitet. Za G.729 standard jedan od ToR zahteva bio je da bi govorni koder trebalo da radi sa 8 kbit/s. Ovaj protok bio je izabran delimi no i zbog toga što je opseg prve generacije digitalnih celularnih standarda varirao od 6.7 kbit/s u Japanu, do 7.95 kbit/s u SAD, pa sve do 13 kbit/s u Evropi. Za G.723.1, ToR zahtevi bili su da bi govorni koder trebalo da radi sa protokom nižim od 9.6 bit/s. Za koder za digitalni simultani glas i podatke (eng. digital simultaneous voice and data – DSVD), ToR zahtevi za bitski protok izvedeni su na osnovu koli ine govornih podataka koje treba preneti modemom od 14.4 kbit/s. Kašnjenje predstavlja glavnu razliku izme u G.729 i G.723.1. ToR zahtev za kašnjenje za G.729, najpre za kodek u jednom pravcu bilo je 10 ms. Zatim je taj zahtev za kašnjenje sistema u jednom pravcu kod G.729 sveden na 35 ms. Glavna primena za G.723.1 je videofonija sa malim bitskim protokom koja se obavlja sa 5 kadrova/s ili mešto manje. Ovaj protok odgovara periodu video kodera od 200 ms. Kod kona ne verzije G.723.1, kašnjenje sistema u jednom pravcu iznosi 97.5 ms. G.723.1 je manje kompleksan od G.729. On se karakteriše sa 14.6 miliona instrukcija u sekundi (eng. millions of instructions per second – MIPS) pri bitskom protoku od 5.3 kbit/s i sa 16 MIPS-a pri bitskom protoku 6.3 kbit/s. Pri tome se koristi 2200 re i iz memorije sa slu ajnim pristupom (eng. radnom access memory – RAM). Zahtevi za upotrebom DSVD kodera bili su 10 MIPS-a, 2000 re i iz RAM memorije i 10 000 re i iz memorije sa o itavanjem (eng. read-only memory – ROM). Koderi govora predstavljeni na ovom mestu su sli ni. ini se da su G.723.1 i G.729A (DVD verzija od G.729) malo manje robusni na greške nastale usled šuma u pozadini i na uslove rada u tandemu. Njihova karakteristika za ist govor i opšta robusnost je dovoljna da ih ITU preporu i za primenu kod simultanog glasa i podataka kao što je to slu aj kod multimedijalnih komunikacija sa malim bitskim protokom. 7.10.3 Standardi za multimedijalno multipleksiranje i sinhronizaciju

Osnovni strimovi (eng. elementary streem – ES) kao što su video podaci, signali za kontrolu sinhronizacije video kadra i indikacije od kojih svaki može biti standardizovan,

113

Page 122: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

multipleksirani su u paketski strim prema preporuci H.222.0. H.222.1/H.222.0 funkcije obuhvataju multipleksiranje obnavljanja vremenske baze, sinhronizaciju medija, otklanjanje džitera, upravljanje baferom, kontrolu bezbednosti i pristupa, podkanalnu signalizaciju. Preporuka H.222.1 odre uje elemente i procedure za H.222.0 radi njihove primene u ATM okruženju a tako e specificira kodne ta ke i procedure za ITU-T definisane osnovne strimove [7.78]. Podkanalna signalizacija je proces na osnovu koje podkanal za audio, video i druge osnovne strimove ESs je uspostavljen izme u predaje i prijema H.222.1 entiteta. ITU-T preporuka H.221

Ova preporuka nosi naziv ’’Struktura kadra za 64 kbit/s do 1920 kbit/s kanal kod audio-vizuelnih teleservisa“ [7.79]. H.221 je namenski protokol koji se odnosi na multipleksiranje za H.320 terminale. Do 30 ISDN B kanala mogu biti združeni da bi se formirao superkanal sa bitskim protokom od n × 64 kbit/s. Kanali media za audio, video, i informacije o podacima su multipleksirani u superkanalu. Za audio i video informacije, H.221 ne daje bilo kakvu kontrolu greške, ali se zato kompletno oslanja na otpornost na greške pri kodovanju medija, što je omogu eno zbog prirode mreže tipa ISDN i malih vrednosti grešaka. Protokol nudi samo bitski orijentisan, nezašti eni transport servis od ta ke do ta ke. ITU-T preporuka H.223 Ova preporuka se zove ’’Multipleksiranje protokola za multimedijalne komunikacije sa malim bitskim protokom“ [7.80]. Tri razli ita tipa adaptacionih slojeva (eng. adaption layers – ALs) iz modela za povezivanje otvorenih sistema (eng. open system interconnection – OSI) su dostupni. Oni imaju razli ite karakteristike u pogledu verovatno e greške i kašnjenja. Adaptacioni slojevi su deo OSI referentnog modela. Podsetimo se da je OSI standard ISO koji služi za definisanje okvira primene protokola, hijerarhijski podeljenih na sedam slojeva (nivoa), radi ostvarivanja komunikacija izme u me usobno kooperativnih ure aja. Referentni OSI model za protokole sastoji se od skupa protokola hijerarhijski pore anih u sedam slojeva (nivoa). Ovaj model je definisan za komuniciranje dva ure aja pri zajedni kom radu. Kanali sa malim kašnjenjem dozvoljavaju ve e greške. AL 1 i AL 2 obavljaju razli ite zadatke. AL 3 služi za kodovani video. Video podaci smešteni su u male pakete promenljive dužine (oko 100 bajta (eng. byte), mada se mogu ugovoriti i ve e dimenzije paketa). 16-bitna cikli na provera suvišnosti (eng. cyclic redundancy check – CRC) za svaki paket omogu ava detekciju greške. Zaglavlje za svaki paket iznosi jedan do tri bajta plus informacije o kontroli greške za AL 3. Što se ti e AL 3, tu je uklju en optimalni retransmisioni protokol koji po neki put omogu ava retransmisiju izgubljenog ili ošte enog paketa. Retransmisija AL 3 vezana je za brzo pristizanje potvrda poruke što je znak da su paketi korektno prenešeni. ITU-T preporuka H.225 Preporuka H.225.0 opisuje na ine na koje audio, video podaci, i kontrola mogu biti združeni, kodovani, i paketizovani za transport izme u H.323 terminala u slu aju

114

Page 123: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

negarantovanog QoS ili izme u H.323 terminala i H.323 mrežnog prolaza koji može biti povezan sa H.320, H.324, ili H.310/321 terminalima u mrežama tipa NISDN, GSTN, ili BISDN respektivno. Ovaj mrežni prolaz kao i konfiguracija terminala i procedura opisani su u H.323 i H.225.0 protokolima i formatima u obliku poruke. Cilj H.225.0 komunikacije je izme u H.323 terminala i H.323 mrežnog prolaza po istoj mreži tipa LAN, pri emu se koristi isti transportni protokol. H.225 koristi transportni protokol u realnom vremenu kontrolni protokol u realnom vremenu (eng. real time transport protocol real time control protocol – RTP/RTCP) za paketizaciju strimova medija i sinhronizaciju mreža tipa LAN. Generalno govore i, H.225.0 treba da obezbedi na in za sinhronizaciju paketa kako bi se olakšale transportne procedure u LAN mrežama. H.225.0 ne traži da svi mediji i kontrola budu zajedno u jednom strimu koji se onda paketizuje. H.225 terminali šalju audio i video koriste i RTP protokol kroz nepouzdane kanale kako bi se minimiziralo kašnjenje. Poništavanje grešaka može se primeniti kako bi se prevazišao problem izgubljenih paketa; u opštem slu aju audio/video nisu prenešeni jer bi to dalo kao rezultat preterano veliko kašnjenje. H.225.0 terminali šalju i primaju audio i video po posebnim transportnim adresama koriste i posebne primere, kad RTP protokol dozvoljava za svaki medijum posebno QoS i kadar. Poseban slu aj za analizu je kada su audio i video paketi pomešani tako da ine jedinstveni kadar i kada su poslati na jednu adresu. Protokoli za zajedni ku kontrolu H.245 H.245 je tako struktiran da se definišu tri glavna odeljka: sintaksa, semantika, i procedure. Notacija ASN.1 se koristila za generisanje sintakse za poruke. Sekcija semantike definiše zna enje elemenata sintakse i obezbe uje sinteti ka ograni enja. Interakcija izme u razli itih entiteta protokola je samo kroz komunikaciju sa H.245 korisnikom. H.245 obezbe uje brojne razli ite servise korisnicima. Servisi se mogu koristiti na osnovu razli ite preporuke za terminale. Neki od ovih servisa su slede i:

Mogu nost razmene, Procedura logi ke signalizacije u kanalima, Signali kontrole i indikacije,

Mogu nost razmene zna i da, pre nego što multimedijalna komunikacija otpo ne,

terminal mora biti obavešten o sposobnosti drugog terminala da primi i dekoduje multimedijalne signale. Audio mogu nosti odre ene su na osnovu jedne od ITU-T G serija preporuka kao što su G.711, G.722, ili MPEG-1 ili MPEG-2 Audio. Što se ti e podataka koristi se serija preporuka T.120. Postoji i audio-vizuelno multipleksiranje. U tom slu aju primenjuje se preporuka H.221. Što se ti e procedure logi ke signalizacije u kanalima, terminalni resursi za kodovanje i dekodovanje koriste logi ku signalizaciju u kanalu. Logi ki broj kanala predstavlja odre eni kanal u sistemu multipleksa. Logi ki brojevi kanala su jedinstveni u svakom pravcu prenosa za specijalni poziv. Signali kontrole i indikacije povezuju da su poruke tako definisane da se prenose signali kontrole i indikacije definisani u H.221 i H.320. Poruke nose razli ite informacije uklju uju i održavanje u kolu povratne sprege, video/audio signale za brzi odgovor, zatim informaciju o komutaciji izvora za primene u više ta aka itd. Od po etka razvoja H.245 o ekivalo se da e to

115

Page 124: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

biti zna ajan dokument sa dodatnim osobinama koje se pridodaju povremeno, da bi se omogu ile nove preporuke za terminal ili da se obezbedi moderna funkcionalnost za ve postoje e preporuke za terminal. Otuda je sintaksa kod H.245 široka. To se postiže koriš enjem markera za proširenje u sintaksi kao i polja za identifikaciju protokola koje ozna ava upotrebljenu verziju H.245. Markeri za proširenje omogu avaju da se pridoda sintaksa na ranije dekoderske implementacije kod H.245, mogu da presko e dodatnu sintaksu, a da je i ne razumeju i da nastave normalno postupak dekodovanja [7.81]. Koristi e se polje identifikatora protokola da bi se nazna ile izmene u preporuci kao što su definicije novih procedura ili dodavanje nove sintakse koju mora da prepozna udaljeni terminal.

7.11 Rezime Standardi imaju veliku ulogu u multimedijalnim komunikacijama jer omogu avaju, pre svega, interoperabilnost izme u hardvera i softvera. Radi se o kompromisu izme u onoga što je teorijski omogu eno, sa jedne, i u tehnološkom smislu ostvarljivo, sa druge strane. Standardi mogu biti uspešni samo ukoliko su dobro izbalansirani kako u tehni kom tako i ekonomskom smislu. To je naro ito zna ajno u oblasti audio-video kodovanja gde postoji raznolikost u pogledu kodnih algoritama koji mogu biti vrlo kompleksni za implementiranje. Uspeh razli itih MPEG i ITU-T standarda zavisi od brojnih eleemenata. MPEG je vode e telo za standardizaciju u audio-vizuelnoj tehnologiji. MPEG-1 je namenjen za CD-ROM sa primenama pri bitskom protoku od oko 1.5 Mbit/s. Standard se pokazao korisnim kod kompjuterski generisanih multimedijalnih podata kada su širina propusnog opsega i kapacitet memorije ograni eni ili skupi. Standard MPEG-2 nemenjen je za visokokvalitetno kodovanje za sve digitalne multimedijalne prenose pri protocima od 2 Mbit/s do 50 Mbit/s. Prema ovom standardu može se proizvesti potreban kvalitet video signala sve do ku e i to za vrlo zahtevne potrebe nau nih primena i biznisa. Cilj i potencijal MPEG-4 standarda analiziran je u kontekstu audio-vizuelnih multimedijalnih komunikacionih okruženja. Pokazano je da ovaj standard pruža alatke i algoritme za kodovanje kako prirodnog tako i sinteti kog audia i videa. Od ne manjeg zna aja je svakako predstavljanje audio/vizuelnih podataka na korisni kim terminalima i to na jedan krajnje fleksibilan na in. Standard JPEG-2000 govori o stepenu ošte enja poruka, dok subjektivni kvalitet mirne slike treba da bude bolji od onog koji su u stanju da proizvedu do tada postoje i standardi. Cilj MPEG-7 procesa standardizacije je da olakša pretraživanje multimedijalnih podataka. Standard MPEG-21 pruža audio-vizuelnu prezentaciju u okviru multimedijalnih poruka. ITU-T proces standardizacije u multimedijalnim komunikacijama obuhvata pre svega video i govorno kodovanje, multipleksiranje i sinhronizaciju (H.32x, H.26x, H.22x). ITU-T preporuka H.261 optimizirana je u smislu primene za opremu koja se odnosi na interektivnu audio-vizuelnu komunikaciju tj. Videofon. U skladu sa H.320 serijom preporuka koristi se za protokole, multipleksiranje i kontrolu kod mreža tipa ISDN. Što se ti e H.263, to je prvi me unarodni standard za video kompresiju koji omogu ava video komunikaciju sa protokom ispod 64 Kb/s. Kada je 1996 godine standard kompletiran, postalo je o igledno da ga treba dogra ivati i poboljšati: ITU-T preporuka H.263 Verzija 2 (H.263+) je prvi me unarodni standard u oblasti video kodovanja koji je tako projektovan da podrži celokupan opseg mreže za komutaciju kanala i komutaciju paketa. H.263+ sadrži više novih karakteristika u oblasti video kodovanja u odnosu na H.263. To su poboljšane efikasnosti kompresije, podrška skalabilnim

116

Page 125: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

strimovima bita kao i razli itim video formatima, poboljšan kvalitet video prenosa, itd. Aktivnosti oko standarda H.26L sastojale su se u istraživanju naprednih kodnih tehnika koje se razlikuju od onih iz preporuke H.263.

Pitanja

1. Zašto se koriste algoritmi za video kodovanje? 2. Od ega zavisi pravilan izbor algoritama za video kodovanje?

Koja se ograni enja pojavljuju u postupku standardizacije mirnih slika i video signala?

3.

Kako se organizuju MPEG standardi? 4. Iz kojih se delova sastoji MPEG-1 standard? 5.

ime se karakteriše audio deo standarda MPEG-1? 6. 7. Šta karakteriše audio deo standarda MPEG-1? 8. Nacrtati blok-šemu arhitekture uproš enog MPEG-1 video kodera.

Koji je cilj MPEG-2 video standarda? 9. Koje razlike uvodi MPEG-2 standard u odnosu na MPEG-1 standard? 10.

11. Navesti tipove sistema strimova u standardu MPEG-2. Iz kojih se delova sastoji MPEG-2 standard? 12. Kako izgleda i ime se karakteriše video deo MPEG-2 standarda? 13.

emu služi audio deo kod MPEG-2 standarda? 14. ime se karakteriše MPEG-4 standard? 15.

16. Šta standard MPEG-4 nudi provajderima servisa, a šta korisnicima? Iz kojih se delova sastoji MPEG-4 standard? 17. Po kojim karakteristikama se razlikuje MPEG-4 vizuelni kodni standard od prethodnog standarda?

18.

Na koji na in vizuelni deo MPEG-4 standarda obezbe uje funkcije kodovanja? 19. 20. Šta je to alat, a šta profil kod MPEG-4 standarda? 21. Šta je to profil, a šta nivo na osnovu vizuelnog dela MPEG-4 standarda?

Koje vrste alata se koriste za kodovanje audija kod MPEG-4 standarda? 22. ime se karakterišu prirodni a ime sinteti ki alati kod kodovanja audija za MPEG-4? 23.

Gde se primenjuje standard H.264/AVC? 24. Koji su osnovni funkcionalni elementi standarda H.264/AVC? 25. Koja je uloga profila kod standarda H.264/AVC? 26.

27. Na koliko slojeva se bazira mrežna arhitektura kod H.264/AVC standarda? Koji su to slojevi? Koja je uloga mrežnog apstraktnog sloja kod standarda H.264/AVC? 28.

emu služi video kodni sloj kod standarda H.264/AVC? 29. 30. Objasniti ulogu svih tipova ise aka kod H.264/AVC standarda.

117

Page 126: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Kako izgleda blok-šema kodera za prenos i rekonstrukciju podataka kod standarda H.264/AVC?

31.

Nacrtati blok-šemu i objasniti princip rada dekodera kod standarada H.264/AVC. 32. Koja je uloga CABAC i CAVLC metoda kod H.264/AVC standarda? 33.

34. U emu i gde se ogleda primena H.264/AVC standarda u industriji? Koje su osnovne karakteristike i primene MPEG-4 VTC standarda? 35.

ime se karakteriše JPEG-LS standard? 36. 37. Šta je to pokretna mrežna grafika PNE i emu služi?

Koje su osnovne karakteristike standarda JPEG-2000? 38. 39. U emu se ogleda zna aj skalabilnog kodovanja mirnih slika?

Koji su najzna ajniji tipovi skalabilnosti i koje su njihove karakteristike? 40. Kako se kod JPEG standarda može poboljšati prenos komprimovanih slika? 41. Kakve su mogu nosti zaštite intelektualne svojine kod JPEG-2000 standarda? 42. Nacrtati blok šemu arhitekture kodera i dekodera za JPEG-2000 standard. 43. Koje su okolnosti uticale na pojavu MPEG-7 standarda? 44. Koji su osnovni tipovi alata kod standarda MPEG-7? 45. Iz kojih se delova sastoji MPEG-7 standard? 46.

47. Navesti klase alata za multimedijalnu deskripciju kod standarda MPEG-7. Koji su bili ciljevi u ranoj fazi razvoja MPEG-21 standarda? 48.

49. U emu se ogleda osnovni koncept razvoja MPEG-21 standarda? Koji su to elementi vezani za arhitekturu koji olakšavaju transakcije izme u korisnika kod standarda MPEG-21?

50.

ime se karakteriše proces ITU-T standardizacije i zašto su ove standardizacije uvedene?

51.

Koje su osnovne karakteristike standarda H.320? 52. Šta je rešilo uvo enje preporuka H.310 u multimedijalne komunikacije? 53. Zašto je uvedena preporuka H. 321 u multimedijalne komunikacije? 54. Šta je uticalo na pojavu standarda H.323? 55. Iz kojih se elemenata sastoji zona H.323 standarda? 56. Koje su prednosti i nedostaci sistema koji koriste H.324 standard? 57. Koje su osnovne karakteristike standarda H.261? 58. Gde se primenjuje standard H.261? 59. Kako se definišu blok, makroblok, i grupa blokova kod standarda H.261? 60. Iz kojih se elemenata sastoje blok-šeme video kodera i video dekodera u standardu H.261? Nacrtati odgovaraju e blok-šeme.

61.

62. U emu se razlikuje standard H.263 od standarda H.261? Koje novine unosi standard H.263+ (H.263 verzija 2) u odnosu na H.263? 63. Šta se postiže uvo enjem verzije standarda H.263++? 64. Koji su osnovni ciljevi standarda H.26L? 65.

118

Page 127: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

66. Od ega zavisi kvalitet govora koji proizvodi govorni koder? Šta su to referentni zahtevi kod standarda za govorne kodere? 67. Kako su formirani referentni zahtevi za bitski protok kod digitalnog simultanog kodera za glas i podatke?

68.

69. U emu se razlikuju standardi G.729 i G.723.1? emu služi preporuka H.222.0? 70.

71. Šta predstavlja preporuka H.221? ime se karakteriše preporuka H.223? 72.

Koji je zadatak preporuke H.225.0? 73. 74. Koja je funkcija H.225.0, a koja H.225 terminala?

Iz kojih se odeljaka sastoji protokol za zajedni ku kontrolu H.245? 75. Koje najvažnije servise obezbe uje protokol H.245? 76. Zašto se koristi polje identifikatora protokola kod H.245? 77.

Literatura [7.1] I. E. G. Richardson, H.264 and MPEG-4 Video Compression. Video Coding for Next-

generation Multimedia. Chichester, England, UK: John Wiley and Sons, 2003. [7.2] K. R. Rao, Z. S. Bojkovi , and D. A. Milovanovi , Multimedia Communication

Systems: Techniques, Standards and Networks. Prentice Hall, 2002. [7.3] Coding of Moving Pictures and Associated Audio at up to About 1,5 Mbit/s, ISO/IEC

11172:1991. [7.4] Information Tehnology-Generic Coding of Moving Pictures and Associated Audio

Information: Systems, ISO/IEC 13818-1:1996. A. Puri, “Video coding using the MPEG-2 compression standard,” Proc. SPIE Visual Commun. Image Processing, pp. 1701-1713, Nov. 1993.

[7.5]

B. Heskell, A. Puri, and A. Netraveli, Digital Video: An Introduction to MPEG-2. Chapman and Hall, 1997.

[7.6]

[7.7] B. L. Tseng and D. Anastassiou, “Multiviewpoint video coding with MPEG-2 compatibility,” IEEE Trans. Circuits Syst. Video Technol., vol. 6, pp. 414–419, Aug. 1996.

[7.8] T. Homma, “MPEG Contribution 95/N0861: Report of the Ad Hoc Group on MPEG-2 Applications for Multi-Viewpoint Pictures,” Mar. 1995.

[7.9] J. Ni, T. Yang, and D. H. K. Tsang, “CBR transportation of VBR MPEG-2 video traffic for video-on-demand in ATM Networks,” in IEEE Int. Conf. Communications, Dallas, TX, Jun. 1996, pp. 1391–1395. M. Orzessek and P. Sommer, ATM and MPEG-2 Integration of Digital Video Into Broadband Networks. Upper Saddle River, NJ: Prentice Hall, PTR, 1998.

[7.10]

[7.11] D. Milovanovi , V. Jovanovi , and Z. Bojkovi , “MPEG-2 sensitivity to date loss and effects of different packet loss patterns,” WSEAS Trans. on Commun., vol. 3, pp.777–

119

Page 128: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

782, Apr. 2004. K. R. Rao and Z. S. Bojkovi , Packet Video Communications Over ATM Networks. Prentice Hall, 2000.

[7.12]

[7.13] Z. Bojkovi , “Multimedia communication systems: Modeling, standardization, requirements,” in Proc. ICOMPT’96 Int. Conf. Multimedia Technology and Digital Telecommunication Services, Budapest, Hungary, Oct. 1996, pp. 5–13.

[7.14] Z. Kruševac and Z. Bojkovi , “SNR in MPEG video compression standard for optimum bit allocation,” in 7th IEEE Singapore Int. Conf. Communication Systems ICCS 2000, Singapore, Nov. 2000. Coding of Audio-Visual Objects, ISO/IEC 14496:1999. [7.15] F. Pereira, T. Ebrahimi, The MPEG-4 Book. Prentice Hall, 2002. [7.16] MPEG-4 Overview - (V.18-Singapore Version), ISO/IEC JTC1/SC29/WG11 N4030, Mar. 2001.

[7.17]

F. Pereira, “MPEG-4: why, what, how and when?” Signal Process.: Image Commun., vol.15, pp.271–279, Jan. 2000.

[7.18]

[7.19] Z. S. Bojkovi and D. A. Milovanovi , “Audiovisual integration in multimedia communications based on MPEG-4 facial animation,” Circuits Systems Signal Processing, vol. 20, no. 3, pp. 311–339, 2001.

[7.20] Z. Bojkovi and B. Bakmaz, “A Survey on MPEG-4 standard and digital television deployment“, WSEAS Transactions on Communications, vol. 9, pr. 33–42, Jan. 2010.

[7.21] Z. Bojkovi , “MPEG-4 video standardization process,” in Proc. ICOMPT’ 97, 2nd Int. Conf. Multimedia Technology and Digital Telecommunication Services, Invited paper, Budapest, Hungary, Oct. 1997, pp. 1–10.

[7.22] S. G. Chao, Z. Bojkovi , D. Milovanovi , J. Lee, and J. J. Hwang, “Image quality evaluation: JPEG 2000 versus intra only H.264/AVC high profile,” Facta Universitatis, Nis, Series: Electronics and Energetics, vol.20, no.1, pp. 71–81, Apr. 2007. Information Technology-Coding of Audio-Visual Objects-Part2: Visual, ISO/IEC 14496-2, Amd 1: 2001.

[7.23]

[7.24] Z. Bojkovi , “Analysis of output signal-to-noise ratio in hybrid DCT/DPCM image coding system,” in Proc. EUSIPCO’88, Grenoble, France, pp. 1661–1664. Information technology-Coding of audio-visual objects-Part 2: Visual, ISO/IEC 14496-2:2001, Part 3: Audio, ISO/IEC 14496-3:2001.

[7.25]

[7.26] J. Dimkovi , D. Milovanovi , and Z. Bojkovi , “Fast software implementation of MPEG advanced audio coder,” in Proc. IEEE/EURASIP Int. Conf. DSP, Santorini, Greece, 2002.

[7.27] D. Milovanovi , J. Dimkovi , and Z. Bojkovi , “MPEG-4 audio/video komunikacija: Optimizacija implementacije i modeli licenciranja,” X Telekomunikacioni Forum TELFOR 2002, Zbornik radova, Beograd, str. 669-672.

[7.28] P. K. Doenges at al., “MPEG-4 audio/video and synthetic graphics/audio for mixed media,” Signal Process.: Image Commun., vol. 9, pp. 433–463, May 1997. S. R. Quackenbush, “Coding of natural audio in MPEG-4,” in Proc. IEEE Int. Conf. Acoustics, Speech and Signal Processing, Seattle, WA, May 1998, pp. 3797–3800.

[7.29]

120

Page 129: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

E. D. Sheirer, “The MPEG-4 structured audio standard,” in Proc. IEEE Int. Conf. Acoustics, Speech and Signal Processing, Seattle, WA, May 1998, pp. 3801–3804.

[7.30]

[7.31] E. D. Sheirer, Y. Lee, and J. W. Yang, “Synthetic audio and SNHC audio in MPEG-4,” in Advances in Multimedia: Systems, Standards and Networks, A. Puri and T. Chen, Eds. New York, NY: Marcel Dekker, 1999.

[7.32] N. Jayant, J. Johnston, and R. Safranek, “Signal compression based on models of human perception,” Proc. IEEE, vol. 81, pp. 1385–1422, Oct. 1993. M. Bosi et al., “ISO/IEC MPEG-2 advanced audio coding,” J. Audio Eng. Soc., vol. 45, pp. 789–814, Oct. 1997.

[7.33]

[7.34] E. D. Scheirer and B. L. Vercoe, “SAOL: The MPEG-4 structured audio orchestra language,” Comput. Music J., vol. 23, pp. 35–51, Feb. 1999.

[7.35] B. L. Vercoe, W. G. Gardner, and E. D. Scheirer, “Structured audio: The creation, transmission, and rendering of parametric sound representations,” Proc. IEEE, vol. 85, pp. 922–940, May 1998.

[7.36] A. Puri, H. Chen, and A. Luthra, “Video coding using H.264/MPEG-4 AVC compression standard,” Signal Process.: Image Commun., vol.19, no. 9, pp. 793–846, Oct. 2004.

[7.37] Z. Bojkovi and Z. Mili evi , “Wireless multimedia networking standards: WLAN, WPAN, WMAN,” Seminar in Signal Procesing/Communications, Electrical Engineering Faculty, University of Texas at Arlington, UTA, Texas, USA, Apr. 2006. K. R. Rao, Z. S. Bojkovi , and D. A. Milovanovi , Introduction to Multimedia Communications: Applications, Middleware, Networking. Wiley, 2006.

[7.38]

[7.39] T. Weigand, G. J. Sullivan, G. Bjontegaard, and A. Luhtra, “Overview of the H.264/AVC video coding standard,” IEEE Trans. Circuits Syst. Video Technol., vol. 13, pp. 560–576, Jul. 2003.

[7.40] S. Kwon, A. Tamhankar, and K. R. Rao, “Overview of H.264/MPEG-4 Part 10,” Journal of Visual Communication and Image Representation, vol. 17, no. 2, pp. 186–216, Apr. 2006.

[7.41] J. Ribas-Corbera, P. A. Chou, and S. L. Regunathan, “A generalized hypothetical reference decoder for H.264/AVC,” IEEE Trans. Circuits Syst. Video Technol., vol. 13, pp. 674–687, Jul. 2003.

[7.42] D. Marpe, H. Schwarz, and T. Wiegand, “Contest-based adaptive binary arithmetic coding in the H.264/AVC video compression standard,” IEEE Trans. Circuits Syst. Video Technol., vol. 13, pp. 620–636, Jul. 2003.

[7.43] D. Marpe, T. Wiegand, and G. J. Sullivan, “The H.264/MPEG-4 advanced video coding standard and its applications,” IEEE Commun. Mag., vol. 44, no. 8, pp. 134–144, Aug. 2006.

[7.44] Z. Mili evi and Z. Bojkovi , “Kvalittet servisa u IP mrežama, parametri i protokoli,” XLVII konferencija ETPAN, Zbornik radova, Sveska II, Herceg Novi, 8–13 juni 2003. S. Wenger, “H.264/AVC over IP,” IEEE Trans. Circuits Syst. Video Technol., vol. 13, pp. 645–656, Jul. 2003.

[7.45]

K. R. Rao and P. Yip, Discrete Cosine Transform: Algorithms, Advantages, Applications. New York, NY: Academic Press, 1990.

[7.46]

121

Page 130: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

W. B. Pennebaker and J. L. Mitchell, JPEG:Still Image Data Compression Standard. New York, NY: Van Nostrand Reinhold, 1993.

[7.47]

[7.48] D. Santa Cruz and T. Ebrahimi, ”An analytical study of JPEG 2000 functionalities,” in Proc. IEEE Int. Conf. Image Processing ICIP, vol. 2, Vancouver, Canada, Sept. 2000, pp. 49–52.

[7.49] D. Nister and C. Christopoulos, “Lossless region of interest with embedded wavelet image coding,” Signal Process., vol. 78, pp. 1–17, Jan. 1999. Multimedia Content Description Interface, ISO/IEC 15938:2002. [7.50] F. Pereira and R. Koenen, “MPEG: Context, goals and working methodologies,”in The MPEG-21 Book, I. S. Burnett et al., Eds. John Wiley and Sons, 2006, pp. 1–30.

[7.51]

[7.52] Z. Bojkovi and B. Bakmaz, “MPEG-21 standardization process: Organization and rate distortion modeling for network adaptation“, in Latest Trends on Communications, N. Mastorakis, V. Mladenov, and Z. Bojkovi , Eds. 14th WSEAS Int. Conf. Communications, Corfu, Greece, Jul. 2010, pp. 103–108.

[7.53] L. Chiariglione, K. Hill, and R. Koenen, “Introduction to MPEG-21,” in “Open workshop on MPEG-21-Multimedia Framework,” in Doc. ISO/MPEG M5707, MPEG Noordwijkerhout Meeting, The Netherlands, Mar. 2000.

[7.54] Information Technology-Multimedia Framework (MPEG-21)-Part1: Vision, Technologies and Strategy, ISO/IEC TR 21000-1:2004.

[7.55] Information and documentation-International Standard Book Number (ISBN), ISO 2108: 2005.

[7.56] Information and Documentation-International Standard Recording Code (ISRC), ISO 3901:2005.

[7.57] Information and Documentation-International Standard Musical Work Code (ISWC), ISO 15707:2001.

[7.58] MPEG Multimedia Description Schemes (MDS). “FCD MPEG-21 IPMP Components, ISO/MPEG N7196,” 72nd MPEG Meeting, Busan, Korea, Apr. 2005. Information Technology-Multimedia Framework (MPEG-21)-Part 7: Digital Item Adaptation, ISO/IEC TR 21000-7:2004.

[7.59]

[7.60] K. Asatani and S. Nogami, “Trends in the standardization of telecommunications on GII, multimedia and other network technologies and services,” IEEE Commun. Mag., vol. 34, pp. 32–44, Jun. 1996.

[7.61] M. H. Willebeek-LeMair and Z. Y. Shae, “Videoconferencing over packet-based networks,” IEEE J. Sel. Areas Commun., vol.15, pp. 1101–1114, Aug. 1997. Adaptation of H.320 Visual Telephone Terminals to B-ISDN Environments, ITU-T Recommendation H.321 (03/1996).

[7.62]

Broadband Audiovisual Communication Systems and Terminals, ITU-T Recommendation H.310 (11/1995).

[7.63]

Control Protocol for Multimedia Communication, ITU-T Recommendation H.245 (03/1996).

[7.64]

Procedures for the Simultaneous Transmission of Data and Digitally Encoded Voice Signals Over the General Switched Telephone Network (GSTN), or Over 2-Wire Leased Point-to-Point Telephone Type Circuits, ITU-T Recommendation V.70 (08/1996).

[7.65]

122

Page 131: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Terminal for Low Bitrate Multimedia Communication, ITU-T Recommendation H.324 (03/1996).

[7.66]

S. Wenger et al., “Error resilience support in H.263+,” IEEE Trans. Circuits Syst. Video Technol., vol. 8, pp. 867–877, Nov. 1998.

[7.67]

Video Codec for Audiovisual Services at p x 64 kbit/s, ITU-T Recommendation H.261 (03/93).

[7.68]

A. N. Netravali and J. D. Robbins, “Motion-compensated television coding: Part I,” Bell Syst. Tech. J., vol. 58, pp. 629–668, Mar. 1979.

[7.69]

H.263+ Video Coding for Low Bitrate Communication, Draft ITU-T Recommendation H.263 Version 2, Sept. 1997.

[7.70]

[7.71] T. Chen, C. T. Swain, and B. G. Haskell, “Coding of subregions for content-based scalable video,” IEEE Trans. Circuits Syst. Video Technol., vol. 7, pp. 256–260, Feb. 1997.

[7.72] ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15F09, Report of the Ad Hoc Committee H.263++ Development, Seoul, Korea, Nov. 1998.

[7.73] ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15D62, Recommended Simulation Conditions for H.263 v3, Tampere, Finland, Apr. 1998.

[7.74] ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15D65, Video Codec Test Model, Near-Term, Version 10 (TMN10), Draft 1, Tampere, Finland, Apr. 1998.

[7.75] ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15F10, Report of the Ad Hoc Committee H.26L development, Seoul, Korea, Nov. 1998.

[7.76] ITU-T, Study Group 16, Video Coding Experts Group (Question 15), Doc. Q15D62, call for proposals for H.26L Video coding, Geneva, Switzerland, Jan. 1998.

[7.77] R. V. Cox and P. Kroon, “Low bit-rate speech coders for multimedia communications,” IEEE Commun. Mag., vol. 34, pp. 34–41, Dec. 1996. Mulimedia Multiplex and Synchronization for Audiovisual Communication in ATM Environment, ITU-T Recommendation H.222.1 (03/96).

[7.78]

Frame Structure for a 64 to1920 kbit/s Channel in Audiovisual Teleservices, ITU-T Recommendation H.221 (07/97).

[7.79]

Multiplexing Protocol for Low Bit Rate Multimedia Communication, ITU-T Recommendation H.223 (03/1996).

[7.80]

Information Technology-Abstract Syntax Notation One (ASN.1)-Specification of Basic Notation, ITU-T Recommendation X.680 (07/1994).

[7.81]

123

Page 132: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

8. APLIKATIVNI ASPEKT MULTIMEDIJA

Aplikativni aspekt multimedija obuhvata prakti na znanja, postupke i resurse koji se koriste u procesu multimedijalnog stvaralaštva.

Multimedijalnim stvaralaštvom, u najširem smislu, mogu se ozna iti sve kreacije stvorene za više ulnu percepciju oveka. Koreni multimedija mogu se tražiti ve u ranoj fazi razvoja ljudskih zajednica sa pojavom prvih oblika ulnih komunikacija. Prvobitne me uljudske komunikacije, kao i komunikacije izme u životinja, audio-vizuelne su, što zna i da su se zasnivale na percepciji zvuka i slike.

Slika koja deluje na ulo vida predstavlja ulazni signal za video percepciju. Zvuk koji deluje na ulo sluha predstavlja ulazni signal za ujnu percepciju. U razvoju komunikacija izme u ljudi, kao i izme u ljudi i životinja, zvuk je imao zna ajniju ulogu od slike. Komunikacija pomo u zvuka može se ostvariti u odsustvu svetlosti, kada nema slike, što je za evolucioni opstanak vrsta izuzetno zna ajno. Za oveka, zvuk je zna ajan, jer je modulisanjem i kodovanjem zvu nih signala formiran govorni jezik za sporazumevanje. Govor oveka uzdiže na viši oblik komunikacija u odnosu na životinjski. Logika i proces mišljenja zasnovani su na re ima i jeziku. Razvojem govornog jezika razvija se proces ljudskog mišljenja. Govor i govorna komunikacija opstaju kao dominantan oblik komunikacije. Tokom razvoja civilizacije razvijali su se, pored govornih, i drugi oblici komunikacije me u ljudima. Govor i u najrazvijenim državama, kao i u nerazvijenim društvenim zajednicama i nepismenom delu stanovništva, ostaje najzna ajniji na in komunikacije.

Pojava pisma doprinela je ubrzanom razvoju ljudske civilizacije. Pismom se memoriše govorni jezik. Razvoj pisanog jezika omogu io je da se ste eno znanje generacijski uva, dopunjuje i integriše. Pismo predstavlja simboli an prikaz govornog jezika. Elementi govornog jezika glasovi – fonemi, re i i re enice, koduju se pomo u vidljivih simbola zapisanih na vrstoj podlozi. Predstavljanje govornog jezika pomo u pisma, ostvareno pre više milenijuma, ekonomi an je na in izražavanja veoma pogodan za memorisanje, obradu i prenos pomo u savremenih informaciono-komunikacionih ure aja i sistema. Duže od jednog veka govorni jezik memoriše se i reprodukuje u prirodnom obliku, što predstavlja izvanrednu pogodnost za nepismene i konfor za pismene. Iako je za generacijski prenos znanja pisani jezik teorijski prestao da bude jedina mogu nost, ne sagledava se kraj koriš enja pisma. Savremeno pismo ima višestruku informacionu i dizajnersku funkciju. Poslednje ubrzavanje civilizacijskog razvoja ostvaruje se razvojem programiranja i primenom programabilnih sistema. Programiranjem se regulišu procesi, upravlja doga ajima u sadašnjem i budu em trenutku. U sofisticirane ure aje ugra uje se sve više znanja i na taj na in

124

Page 133: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

im se prepušta vo enje složenih procesa koji su ranije zavisili od oveka. Razvojem programiranja ostvarena je mogu nost interakcije oveka i mašina.

Razvoj sofisticiranih informaciono-komunikacionih ura aja i sistema omogu io je da se integrišu slika, zvuk i tekst što je ozna eno kao multimedija. Multimedija, o kojoj su posve ena prethodna poglavlja ove knjige, uklju uje sva pomenuta saznajna dostignu a koja se odnose na zapisivanje, obradu, i prikazivanje audio-vizuelnih sadržaja.

Sa multimedijom se uvodi pojam virtuelnog sveta i virtuelne stvarnosti. Formiran je, tako e, pojam fizi ka realnost i virtuelna realnost.

Virtuelnost je pojam kojim se ozna ava nešto što nije a prikazuje se kao da jeste. Primer za virtuelnost su ceremonijali koji prikazuje englesku kraljicu kao da ima apsolutnu vlast, iako ona nema stvarnu vlast. U demokratskim monarhijama, za vlast kraljeva kaže se da je protokolarna, odnosno virtuelna. Protokoli posebne vrste koriste se i u multimedijalnim sistemima na kojima se prikazuje virtuelna stvarnost.

Pomo u multimedijalnih tehnologija umetnici kreiraju nove imaginarne svetove, pokušavaju i da što više budu originalni, razli iti od poznatog realnog sveta. Da bi se imaginarni svetovi predstavili oveku, dizajniraju se prema mogu nostima ulne percepcije. To zna i da se u prezentaciju imaginarnog sveta ugra uju zakonitosti fizi kog sveta, jer su ula na njih adaptirana. Imaginarni svetovi na taj na in postaju virtuelni. Virtuelni svet kreira se pomo u signala slike i zvuka, a u novije vreme uklju uju se i ure aji za generisanje signala mirisa. Najve i stepen virtualizacije ostvaruje se u multimedijalnim prezentacijama u koje je uprogramirana mogu nost interakcije sa korisnikom.

Virtuelna, kao i realna stvarnost prezentira se ove ijim ulima u prostorno-vremenskim koordinatama. U prostoru i vremenu ispoljava se sve ono što sadrži fizi ki svet. Virtuelni svet i virtuelna realnost, koji se kreira pomo u multimedijalnih tehnologija, kao i fizi ki svet i fizi ka realnost, tako e se neizbežno prikazuju u prostoru i vremenu.

Prostor i vreme su fizi ke veli ine koje imaju presudnu ulogu u svim fazama realizacije multimedijalnog projekta.

Angažovani multimedijalni resursi definišu se na osnovu prostornih i vremenskih parametara informacionih sadržaja multimedijalnog proizvoda.

Prostorni domen informacionih sadržaja odre uje potrebnu veli inu, odnosno kapacitet memorijskih resursa.

Vremenski domen informacionih sadržaja odre uje zahtevanu propusnu mo , odnosno kapacitet prenosnih resursa komunikacionog sistema.

Alati za multimedijalnu produkciju kojima se obra uju informacioni sadržaji u prostornom i vremenskom domenu isprogramirani su na osnovama analiti ke geometrije i Fourier-ovih transformacija. Prostorne i vremenske koordinate signala me usobno se povezuju i transformišu u cilju obrade i prenosa vizuelnih sadržaja. Tako se prenos 2D slike kroz 1D kanal ostvaruje zahvaljuju i prostorno-vremenskoj transformaciji. Slika, kao 2D raspodela svetlosti, tretira se kao skup piksela koji se mogu sukcesivno preneti kroz 1D kanal i na odredištu rasporediti u 2D prostor na osnovu vremenskog redosleda pristizanja.

125

Page 134: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

8.1 Aplikativni aspekt onovnih informaciono-komunikacionih pojmova

U ovom poglavlju multimedija se razmatra sa aplikativnog aspekta. itaoce koje

multimedija interesuje samo sa aplikativnog aspekta korisno je podsetiti na pojednostavljene definicije osnovnih pojmova u oblasti multimedija. Medij, re starogr kog porekla koristi se da ozna i sredinu, prostor, ili sredstvo za prenos, memorisanje i prezentaciju informacija.

Multimedija, što bukvalno zna i mnogo sredina, sadrži pojmovnu suvišnost jer je medija množina od medij, a po inje da se koristi sedamdesetih godina prošlog veka u razli itim kontekstima da bi se devedesetih godina preciznije definisala. Multimedija, prema standardu ISO/IEC JTC1 SC29/WG12, kako je ve navedeno na po etku ove knjige, predstavlja sposobnost postupanja sa razli itim vidovima prezentacionih medija koji ine tip podataka sa zadatkom da definišu prirodu informacije u njenom kodiranom formatu.

Navedena definicija najkompetentnijih asocijacija za multimediju je uopštena i strogo egzaktna. Iako se sa nau nog aspekta ne može dati primedba, data definicija je, zbog apstraktnosti, suviše neprikladna za širu upotrebu.

Za prakti are zadovoljavaju e je koristiti jednostavniju definiciju. Multimedija, sa aplikativnog aspekta, predstavlja informaciono-komunikacioni proizvod

ra unarskih tehnologija koji pomo u integrisanih hardverskih i softverskih ure aja prikazuju pojave za ulo vida, sluha, i dodira, u novije vreme i za ulo mirisa. Multimedijalni proizvod predstavlja sintezu slika, teksta, animacije, zvuka, taktilnih elementa, u novije vreme i mirisa. Multimedija pojmovno obuhvata razli ite medije, informacione sadržaje, i interaktivnost.

Interaktivna multimedija podrazumeva postojanje interakcije sa korisnikom. Savremeni multimedijalni proizvodi su, po pravilu, interaktivni, pa se pod pojmom multimedija interaktivnost ve podrazumeva, i pridev interaktivna izostavlja.

Hipermedija je interaktivna multimedija sa linkovima za navo enje korisnika. U savremenom društvu miltimedija postaje nova pismenost i opšti na in izražavanja. Multimedija se koristi u marketingu, obrazovanju, zabavi, medicini i poslovanju. Skoro

da nema delatnosti gde multimedija ne nalazi primenu. Proces realizacije multimedijalnih proizvoda definišu: namena, sadržaj, raspoložive

tehnologije i koriš eni mediji. Namena multimedijalnog proizvoda definisana je funkcijom koju proizvod treba da

ostvari da bi se ulaganja u njegovu realizaciju isplatila. Sadržaj se odre uje prema nameni, i prema raspoloživim tehnologijama i koriš enim

medijima. Koje e se raspoložive tehnologije i mediji koristiti zavisi od namene proizvoda i izdvojenog budžeta.

Prema funkciji, mediji se klasifikuju na: memorijske, prenosne i prezentacione. Memorijski medij je fizi ko sredstvo za skladištenje informacija, kao što su:

poluprovodni ke, magnetne i opti ke memorije. Osnovni parametri koji karakterišu memorijske medije su: kapacitet memorije, vreme

pristupa i fizi ki gabariti. Prenosni medij je sredina ili sredstvo za prenos signala kao što su: bakarni provodnici,

staklena vlakna i slobodan prostor.

126

Page 135: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Osnovni parametri kojim se karakterišu prenosni mediji su: podužno slabljenje i prenosni kapacitet.

Prezentacioni medij je fizi ko sredstvo ili ure aj pomo u koga se informacije predstavljaju korisniku, kao što su ure aji sa ekranima za prikazivanje slike i ure aji sa zvu nicima za generisanje zvuka.

Medij za prikazivanje slike karakterišu parametri za rezoluciju, kontrast i osvetljaj slike. Medij za generisanje zvuka karakteriše dinami ki i frekvencijski opseg audio poja ava a

i zvu nika. Kroz medij cirkuliše energija, materija i informacija. Komunikacije se zasnivaju na

razmeni informacija. U informaciono-komunikacionim tehnologijama, od interesa je informacioni aspekt koriš enja medija.

Osnovni informaciono-komunikacioni pojmovi su: informacija, poruka, podatak, komunikacija, signal i kodovanje.

Informacija predstavlja skup poruka. Poruka predstvalja skup podataka. Podatak predstavlja karakteristiku elementa, sistema, ili procesa. Komunikacija predstavlja proces prenošenja informacija. Prenošenje informacija se ostvaruje pomo u signala. Signal je materijalizovani nosilac informacija.

Po obliku razlikuju se analogni i digitalni signali. Analogni signali nastaju kao neposredan odraz procesa koji generišu fizi ki fenomeni i na prijemu donose informacije u istom obliku kako ih fizi ki fenomeni, iji su odraz, generišu. Primeri analognih signala su zvu ni i svetlosni talasi, odnosno zvuci koje slušamo i slike koje gledamo. ove ija ula predstavljaju prijemnike za analogne signale slike, zvuka, dodira, mirisa i ukusa. Digitalni signali nastaju u procesu kodovanja i prenose informacije pomo u simbola odre enog kodnog sistema. Kodovanje je postupak simboli nog šifrovanog predstavljanja informacija pomo u elemenata odre enog brojnog sistema ili azbuke odre enog jezika. Za memorisanje, obradu, prenos i koriš enje digitalnih signala koriste se sofisticirani ure aji i sistemi. Signali se karakterišu dinami kim, frekvencijskim i vremenskim domenom. Dinami ki domen signala koristi se za predstavljanje snage, odnosno intenziteta signala. Za obradu i prenos signala zna ajan je raspon ili odnos maksimalnog i minimalnog intenziteta signala što se ozna ava kao dinamika signala. Od dinamike signala zavisi sa koliko bita, osnovnih informacionih jedinica, analogni signal se koduje i prevodi u digitalni oblik. Frekvencijski domen koristi se za predstavljanje brzine promena signala. Za obradu, memorisanje i prenos signala zna ajna je maksimalna brzina promene, odnosno maksimalna u estanost – frekvencija signala. Pove anjem maksimalne u estanosti rastu i zahtevi u pogledu potrebnih resursa za obradu, memorisanje, i prenos signala. Vremenski domen koristi se za predstavljanje brzine promena, trajanja pojedinih intervala, i ukupno trajanje signala. Brzine promena povezane su sa spektrom signala, odnosno frekvencijskim domenom. Trajanja pojedinih intervala i ukupno trajanje signala odre uje zauzetost procesorskih, memorijskih i prenosnih resursa.

127

Page 136: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Pomo u multimedijalnih tehnologija obra uju se pojedina no i/ili objedinjuju podaci koji se odnose na tekst, zvuk i sliku. Od podataka se formiraju signali za potrebe memorisanja, prenošenja ili prikazivanja multimedijalnih informacija. Signali sa tekstualnim, zvu nim i slikovnim sadržajima razlikuju se po koli ini informacija, odnosno brzini prenošenja. Najmanje memorije zauzimaju i najbrže se prenose signali sa tekstualnim sadržajem. Najviše memorije zauzimaju i najsporije se prenose video signali, odnosno signali koji nose informacije o pokretnim slikama. Signali zvuka predstavljaju talasni prenos oscilacija kroz materijalnu sredinu i imaju u osnovnom opsegu spektar širine 20 kHz i dinami ki opseg od preko 100 dB. Kod prevo enja zvu nog signala u elektronski analogni ekvivalent koji se zovu audio signali potrebni su veliki kapaciteti memorija i prenosnih kanala. Za prevo enje analognih u digitalne signale potrebno je još više kapaciteta. Signali pokretnih slika, odnosno njihovi elektri ni ekvivalenti koji se naj eš e nazivaju video signali, imaju u osnovnom opsegu spektar širine od 5 MHz i dinami ki opseg od 50 dB, zbog ega je i za njih, kod prevo enja u digitalni oblik, potrebna velika memorija i velike brzine prenosa. Za ekonomi no memorisanje i prenos audio i video signala razvijeni su postupci kompresije pomo u kojih se smanjuje koli ina podataka koja reprezentuje signale. Prenos i memorisanje digitalnih audio i video signala bez kompresije bili bi izuzetno zahtevni i mnoge komunikacije prakti no neostvarljive. Procesom kompresije omogu ava se memorisanje i prenos digitalnih audio i video signala sa višestruko manjim memorijskim i prenosnim resursima. Postupci kompresije su dugo godina razvijani i usavršavani da bi se na kraju optimalne varijante kompresije usvojile u formi standarda. Usvojeni su standardi za kompresiju mirne slike, kompresiju audio signala i za kompresiju video signala. Kompresioni postupci mogu biti reverzibilni – bez gubitaka, i nereverzibilni – sa gubicima. Za prezentaciju kod krajnjeg korisnika neophodno je postupcima dekompresije vratiti signal u prirodni oblik. Dekompresovani signal, zavisno od toga da li je kompresija reverzibilna ili nereverzibilna, može biti potpuno veran originalu, ili unekoliko degradiran zbog gubitka odre enog procenta informacionog sadržaja. Multimedijalni sistem predstavlja skup ure aja i programa za integrisanu obradu i upravljanje nezavisnim diskretnim i kontinualnim medijima u cilju prilago avanja realnih pobuda–stimulusa ove ijem ulnom sistemu za zadovoljenje odgovaraju e percepcije. Multimedijalni sistemi obra uju nezavisne medije i kada su oni funkcionalno povezani, na primer snimak lica govornika i njegovog govora. Ako je zbog sinhronizacije i prepoznavanja govora potrebno da se poveže izgovor sa pokretima usana, onda se koriste multimodalni sistemi. Multimodalnost predstavlja povezanost me usobno zavisnih kanala – modalities za ulnu percepciju, kao što je zavisnost govora od pokretanja usana i izraza lica.

Multimodalni sistem predstavlja skup ure aja i programa za integrisanu obradu i upravljanje me usobno zavisnih medija odnosno me usobno zavisnih komunikacionih kanala. Govor je povezan sa pokretanjem usana i izrazima lica, pa se preko ula vida dopunjava doživljaj koji dolazi od ula sluha.

128

Page 137: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

8.2 Osnovne multimedijalne delatnosti

Multimedijalna delatnost je multidisciplinarna i obuhvata razne tehni ko-tehnološke, ekonomske, sociološke i umetni ke specijalnosti.

Stvaranje multimedijalnog dela, zavisno od njegove kompleksnosti, zahteva angažovanje razli itog broja i profila stru njaka. Kreiranje multimedijalnog proizvoda može da bude nemetodi no ili proceduralno strukturirano. Primer nemetodi nog stvaranja su pojedina ni proizvodi koji nisu dobro definisani.

Za realizaciju kompleksnih projekata uklju uju se timovi stru njaka, dok odre eni jednostavni proizvod može da kreira samo jedan izvršilac. Projekti zatevaju procedure i metodološku strukturalizaciju.

Za po etak rada treba da postoje odre eni zahtevi kojima se specificiraju zahtevi investitora. Ti zahtevi predstavljaju projektni zadatak za realizaciju multimedijalnog proizvoda.

Projektni zadatak predstavlja dokument kojim se izražavaju:

Potrebe, Sadržaj, Propisi, Specifikacija naru ioca – klijenata, Proizvodnja ili izbor multimedijalnih komponenti teksta, slike/ grafike, audio i

video/animacije koji e najbolje preneti poruku, Navigacija koja odre uje željeni na in prezentacije multimedijalnog proizvoda, Tehnološka ograni enja: potrebe – zahtevi za materijal, softver, hardver, troškovi i vreme

stvaranja, su ograni avaju i inioci stvaranja multimedijalne aplikacije koje je potrebno uzeti u obzir u procesu stvaranja,

Kontrola ispravnog funkcionisanja multimedijalnog proizvoda, Tržište, Medij za isporuku, na in distribuiranja, Transport, reklamiranje i održavanje – podrška multimedijalnog proizvoda,

Karakteristi ne su tri faze u realizaciji projekata iz oblasti multimedija: preprodukcija, produkcija i postprodukcija. Multimedijalna preprodukcija predstavlja prvu fazu realizacije projekta koju karakterišu slede e aktivnosti:

Razra uju se zahtevi naru ioca, definišu ciljevi, analizira interesna grupa, postavljaju zadaci;

Definiše se žanr: dokumentarni, obrazovni ili instruktivni, narativni, animacija, interaktivni, umetni ki ili ekspresivni;

Definiše se vrsta medija: letak, bilbord, novine, televizija, internet; Definiše se sadržina proizvoda; Analiziraju se iskustva drugih i postoje a rešenja; Sastavlja se detaljan pregledan plan, naj eš e u vidu ilustrovane pri e koja je, zbog

vešanja na tablu, nazvana storibord.

129

Page 138: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Multimedijalna produkcija predstavlja drugu fazu realizacije projekta u kojoj se neposredno formira sadržaj koji e se ugra ivati u proizvod. Zavisno od kompleksnosti proizvoda koristi se ra unar, kamera, glumci, kostimi, studija i scenografija. Multimedijalna postprodukcija predstavlja završnu fazu realizacije projekta u kojoj se formira kona na verzija multimedijalnog proizvoda. Kod digitalnih multimedija postprodukcija se svodi na uredništvo, editovanje (eng. editing). Kad se radi sa zvukom i pokretnim slikama, to je montaža. 8.2.1 Multimedijalna preprodukcija

Multimedijalna preprodukcija predstavlja prvu fazu multimedijalnog projekta u kojoj se prikupljaju i razra uju zahtevi naru ioca/klijenta, definišu ciljevi, analiziraju korisni ke specifikacije i pravi se projektni plan. Redosled aktivnosti i metod planiranja zavise od vrste proizvoda. Razli ite tehnologije i vidovi multimedijalne proizvodnje: video, grafika i/ili animacija opredeljuju postupke koji e se primenjivati u fazi preprodukcije. PRETHODNA ANALIZA U PREPRODUKCIJI

Prethodna analiza predstavlja prvu aktivnost u realizaciji svakog projekta i sastoji se od razrade ideje i sagledavanja postoje ih rešenja iz predmetne oblasti.

U razvoju multimedijalnog projekta cilj je da se ideja o planiranom projektu identifikuje i vizualizuje.

Identifikacija ideje podrazumeva istraživanje, inkubaciju – spori razvoj bez uticaja spoljašnjih, opažljivih znakova i generisanje ideje.

Jedna od tehnika generisanja ideje je brejnstorming (eng. brainstorming – moždana oluja, stvarala ki žar) – spontano grupno razmatranje da bi se proizvele ideje i rešenja za problem. Brejnstorming predstavlja intenzivnu mentalnu aktivnost razrade i vizualizacije ideja. Na po etku je dobro da se razmotri što više ideja, brojnost ide ispred kvaliteta, loše ideje nekada navedu na dobre ideje. Da bi se uspešno kompletirala ve ina produkcija sa ostvarenom svrhom multimedijalnog proizvoda za koju je namenjen, definišu se zadaci – Brejnsorming koraci. Razlikuje se šest Brejnsorming koraka [8.1]:

a) Analiza projektnog zadatka Analiza projektnog zadatka predstavlja temeljno istraživanje zadate teme koja naj eš e

nije zadata u strogo definisanom obliku. Razmatraju se mogu i problemi i potencijalna rešenja: video, audio, tekst.

b) Analiza ciljne publike Analiza ciljne publike može biti demografska i psihografska.

130

Page 139: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Demografska analiza strukture ljudske populacije koristi statistiku koja se odnosi na godinu ro enja, smrti, ekonomski nivo, bolesti, geografske koncentracije ili znanja proizvoda. Psihografskom analizom se vrši klasifikacija populacije prema njihovim osobinama, kao što su na in života, primarni interesi, verovanja. Na dizajn poruke uti u faktori kao što su: publika kojoj je namenjena, medijum, svrha i priroda poruke. Kada se planira za multimedijalnu produkciju, važno je definisati gde e se distribuirati zavšeni projekat, definisati krajnjeg korisnika – ciljnu publiku, što odre uje kako e sadržaj biti prezentovan.

c) Definisanje cilja Definisanje cilja koji se želi posti i multimedijalnim projektom služi kao odrednica multimedijalnoj produkciji. Kada se postavljaju ciljevi projekta, treba da budu jasno definisani, hijerarhijski ure eni i kvantitativno formulisani. Brojne vrednosti za

prikazivanje poruke omogu avaju da se kasnijim prikupljanjem podataka može ustanoviti da li je kona an proizvod uspešan. Ciljevi treba da budu realno dostižni, što zna i da se uzimaju u obzir realne mogu nosti, isplativost i troškovi proizvodnje.

d) Osnovno istraživanje Osnovno istraživanje obuhvata prou avanje teme i tehnologije na kojoj se radi. Kreator multimedijalnog proizvoda istraživanjem izgra uje subjektivno znanje o predmetnoj

materiji. Istraživanje može uklju iti susret sa ekspertima, itanje publikacije, istraživanje na internetu, ili pogledati kako su drugi profesionalci rešili sli ne probleme.

Proces generisanja ideje – Brainstorming za stvaranje multimedijalnog proizvoda uklju uje i razmišljanje:

1) O emocijama – kakva ose anja su povezana sa projektom na kom se radi, kojim

se vizuelnim sredstvima i sumbolima mogu izraziti; 2) O analogijama – kakvim oblicima i bojama se mogu izraziti odre ene emocije, ili

toplota na primer; analogije pomažu da se ode dalje od originalnih re i i osmisle konkretni vizuelni elementi za projekat;

3) O suprotnostima; ideje treba svesti na jednu, onu koja najbolje može izraziti ciljeve.

e) Razmatranje sadržaja

Posle definisanja ideje razmatra se prototip/skica sadržaja. U multimedijalnom dizajnu prototip se može izraditi kao: serija skica, storyboard, Powerpoint slide show, Flash prezentacija, video koji simulira koriš enje sistema, kartonska simulacija, serija veb stranica. Skica sadržaja je narativni opis sadržaja multimedijalnog proizvoda, konfiguracija istorije/pri e ili poruke koja treba da se prenese korisnicima, koriste i odgovaraju u usmenu ili pismenu tehniku. Istraživane informacije se prikazuju odre enim redosledom. Dizajnirane su da obezbede usredsre ivanje na ideju ili subjekat videa.

Razvijanje teme multimedijalnog projekta uklju uje:

1) Identifikaciju stila multimedijalnog proizvoda,

131

Page 140: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

2) Razmatranja dizajna screen layout uklju uju i: ravnotežu (eng. balance), jedinstvo (eng. unity), boju (eng. color).

3) Skiciranje na papiru screen layout, raspored osnovnih elemenata. 4) Definisanje interfejs dizajna.

Korisni ki interfejs je medijum preko koga korisnik vrši interakciju sa multimedijalnim proizvodom, koji uklju uje navigaciju od strane korisnika u jednoj aplikaciji i reakciju/odziv aplikacije na aktivnost, kao što je klik na button ili hiperlink. U toku formiranja konture sadržaja utvr uje se koja e informacija biti uklju ena u multimedijalni proizvod. Informacija treba da bude sažeta i organizovana kolekcija istraživanja koja podržava izabrani cilj. Ve ina produkcijskih tekstova u audio/video proizvodnji pisana je na stranici koja je podeljena na dve kolone. U levoj koloni je opis video scene, a u desnoj odgovaraju i audio. Selekcija re i, zvuka i slike uti e na postizanje zahtevanog cilja.

f) Okvirni nacrt – scope dokument

Skoup dokument treba da specifikuje slede e:

1) Metode na osnovu kojih e korisnik ostvariti multimedijalnu interakciju, 2) Izvo a ke kriterijume projekta, kao što su vreme obrade i raspoloživo vreme, 3) Osobine projekta kao što su modularnost (norma, standard) i bezbednost, 4) Ograni enja u mogu nostima za kreiranje multimedijalnog proizvoda, kao što su

koriš enje specifi nog softvera ili metodologije.

Svrha skoup dokumenta je da produkcioni tim precizno shvati postavljene produkcione zahteve i da ga koristi za proizvodnju i kontrolu realizacije multimedijalnog projekta.

PRI A NA TABLI - STORYBOARD

Storibord predstavlja o igledan, sažet i strukturiran prednacrt sadržaja multimedijalnog proizvoda.

Za video produkciju, storibord je vizuelna, grafi ka, reprezentacija svake specifi ne sekvence u videu. Storibording (eng. storyboarding) je proces stvaranja niza skica oblika strip knjige kojima su prikazani klju ni spotovi, željeni okviri – frejming (eng. framing) u videu i glavni objekti kao i akcije za svaki snimak, sa detaljnim opisom raznih poruka, razgovora, slika.

Storibord se koristi kao vodi za snimanje ili animaciju. Njime se odre uje broj i tip snimka za svaki video ili audio proces, kao i specijalni efekti i tranzicije – cue. On pomaže razvojnom timu da proceni logi ki tok sekvence koja se koristi u videu, obezbedi miran, blag (eng. smooth) pokret i odredi digitalni audio i video sadržaj koji je potrebno da se snimi i edituje.

U multimedijalnim aplikacijama storibord reprezentuje izgled i linkove svakog ekrana multimedijalnog projekta. Osnovna funkcija storiborda je povezivanje sadržaja i poruke, tako da bude olakšan razvoj multimedijalnog proizvoda sa softverskim alatima. Jedna stranica storiborda opisuje sliku multimedijalnog proizvoda u jednom odre enom vremenskom trenutku.

Storibord sadrži glavnu poruku koja se želi preneti korisniku i precizan sadržaj multimedijalnog proizvoda sa jasnim uputstvom za oblikovanje sadržaja, što zna i slede e:

132

Page 141: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Identifikaciju sadržaja koji treba da ima specijalnu dozvolu ili copyright izdanje, Ukupan broj stranica – layout-a, Neophodne detalje za navigaciju, Definisanje odre enih oblika interaktivnosti, Informacije u vezi sa projektantima (dizajniranje) multimedijalnog proizvoda, Komentare i druge korisne informacije za programere koji e da preuzmu kreiranje

multimedijalnog proizvoda.

Za snimanje videa definiše se lokacija, postavljanje svetla i položaja kamera. Posebno se analiziraju potencijalni problemi kako za snimanje slike tako i za snimanje zvuka. Odre uje se mesto gde e biti postavljene kamere, veli ina frejma i kretanje glumca u kadru. PROCENA TROŠKOVA

Procena troškova je jedan od klju nih elemenata za uspešnu realizaciju multimedijalnog projekta. Radi se na osnovu procene troškova za rad i materijalnih troškova. Troškovi za rad odre uju se na osnovu cene u eš a angažovane ekipe, a materijalni troškova na osnovu cene koriš ene opreme za produkciju, postprodukciju i distribuciju multimedijalnog proizvoda. Cena za rad ra una se na osnovu cene norma asa svakog angažovanog pojedinca u projektnom timu i vremena angažovanja svakog izvršioca. Za organizovanje resursa za multimedijalnu produkciju, distribuciju i prezentaciju potrebno je identifikovati:

Projektni tim: izvršioce sa znanjem dizajna i tehnologija za proizvodnju, distribuciju i prezentaciju multimedijalnih sadržaja: glumce, producente i direktore, tehni ko osoblje, kamermane, audio/video inženjere, direktora svetla;

Hardverske resurse: ure aje i sisteme za prijem i obradu, montažu i distribuciju multimedijalnih sadržaja: skeneri, audio rekorderi, video rekorderi, fotoaparati, video kamere, ra unari za audio i video obradu i montažu, širokopojasne ra unarske mreže, ure aji za audio reprodukciju, ure aji za video reprodukciju.

Softverske alate za obradu teksta, zvuka i slike kao što su: Painter ili Photoshop – za obradu bitmapirane grafike, ImageReady – za veb grafiku,

Freehand i Illustrator – za vektorsku grafiku, Dreamweaver – za razvoj veb prezentacija, Sound Forge i SoundMaker – za obradu zvuka, Flash – za animaciju i interaktivnost, Premiere, After Effects i QuickTime Pro – za video i audio montažu, 3D MAX i MAYA – za animaciju, kao i softver koji omogu ava dizajneru da poveže razli ite multimedijske elemente u vremenu i prostoru i doda celini interaktivno ponašanje.

Pogodan medijum za dostavljanje. RADNI TIM ZA MULTIMEDIJALNU PRODUKCIJU

Radni timovi za multimedijalnu produkciju sastavljaju se na osnovu planiranog budžeta i kompleksnosti projekata. Za velike projekte angažuju se specijalisti, dok jednostavnije projekte

133

Page 142: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

mogu raditi izvršioci koji objedinjuju više razli itih funkcija. Slede e specijalnosti se mogu izdvojiti kao posebne:

Menadžer projekta – oblikuje projekt u svim fazama rada, po ev od trenutka programske

i uredni ke odluke za odre eni projekat pa do njegove potpune realizacije. Predlaže i usvaja tehnološko-produkciona rešenja realizacije projekta. Vrši rediteljsku razradu emisije i izra uje detaljnu knjigu snimanja.

Urednik – osmišljava projekte i akcije, obavlja predistraživanje, istražuje, prikuplja, stilski i žanrovski klasifikuje i ure uje sadržaj, u estvuje u realizaciji, koordinira rad ekipe.

Direktor produkcije – upravlja, organizuje, koordinira i kontroliše tehnološki proces proizvodnje.

Producent – izra uje/odobrava plan proizvodnje, organizuje i finansijski vodi proizvodnju i finalizaciju projekata, odgovoran je za budžet projekta, sprovo enje tehni kih standarda i rokove proizvodnje.

Reditelj – u estvuje u oblikovanju projekta u svim fazama rada, po ev od trenutka programske i uredni ke odluke za odre eni projekat pa do njegove potpune realizacije, predlaže i usvaja tehnološko-produkciona rešenja realizacije projekta, u estvuje na dramaturškoj obradi scenarija, vrši rediteljsku razradu emisije i izra uje detaljnu knjigu snimanja, vrši izbor glumaca, izvo a a i drugih u esnika u projektu, rukovodi kreativnim procesom snimanja slike i zvuka, kreativno rukovodi postprodukcijskim procesom.

Snimatelj slike – u pripremnoj fazi u estvuje u utvr ivanju tehni ko-produkcionih uslova, utvr uje tehni ke standarde snimanja slike, potrebnu tehniku i opremu za snimanje slike, u fazi snimanja postavlja svetlosnu postavku, pozicionira kameru, snima sliku u skladu sa produkcijskim zahtevima, utvr uje sve pokrete kamere, na in i opremu za njihovo izvo enje.

Pored navedenih za ve e projekte i televizijsku produkciju postoje slede e specijalnoasti:

dizajner svetla, montažer, video-mikser, majstor zvuka, mikser zvuka, majstor slike, dizajner video grafike i snimatelj tona. 8.2.2 Multimedijalna produkcija

Produkcija je druga faza realizacije projekta, realizacije multimedijalnog proizvoda u kojoj se vrši neposredno formiranje sadržaja koji e se ugra ivati u proizvod. U fazi produkcije, zavisno od kompleksnosti proizvoda, koristi se ra unar, kamera, glumci, kostimi, studio i scenografija.

U zavisnosti od projekta zavise i aktivnosti u toku produkcije. U video produkciji to može biti poseta lokacija, organizacija opreme, kostima, rekvizita i snimanje.

Procesi u fazi produkcije su:

Pisanje scripta, Istraživanje i pisanje sadržaja, Izbor i priprema odgovaraju e opreme za video snimanje: kamera, tripod, mikrofoni,

134

Page 143: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

svetlo, Snimanje audio i video sadržaja koriste i storyboard, Montaža audio i video sadržaja, Stvaranje multimedijalnih komponenti, Razvoj kompjuterske animacije, Interfejs dizajn, Grafi ko oblikovanje, Integrisanje multimedijalnih komponenti u multimedijalni proizvod (eng. authoring), Testiranje proizvoda.

U video produkciji postoje slede e faze:

Video plan – capture, Uvo enje videa u multimedijalni projekat, Identifikacija softvera koji je na raspolaganju za video produkciju /nelinearnu montažu, Nelinearna montaža videa, titlovanje, specijalni efekti, prelazi–tranzicije.

Osnovne strategije organizacije sadržaja Osnovne strategije organizacije sadržaja su:

a) Izveštaj, reportaža, raport, saopštenje, b) Hronološka, c) Geografska, d) Sistemska, e) Strukturalna.

U svim ovim strategijama, sadržaj je organizovan u hijerarhijskim nivoima. Da bi

korisnik lokalizovao odre enu informaciju, potrebno je da pre e hijerarhiju (eng. drill down). Hijerarhijska organizacija daje korisniku informacije u pogledu organizacione konstrukcije i istovremeno ne dopušta da ga “pretrpaju” nepotrebne informacije, što bi bilo neizbežno u linijskoj konstrukciji organizacije.

a) Izveštaj reportaža i sopštenje predstavlja najopštiji oblik organizacije sadržaja za enciklopedijske oblike rada. Sadržaji se grupišu u konstitucione i logi ke grupe.

b) Hronološka organizacija predstavlja vremensku organizaciju sadržaja i prikazivanje

multimedijalne aplikacije kao što je proizvodnja videa na vremenskoj osi. Dizajner treba da izvrši korelaciju doga aja i odgovaraju ih datuma. Da bi se problem umanjio upotrebljavaju se razne tehnike zasnovane na prepoznavanju, a ne na se anju, kao što je koriš enje pop-up displeja za prikazivanje doga aja dok dizajner prelazi vremensku osu (eng. timeline) i pokazivanje slika koje reprezentuju glavne istorijske momente, na vremenskoj osi.

c) Geografska organizacija predstavlja prikazivanje geografskih sistema i upotrebu 2D

karti ili 3D predstavljanja. Hijerarhijska konstrukcija i navigacija je podržana opercijom

135

Page 144: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

zum (eng. zoom). Kombinacija geografskog i vremenskog prikazivanja je veoma esta, jer pokriva veliki broj multimedijalnih proizvoda, kao što je prikazivanje istorijskih doga aja za oblast neke države, ili prikazivanje prostorno-vremenskih manifestacija.

d) Sistemska organizacija sadržaja je klasi na metodologija prikazivanja na ina

funkcionisanja sistema sa tehnološkog aspekta. Ima široku upotrebu u obrazovne svrhe, tutorijali i simulacije. Sistemska organizacija je posebno pogodna za interaktivne multimedijske proizvode. Sistem se deli na podsisteme, podsistemi na druge podsisteme, sve dok se ne stigne do osnovnih sastavnih komponenti. Glavni problem sa sistemskom organizacijom je teško a prilago avanja prikazivanja velikom broju kategorija korisnika koji nisu upoznati sa tehnologijom koja se objašnjava. Iz tog razloga dobro je da se koriste neki po etni primeri iz svakodnevnog života korisnika za po etno razumevanje sistema.

e) Strukturalna organizacija sadržaja ima za cilj prikazivanje strukture organizama i

preduze a što se ti e njihovih aktivnosti, službenika, proizvoda i usluga koje daju. Prikazivanje je hijerarhijsko, pošto se organizacija preduze a zasniva na hijerarhiji osoblja, kao i odseka.

8.2.3 Multimedijalna postprodukcija Multimedijalna postprodukcija predstavlja završnu fazu u kojoj se formira kona na verzija multimedijalnog proizvoda. Kod digitalnih multimedija postprodukcija se svodi na uredništvo, editing. Kad se radi sa zvukom i pokretnim slikama onda je to audio i video montaža. Postprodukcija ima zadatake da izradi:

Originalni, glavni (eng. master) uzorak i proizvede duplikate. Uputstvo za korisnike (eng. user manual) i napravi arhivu proizvoda – pakovanje –

ambalažu proizvoda. Video postprodukcija je obrada snimljenog videa, materijala ili filma u završni proizvod

za emitovanje ili distribuciju. Osnovni procesi u video postprodukciji su rendering i snimanje završne verzije na prenosni medij. Rendering (eng. rendering) predstavlja proces kompjuterske sinteze slike od sirovih podataka, modela, odnosno elemenata scene ije objekte i osobine materijala uobli avaju svetlosni izvori, položaji i pravac posmatranja gledaoca. Osvetljenje ima presudan uticaj na scenski doživljaj pa se renderovanje esto ozna ava kao poslednja faza u procesu dizajniranja slika. Poslednja faza pred distribuciju multimedijalnog proizvoda je snimanje kreiranog proizvoda na spoljašnji prenosni medij: tejp, DVD, CD, fleš memoriju. Distribucija multimedijalnog proizvoda može da se obavlja preko interneta – on-line, ili pomo u memorijskih medija CD-ROM, DVD, fleš memorija – off-line.

136

Page 145: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

8.3 Slika u multimediji Slika, sa fizi kog aspekta, predstavlja raspodelu svetlosti na površini, u ravni ili prostoru. Svetlost je elektromagnetni talas sa širokim opsegom talasnih dužina od 390 nm do 760 nm, koje se pojedina no vide kao boje svetlosti. Boja predstavlja jedan uži deo svetlosnog spektra koji sistem za vid razlikuje od susednih delova spektra. Boje se klasifikuju na primarne, sekundarne i tercijarne. Primarne ili osnovne boje su crvena, plava i žuta. Sekundarne boje ili boje drugog reda su narandžasta (žuta + crvena), zelena (plava + žuta) i ljubi asta (crvena + plava) . Tercijarne boje – boje višeg reda su kombinacije primarnih i sekundarnih boja. Ljudsko oko razlikuje oko 10 miliona razli itih boja. Ogromna paleta tercijarnih boja dobija se mešanjem primarnih i sekundarnih boja. Postoje dva na ina mešanja boja, aditivno i subtraktivno mešanje boja. Aditivno mešanje boja odvija se na osnovu superpozicije, sabiranja svetlosnih talasa pojedinih boja. Svaka boja se može sintetizovati od odgovaraju e koli ine tri osnovne boje. Primer aditivnog mešanja boja su slike na ekranima. Subtraktivno mešanje boja odvija se na osnovu me usobne apsorpcije obojenih estica, što je slu aj u slikarstvu. Monohromatska slika je crno-bela slika, a hromatska slika je slika u boji. Slika u multimediji predstavlja 2D tabelu diskretnih elemenata slike – piksela. Piksel (eng. picture element) je elemenat slike odre en svojom sjajnoš u i položajem u slici. Sjajnost piksela se izražava brojnom vrednosti intenziteta. Položaj piksela predstavlja se koordinatama (x, y). 8.3.1 Memorisanje, prenos i prikazivanje slike

Memorisanje, prenos i prikazivanje slike vrši se pomo u elektronskih ure aja posle procesa konverzije piksela iz svetlosnog u elektri ni domen i formiranja video signala.

Video ure aji za snimanje slike – elektronske kamere, razvijeni su po ugledu na ulo vida živih organizama. Oko je predstavljalo uzor za konstrukciju elektronske kamere.

Pikseli opti ke slike pretvaraju se u mrežnja i oka u bioelektri ne impulse, takozvane talase akcionog potencijala. Od mrežnja e, snop nervnih vlakana prenosi talase akcionih potencijala do centra za vid u temenom delu korteksa. U centru za vid odvija se proces percepcije, prepoznavanje sadržaja, tuma enja slike. ulo vida ima visoku rezoluciju zahvaljuju i ogromnom broju fotoreceptora u mrežnja i i nervnih vlakana u živ anom snopu kojih ima oko 120 000 000. Pikseli se u sistemu ula vida paralelno konvertuju, prenose i obra uju.

Tehni ki video sistemi, za razliku od ula vida sa paralelnim sistemom prenosa, koriste serijski sistem prenosa. Serijski prenos se zasniva na transformaciji prostornih koordinata u vremenske. Tokom snimanja slike linearnom sekvencijalnom analizom, prostorne koordinate transformišu se u vremeski niz. Tokom reprodukcije linearnom sintezom, formiraju se prostorne koordinate.

137

Page 146: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Kod sofisticiranih tenni kih video sistema, razvijaju se, po ugledu na moždani centar za vid, viši nivoi obrade slike. Istražuje se sadržaj, semantika slike, i razvijaju sistemi za prepoznavanje oblika. Ure aji koji transformišu opti ku u elektri nu sliku pogodnu za obradu i prenos su elektronske kamere i skeneri. To su ure aji za snimanje – capture ure aji.

Opti ka slika kao 2D raspodela svetlosti transformiše se u 2D sliku raspodele elektronskih naelektrisanja.

Dvodimenzionalna slika raspodele elektronskih naelektrisanja transformiše se u analogni video signal.

Memorisanje slike vrši se posredstvom video signala u kome su sadržane informacije o svim elementima slike – pikselima.

Kod savremenih ure aja analogni video signal transformiše se u digitalni video signal koji obra uju mikroprocesori. Slika se u digitalnom obliku memoriše kao matrica u kojoj su redovi pikseli na koordinati X, a kolone pikseli na koordinati Y. 8.3.2 Senzori slike Senzori slike su komponente video sistema koje transformišu opti ku sliku u video signal. Razlikuju se senzori slike sa elektronskim mlazom i senzori slike sa poluprovodnicima. Senzori slike sa elektronskim mlazom: vidikoni, ortikoni, super ortikoni, plumbikoni, satikoni. Fotoelektri ni senzori u vidu mozaika na poluprovodnoj plo ici smešteni su u vakuumsku cev od stakla. Svetlosna slika koja se projektuje na fotoosetljivu senzorsku plo icu transformiše se u sliku naelektrisanja. Slika naelektrisanja skenira se pomo u elektronskog mlaza koji zatvara strujno kolo preko radnog otpornika formiraju i na taj na in video signal. Senzore slike sa elektronskim mlazom potisnuli su mnogo manji poluprovodni ki senzori. Senzori slike sa poluprovodnicima predstavljaju fotoosetljive plo ice sa mozaikom elemenata koji pod dejstvom svetlosti formiraju elektri nu sliku. Za o itavanje je mogu pristup svakom nizu fotoosetljivih elemenata koji reprezentuju piksele. Naelektrisanja elemenata mozaika proporcionalna su intenzitetu osvetljaja pojedinih piksela. Sukcesivnom analizom 2D slike naelektrisanja formira se video signal. Senzori slike sa poluprovodnicima imaju adresibilnu vezu do svakog piksela 2D slike elektronskog naelektrisanja, što daje fleksibilnost u o itavanju. Postoje više izvedbi ovih senzora pod nazivom:

Ure aji sa spregnutim naelektrisanjem (eng. charge-coupled device – CCD), Ure aj za detektovanje punjenja (eng. charge injection device – CID), Komplementarne logike tranzistorski metal-oksid-poluprovodnik (eng. Complemantary

metal-oxide-semiconductor – CMOS), Fotodiode (eng. photodiode).

CCD, CID i CMOS senzori slike sastavljeni su od miliona fotoosetljivih elektronskih senzora. Zavisno od intenziteta svetlosti, u elektronskim senzorima se stvara odre eno naelektrisanje. Proces pražnjenja se vrši primanjem odre ene kontrolne naredbe. Izlaz senzora proporcionalan je integralu svetlosne energije. Elektronski senzori su raspore eni u matri nom obliku – obliku mreže. Svaki senzor odgovara jednom pikselu. Za dobijanje boje upotrebljavaju se R, G, B filteri kojima se oblažu senzori. CCD, CID i CMOS elementi se integrišu u 2D matrice, formiraju i senzore slike koji se koriste u kamerama.

138

Page 147: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Fotodiode se integrišu u 1D nizove koji se koriste kao senzori u skenerima. Napon na izlazu fotodiode je proporcionalan intenzitetu svetlosti. 8.3.3 Osnovne obrade slike Osnovu za obradu slike ine elementi 2D prostora – pikseli, elementi 3D prostora – vokseli i elementi vremenske koordinate – vremenski intervali. Osnovne obrade slike su: analiza slike, digitalizacija signala slike, poboljšanje, restauracija, kompresija i rekonstrukcija. Analiza slike predstavlja pretraživanje i odmeravanje elemenata slike, pojedinih segmenata slike i slike u celini. Slika se može analizirati po površini, nivoima i sadržaju. Analiza po prostoru vrši se sistematskim pretraživanjem – skeniranjem, liniju po liniju, elemenata slike po površini fotoosetljivog senzora slike. U senzoru opti ke slike proizvodi se analogna elektri na 2D slika. Linijskom analizom se analogna slika sa senzora prevodi u analogni video signal pri emu se 2D koordinate piksela transformišu u vremenske intervale video signala. Linijska analiza slike sa proredom primenjuje se u televizijskim sistemima:

PAL sistem 625/50 Hz (Evropski standard linijske promene faze (eng. phase alternating line – PAL)),

NTSC sistem 525/60 Hz (Ameri ki standard nacionalnog komiteta za televizijski sistem (eng. National Television System Committee – NTSC))

HDTV –. Televizija visokokog kvaliteta – definicije (eng. high-definition television – HDTV) postoji više varijanti. Osnovne su dve: 1125 /60 Hz i 1250/50 Hz, ali obzirom na digitalnost fleksibilan je i razvijaju se nove verzije sa znatno ve im brojem linija. Analiza slike po nivoima koristi se za izdvajanje ivica, segmentaciju i identifikaciju

objekata. Analiza slike po sadržaju – semanti ka analiza koristi se za analizu sadržaja slike i prepoznavanje oblika.

Analizi slike po nivoima i semanti koj analizi prethodi digitalizacija analognog video signala. Digitalizacija predstavlja analogno-digitalnu konverziju koja se odvija u tri koraka: odabiranje, kvantizacija i kodovanje. Odabiranje ili uzorkovanje – sampling predstavlja proces tokom kojeg se iz kontinualnog video signala, u odre enim vremenskim intervalima, periodima odabiranja, izdvajaju trenutne vrednosti signala, odbirci – uzorci u cilju diskretizacije video signala i konverzije iz analognog u digitalni oblik. Diskretizacijom se osloba aju vremenski intervali izme u uzimanja odbiraka za formiranje višestrukog prenosa signala – vremenskog multipleksa. Prevo enje signala iz analognog u digitalni oblik – A/D konverzija omogu ava složene obrade signala slike. Kvantizacija je proces odmeravanja što zna i procenu brojne vrednosti svakog odbirka. Odbircima se dodeljuju vrednosti iz kona anog skupa vrednosti koje su odre ene kvantizacionim nivoima. Vrednosti svih odbiraka koji pripadaju jednoj kvantnoj zoni uzimaju vrednost kvantnog simbola koji reprezentuje datu zonu.

139

Page 148: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Kodovanje je proces izražavanja kvantovane vrednosti odbiraka pomo u odre enog koda, odnosno brojnog sistema. Po pravilu koristi se binarni brojni sistem gde je ukupan broj simbola N odre en željenim brojem bita B prema formuli N = 2B. Poboljšanje slike predstavlja postupak obrade kojim se vrši poboljšanje kontrasta, potiskivanje šuma, poja anje oštrine i bojenje. Postupci za poboljšanje slike relativno su jednostavni i mogu se obavljati u realnom vremenu. Restauracija slike je postupak obrade kojim se poboljšava kvalitet slike kada je degradacija slike poznata i kada se može formirati model degradacije. Tu spada korekcija geometrijskih izobli enja opti kog sistema kamere, potiskivanje šuma iji je statisti ki model poznat i korekcija smanjene oštrine slike usled pokreta ili defokusacije kamere. Metode restauracije su kompleksni i naj eš e se ne mogu izvršavati u realnom vremenu. Kompresija slike je postupak smanjenja broja informacionih bita pomo u kojih se slika memoriše i prenosi.

Standardna filmska slika dimenzija 24 mm × 36 mm, ima oko 107 piksela ako je rezolucija filma 0.01 mm. Standardna digitalna slika rezolucije 512 × 512 piksela ima oko 256 000 elemenata kodovanih sa 8 bita/odbirku smešta se u 256 KB memorije. Za memorisanje TV slika u toku jedne sekunde potrebno je 10 MB. Efikasnost kompresije zavisi od sadržaja slike. Sve metode kompresije sadrže programski deo i deo za podatke koji se pove ava sa pove anjem stepena kompresije što ograni ava krajnju uštedu u potrebnom memorijskom i prenosnom kapacitetu. Kompresija bez gubitaka (eng. lossless compression) omogu ava dekompresiju originalne slike. Dekomprimovana slika je identi na originalnoj slici. Kodovanje dužine niza (eng. run-length encoding – RLE) je kompresija sadržaja slike bez gubitaka pomo u beleženja dužine niza istih vrednosti piksela. Algoritmi RLE kompresije su:

Promenljiva dužina kodova VLC, Huffman-ov codes Kodiranje na bazi re nika (eng. dictionary-based coding – DBC)

Kompresija sa gubicima (eng. lossy compression) omogu ava dekompresiju koja daje

aproksimativnu sliku originala. Kompresija JPEG je kombinacija smanjenja koli ine podataka i kompresije podataka. Niz piksela predstavljenih koordinatama x i y i vrednoš u z koja odgovara sjajnosti ili boji, mogu e je transformisati u frekvencijski domen koriste i Fourier-ovu transformaciju. Komponente ove transformacije koje se nalaze u spektru viših frekvencija odgovaraju naglim promenama intenziteta ije efekte ljudsko oko manje prime uje, naro ito ako se radi o slikama u boji. Primenjuje se diskretna kosinusna transformacija DCT, kojom se dobija 2D matrica koeficijenata istih dimenzija kao i po etna 2D matrica vrednosti piksela. Pomo u DCT izvršena je promena podataka u formu pogodniju za procenu i komprimovanje, dobija se 2D slika u prostornom frekvencijskom domenu u kojem se lakše odre uju i odstranjuju bezna ajne suvišne komponente. Da bi se smanjilo vreme obrade proporcionalno sa kvadratom broja piksela, DCT se vrši nad slikom i to sa blokovima od 8 × 8 piksela.

Komponente na razli itim frekvencijama kvantuju se razli itim brojem nivoa kvantizacije. Broj kvantizacinih nivoa može se definisati posebno za svaki koeficijent

140

Page 149: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

kvantizacionom matricom. Mnoge komponente, naro ito na višim frekvencijama, aproksimiraju se sa vrednoš u nula, dok je kod ostalih komponenti smanjen broj bitova potrebnih za memorisanje vrednosti komponenata koje nemaju vrednost nula. Naknadno se na njih primenjuje RLE kodovanje. Selekcija se vrši specijalizovanim alatima za izdvajanje pravougaonih i elipti nih oblika, nepravilnih površina sa tkz. magi nim štapom (eng. magic wand) i magnetskim lasom (eng. magnetic lasso). Selekcija definiše masku koja stoji preko dela slike koji nije selektovan i koji je zašti en od obrade. Maska može biti: providna, neprovidna, i poluprovidna. Nijansirane maske nazivaju se alfa kanali (eng. alpha channel), mogu imati 256 nivoa providnosti. Bojenje, filtracija i druge modifikacije piksela pomo u digitalnih maski proporcionalno je vrednosti zapisanoj u alfa kanalu. Dve ili više slika mogu se utopiti u jednu pomo u raznih veli ina prozirnosti maski kao i ublažiti oštre ivice objekata na slici. Obrada pojedina nih piksela omogu ava proporcionalne promene bitmapirane slike u celini kao što su dobijanje negativa, korekcija sjajnosti i kontrasta, kao i korekcija boja. Za vrednost piksela p nova vrednost p' se dobija kada se primeni funkcija f, tj.,

p' = f(p). Funkcija f se naziv funkcija mapiranja. Primer konstrukcije negativa crno bele slike:

f(p) = W – p gde je

W vrednost piksela koja reprezentuje belu boju. Obrada grupe piksela omogu ava geometrijske promene u slici i prilago avanje bitmapa razli itim ekranima. Ova se obrada zasniva na procesu konvolucije koji pri transformaciji vrednosti piksela u obzir uzima vrednost piksela u neposrednom okruženju tog piksela. Filteri iji je efekat zamu enje ili pak izoštravanje slike su dve tipi ne primene obrade grupe piksela.

Rekonstrukcija slike je postupak pomo u kojeg se 2D ili 3D objekti sastavljaju iz više 1D ili 2D projekcija. 8.3.4 Bitmapirana slika Bitmapirana slika predstavlja 2D niz vrednosti elemenata slike – piksela u digitalnoj video memoriji ili prikazanih na ekranu u vidu opti ke slike. Pikseli bitmapirane slike formiraju se u procesu snimanja ili skeniranja opti ke slike. Raster slike ili bitmapa predstavlja pravougaonu mrežu piksela kojom se formira slika na ekranima ili papiru. Monohromatska slika predstavlja se 2D matricom, gde su reprezentovane vrednosti odbiraka na koordinatama X i Y koje odgovaraju vrednostima intenziteta svetlosti na odre enom

141

Page 150: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

mestu slike. Opseg mogu ih vrednosti intenziteta svetlosti je odre en brojem kvantizacionih nivoa – brojem nivoa sivog, zavisno od broja bita po pikselu. Hromatska slika predstavlja se sa tri 2D matrice (crvena, zelena i plava) gde su reprezentovane vrednosti odbiraka na koordinatama X i Y koje odgovaraju vrednostima intenziteta boje na odre enom mestu slike. Rezolucija slike, kao osnovni parametar bitmapirane slike, predstavlja meru sa kolikom fino om digitalna slika, sa kona nim brojem piksela, aproksimira kontinualnu sliku. Kvalitet slike zavisi od broja piksela – prostorne rezolucije i broja kvantizacionih nivoa – nijansi. Geometrijske promene u bitmapiranoj slici vrše se transformacijama za rekonstrukciju slike iz jednog oblika u drugi. To je ekvivalentno transformaciji u analogni video signal i ponovno odabiranje pri emu se koriste metode interpolacije. Rezolucija za štampa e i skenere izražava se brojem ta aka po jedinici dužine (eng. dots per inch – dpi). Rezolucija štampa a se definiše brojem linija po in u. Rezolucija štampa i je 600 dpi do 1200 dpi, a najbolji do 2700 dpi. Štampa i u boji mogu imati rezoluciju ak i 1200 ta aka po in u, što ne zna i da se tako velika rezolucija koristi za štampanje svih fotografija. asopisi u boji koriste rezoluciju od 137 linija po in u, dok se u knjigama najviše upotrebljavaju rezolucije od 150 ta aka po in u. Štampa i u boji koriste etiri do šest osnovnih boja. Rasterska elija štampa a u boji sadrži osnovne boje i definiše veli inu piksela kolor slike. Rezolucija skenera odre uje sa kolikom fino om e raster slike biti iskoriš en da reprezentuje datu sliku. Bitmapirana slika e imati više detalja ako je ve i dpi skenera. Tipi an opseg vrednosti rezolucije skenera je oko 300 dpi do 3600 dpi i više. Veli ina rezolucije za skeniranje bitmapirane slike zavisi od toga za koju je namenu planirana slika: da li e se slika štampati, da li je slika planirana za prikazivanje na monitoru, ili za veb prezentaciju. Fotografije u asopisima reprodukovane su sa oko 200 dpi do 300 dpi. Ako se planira skeniranje slike iz asopisa i slanje na veb, skeniranje se može izvršiti sa rezolucijom od 72 dpi.

Dubina boje (eng. bit depth) je broj bita koji se dodeljuje svakoj ta ki i koristi se za opis boje. Sa ve om vrednosti bit depth skener je u mogu nosti da odabira više boja, što omogu ava ve i raspon u promeni kontrasta (eng. contrast) i sjajnosti (eng. brightness) bitmapirane slike. Da bi se formirala “true colour” skeneru je potrebno 24 bit depth, zna i da se dodeljuje po 8 bita za crevenu, plavu i zelenu boju za svaku ta ku – piksel. U tom slu aju ukupan broj mogu ih boja je 28 × 28 × 28 = 256 × 256 × 256 = 16 777 216 16.7 miliona boja. Rezolucija bitmapiranih slika na televizijskim ekranima i ra unarskih monitora izražava se brojem piksela u slici. Primeri slika sa visokom i niskom rezolucijom dati su na Slici 8.3.4.1. Nezavisno od veli ine ekrana, televizijska slika se prikazuje pomo u istog broja piksela i to:

PAL standard: 720 × 576 piksela, NTSC standard: 640 × 480 piksela, HDTV standard: 1280 × 720 piksela.

Rezolucija slike ra unarskih monitora može biti:

VGA standard (video grafi ka kartica – niz (eng. video graphics array – VGA)): 640 × 480 pixela, SVGA standard (super video grafi ka kartica – niz (eng. super video graphics array –

142

Page 151: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

SVGA)): 800 × 600 pixela, XGA standard (proširena grafi ka kartica – niz (eng. eXtended graphics array – XGA):

1024 × 768 pixela, 14 in ni monitor sa 72 dpi = 640 × 480 piksela, 17 in ni monitor sa 72 dpi = 832 × 624 piksela.

Slika 8.3.4.1—Primeri slika sa visokom i niskom rezolucijom

Dimenzije bitmapirane slike izražavaju se ukupnim brojem piksela koje sadrži i ne poklapaju se uvek sa dimenzijama ekrana. Slika sa stranicom dužine 128 piksela na ekranu sa rezolucijom: od 72 dpi, bi e 45 mm, od 115 dpi od 28 mm, a na štampa u sa 600 dpi bi e široka samo 5 mm širine. To se može izraziti relacijom: fizi ke dimenzije slike (inch) = dimenzije ekrana u pikselima (pix) / rezolucija ure aja (pix/inch). Softver za prikazivanje originalnih dimenzija slike skalira bitmap pomo u formule:

faktor skaliranja = rezolucija ure aja / rezolucija slike. Reprodukcija bitmapa na ekranu sa ve om rezolucijom vrši se interpolacijom – prekoodabiranje (eng. oversampling), a na ekrane sa manjom rezolucijom izbacivanjem me upiksela – pododabiranje (eng. downsampling). 8.3.5 Vektorski generisane slike

Vektorski generisana slike su vešta ke slike ura ene pomo u vektorske grafike. Vektorska grafika ili geometijsko oblikovanje predstavlja proizvodnju slika pomo u

geometrijskih oblika kao što su: ta ke, linije, krive i poligoni. Zasniva se na matemati kom opisu

143

Page 152: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

pravih i krivih linija i oblika. Vektorska aritmetika ili analiti ka geometrija glavni je matemati ki aparat koji se koristi pri prora unu vrednosti piksela. Sa operativnog aspekta, vektorska grafika predstavlja niz komandi kojima se ostvaruje generisanje i transformacije raznih geometrijskih oblika. Prilikom prikazivanja vektorske grafike na ekranu, odvija se proces renderovanja. Prikazivanje vektorskih slika – renderovanje zahteva prethodni prora un za generisanje vrednosti piksela. Osnovni elementi za formiranje vektorskih slika su:

Koordinate – broj ani podaci o položaju ta aka u ravni prostora, Koordinatni sistem – ravan ili prostor u kome su definisane ose i koordinatni po etak, Vektori – orijentisane duži za predstavljanje fizi kih veli ina koje karakteriše ja ina,

pravac i smer delovanja, Linije – neprekidno geometijsko mesto ta aka koje povezuje odre eno svojstvo, Poravnanje – približno predstavljanje provla enjem glatke linije izme u ta aka koje od

te linije odstupaju sa odre enom tolerancijom, Bezijerove krive – linije koje spajaju zadate ta ke na optimalan na in kao što je prikazano

na Slici 8.3.5.1-a, Putanje – linije kojima se ozna avaju kretanja odre enih objekata, što se tako e vidi na

Slici 8.3.5.1-a, Potezi i popunjavanje – standardizovano povezivanje ta aka i bojenje odre enih površina

što je prikazano na Slici 8.3.5.1-b.

Slika 8.3.5.1—Primeri: Bezijerova kriva, putanja, potezi i popunjavanje Transformacije koje se jednostavno izvode u vektorskoj grafici su skaliranje, rotacija, translacija i refleksija kao što je prikazano na Slici 8.3.5.2.

Vektorske slike (Slika 8.3.5.3-a) u pore enju sa bitmapiranim slikama – rasterskom grafikom (Slika 8.3.5.3-b):

Zauzimaju manje memorijskog prostora, manja je koli ina podataka, što je prikazano u

Tabeli 8.3.5.1,

144

Page 153: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Slika 8.3.5.2—Ilustracija vektorskih transformacija: skaliranje, rotacija, translacija i refleksija

Jednostavnije su za editovanje, Lakše se pamte jer se percepcija mozga zasniva na pam enju osnovnih karakteristika

slike, kontura, engrama, Pogodnije su za internet, Reprezentacija vektorskih slika je kompaktna, skalabilna, nezavisna od rezolucije ekrana

što nije slu aj sa bitmapiranom slikom, Uve anje objekta i približavanje ne izaziva smanjenje rezolucije detalja i gubitka na

kvalitetu, Informacije o transformacijama i procedurama se pamte što omogu ava da se mogu

kasnije menjati; to zna i da pomeranje, skaliranje, rotiranje, popunjavanje, ili neka druga geometrijska transformacija ne smanjuju kvalitet crteža kao kod bitmapirane slike.

Zbog istih i oštrih prelaza izme u boja, vektorskom grafikom se ne mogu prikazati fotorealisti ne slike, fotografije.

Slika 8.3.5.3—Primer vektorske i bitmapirane slike

145

Page 154: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Tabela 8.3.5.1—Pore enje veli ine datoteke bitmapirane i vektorske slike

Dimenzije u pikselima

Bitmapa Vektorski zapis

250 × 78 57 KB 36KB 800 × 248 581 KB 36KB

1500 × 466 2000 MB 36KB

8.3.6 Promenljive slike u multimediji

Promenljive, pokretne (eng. move) slike na prezentacionim medijima, bioskopskim i monitorskim ekranima, predstavljaju niz razli itih slika koje se prikazuju jedna za drugom takvom brzinom da ih ulo vida ne može pojedina no pratiti i sistem za percepciju povezuje njihov sadržaj u kontinuitet koji doživljavamo kao jedinstvenu promenljivu odnosno pokretnu, ”živu” sliku. Dinami ka slika nastaje usled promena ili pomeranja objekata ili usled promene ja ine i/ili boje svetlosti koja osvetljava scenu. Doživljaj dinamike u reprodukovanoj slici ostvaruje se zahvaljuju i inerciji ula vida. Doživljaj pokretnih slika sa bioskopskih i monitorskih ekrana stvara se u moždanom centru za vid. Slika objekta projektovana pomo u so iva na fotoosetljivu mrežnja u oka prenosi se do centara za vid pomo u talasa akcionih potencijala, koji kroz nervna vlakna o nog živca formiraju diskretne bioelektri ne video signale. Delovanje svetlosnog nadražaja svakog pojedina nog piksela proizvodi niz impulsa talasa akcionog potencijala ograni enog trajanja. Vrednosti pojedinih piksela i itave slike koju formiraju prenose se do centra za vid u sukcesivnim intervalima. U centru za vid odvija se, na osnovu prispelih impulsa, proces viših nivoa obrade, memorisanje, i prepoznavanje objekata što se ozna ava kao proces percepcije. Mrežnja a oka, nervna vlakna o nog živca, i centar za vid imaju ograni enu sposobnost razlikovanja brzih promena svetlosti koje se smenjuju u intervalima kra im od 100 ms. Brže diskretne promene povezuju se u neprekidan doživljaj zbog inercije koju karakteriše perzistencija vida. Perzistencija vida (eng. persistence of vision) predstavlja vreme zadržavanja percepcije prethodne slike, grani ni interval za razlikovanje susednih slika, odnosno povezivanje sukcesivnih slika i percepcija kontinuiteta niza pojedina nih slika. Povezivanje susednih slika u kontinuum karakteriše u estanost sjedinjavanja slika.

U estanost sjedinjavanja slika – fuziona frekvencija (eng. fusion frequency) predstavlja grani nu brzinu smenjivanja slika u nizu pri kojoj naša percepcija gubi sposobnost da razlikuje pojedina ne slike tako što vidimo kontinualne promene ili pokrete u slici. Minimalna fuziona frekvencija je (12 do 15) slika u sekundi. Fuziona frekvencija od 40 slika u sekundi eliminiše treptanje koje postoji pri malim brzinama smenjivanja slika.

Proizvodnja pokretnih slika obavlja se pomo u:

Filmske tehnike Video tehnike Tehnike animacije

146

Page 155: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Filmska tehnika predstavlja proizvodnju pokretnih slika pomo u celuloidne trake, tako što se u procesu snimanja slike pokretnih i promenljivih objekata projektuju na filmsku traku, a u procesu reprodukcije slike sa filmske trake projektuju se na ekran. Prenos slike na filmsku traku, u toku snimanja, kao i prenos slike sa filmske trake, u toku prikazivanja, ostvaruje se projekcijom pomo u svetlosnih zraka. U toku postprodukcije, sa filmom je mogu a takozvana linearna montaža, koja se svodi na nadovezivanje i lepljenje filmske trake. Dimenzije filma su standardizovane. Filmski formati za širinu trake su: 8 mm, 16 mm, 32 mm. Fuziona frekvenca kod filma iznosi 24 slike u sekundi sa po dva prosvetljavanja, što za smanjenje treptanja daje efekat kao da je 48 slika. Prednost filmske tehnike je visoka rezolucija slike. Nedostatak filmske tehnike je nemogu nost kontrole snimka u realnom vremenu. Video tehnika, odnosno video, predstavlja elektronsko snimanje, obradu i reprodukciju niza slika koje se sukcesivno smenjuju. Kod reprodukcije niza slika sa razli itim sadržajem, koje se smenjuju dovoljno brzo da vizuelna percepcija ne uspeva da prati sadržaje svake slike pojedina no, ve da ih povezuje u kontinuitet, stvara se doživljaj promena odnosno pokreta u sadržaju posmatrane video slike. Video tehnika omogu ava da se opti ke slike pomo u fotoelektri nog efekta transformišu u elektri ne slike, a zatim linijskom analizom se pikseli elektri ne slike sukcesivno transformišu u video signal. Iz video signala sukcesivnom linijskom sintezom reprodukuju se slike na ekranu monitora ili na bioskopskom ekranu pomo u video projektora.

Jedna video slika se naziva frejm (eng. frame). U televizijskom sistemu jedan frejm sastavlja se ispisivanjem linija dve poluslike koje se zovu fild (eng. field) sistemom u ešljavanja sa proredom (eng. interlaced), sa parnim i neparnim linijama. Kod ra unarskih video monitora, za razliku od ispisivanja sa proredom, ispisivanje slike može da bude progresivno (eng. progressive) ispisivanje, odnosno skeniranje (eng. scan), što zna i linija za linijom. Prikazivanje pomo u poluslika, sli no dvostrukom prosvetljavanju svake pojedina ne slike kod filma, vrši se zbog smanjenja efekta treptanja video slike.

U televizijskom PAL sistemu u estanost sukcesivnog smenjivanja slika je 25 frejma u sekundi (eng. frames per second). Veli ina jedne slike je 576 linija ×720 kolona.

U televizijskom sistemu NTSC u estanost je 30 frejma u sekundi. Veli ina jedne slike je 480 linija × 720 kolona.

U HDTV veli ina jedne slike je u granicama od 720 linija × 1280 kolona do 1080 linija × 1920 kolona.

Obrada slike u video tehnici može biti prostorna, vremenska i prostorno – vremenska. Prostorna obrada video slike vrši se pojedina no unutar slike i sastoji se od otklanjanja

šuma u slici, izdvajanja ivica i poboljšanja kvaliteta slike. Vremenska obrada video slike podrazumeva obradu piksela u slici u više uzastopnih

vremenskih trenutaka i vrši se u cilju detekcije i estimacije pokreta i vremenskog filtriranja. Prostorno – vremenska obrada video slike omogu ava transformaciju formata slike kao

što je video skaliranje 4:3 slike u 16:9 sliku. U procesu snimanja vrši se opto – elektri na, a u procesu reprodukcije elektro – opti ka

transformacija slike. Konverzija površinske slike u video signal obavlja se postupkom prostorno

147

Page 156: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

– vremenske transformacije. Iz video signala se vremensko – prostornom koverzijom reprodukuje slika na TV ekranima i monitorima.

Osnovne prednosti video tehnike koje joj obezbe uju primat nad filmskom tehnikom, su mogu nosti kontrole kvaliteta slike tokom snimanja i elektronska obrada video slike sa velikim mogu nostima za razli ite transformacije, promenu sadržaja, kompresiju, dekompresiju i nelinearnu montažu u procesu editovanja.

Klasi nom video tehnikeom ostvarivana je manja rezolucija slike u odnosu na film, a finansijska ulaganja su velika zbog potreba za velikim memorijskim kapacitetom ra unara, širokim opseom kanala za prenos video signala i veoma brzim video procesorima. Tokom razvoja, navedeni problemi prakti no su prevazi eni.

Standardi u video tehnici uskla eni su sa televizijskim standardima:

NTSC 525 vidljivih linija, 30 slika/s, 60 poluslika/s; PAL i SECAM (Francuski televizijski standard (fran. sequentiel couleur a memoire, eng.

sequential color with memory – SECAM)) vidljivih 575 linija, 25 slika/s, 50 poluslika/s; HDTV 1125linija, 50 slika/s, ili 1250 linija 50 slika/s.

Ra unarski video sistemi nisu zavisni od TV standarda, broj kadrova se može podešavati. Za internet broj kadrova za prenos smanjuje se na (12 do 15) kadrova u sekundi, jer se na

prijemu mogu interpolirati me ukadrovi i pove ati brzina osvežavanja ekrana. Potrebni kapaciteti memorije i prenosnih kanala za tekst, sliku, zvuk i video znatno se

razlikuju. Tekst – jedna stranica sa 80 slova po liniji i 64 linije po stranici zahteva:

80 slova po liniji × 64 linije × 1 stranica × 8 bita po slovu = 40 960 bita = 41 kbit/stranici. Slika – 24 bita po pikselu, 512 × 512 piksela, zahteva: 512 × 512 piksela × 24 bita po

pikselu = 6 Mbit/slici. Zvuk – CD kvalitet odabiranja 44.1 kHz i 16 bita po odmerku zahteva za mono:

44 100 odmeraka/s × 16 bita/odmerku = 706 kbit/s, i za stereo 1412 kbit/s. Videokadar – 360 × 240 piksela, kodovanih sa 24 bita po pikselu, 30 kadrova u sekundi

zahteva: 360 × 240 piksela × 24 bita po pikselu × 30 kadrova u sekundi = 60 Mbit/s. Zvuk i slika u originalnom obliku teško bi se memorisali i prenosili. Za memorisanje i prenos audio i video signala neminovna je potreba za kompresijom signala zvuka i slike.

Kompresija signala zvuka i slike detaljno je obra ena u okviru sedmog poglavlja ove knjige Standardi u multimedijalnim komunikacijama.

8.4 Tekst u multimediji

Tekst predstavlja zapis govornog jezika. O zna aju zapisivanja govornog jezika, odnosno pisma, bilo je re i na po etku ovog poglavlja, a o predstavljanju teksta u digitalnoj formi, kompresiji, i standardima u šestom poglavlju ove knjige Kompresija teksta. Slede a razmatranja posve ena su problematici prikazivanja teksta u multimedijalnim proizvodima i servisima.

148

Page 157: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Tekst u multimediji predstavlja vidljivu reprezentaciju govornog jezika i istovremeno predstavlja grafi ki, dizajnerski i estetski element. O dualisti koj prirodi teksta u multimediji dizajneri posve uju posebnu pažnju. Kao reprezent govornog jezika tekst nosi semanti ki smisao zapisan slovima odgovaraju e azbuke koriš enog pisma. Vizuelni izgled teksta u multimediji posebno je zna ajan, a odnosi se na oblik slova – karaktera, prostor koji oni zauzimaju, kao i raspored po redovima, pasusima i ve im delovima teksta na ekranu ili stranici, što je problematika kojom se bavi umetnost tipografije. Tekst se sastoji od re enica, re enice su sastavljene od re i, a re i predstavljaju kombinaciju slova. Pored slova, tekst sadrži interpunkcijske znake, brojeve i matemati ke simbole. Tekst u dalekoisto nim zemljama, koje koriste slikovno pismo, sastoji se od ideograma. Uopšteno, može se re i da su osnovni elementi teksta karakteri. Karakter, kao tekstualni elemenat, naziv je za slova, brojeve, interpunkcijske ili matemati ke znake, ili pisane simbole. U informaciono-komunikacionim tehnologijama, karakter se predstavlja, memoriše i prenosi u binarnoj formi. Razvoj digitalizacije i uvo enje teksta u ra unar po eo je sa digitalnim kodovanjem engleskog jezika, da bi se širio preko jezika razvijenih zemalja i danas obuhvatio idiograme i prakti no sva postoje a pisma. 8.4.1 Standardi za digitalnu prezentaciju karaktera

Razvojem informaciono-komunikacionih tehnologija, uvodila se i vremenom proširivala standardizacija za digitalno memorisanje i reprezentaciju karaktera. Dominantni standardi su: ASCII, ISO 646, Unicode, i ISO 10646. Ameri ki standardni kôd za razmenu informacija ASCII je dominantan skup karaktera, od 1970 godine. Za svaki karakter rezerviše po jedan bajt memorije, od ega koristi sedam bita, što zna i da može da kombinuje 128 kodnih vrednosti. Repertoar karaktera ASCII sastoji se od samo 95 karaktera. Vrednosti od 0 do 31 i 127 koriste se za kontrolne karaktere kao što je formiranje pomaka, nosioca, i brisanje koji se tradicionalno koriste za kontrolu operacija izlaznih ure aja. Me unardona organizacija za standardizaciji ISO donela je standard ISO 646 koji koristi jedan bajt za koriš enje ASCII izvan Amerike. Dalji razvoj, pojava, ekspanzija interneta i uklju ivanje kineskog pisma, uslovljen je rezervisanjem više memorije. Unicode je standard koji se koristi od 1991 godine i zasniva se na šesnaestobitnom skupu karaktera koji ima 65 536 kodnih mogu nosti i može obuhvatiti 256 osmobitnih varijanti istovremeno. Sa Unicode-om obezbe ene su kodne vrednosti za pisanje svih savremenih “velikih” jezika, kao i klasi ne forme nekih jezika. Dostupni alfabeti uklju uju latinski, gr ki, irilicu, jermenski, hibru, arapski, devanagari, bengalski, gurmukhi, gudžarati, oraja, tamil,

teluga, kanara, malajam, tai, lao, gruzijski i tibetanski, kao i kineske, japanske i koreanske ideograme i japansko i koreansko fonetsko i silabi ko pismo. Uklju uje, tako e, znake interpunkcije, tehni ke i matemati ke karaktere, strelice i mnoge raznovrsne karaktere kao što su šaka, zvezda, itd. Karakteri kao što su akcentovana slova koriš ena u mnogim jezicima, znaci raspoznavanja, kao što su akcenat i tilda (talasi ), obuhva eni su, a obezbe en je i mehanizam kombinovanja karaktera kombinovanjem tih oznaka sa drugim simbolima. Ovo ne obezbe uje

149

Page 158: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

samo alternativno kreiranje akcentovanih slova, ve odgovara matemati arima koji po navici prave nove karaktere dekorišu i postoje e. Obezbe ene su kodne vrednosti za gotovo 39 000 karaktera, ostavljaju i neke od kodnih poena neiskoriš enim. Markap jezici kakvi su HTML i XML i programski jezik Java, koriste Unicode kao svoj skup karaktera. Kada jednom bude usvojen kao skup karaktera ve ih operativnih sistema, zadatak prenosa teksta koji koristi karaktere van SAD – engleskog ASCII repertoara trebalo bi da bude višestruko olakšan.

Unicode je kompatibilan sa ISO 10646 standardom koji predstavlja dalje proširenje za zapise koji nisu obuhva eni sa prethodnim standardima, kao što su, na primer, notni zapisi.

ISO 10646 je 32-bitni kôd karaktera, od kojih je 8 bita za 256 grupa, 8 bita za 256 ravni za svaku od grupa i 16 bita za 65 536 karaktera u svakoj od ravni. Sa ovim standardom ostavljene su najšire mogu nosti za sva budu a proširenja. 8.4.2 Font

Font je izraz koji se u tipografiji koristio za skup slova jedne veli ine i jednog tipa, a u multimedijalnim tehnologijama font ozna ava fajl sa glifovima i slovnim ornamentima. Font predstavlja jednu odre enu familiju glifova. Glif je izraz za šaru, grafi ki oblik i sli icu, a u multimedijalnim tehnologijama glif ozna ava spoljašnji lik sa kojim se prezentira karakter. Tekst se sastoji od nizova karaktera koji se u ra unaru memorišu kao binarni kodovi odre enog standarda: ASCII, ISO 646, Unicode i ISO 10646. Da bi se prikazali, kodovi karaktera se povezuju sa glifovima smeštenim u glifovskim datotekama – fontovima. Datoteke glifova, odnosno fontovi, razlikuju se po stilu, dizajnu i na inu memorisanja glifova. Glifovi predstavljaju sli ice i formiraju se, kao i slike, pomo u bitmapirane ili vektorske grafike. Na in formiranja glifova uzima se kao osnova za klasifikaciju fontova koji predstavljaju zbirku glifova. Fontovi se, na osnovu na ina formiranja glifova, dele na bitmapirane i vektorske. Bitmapirani – Bitmap ili rasterski fontovi sastavljeni su od niza ta aka, piksela, pomo u kojih se prikazuje slika karaktera. Prednost ovih fontova je što se brzo o itavaju, a nedostatak što nisu skalabilni, jer je za svaku veli inu potrebno imati poseban skup fontova.

Bitmapirani fontovi pokazuju iste karakteristike kao i bitmapirane slike klasi nih formata: .bmp – bitska mapa (eng. bitmap), .png – pokretna mrežna grafika (eng. portable network graphics), i .tif format ozna ene slike (eng. tagged image format) ili .tiff format dat. ozna ene slike (eng. tagged image file format). Svaka platforma poseduje sopstveni format bitmapiranih fontova, naj eš e poboljšan na neki na in, da bi efikasno radio sa rutinama sistemskog softvera koje obra uju prikazivanje teksta. Konturni (eng. outline) ili vektorski fontovi sadrže skup instrukcija, pomo u kojih se iscrtava glif kao vizuelna predstava karaktera. Velika im je prednost što su skalabilni, odnosno, mogu menjati veli inu. Promena veli ine glifa ne uti e na njegovu rezoluciju, tako da se može koristiti samo jedan tip datog fonta.

Konturni fontovi grade se po pravilima vektorske grafike od krivih i pravih linija, i obi no su smešteni u formate za više platformi. Dva naj eš e koriš ena formata su Adobe Type 1, koji se esto jednostavno naziva PostScript font, iako postoji još drugih PostScript fontova, i TrueType.

150

Page 159: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

TrueType font originalno je uveden od strane Apple-a, ali ga više koristi Windows nego Macintosh operativni sistem (eng. operating system – OS)) Mac OS, kod koga se zbog popularnosti Adobe više koristi Type 1. Konturni fontovi mogu biti proizvoljno skalirani i isti font može biti koriš en za prikazivanje na niskoj rezoluciji ili štampanje na jako visokoj. Program za prikazivanje može da prevodi konturne fontove bilo koje veli ine. Program Adobe Type Manager (ATM) obavlja ovu funkciju na sistemskom nivou za Type 1 fontove. Konturni fontovi u bilo kom od popularnih formata mogu sadržati do 256 glifova. Glifovi u Type 1 fontu jednostavno su mali programi, napisani u ograni enom podskupu PostScripta. Ograni enja su namenjena da u ine mogu im da glifovi budu efikasno prikazani na ekranu, programima kao što je ATM, u dovoljnom kvalitetu kada se prikažu na rezoluciji ekrana. TrueType je alternativni format. Konturni karakter u TrueType fontu uva se kao serija ta aka koje definišu linije i krive ine i njihov oblik. Novorazvijeni format OpenType ujedinjuje Type 1 i TrueType fontove, obezbe uju i format fajla koji omogu ava da bilo koja vrsta konturnih fontova bude sa uvana. OpenType su razvili Adobe i Microsoft zajedno 1997–8 godine, a pojavio se 1998 i Type 3 format. Postoji i format Type 0 u kome elementi fonta nisu glifovi karaktera, ve drugi fontovi. Type 0 font namenjen je za uvanje kombinovanih fontova, od kojih je svaki sastavljen od nekoliko Type 1 fontova. Njegova glavna namena je da obezbedi veliki repertoar karaktera, koji bi bili potrebni za koriš enje u saradnji sa Unicode-om. Type 1 i TrueType sadrže, pored opisa glifova, i informacije koje mogu biti iskoriš ene od strane programa za prikazivanje, da bi se poboljšao izgled teksta na niskim rezolucijama. Ove informacije odnose se na izuzetno fine osobine, koje mogu izgubiti svoju fino u kada se manje piksela koristi za svaku liniju. U Type 1 fontovima nalaze se u obliku saveta (eng. hints), koji obezbe uju vrednosti i parametre koji mogu biti iskoriš eni da upravljaju prikazivanjem glifova na niskim rezolucijama. Na primer, saveti su namenjeni da izazovu smanjenje prelaza. Kao što smo pomenuli, prelaz normalno pomaže da se poboljša propisani izgled fonta. Kako bilo, na niskim rezolucijama, kada se veli ina prelaza zaokruži na najbliži piksel, efekat može biti preteran i tekst e izgledati nepravilnije nego što bi izgledao da mala slova budu ta no visine h. Ta ka na kojoj e se uklju iti smanjenje prelaza direktno zavisi od dizajna fonta, pa ne može biti uklju ena bez informacija koje pruža sam dizajner fonta. Saveti Type 1 fontova omogu avaju distribuciju ovih informacija. Ostali saveti srazmerno smanjuju varijacije u osnovi fonta, koje e iako estetski ugodne na velikim rezolucijama, izgledati u najmanju ruku nejednako na niskim rezolucijama. 8.4.3 Prikazivanje teksta na monitoru

Tekst se na monitorima ra unara prikazuje pomo u glifova odre enog fonta koji se povezuje sa kodovima karaktera. Kodovi karaktera o itavaju se, iz memorije ra unara, i zamenjuju glifovima koji se prikazuju na ekranu monitora. Proces je jednosmeran jer iz teksta, kao grafi kog dizajna karaktera na ekranu monitora, ne sledi mogu nost direktne povratne veze u memoriju kodovanih karaktera prikazivanog teksta. U procesu prikazivanja na ekranu tekst postaje grafika ija se prvobitna osnova u formi kodovanih karaktera ne može iz grafi kog oblika lako pretraživati i menjati.

151

Page 160: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Problem povratka iz pisanog teksta u memoriju kodova karaktera javlja se zato što je kod karaktera jedinstven i zauzima manje bita, dok je njegova grafi ka predstava – glif složenija i zauzima više memorije. Niz kodova karaktera kompaktniji je od niza glifova koji predstavljaju isti tekst, pa zamena karakter – kodova glifovima uve ava veli inu fajla koji sadrži tekst. Grafi ki prikaz teksta neefikasan je za pretraživanje i zbog toga što ne koristi ponavljaju u prirodu teksta. Isti karakter, odnosno glif, višestruko e se ponavljati, pa ako je izvršen prelaz u glifove, mnogo kopija istog glifa e biti koriš eno, a svaki e biti mnogo ve i nego odgovaraju i kôd karaktera. Vra anje u kod karaktere iz prikazivanog teksta može da se ostvari na posredan na in, pomo u specijalizovanog ra unarskog programa. Ako je stranica odštampana pa tekst skeniran, rezultat je bitmapirana slika teksta. Do karaktera skeniranog teksta može se do i pomo u specijalizovanog programa za opti ko prepoznavanje znakova (eng. optical character recognition – OCR) koji analizira oblike na bitmapiranoj slici i prepoznaje koje karaktere ti oblici predstavljaju. Ne postoji potpuna uspešnost prepoznavanja ali je primena ovog programa veoma zahvalna naro ito kod digitalizacije papirnih izdanja.

Za sigurnu reprodukciju karaktera kod razmene tekstualnih dokumenata, naro ito u slu aju re e koriš enih fontova, postoji mogu nost da se koriš eni font ugnezdi i šalje zajedno sa dokumentom. To pove ava veli inu fajla ali obezbe uje sigurnost repliciranja. 8.4.4 Veli ina, razmera i tip fontova

Veli ina, razmera i tip fonta definiše izgled glifova koji tom fontu pripadajaju. Veli ina i razmera fonta ozna avaju fizi ke dimenzije glifova: slova, brojeva i znakova odnosno svih grafena koji pripadaju datom fontu, a izražavaju se u poenima (eng. points – pt). U digitalnoj tipografiji jedan poen je 1/72 in a, približno 0.3528 mm. To je veoma mala jedinica, pogodna za merenje dimenzija malih objekata kakvi su karakteri. Za malo ve e vrednosti, kakav je razmak me u linijama teksta, obi no se koristi cicero (pica – pc), koji je 12 poena ili 1/6 in a, 4.2333 mm. Za razliku od ostalih mernih jedinica kakvi su metar ili stopa, poeni nemaju internacionalno priznatu standardnu veli inu. Vrednost od ta no 1/72 in a je uvedena od strane PostScript-a.

Na Slici 8.4.4.1-a prikazane su karakteristi ne veli ine fonta. Razmera izme u visine x i veli ine tela fonta jedna je od najvažnijih karakteristika svakog fonta. Visina – x nekog fonta koristi se kao jedinica mere i obi no se piše kao ex. Ima korisnu osobinu da nije apsolutna jedinica, kao što je poen, ve je relativna, menja se kako se menja veli ina fonta, i razlikuje se za razli ite fontove, ali uvek ostaje u istoj relaciji u odnosu na visinu malih slova. Tako obezbe uje zgodan na in izražavanja vertikalne veli ine koja se menja proporcionalno ovoj veli ini. Srodna jedinica je horizontalni razmak i naziva se em. Tradicionalno 1em je širok kao veliko slovo M. Kod mnogih fontova, širina slova M jednaka je širini tela fonta pa se zna enje jednog em-a promenilo tokom godina, i danas se naj eš e uzima kao jedinica dužine jednaka veli ini fonta. Veli ina em je definisana sli no kao jezik formatiranja kaskadni stil listova (eng. cascading style sheets – CSS). Duga ke crte koriš ene za umetnute fraze duga ke su 1 em i samim tim se nazivaju em crte. Ponekad se sre e još jedna relativna jedinica en koja predstavlja osnovnu širinu velikog slova N, i koristi se da se definiše 0.5 em. Jedna en-crtica je crtica širine 1 en, i koristi se za odvajanje stranica ili datuma, kao što je 1998–99 godina.

152

Page 161: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Svako slovo ima svoj prihvatni prostor (eng. bounding box) koji je u stvari najmanji prostor koji može da obuhvati to slovo. Naj eš e se ostavlja mali razmak me u prihvatnim prostorima susednih karaktera. Drugim re ima kada crtamo glif neposredno pored drugog, prazan prostor se ume e blizu glifa, i nalazi se van prihvatnog prostora, naj eš e levo, na razmaku koji je poznat kao nosa leve strane (eng. left side bearing), što je prikazano na Slici 8.4.4.1-b. Ponekad, kada se dva odre ena slova smeste jedno pored drugog, prostor me u njima izgleda premali ili preveliki. Postoji mogu nost podešavanja – letter spacing.

Slika 8.4.4.1—Veli ine koje karakterišu font Veli ine koje opisuju veli inu pojedinog karaktera i razmak me u karakterima, zajedno su poznate kao metrika fonta. Programi koji obavljaju slovoslaganje, zahtevaju pristup metrici fonta da bi odredili gde ta no da smeste glif dok prave linije, pasuse i stranice. Organizacija ovih informacija zavisi od formata fonta, ra unarskog sistema i slovoslaga kog softvera koji se koristi. Tip fonta predstavlja dizajn sa kojim su ura eni glifovi koji pripadaju odre enom fontu. Razvijen je veliki broj razli itih tipova fontova. Ne postoji jedinstvena klasifikacija tipova fontova. Najosnovnija podela fontova po tipu je na fontove fiksne veli ine – jednomesne i proporcionalne fontove. Fontovi fiksne veli ine sadrže glifove koji za svaki karakter horizontalno zauzima jednaku veli inu prostora, nezavisno od svoje veli ine. Neka slova imaju, oko sebe, više praznog mesta od drugih. Na primer, uski oblik malog slova j ima oko sebe onoliko praznog prostora koliko je potrebno da se popuni širina malog slova š. Proporcionalni fontovi sadrže glifove koji za svaki karakter zauzimaju onoliko mesta kolika je širina slova. Na primer, slovo š zauzima više mesta od slova j. Pokazalo se da tekst sa proporcionalnim fontovima izgleda skladnije i lakši je za itanje, u ve ini slu ajeva. Osim toga, više re i staje u redovima.

153

Page 162: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Slede a klasifikacija odnosi se na serif i sans serif (ponekad sanserif) fontove. Serifi su crtice dodate na krajeve fontova kao na Slici 8.4.4.2. Crtice se nalaze na serif fontovima, ali su izostavljene na sans serif glifovima, što im daje uobi ajeni izgled. Serifi poti u od tragova dleta na rimskim kamenim plo ama, pa se serif fontovi nekad nazivaju i rimski.

Slika 8.4.4.2—Serifi

Opšta je mogu nost ispisivanja slova sa vertikalnim linijama, ili koso sa italik fontom. Italik fontovi imitiraju glifove sa slovima nagnutim na desnu stranu, ime se imitira odre eni stil pisanja. Ve ina italik fontova su ili parnjaci, ili razli ite varijante uspravnih fontova. Na primer, Times italik je italik verzija fonta Times Roman. Postoje, ipak, neki italik fontovi koji imaj svoj sopstveni dizajn, koji su obi no dizajnirani da imaju izgled rukopisa, i koriste se kada je potreban lepši, humaniji izgled od obi nog kucanog teksta. Postoje konturni fontovi koji imaju šuplja slova i fontovi koji bacaju senku. Razvijeni su fontovi koji izgledaju malo horizontalno spljošteni, kada se uporede sa proporcijama ve ine fontova. Nazivaju se “skra eni” fontovi, i namenjeni su prilozima, kao što su poruke na marginama ili uske novinske rubrike, gde se zahteva da tekst bude upakovan na što manje prostora. Za razliku od ovih, fontovi koji se nazivaju “prošireni” izgledaju horizontalno razvu eni, što ih ini pogodnijim za naslove i druge izolovane tekstualne elemente. Fontovi se mogu klasifikovati prema težini, to jest, prema debljini crta koje ine slova. Deblje crte ine da tekst izgleda tamnije i vrš e. Po konvenciji, ovi fontovi se nazivaju teškim (debljih crta), boldfejs ili jednostavno bold. Kao i italik, bold fontovi su obi no verzije fontova sa manjom težinom. Rezultat toga je da težina nije apsolutna osobina, bold težina nekog jako lakog fonta može biti lakša od obi ne težine nekog jako teškog fonta, ija bi bold verzija bila još teža. Neki od fontova mogu postojati u više varijanti, predstavljaju i razli ite stepene težine. Pod ovim okolnostima, pojedini stilovi se opisuju terminima kao što su: ultra-bold, semi-bold, laki i ultra-laki. Tekst procesori esto tretiraju podvla enje kao stilsku opciju sli nu italik ili boldu, pa se može pretpostaviti da su i to, tako e, podvu ene verzije fontova. Podvu eni fontovi veoma su retki, jer se u tipografskim krugovima smatra da su loša zamena italizacije, pogodna samo za slovoslaga e koji nemaju italik-opciju. Kao i ve ina tipografske rutine, i nepoželjnost podvla enja je dovedena u pitanje. Pošto se raznovrsniji efekti mogu posti i kombinovanjem obi nih fontova sa linijama razli itih debljina, ovo preispitivanje nije dovelo do ekspanzije u koriš enju podvu enih fontova.

8.5 Animacija

Animirati zna i oživeti, pokrenuti, udahnuti dušu (eng. to animate – to get thing alive, to make them change).

154

Page 163: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Animacija je postupak stvaranja iluzije o kretanju 2D i 3D objekata, slika, crteža i modela.

Prikazivanje pokreta može se videti na crtežima iz paleolitskog doba. Nizovi slika, sli no savremenim stripovima, postoje u staroegipatskim, persijskim, indijskim i kineskim hramovima. Ideja o animaciji je veoma stara, ali je tehni ki realizovana tek krajem 19. veka, pojavom filma. U razvoju animacije karakteristi na su dva perioda. Prvi period je do po etka primene ra unara za obradu i montažu slike krajem 20. veka, što se ozna ava kao tradicionalna animacija. U 21. veku, tradicionalnu animaciju potiskuje kompjuterska animacija.

Pojedina ne slike od kojih se pravi niz za animaciju mogu biti snimci crteža ili modeli – objekata koji se namenski kreiraju. Animacioni niz se može praviti i kombinovanjem pojedina nih slika snimljenog filma ili frejmova TV slika. U nizu slika koje se formiraju za animaciju, objekti na slikama imaju tendenciju promene pozicije, oblika, boje, transparencije, strukture usled aktivnosti samih objekata ili promene uslova okoline. Promene izme u dve susedne slike mogu biti jedva primetne, ili opažljivo primetne. Prikazivanjem niza slika dobija se iluzija kretanja zbog perzistencije ula vida. Minimalni broj slika za doživljaj kontinuiteta, odnosno iluzije kretanja, je niz od 12 slika u sekundi. Proces animacije ozna ava formiranje niza razli itih crteža i/ili fotografija koji se u toku prikazivanja smenjuju dovoljno velikom brzinom, da se stvara doživljaj pokretnih slika. Svaka pojedina na slika predstavlja jedan okvir – frejm. Animacija se proizvodi frejm po frejm (eng. a frame at a time). Princip je isti kao i kod filma i televizije, jer se slike – frejmovi sukcesivno smenjuju sli no prikazivanju pomo u kono-projektora. Brzina smenjivanja je 24 slike u sekundi, 25 slika u sekundi u PAL TV mreži i 30 slika u sekundi u NTSC TV mreži. U ra unarskim mrežama, brzina promene frejmova može se proizvoljno menjati. Savremena digitalna animacija obi no se projektuje, zbog ekonomi nosti i mogu nosti interpolacije, sa manjima brojem slika u sekundi, u odnosu na TV standarde i film. 8.5.1 Tradicionalna animacija

Tradicionalna ili klasi na animacija, tako e poznata kao celuloidna – cel animacija, predstavlja formiranje pokreta pomo u niza crteža, modela i objekata snimljenih na celuloidnu traku.

Za stvaranje iluzije pokreta, potreban je veliki broj crteža koji se me usobno malo razlikuju. Crtanje je zahtevan posao pa su se, u cilju uštede vremena i materijala, tražili na ini da se smanji broj crteža i izbegne ponovno crtanje istog sadržaja slike. U procesu crtanja koristi se providna folija (eng. sheets) za odvajanje stati ne pozadine i pokretnih objekata koji su sastavni delovi slike. Postupak kreiranja animacije koriš enjem folija prikazan je na Slici 8.5.1.1. Stati ni elementi crtaju se na pozadini samo jednom. Preko pozadine postavlja se transparentna, providna folija – sloj (eng. layer), na koji se crtaju oni elementi slike koji treba da se kre u ili menjaju oblik. Pozadina je stacionarna, a providna celuloidna folija, na kojoj se crtaju slike sa kojima se formira pokret, postavlja se, tokom crtanja i snimanja, preko pozadine. Tehnika predstavljanja efekta putovanja kroz scenu zasniva se na kreiranju pozadine na površini ve oj od frejma – slike i pomeranjem pozadine ispod providnog lista – lejera.

Kompletirani crteži snimaju se pojedina no, jedan po jedan u nizu, kako e se reprodukovati i proizvesti iliziju kretanja. Taj je postupak nazivan animacija stani – kreni.

155

Page 164: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Slika 8.5.1.1—Ilustracija postupka kreiranja animacija koriš em folija

Animacija stani – kreni (eng. stop – motion) zasniva se na fizi kom manipulisanju objekata koji se snimaju kadar po kadar da bi se kod prikazivanja dobila iluzija o kretanju. Sa tehnikom stani – kreni razvijeno je više na ina animacije, kao što su:

Lutkarska animacija (eng. uppet animation) Glinena ili plati na animacija (eng. clayanimation) Animacija od ise aka (eng. cutout animation) Animacija sa modelima (eng. model animation) Animacija sa grafi kim materijalom (eng. graphic animation) Animacija sa glumcima – pixilation

U tradicionaloj animaciji postoji 12 principa i postupaka koji se koriste i u kompjuterskoj

animaciji:

Gnje enje i rastezanje (eng. squash and stretch) je postupak kojim se naglašava fleksibilnost, pokret i brzina pokreta objekta ime se stvara predstava o promeni oblika i težini crtanih objekata, a ekstremnim efektima postiže se komi nost.

Anticipacija (eng. anticipation) je postupak koji se koristi za pripremu publike za predstoje u akciju animiranog objekta da bi utisak bio uverljiviji. Skaka iz mesta priprema se savijanjem kolena, a igra golfa pravi zamah unazad.

Postavljanje scene (eng. staging) predstavlja prezentovanje ideje sredstvima usmeravanja pažnje gledalaca na glavni objekt scene da bi prezentacija svake akcije, li nosti i izraza raspoloženja bila nedvosmislena.

Podešavanje vremena – tajming (eng. timing) predstavlja jasno definisanje i prora unavanje etapa planirane akcije: priprema, akcija i reakcija. Tajming se realizuje brojem crteža ili slika za datu akciju, odnosno brzinu akcije. Dobar tajming ini da objekti izgledaju kao da poštuju zakone fizike, na primer, padanje, klizanje, sudari. Vreme je od klju ne važnosti za uspostavljanje raspoloženje lika, emocije i reakcije.

156

Page 165: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Planiranje i odre ivanje pogodnog završetaka akcije (eng. follow through and overlapping action). U jednoj akciji može biti više planiranih kretanja ili promena koje se ne odvijaju simultano i koji mogu da se preklapaju u vremenu.

Izbor jednog od dva postupka u procesu stvaranja animacije. Prvim postupkom se vrši kreiranje svih slika u sekvenci, od prve do poslednje (eng. straight ahead action). Drugim postupkom se naglašava akcija i njene faze: prvo se vrši kreiranje glavnih slika–scena, dok se ostale slike stvaraju kasnije (eng. pose-to-pose action).

Usporavanje kretanja u krajnjim ekstremnim ta kama (eng. slow in and out), lagan ulazak i izlazak.

Luk (eng. arcs) predstalja prikazivanje putanje kretanja objekta koja može biti prava linija ili, što je eš e i prirodnije, u obliku luka.

Preuveli avanja (eng. exaggeration) objekata ili kretanja ima za cilj da se bolje definiše neko emocionalno stanje.

Sekundarna akcija (eng. secondary action) predstavlja sporednu radnju koja se odvija istovremeno sa glavnom akcijom sa kojom ima veze, a koristi se da naglasi realnost glavne akcije.

Princip vrstog crteža (eng. solid drawing) uzima u obzir oblike u 3D prostoru, daju i im ja inu i težinu. Animator treba da bude vešt crta i razume osnove 3D oblika, anatomije, težine, svetlosti i senke.

Privla nost (eng. appeal) crtanih likova odgovara harizmi glumca koji ne mora da bude simpati an i pozitivan. Važno je da gledalac ose a da je lik realan i interesantan.

8.5.2 Kompjuterska animacija

Kompjuterska animacija predstavlja proces generisanja animacije pomo u kompjuterske grafike. Na sli nom logi kom i proceduralanom konceptu, kao tradicionalna cel animacija, kompjuterska animacija omogu ava da se niz slika generisanih u ra unaru sukcesivnim o itavanjem i elektroopti kom transformacijom prikaže na ekranu, stvaraju i percepciju pokretnih i promenljivih objekata.

Kompjuterska animacija, u suštini, digitalni je naslednik tehnike stani – kreni tradicionalne animacije sa 3D modelima, i slika po slika animacije sa 2D ilustracijama. Kompjuterski generisane animacije mogu se kontrolisati više nego fizi ki procesi. To omogu ava kreiranje pokretnih slika što ne bi bilo izvodljivo koriš enjem bilo koje druge tehnologije. Tako e je omogu eno da grafi ki umetnik radi bez glumaca, skupe scene i rekvizita.

Za kreiranje komjuterske animacije potrebna su dizajnerska znanja, i mo an ra unarski hardver i softver. Postoje 2D i 3D kompjuterske animacije. Pretežno se kreiraju 2D animacije, jer ih je lakše i jeftinije realizovati. Postoje više razli itih softverskih alata kako visoko profesionalnih i skupih tako i besplatnih – otvoreni kod – otvoreni izvor (eng. open source) za izradu animacija. Pregled ovih alata dat je u poslednjoj glavi ove knjige.

Digitalno predstavljanje slike je, u suštini, numeri ko, što daje mogu nost interpolacije koja je izuzetno koristan postupak u kompjuterskoj animaciji. Ra unar sa algoritmima za interpolaciju formira me uslike i tako pomaže animatoru, smanjuju i mu broj kadrova koje je u tradicionalnoj animaciji morao da crta.

157

Page 166: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Animacija se može generisati uvo enjem, importovanjem svakog pojedina nog kadra – frejma u vremensku osu, odnosno animacioni niz i kreiranjem sadržaja svakog pojedina nog kadra u nizu. Takav postupak animacije poznat je kao niz fajlova sa slikama. Niz fajlova sa slikama (eng. sequence of image files) predstavlja reprezentaciju animacije koja je veoma fleksibilna, jer daje mogu nost obrade pojedinih fajlova u izabranom grafi kom programu, pojedina an fajl može biti uklonjen iz sekvence, zamenjen ili dodat. Sequence of image files može se importovati u video-editing aplikaciju i konvertovati u format za video – isprepletani zvuk i slika (eng. audio video interleave, audio video interleaved – AVI) ili QuickTime standard za video format. Drugi na in generisanja animacije je pomo u klju nih kadrova– frejmova. Klju ni kadrovi su prvi i poslednji kadar jedne akcije. Mogu se koristiti u svakoj ta ki ili momentu, u kojem postoji ili nastaje zna ajna promena. Klju ni kadrovi se obi no uzimaju za karakteristi ne položaje pokretanih objekata, takozvane ekstreme. Animacija pomo u klju nih kadrova (eng. key frame animation) je postupak formiranja frejmova izme u dva klju na frejma – in-betweeners automatski, primenom interpolacije. Interpolacija je matemati ki postupak za prora unavanje vrednosti funkcije izme u poznatih ta aka. Kreiranje frejmova koji posreduju izme u klju nih frejmova ozna en kao proces ra anja bliznaka – tvining (eng. tweening). U tvining-procesu, kreiraju se prvo dva klju na kadra koji reprezentuju odre enu promenu, zatim se crta niz progresivno razli itih frejmova – me ukadrova. Kreiranje me ukadrova može da odradi ra unar pomo u interpolacionih algoritama, što je prikazano na Slici 8.5.2.1.

Slika 8.5.2.1—Interpolacija izme u klju nih kadrova Kod kreiranja kompjuterske animacije bitan parametar je putanja kretanja objekata. Na osnovu definisane putanje kreiraju se promene izme u klju nih kadrova. Putanja (eng. path) odre uje promenu na objektu: veli ine, boje, detalja, i promene brzine kretanja. Putanja na osnovu koje se vrši interpolacija me ukadrova može biti ili prava linija ili neki drugi oblik, što se definiše linearnim jedna inama prvog reda ili Bazirijevim krivama.

U linearnoj interpolaciji veli ina pokreta, što zna i promene izme u dva susedna kadra, konstantne su i odre ene priraštajem izme u krajnjeg i po etnog klju nog kadra, podeljeno sa brojem me ukadrova. Bazirijeva interpolacija koristi se kada polazak iz po etnog klju nog kadra i završetak u krajnji klju ni kadar ne treba da budu nagli, što bi se dobilo linearnom interpolacijom, ve sa postepenim prelazima. Kompjuterska animacija se može kreirati vektorskim i bitmapiranim slikama. Animacija vektorskim slikama izvodi se zahvaljuju i mogu nostima geometrijske transformacije slike kao što su translacija, rotacija i skaliranje ijom se kombinacijom mogu

158

Page 167: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

prikazati razni oblici promena i realizovati niz slika sa kojima se stvara iluzija kretanja. Za animaciju vektorskim slikama razvijeni su specijalizovani softverski alati kao što je široko primenjivani Macromedia Flash. Animacija bitmapiranim slikama izvodi se zahvaljuju i mogu nostima da se bitmapirana, kao i vektorska slika, može pomerati, rotirati i skalirati i na taj na in uticati na karakteristike slike, kao što je srazmera, ugao i veli ina ime se može formirati niz za animaciju. Algoritmi za navedene operacije druga iji su, i vreme izvršenja je duže nego u slu aju vektorskih slika. Program After Efect je softverski alat za kreiranje animacije sa bitmapitanim slikama.

Za jednostavnije animacije popularna su dva postupka pod nazivom grafi ki fajl format za razmenu (eng. graphics interchange format – GIF) i Sprajt animacija. GIF fajl format jedan je od dva naj eš e koriš ena ra unarska grafi ka formata za razmenu slika koji se može koristiti za kreiranje malih animacija sa nižom rezolucijom i paletom od 256 boja. GIF fajl format se koristi da bi se sa uvala sekvenca slika. GIF89 fajl format može da kontroliše ponašanje animacije, npr. ponavljanje odre eni broj puta ili neograni eno, minimalno kašnjenje izme u frejmova. Nedostaci su što se ne može dodati zvuk i ograni enje na paletu od 256 boja. Ovo ograni enje se može prevazi i koriš enjem QuickTime video formata koji može da se menja, kombinuje sa drugim klipovima, pa ak i da mu se dodaju efekti. Sprajt - sprite animacija je animacija na ra unarima koja se zasniva na objektima koji se pomeraju. Složen pokret može se dobiti dodeljivanjem više slika jednom sprajtu. Sprajt animacija se naj eš e koristi za simulaciju hodanja kod ljudskih slika, što je prikazano na Slici 8.5.2.2, za kreiranje 2D video igrica, za razli ite tipove simulacija, kao i za same prezentacije na internetu.Vrednosti koje se menjaju pri pomeranju objekta prora unava kompjuter.

Slika 8.5.2.2—Kreiranje sprajt animacije

159

Page 168: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

8.5.3 Animacija u multimedijalnim sistemima

Animacija u multimedijalnim sistemima predstavlja informacionu tehnologiju za kreiranje najupe atljivije virtualne realnosti koja se ostvaruje trodimenzionalnim objektima, virtualnom realnoš u i interakcijom što je najviše došlo do izražaja u ra unarskim igrama. Predvi a se da i razvoj budu e filmske industrije ide u pravcu sve ve e primene multimedijalnih animacija, aktivnim uklju ivanjem gledaoca kroz interaktivne mogu nosti budu ih kreacija, što film usmerava, u odre enom smislu, na igru. Slede i odeljci su abstrakti za trodimenzionalnu animaciju i virtualnu realnost dok se interakcija kao opšta mogu nost ukratko razmatra u posebnom poglavlju. TRODIMENZIONALNI OBJEKTI U ANIMACIJI – 3D ANIMACIJA Trodimenzionalni objekti su materijalni objekti koji zauzimaju stvarni 3D prostor kao i nematerijalni modeli u virtualnom 3D prostoru koji se pomo u svetlosti i senki do aravaju na 2D ekranu. Animacija trodimenzionalnih objekata – 3D animacija predstavlja postupak prikazivanja 3D objekata na 2D ekranima pomo u kompjuterske grafike i specijalizovanih softverskih alata. Konstrukcija i prikazivanje 3D objekata naj eš e uklju uje i proces animacije, jer iluzija trodimenzionalnosti nije potpuna ako se objekat ne prikazuje sa raznih strana. 3D animacija nalazi primenu u raznim oblastima nauke, tehnike, umetnosti, posebno u proizvodnji ra unarskih igara. Za kreiranje 3D animacije potrebna je sposobnost zamišljanja objekata u tri prostorne i jednoj vremenskoj dimenziji i njihovo predstavljanje u 2D ekranu. Za renderovanje potrebni su snažni procesori i vreme. Za realizaciju ozbiljnijih 3D projekata potrebno je mnogo novca i vremena. Kod zahtevnijih 3D animacija, koriste se fizi ki zakoni za kreiranje pokreta. Dizajner treba da poznaje zakone kinematike. Kako se objekti kre u i šta ih pokre e treba za percepciju da bude što uverljivije. Dobar primer problematike kretanja u 3D animaciji je veza kod spojenih delova, kao što su ruke ili noge kod ljudskih figura ili životinja. Ruka se može kretati, zbog na ina na koji su delovi spojeni, samo u odre enim pravcima. Pokret gornjeg dela ruke odre uje pokret donjeg dela ruke. Zato je zgodnije prvo pozicionirati šaku na kraju ruke, zatim uskladiti pokret njenog preostalog dela. Sli no je kod animacije hoda, stopalo mora biti iznad podloge, oslonjeno na nju pri svakom koraku. Animator podešava položaj stopala, zatim program sam prora unava položaj butine i potkolenice. Ovaj oblik modelovanja se naziva inverzna kinematika. VIRTUALNA REALNOST U ANIMACIJI

Virtuelna stvarnost (eng. virtual reality) predstavlja kompjuterski kreiranu okolinu koja može da simulira fizi ko prisustvo objekata u realnom svetu kao i u zamišljenom svetu. Prvobitno, izraz “virtuelna stvarnost” se koristio da opiše doživljaj sinteti kog sveta. Ekrani koji su osetljivi na pomeranje glave koriš eni su da projektuju slike na korisnikove o i, modifikuju i ih dok se glava pomera, tako da korisnik ima utisak da se nalazi u 3D svetu. Postoje

160

Page 169: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

i rukavice, koje su osetljive na pomeranje ruke. Visoka cena opreme ograni ila je njeno koriš enje na simulacije letenja i industrijske simulacije. Za programiranje distribucije multimedijalnih proizvoda sa virtuelnom realnoš u preko interneta koristi se jezik modelovanja virtualne realnosti (eng. virtual reality modeling language – VRML). VRML je bio jezik zasnovan na tekstu, koji je omogu avao da 3D objekti i scene budu opisani u programskom jeziku. Poboljšane verzije su VRML 1.0 i VRML 2.0. VRML omogu ava specifikaciju objekata, odnosno njihove geometrije i materijala od koga su sastavljeni. Razli ite teksture mogu biti primenjene na površine objekta, koji e se postaviti u 3D prostor. Scene mogu biti napravljene u uobi ajenim tekstualnim editorima, ili u programima za 3D modelovanje i osvetljene na razli ite na ine. Objekti u VRML fajlu nazivaju se vorovi – nodovi. Kada su ure eni hijerarhijski, nodovi predstavljaju graf scene. Svaki VRML svet, bez obzira koliko jednostavan, predstavlja graf scene. Graf scene sadrži nodove koji opisuju objekte i njihove osobine. On sadrži hijerarhijski grupisanu geometriju da bi obezbedio audio-vizuelnu reprezentaciju objekata, kao i u eš e nodova u generisanju doga aja i mehanizmu rutiranja. Zajedni ki efekat nodova u grafu scene naziva se stanje (eng. state). Oblik noda pridružuje geometriju noda nodovima koji definišu dati geometrijski izgled. Oblik noda bi e deo transformisane hijerarhije koja ima vidljiv rezultat, a sadržaj transformisane hijerarhije bi e oblik noda za neku vidljivu geometriju. Grupisanje nodova ima polja koja sadrže listu dece nodova. Svako grupisanje noda definiše koordinatan prostor za njegovu decu. Ovaj koordinatni prostor relativan je u odnosu na koordinatan prostor noda ije je dete grupisani nod. Takav nod zove se roditelj nod. Ovo zna i da transformacija akumulira niži graf scene u hijerarhiji.

8.6 Zvuk u multimediji

Zvuk u multimediji koristi se u razli ite svrhe zavisno od vrste multimedijalnog proizvoda i informacionog sadržaja koje zvuk nosi. U multimediji se koriste tri osnovna informaciona sadržaja koje zvuk može da nosi: govor, muzika i zvu ni efekti raznih zvu nih izvora. Drugo poglavlje ove knjige Osnovi audija posve eno je zvuku.

Govor u multimediji, kao osnov za jezi ku komunikaciju, u enje i mišljenje može da ima primarnu funkciju i bude važniji od slike i teksta. Ve i bebe više zadržavaju pažnju na likovima koji govore, nego na likovima koje ne prati zvuk. Percepcija pra ena govorom otpornija je na smetnje i bolje se pamti. Govor u mozgu izaziva i vizuelne asocijacije.

etvrto poglavlje ove knjige posve eno je audio-vizuelnim integracijama i bimodalnosti ljudskog govora.

Muzika u multimediji može da bude primarna kada je slika prate a, kao u slu aju muzi kih koncerata i spotova ili da prati sliku kada ima funkciju da poboljšava raspoloženje i ose anja koja pobu uje multimedijalna prezentacija.

Zvu ni efekti u multimediji koriste se da poja avaju odre ene funkcije, virtualnost i interaktivnost multimedijalne prezentacije.

Sa aplikativnog aspekta osnovne operacije vezane za zvuk u multimediji vezane su za procese preprodukcije, postprodukcije i reprodukcije.

U procesu preprodukcije obavljaju se snimanja zvuka i tonska režija. U procesu postprodukcije obavlja se obrada i montaža audio signala. U procesu reprodukcije obavlja se elektroakusti ka konverzija i ekvalizacija.

161

Page 170: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Pojednostavljena ilustracija sistema za ulnu percepciju zvuka i principa procesa snimanja data je na Slici 8.6.1.

Slika 8.6.1—Pojednostavljen prikaz ulne percepcije zvuka i principa procesa snimanja

Mikrofon je pretvara zvu nih u elektri ne signale što ekvivalentno radi unutrašnje uho ula sluha. Interesantno je i to da kroz slušni živac od unutrašnjeg uha do moždanog centra za

sluh, prenos audio signala se odvija pomo u elektri nih binarnih impulsa. Broj impulsa u jedinici vremena srazmeran je intenzitetu audio signala, što odgovara impulsnoj frekvencijskoj modulaciji, što je najpouzdaniji na in prenosa. Ra unar ima najzna ajniju ulogu za sliku i zvuk. Za ra unar se razvijaju programi sa sve ve im logi kim mogu nostima, tako da se ra unar sve više osposobljava za funkcije koje je imao isklju ivo ljudski mozak. Na taj na in ra unar je osposobljen da u multimedijalnim primenama pretvara audio signale u tekst, odnosno da bude pisar, kao i da iz teksta sintetiše govor, odnosno da ita.

U procesu postprodukcije, analiziraju se, obra uju, i montiraju snimljeni signali zvuka. Postoji znatan broj programa za postprodukciju zvuka kojima je posve eno slede e, deveto poglavlje ove knjige Aplikativni softver za multimedije. Ekrani sa Slike 8.6.2 ilustruju jedan softverski alat za multimedijalnu postprodukciju zvuka koji je razvijen u Kembridžu.

Slika 8.6.2—Ekrani jednog softverskog alata za analizu zvuka

162

Page 171: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

8.7 Dodir u multimediji

Dodir – hapt s predstavlja stimulaciju, pobudu somatosenzora u koži za percepciju prostornih i kineti kih karakteristika objekata.

Dorir u multimediji primenom heptik tehnologija (eng. haptic technology) omogu ava dobijanje informacije o veli ini, obliku, teksturi, težini ili vibracijama objekata i uspostavljanje interakcije u multimedijalnom sistemu.

U informaciono-komunikacionim tehnologijama, dodir se koristi od po etka razvoja prvih ure aja ne gube i zna aj do najsavremenijih sistema. Prstima se i danas kuca tekst i upravlja ra unarom preko tastature i miša. Osim neposrednog upravljanja dodirom, razvijeni su raznovrsni taktilni senzori koji doprinose vernijoj virtualizaciji realnih sistema.

Percepcija dodira je proces prepoznavanja objekata dodirom. Ose aj dodira se sastoji od tri glavna ose aja koja je esto teško razdvojiti. To su:

Opipljiva, dodirna percepcija (eng. tactile perception) prima informacije preko kožne

senzitivnosti kada se ovek ne kre e. Dodir je senzorska stimulacija koju osoba ose a kada nešto dolazi u dodir sa kožom. Izaziva nekoliko tipova ose aja: temperature, vibracija, teksture.

Percepcija pokreta (eng. kinaesthetic sense) je svest pokreta, pozicije i orijentacije delova

ljudskog tela.

Haptic percepcija koristi informacije ose aja dodira i pokreta.

Ose aj pokreta može biti rezultat akcije oveka – aktivni dodir, koji uklju uje signale koje mozak šalje u miši e, ili može biti od sila izvan tela – pasivni dodir. Aktivna haptic percepcija, kada se uzimaju informacije o objektu izvan tela, glavna je informacija ose aja koja se pridružuje interfejsu dodira.

Interfejsi dodira su ure aji koji mere kretanje i obezbe uju pobudu senzora od korisni kih ruku i prstiju. Interfejs dodira daje informacije kompjuteru zasnovane na poziciji ure aja i stimulišu korisnikov ose aj dodira snabdevanjem izlaza u formi sile povratne sprege i dodira. Interfejsi dodira omogu avaju korisniku da dodirne, oseti, manipuliše, stvara ili menja, sa njegovim rukama ili prstima, objekte prisutne na displeju ra unara, kao da su oni realni fizi ki objekti. To je ostvareno pažljivim merenjem sile koju bi neko ose ao kada dodirne realan objekat. Prezentovanjem tih sila korisniku, koriš enjem sile povratne sprege i dodirne sposobnosti displeja heptik ure aja, stvara se iluzija dodirivanja objekta.

Na in ostvarivanja komunikacije preko taktilnog ekrana prikazan je na Slici 8.7.1. Primena heptik tehnologije kod mobilnih telefona prikazana je na Slici 8.7.2.

Interfejsi dodira, na osnovu interakcije izme u korisnika i mašine, mogu se klasifikivati kao:

Zasnovani na prstima: dodaju se prstima i odgovaraju na kretanje prstiju. Zasnovani na rukama: korisnik ostvaruje interakciju sa ure ajem stezanjem krute sprave.

Mašina daje ljudskoj ruci ose aj sile koja je dodeljena raznim slu ajnim manevrima.

163

Page 172: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Slika 8.7.1—Komunikacija preko taktilnog ekrana

Slika 8.7.2—Komercijalna primena heptik tehnologije kod mobilnih telefona

Spoljašnji skelet (eng. exoskeletal): prati kretanje ramena, ili ak celog tela, dozvoljavaju i visoku interaktivnost, ali i ekstremno visoke cene. Te mašine se koriste u medicini, za ljude sa nekim nemogu nostima, u vojsci.

Suštinski pasivni ure aji (eng. inherently passive devices) ili inteligentni pomo ni ure aji (eng. intelligent assist devices): pasivni roboti za direktnu fizi ku interakciju sa ovekom – operatorom.

164

Page 173: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

8.8 Miris u multimediji

Miris (lat. olfactus, nem. geruch, eng. odor ili odour) predstavlja ose aj (eng. sense) prisustva odre ene supstance u vazduhu što detektuju hemoreceptori nosa povezani olfaktornim živcem (eng. olfactory nerve) sa moždanim centrom za miris. ulo mirisa nalazi se u nosu i detektuje koncentraciju supstanci koje su u gasovitom stanju rastvorene u vazduhu. Pomo u hemoreceptora, na sli nom principu kao ulo mirisa, funkcioniše ulo ukusa koje detektuje koncentraciju supstance u te nom stanju.

Receptorski neuroni za miris su specijalizovane elije koje mogu da transformišu prisutne molekule mirisa u povorku akcionih potencijala koje šalju u mozak snadbevaju i, na taj na in, centar za miris informacijama o prisustvu odre ene supstance u vazduhu. Na Slici 8.8.1-a prikazan je princip percepcije mirisa – biološki nos. Intenzitet mirisa je u direktnoj srazmeri sa elektri nim odzivom elija za miris (eng. olfactory cell). elije organa za miris koriste jedan mali deo od ukupno 1000 receptora. elije prepoznaju odre eni miris selektovanjem koji e receptori imati odziv. U nosu postoje oko 10 miliona olfactory cells. Postoji najmanje 1000 razli itih vrsta receptora mirisa (eng. olfactory receptors), ali svaki prepoznaje i odgovara samo jednoj vrsti mirisa (eng. fragrance). Svaka elija mirisa može upotrebiti samo nekoliko njenih receptora odjednom. Svaki molekul se kombinuje sa jednim brojem receptora u promenljivom stepenu i proizvodi se karakteristi an odziv. Karakteristi no je da miris nije aditivan, sabiranjem dva razli ita mirisa dobija se u potpunosti nov, razli iti miris. Miris je najkompleksniji ljudski ose aj.

Istraživanja mirisa, za koja je najviše zainteresovana farmaceutska industrija, kao i vojska zbog hemijskih i bioloških detektora, prenose se i u oblast informatike. Najnovija istraživanja idu ka modelovanju ponašanja elije za miris. Miris u multimediji predstavlja novi medij za koji se razvijaju senzori mirisa i generatori mirisa. Uvo enjem mirisa menja se dosadašnje iskustvo u interaktivnom domenu. Miris se uvodi u filmove, igre, animaciju, ili neki drugi oblik digitalnog medija. Senzori mirisa predstavljaju sonde koje detektuju prisustvo koncentracije odre ene supstance u vazduhu i generišu signale mirisa.

Generatori mirisa su ure aji koji kontrolišu isparavanje odre ene mirisne supstance. U multimedijalnom sistemu koji uklju uje i medij mirisa, interfejsi za miris detektuju ili

reprodukuju miris. Postoje dva tipa interfejsa za miris: ulazni interfejs za miris i izlazni sistem za miris. Ulazni interfejs za miris ine senzori mirisa koji detektuju prisustvo supstance u gasnom okruženju. Ulazni interfejs za miris zove se i elektronski nos (eng. electronic nose, e-nose). Elektronski nos je ure aj koji oponaša na in delovanja olfaktornog sistema oveka koriš enjem niza senzora koji mogu simulirati odziv na miris, sa ciljem prepoznavanja složenih mirisa. Koristi se za sakupljanje i interpretaciju mirisa. Na Slici 8.8.1-b prikazan je osnovni koncept projekta e-nosa. Elektronski nos je instrument kojim se analizira miris i isparljiva organska jedinjenja (eng. volatile organic compounds –VOCs). Isparljiva organska jedinjenja su organska, hemijska jedinjenja koja imaju zna ajne pritiske pare (eng. vapor pressures) i koja mogu uticati na okolinu i ljudsko zdravlje. Na na in sli an ljudskom nosu, elektronski nos dopušta globalnu analizu isparljivih organskih jedinjenja generisanih te nim, gasovitim ili vrstim uzorcima.

165

Page 174: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Elektronski nos za analizu mirisa se sastoji od tri dela: sistema uzoraka (eng. sampling system), detekcionog sistema (eng. detection system), sistema prikupljanja podataka (eng. data acquisition) i sistema za obradu (eng. processing system). Molekuli gasa interaguju sa senzorima vrstog stanja, sa tanjim ili debljim filmom od senzorskog materijala, absorbcijom, adsorbcijom ili hemijskim reakcijama. Senzorski ure aj detektuje fizi ke i/ili hemijske promene nastale tim procesima i te promene se mere kao jedan elektri ni signal.

Slika 8.8.1—Osnovni koncept projekta elektronskog nosa: a) biološki nos, b) e-nos

Molekuli mirisa se transliraju u e-nos koriš enjem tehnike odabiranja. Jedan odmerak prolazi kroz niz senzora i prouzrokuje reverzibilnu fizi ku i/ili hemijsku promenu u senzorskom materijalu, koja dalje prouzrokuje odgovaraju u promenu elektri nih pojava, kao što je provodljivost. Svaka elija u nizu se ponaša kao receptor daju i razli iti stepen odziva za razli ite mirise. Te promene se pretvaraju u elektri ne signale koji se dalje analiziraju. Sistem e-nosa je tako napravljen da je ukupan odziv niza senzora jedinstven za dati miris iz skupa mirisa koji se razmatraju sistemom. Detekcione tehnologije koje se koriste su: senzori gasa (eng. metal oxide sensors – MOS), ekstremno brza hromatografija gasa (eng. ultra fast gas chromatography), fingerprint spektrometrija mase (eng. mass spectrometry), blago jonizovana spektrometrija mase (eng. soft ionized mass spectrometry). Postoje tri razli ita pristupa za ovu vrstu ulaznih ure aja:

166

Page 175: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Hromatografija gasa: odvajanje, identifikacija i odre ivanje hemijskih komponenti u kompleksnoj smeši koriste i razlike u migration rates duž komponenata;

Spektrometrija mase: detekcija modela molekula koriste i razliku mere masa-naboj (eng. mass-to-charge ratio) jonizovanih atoma;

Hemijski senzorski niz (eng. chemical sensor arrays): odziv niza hemijskih senzora se koristi za identifikaciju komponenti gasa.

Najve i broj postoje ih hemijskih senzora je dizajnirano za detekciju specifi nih molekula. Senzori gasova se esto kombinuju u jedan elektronski nos.

Izlazni interfejs za miris sa injavaju moduli koji integrišu odre eni hardver i softver za generisanje mirisa. Hardverski deo proizvodi miris, softverski deo razvija matemati ke modele za miris i generiše specifi ne signale za specifi ne mirise koji e biti proizvedeni sa hardverskim ure ajem. Hardverski ure aj je priklju en na kompjuterski sistem. Za njega postoji drajver program koji razvija digitalne jedna ine za generisanje specifi nog gasa. Displeji mirisa – “Mirisni displeji” su elektronski ure aji koji mogu da proizvedu i ostvare pobudu mirisa na osnovu digitalnih podataka – otisaka. Proces je nazvan i virtualni miris a sistem “virtualni mirisni displej”. Signali mirisa, u pore enju sa signalima slike i zvuka, relativno veoma sporo se menjaju zbog ega je njihov spektar višestruko uži od spektra audio i video signala. Pridruživanje ovih signala tonu i slici prvenstveno zavisi od ideja i opredeljenja dizajnera, jer njihovo memorisanje, obrada i prenos ne predstavlja problem zbog toga što prakti no neznatno optere uju multimedijalni sistem.

8.9 Interakcija u multimediji

Interakcija u multimediji predstavlja me usobno delovanje izme u korisnika i multimedijalnog sistema, a ostvaruje se tako što korisnik upravlja sofisticiranim sistemom na osnovu njegovog odziva. Upravljanje (eng. control) se vrši na osnovu povratne sprege (eng. feedback). Sistem obra uje ulazne informacije, proizvodi odziv i prikazuje rezultat korisniku. Interakcija se ostvaruje preko interfejsa.

Interfejs je deo sistema u kome se sa jedne strane obavlja digitalizacija signala koji su fizi ki nosioci informacija i uvodi ih u procesor, a sa druge strane vrši prevo enje memorisanih informacija u fizi ke nosioce za reprodukciju signala u prirodnom obliku. Interfejs se sastoji od senzora i pokreta a. Senzori (eng. sensors) su komponente koje pretvaraju signale iz spoljašnjeg sveta u elektri ne signale za ulaze multimedijalnog sistema koji proizvodi virtuelni domen. Ulazi senzora mogu biti: pokret koji predstavlja kineti ki signal, zatim svetlosni, zvu ni i/ili elektromagnetni signal. Pokreta i (eng. actuators) su ure aji na izlazu multimedijalnog sistema koji na osnovu elektri nih signala proizvode odgovaraju a dejstva perceptibilna od strane oveka. Odziv sistema (eng. system feedback) može biti aktivan i pasivan. Pasivni odziv je onaj koji nije generisan od sistema. Aktivni odziv je onaj koji generiše sistem i kontrolisan je od strane korisnika.

167

Page 176: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Kompjuter, kao jedan elektronski sistem, generiše odzive preko izlaznih ure aja u interfejsu, koju su perceptibilni za oveka. To su virtuelni odzivi jer oni nisu stvarno tu, ali mogu biti perceptovani. Multimodalni interfejsi omogu avaju korisniku da uje, vidi i ose a virtuelni svet.

Audio-vizuelni multimedijalni tipovi podataka mogu biti: diskretni ili stati ni podaci i kontinualni ili dinami ki podaci. Diskretni podaci su oni koji ne zavise od vremenske ose: tekst, grafika i slike. Kontinualni podaci audio i video zavise od vremenske ose, kompleksniji su od diskretnih podataka, upotrebljavaju mnogo bolje kompresione i dekompresione algoritme i sofisticirane operacije za njihovu interpretaciju i manipulaciju.

Generisani mediji su razli ite vrste kompjuterski generisanih prezentacija, kao što su animacija i muzika. Kada su memorisani u audio i video fajlove, nema razlike u odnosu na audio i video podatke. Ako su generisani u realnom vremenu koriste i specifi ne ure aje i instrumente, tretiraju se kao posebni mediji. Generisani mediji zasnovani su na interakciji ovek – kompjuter zbog ega se ozna avaju kao interaktivni mediji.

8.10 Rezime

Sa aplikativnog aspekta, multimedija je informaciono-komunikacioni proizvod ra unarskih tehnologija koji pomo u integrisanih hardversih i softverskih ure aja prikazuju pojave za ulo vida, sluha i dodira, a u novije vreme i za ulo mirisa. Multimedijalna delatnost predstavlja multidisciplinarnu oblast koja obuhvata razne tehni ko-tehnološke, ekonomske, sociološke i umetni ke postupke. Proces stvaranja multimedijalnog dela zapo inje definisanjem projektnog zadatka kojim se izražavaju potrebe, postavljaju ciljevi i definišu ograni enja. Karakteristi ne su tri faze u realizaciji projekata iz oblasti multimedija: preprodukcija, produkcija i postprodukcija. Multimedijalna preprodukcija predstavlja prvu fazu realizacije projekta u kojoj se razra uju zahtevi naru ioca, definišu ciljevi, analizira interesna grupa, postavljaju zadaci, odre uje žanr, vrsta medija, sadržina proizvoda, sastavlja detaljan pregledan plan, naj eš e u vidu ilustrovane pri e koja je, zbog vešanja na tablu, nazvana storibord. Multimedijalna produkcija predstavlja drugu fazu realizacije projekta u kojoj se neposredno formira sadržaj koji e se ugra ivati u proizvod. Zavisno od kompleksnosti proizvoda koristi se ra unar, kamera, glumci, kostimi, studio i scenografija. Multimedijalna postprodukcija predstavlja završnu fazu realizacije projekta u kojoj se formira kona na verzija multimedijalnog proizvoda. Kod digitalnih multimedija postprodukcija se svodi na uredništvo, editing. Kad se radi sa zvukom i pokretnim slikama onda je to montaža. Prostor i vreme su fizi ke veli ine koje imaju presudnu ulogu u svim fazama realizacije multimedijalnog projekta. Angažovani multimedijalni resursi definišu se na osnovu prostornih i vremenskih parametara informacionih sadržaja multimedijalnog proizvoda. Prostorni domen informacionih sadržaja odre uje potrebnu veli inu, odnosno kapacitet memorijskih resursa. Vremenski domen informacionih sadržaja odre uje zahtevanu propusnu mo , odnosno kapacitet prenosnih resursa komunikacionog sistema.

168

Page 177: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Multimedijalni proizvod predstavlja sintezu slika, teksta, animacije, zvuka, taktilnih elementa i u novije vreme mirisa.

Slika u multimediji predstavlja najzahtevniji sadržaj koji se obra uje na nivou pojedina nih piksela, na nivou pojedina nih slika, frejmova kao i skupovima slika – pokretnih slika, videa i animacija. Za obradu slika potrebni su mo ni hardverski resursi, a za prenos veliki kapaciteti prenosnog kanala. Da bi se ublažili zahtevi za koriš enje multimedijalnih resursa nužna je kompresija video signala.

Multimedijalni proizvodi mogu sadržati bitmapirane i/ili vektorske slike. Pokretne slike se formiraju od niza pojedina nih slika koje se smenjuju dovoljnom

brzinom da se u procesu percepcije, zbog inercije ula vida, ostvari doživljaj kontinuiteta. Tekst u multimediji tretira se kao skup karaktera koji se u ra unaru memorišu kao binarni

kodovi odre enog standarda: ASCII, ISO 646, Unicode i ISO 10646. Da bi se prikazali kodovi karaktera povezuju se sa glifovima smeštenim u glifovskim datotekama – fontovima. Datoteke glifova, odnosno fontovi, razlikuju se po stilu, dizajnu i na inu memorisanja glifova. Font je izraz koji se u tipografiji koristio za skup slova jedne veli ine i jednog tipa, a u multimedijalnim tehnologijama font ozna ava fajl sa glifovima i slovnim ornamentima. Font predstavlja jednu odre enu familiju glifova. Glif je izraz za šaru, grafi ki oblik i sli icu, a u multimedijalnim tehnologijama glif ozna ava spoljašnji lik kojim se prezentira karakter.

Animacija u multimediji predstavlja kreiranje virtuelnog sveta od velikog broja pojedina nih slika koje se sukcesivno snimaju i prikazuju kao niz koji stvara doživljaj pokretnih slika.

Pojedina ne slike od kojih se pravi niz za animaciju mogu biti fotografije crteža ili objekata koji se namenski kreiraju. Animacioni niz se može praviti i kombinovanjem pojedina nih slika snimljenog filma ili frejmova TV slika. U nizu slika koje se formiraju za animaciju, objekti na slikama imaju tendenciju promene pozicije, oblika, boje, transparencije, strukture usled aktivnosti samih objekata ili promene uslova okoline. Promene izma u dve susedne slike mogu biti jedva primetne ili opažljivo primetne. Prikazivanjem niza slika dobija se utisak kretanja zbog perzistencije ula vida.

Za kreiranje animacije nephodna su dizajnerska znanja kao i mo an ra unarski hardver i softver. Postoje 2D i 3D kompjuterske animacije. Pretežno se kreiraju 2D animacije, jer ih je lakše i jeftinije realizovati. Postoje više razli itih, kako visoko profesionalnih i skupih, tako i jeftinih i besplatnih – open sors softverskih alata za izradu animacija.

Animacija u multimedijalnim sistemima predstavlja informacionu tehnologiju za kreiranje najupe atljivije virtualne realnosti koja se ostvaruje 3D objektima, virtualnom realnoš u i interakcijom, što je najviše došlo do izražaja u ra unarskim igrama.

Zvuk u multimediji koristi se u razli ite svrhe, zavisno od vrste multimedijalnog proizvoda i informacionog sadržaja koje zvuk nosi. U multimediji se koriste tri osnovna informaciona sadržaja koje zvuk može da nosi: govor, muzika i zvu ni efekti raznih zvu nih izvora. Drugo poglavlje ove knjige Osnovi audija posve eno je zvuku.

Govor u multimediji koji nosi informacioni sadržaj, može da ima primarnu funkciju i bude važniji od slike i teksta. etvrto poglavlje ove knjige posve eno je audio vizuelnim integracijama i bimodalnosti ljudskog govora.

Muzika u multimediji može da bude primarna kada je slika prate a, kao u slu aju muzi kih koncerata i spotova, ili da prati sliku kada ima funkciju da poboljšava raspoloženje i ose anja koja pobu uje multimedijalna prezentacija.

169

Page 178: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Zvu ni efekti u multimediji koriste se da poja avaju odre ene funkcije, virtualnost i interaktivnost multimedijalne prezentacije.

Dodir u informaciono-komunikacionim tehnologijama uopšte, kao i u multimedijalnim sistemima posebno, postoji od po etka razvoja prvih ure aja, ne gube i zna aj do najsavremenijih sistema. Prstima korisnika i danas se kuca tekst i upravlja ra unarom preko tastature i miša. Danas se ve široko primenjuje heptik tehnologija neposrednog upravljanja dodirom, kao što je to slu aj u kod mobilnih telefona. Razvijeni su raznovrsni specijalizovani heptik sistemi koji doprinose vernijoj virtualizaciji realnih sistema.

Miris u savremenoj multimediji ne predstavlja nedostižni novi medij, jer su ve razvijeni senzori i generatori mirisa.

Senzori mirisa predstavljaju visoku tehnologiju i skupe su komponente koje se ugra uju u sistem ozna en kao elektronski nos.

Generatori mirisa su ure aji koji kontrolišu osloba anje mirisa iz odre enih rezervoara. Elektronski signali od senzora koji detektuju dodir i miris su, u pore enju sa signalima

slike i zvuka, sporo promenljivi signali. Spektar signala dodira i mirisa višestruko je uži od spektra audio i video signala. Pridruživanje ovih signala tonu i slici prvenstveno zavisi od ideja i opredeljenja dizajnera jer njihovo memorisanje, obrada, i prenos ne predstavlja problem imaju i u vidu da prakti no neznatno optere uju multimedijalni sistem.

Interakcija u multimediji predstavlja me usobno delovanje izme u korisnika i multimedijalnog sistema, a ostvaruje se tako što korisnik upravlja sofisticiranim sistemom na osnovu njegovog odziva. Upravljanje (eng. control) se ostvaruje na osnovu povratne sprege (eng. feedback). Sistem obra uje ulazne informacije, proizvodi odziv, i prikazuje rezultat korisniku. Interakcija se ostvaruje preko interfejsa.

Pitanja 1. Šta je projektni zadatak? 2. Šta je multimedijalna preprodukcija? 3. Šta je multimedijalna produkcija? 4. Šta je multimedijalna postprodukcija? 5. Šta je prethodna analiza u preprodukciji? 6. Šta je storibord? 7. Šta predstavlja slika u multimediji? 8. Šta su primarne boje? 9. Šta su sekundarne boje?

10. Šta su tercijarne boje? 11. Šta predstavlja aditivno mešanje boja? 12. Šta predstavlja subtraktivno mešanje boja? 13. Iz ega se sastoji elektronska kamera? 14. Šta predstavlja bitmapirana slika? 15. Šta predstavlja rezolucija slike? 16. Šta je vektorski generisana slika?

170

Page 179: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Koji su osnovni elementi za formiranje vektorske slike? 17. 18. Kakve su vektorske slike u pore enju sa bitmapiranim slikama?19. Šta predstavljaju pokretne slike na prezentacionim medijima? 20. Pomo u ega se obavlja proizvodnja pokretnih slika? 21. Šta predstavlja filmska tehnika? 22. Šta predstavlja video tehnika? 23. Šta predstavlja tekst u multimediji? 24. Šta predstavlja karakter? 25. Šta predstavlja font? 26. Šta predstavlja glif? 27. Koji su standardi za digitalnu reprezentaciju karaktera? 28. Kako se fontovi mogu klasifiovati? 29. Šta predstavlja animacija? 30. Šta predstavljaju tradicionalne animacije? 31. Šta predstavlja kompjuterska animacija?

Kako se koristi zvuk u multimediji? 32. Kako se koristi dodir u multimediji? 33. Kako se koristi miris u multimediji? 34. Šta predstavlja i kako se ostvaruje interakcija u multimediji? 35.

Literatura [8.1] H. Harrison, T. Loveland, V. Deaton, and K. Squibb, “Film technology,” in The TECH-

Know Project: High School Student Edition 2., R. Peterson, Ed. Cincinnati, OH: Centre Pointe Learning, 2005, pp. 18–23.

[8.2] Ireland Department of Education and Science. Storyboards: www.fis.ie/default. asp?PageName =Lesson7.

[8.3] E. L. Counts, Multimedia Design and Production for Student and Teachers. Pearson/Allyn and Bacon, 2004.

[8.4] V. Ray, Multimedia for Designers. New York, Delamar Cengage Learning, 2008. N. Chapman and J. Chapman, Digital media tools. New York: John Wiley & Sons, 2002.

[8.5]

N. Chapman and J. Chapman, Digital Multimedia. John Wiley & Sons, 2007. [8.6] [8.7] T. Vaughan, Multimedia: Making It Work. 8th ed. McGraw-Hill, 2011.

D. E. Knuth, Metafont. Addison-Wesley, 1986. [8.8] [8.9] B. Kerr, “Effective use of audio media in multimedia presentations,” Middle Tennessee

State University, 1999. B. L. Mann, “The evolution of multimedia sound,” Computers and Education, 2007. [8.10]

[8.11] http://de.wikipedia.org/wiki/Haptische_Wahrnehmung

171

Page 180: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

9. APLIKATIVNI SOFTVER ZA MULTIMEDIJE

Aplikativni softver za multimedije su ra unarski programi koji se koriste kao sredstvo, odnosno alat za izradu multimedijalnih proizvoda.

Proizvodnja softvera, te specifi ne “meke robe”, veoma je zahtevan posao u koji treba uložiti puno pameti i još više vremena, što iziskuje velika finansijska ulaganja u rad. Cena softvera, sli no kao i kod opipljivih roba, zavisi od uloženog rada i broja korisnika, odnosno veli ine serije. Kompleksni i skupi proizvodi ne mogu imati velike serije i obrnuto, jednostavniji proizvodi su jeftiniji zbog manjih po etnih ulaganja i mogu nosti da budu pristupa ni ve em broju korisnika.

Postoje više klasifikacija aplikativnog softvera od kojih je dobro znati onu koja se odnosi na njegovu dostupnost. Osnovna podela se odnosi na vlasni ka prava.

Vlasni ki softver (eng. Proprietary software) su ra unarski programi koji su licencirani sa ekskluzivnim legalnim autorskim pravima copyright. Licenca daje pravo koriš enja softvera pod odre enim uslovima. Nije dozvoljena modifikacija i distribuiranje.

Softver u javnom vlasništvu (eng. Public domain software) nekomercijalan je softver, nema autorskih prava i može se slobodno preuzimati i koristiti.

GNUs je dizajn sli an Unix-u, ali se razlikuje od Unix-a jer je slobodan softver i ne sadrži Unix kod (eng. Gnu’s Not Unix – GNU). GNU opšta javna licenca (eng. General Public License – GPL), GNU GPL ili GPL, je slobodna softverska licenca – copyleft license koja omogu ava da se izvedeni posao može distribuirati pod uslovima koje definiše licenca.

Slobodan softver (eng. Free software) su programi licencirani od vlasnika sa tolerantnim uslovima. Generalno je dostupan i besplatno, ili sa mnogo nižom cenom u odnosu na Vlasni ki softver. Dozvoljena je modifikacija softvera. Ovakvi softveri nemaju garanciju i ne dodeljuju zakonsku odgovornost.

Slobodan softver i Softver otvorenog koda (eng. Free and Open source software) je softver koji je slobodno licenciran da odobri pravo korisnicima da koriste, ili menjaju dizajn, sa dostupnim izvornim kodom softvera. Re slobodan (eng. free) odnosi se na slobodu da se softver kopira i ponovo koristi, sloboda u filozofskom smislu re i koju softver daje korisniku. Re Softver otvorenog koda fokusira na percepciju ja ine razvoja modela. Softver otvorenog koda može se instalirati na više ra unara istovremeno, dozvoljen je pristup izvornom kodu za prepravke.

Slobodnorobni softver (eng. Freeware software) su programi dostupni za upotrebu besplatno, ali obi no sa jednim ili više ograni enjem korisni kog prava.

Komercijalni softver (eng. Commercial software, payware software) proizveden je za prodaju, ili služi u komercijalne svrhe. Komercijalni softver je naj eš e Vlasni ki – Proprietary

172

Page 181: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

softver ali može biti i free software i free and open source software. Prilikom kupovine programa kupac dobija binarnu verziju programa. Licencirani program isklju uje pristup kodu, prepravke, promene tehni ke prirode i umnožavanje.

Intenzivan razvoj softvera za obradu slike i zvuka datira po etkom devedesetih godina prošlog veka. U tom razvoju prednja e ameri ke kompanije AVID, Adobe i Apple koje i danas vode sa najmo nijim softverima za snimanje, obradu i editovanje zvuka, slike i videa.

Za razvoj multimedijalnih proizvoda postoji mnoštvo programskih alata za realizaciju projekata za razli ite namene i nivoe složenosti. Osnovna podela po nameni su alati za izradu multimedijalnih prezentacija, obradu slike i alati za obradu zvuka.

Ovladavanje veštinom pravljenja multimedijalnih proizvoda dobro je zapo eti izradom najjednostavnijh prezentacija sa ure ivanjem i kreiranjem mirnih slika, nastaviti sa digitalnim video editovanjem, raditi zatim sa multimedijalnim prezentacijama da bi se ovladalo izradom ozbiljnih prezentacija sa multimedijalnim interaktivnim sadržajem. Izrada animacija i filmova, kao najviši multimedijalni nivo, zahteva i najviši profesionalizam, zna ajan utrošak vremena i budžeta.

Profesionalno ura eni multimedijalni proizvodi odlikuju se visokim kvalitetom dizajna i ugra enim mogu nostima za interakciju sa korisnikom. Rade se pomo u mo nih softverskih alata, ili programskih jezika, zbog ega je potrebno da dizajner ima neophodna stru na i programerska znanja. Za multimedijalnu produkciju postoji više softverskih alata i programskih jezika razli itih mogu nosti, namena i cena. Izbor zavisi kako od vrste multimedijalnog proizvoda tako i od znanja i afiniteta dizajnera.

9.1 Softverski alati za izradu multimedijalnih prezentacija

Multimedijalne prezentacije predstavljaju združeno prikazivanje tekstualnih, slikovnih i zvu nih informacija. Za izradu multimedijalnih prezentacija postoji više programskih paketa koji omogu avaju izradu raznovrsnih multimedijalnih prezentacija. Ovde je dat pregled najpoznatijih.

PowerPoint je program za izradu prezentacija koji je još krajem osamdesetih godina prošlog veka lansirao Microsoft i stalno ga usavršavao tako da najnovije verzije omogu avaju jednostavnu izradu multimedijalnih prezentacija programiranom promenom sadržaja.

HiperStudio, kreiran u Microsoft-u, sli an je PowerPoint-u, ali sa nešto ve im mogu nostima za ostvarivanje interaktivnosti.

Velike mogu nosti za izradu multimedijalnih proizvoda, uz pristupa nu cenu, nudi komercijalni programski paket Macromedia Flash.

Flash je mo an softverski alat, ije je prve verzije lansirala Macromedia, zatim preuzela Adobe, predvi en je za izradu razli itih prezentacija, od interaktivnih veb stranica do animiranih filmova. Poseduje odli na uputstva, lak je za u enje i veoma je efikasan. Tehni ke su mu prednosti što podržava vektorsku grafiku sa visokom rezolucijom, brzim operacijama i visok stepen interakcije sa veoma malim datotekama. Macromedia Director i Macromedia Authorware su bili prvi alati za multimediju. Director pruža velike mogu nosti za dizajniranje pokreta. Authorware je sofisticirani paket za dizajniranje interaktivnih instrukcija. U savremene verzije Flash-a ugra ene su mogu nosti oba ova programska paketa.

173

Page 182: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Dreamweaver je predvi en za konstrukciju interaktivnih veb sajtova, a koristi se kao odli na platforma za isporuku i prikazivanje multimedijalne produkcije ura ene u Flash-u. Sli an je sa Adobe GoLive i Microsoft Front Page.

After Effects je za kreiranje pomeranja i animacija ono što je Photoshop za mirne slike. Ovaj programski paket omogu ava dizajniranje u dve i tri dimenzije, i kreiranje efekata za koriš enje u drugim softverima za multimedije.

Ulide GIF Animator veoma je popularan i jeftin programski paket za pravljenje pokretanja grafi kih slika i jednostavnih animacija na vebu, ozna enih kao Graphics Interchange Format – GIF.

QuickTime i Real Media su programski paketi sa velikim mogu nostima za ure ivanje, beleženje zvuka, konverziju, i eksportovanje razli itih datoteka, od jednostavno animiranh gifova do digitalnog video striminga.

Dizajniranje veb stranica mogu e je ostvariti linijskim kodovanjem. Popularni jezici za kreiranje veb stranica su Hiper Text Markup Language - HTML, Java i Javascript.

Linijsko kodovanje može se u izvesnoj meri ostvariti i pomo u Flash-a. Actionscript je programski paket koji ima još ve e mogu nosti za linijsko kodovnje.

Dizajneri pomo u linijkog kodovanja mogu da ostvare najrazli itije efekte i visokoprofesionalne kreacije. Da bi to ostvarili potrebno je, pre svega, da se familijarizuju sa softverima za linijsko kodovanje, što zahteva vreme i strpljenje.

Za multimedijalnu, kao i za svaku, kreaciju, pored znanja, koje se podrazumeva, dizajner treba da ima sklonost i ljubav prema poslu na koji se troši puno vremena.

9.2 Softverski alati za obradu slika

Softverski alati za obradu slika su programi pomo u kojih se mogu menjati karakteristike pojedina nih slika i sekvence slika do kona no prihvatljive verzije za njihovo prikazivanje.

Izbor alata zavisi od vrste i kompleksnosti multimedijalnog proizvoda, odnosno od toga šta je potrebno da se sa slikama radi. U najjednostavnije operacije spada odabir i ure enje niza slika, što se ozna ava kao editing. Pomo u ra unara radi se editovanje digitalnih slika, odnosno slika koje su u ra unaru memorisane kao matrica digitalnih cifara.

Editovanje digitalnih slika predstavlja obradu ure ivanja mirnih slika kao što su manipulacije, obrezivanje, promena veli ine i filtriranje i kreiranje slika, po etna je osnova za bavljenje multimedijom. 9.2.1 Softverski alati za obradu bitmapiranih slika

Softverski alati za obradu bitmapiranih slika omogu avaju poboljšanje kvaliteta slika i njihovo prilago avanje krajnjoj nameni. Razvijeno je više softverskih alata od kojih su ovde pobrojani samo najpoznatiji.

Adobe Photoshop ili samo Photoshop softverski je alat namenjen za generisanje i obradu bitmapiranih slika, koji ima mogu nost za interpolaciju na osnovu vrednosti najbližeg susednog piksela, bi-linearnu interpolaciju i bi-kubnu interpolaciju.

174

Page 183: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Corel Painter je softverski alat koji se može kvalifikovati kao elektronska slikarska etkica, što omogu ava umetni i rad sa slikama. Program usko specijalizovan prvenstveno za

crtanje i slikanje. Koriste ga slikari i crta i, manje dizajneri i oni koji se bave obradom slike. Dobro simulira alate za crtanje, kao što su olovka, pero, temper.

Corel PHOTO-PAINT, obi no je u sastavu CorelDRAW paketa programa namenjenih generisanju i obradi grafike. Može se koristiti kao alternativa Photoshop-u.

Macromedia Fireworks, obi no je u sastavu paketa sa programima kao što su Flash i Dreamweaver, prvenstveno se koristi za generisanje i obradu bitmapiranih slika namenjenih veb stranicama. 9.2.2 Softverski alati za obradu vektorskih slika

Za obradu vektorskih slika postoji više softverskih alata od kojih su najpoznatiji Adobe Illustrator, CorelDRAW i Macromedia FreeHand.

Adobe Illustrator jedan je od najkoriš enijih programa za izradu i obradu vektorske grafike koji pruža mogu nost umetni kog stvaranja. Radni ekran ovog programa prikazan je na Slici 9.2.2.1-b.

Macromedia FreeHand je program za generisanje i obradu vektorskih slika koji poseduje dobru interaktivnost sa softverskim proizvodima Macromedia. esto se koristi za stvaranje i obradu slika za Flash aplikaciju. Radni ekran ovog programa prikazan je na Slici 9.2.2.1-a.

Slika 9.2.2.1—Radno okruženje programa Adobe: a) FreeHand i b) Illustrator

Corel DRAW je program koji se koristi za generisanje i obradu vektorskih slika i teksta, a sadrži neke jednostavnije alate za obradu bitmapiranih slika. Na Slici 9.2.2.2-a prikazan je radni ekran programa CorelDRAW a na Slici 9.2.2.2-b prikazano je radno okruženje programa Flash.

175

Page 184: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Slika 9.2.2.2—Radno okruženje programa Adobe : a) CorelDRAW i b) Flash 9.2.3 Softverski alati za editovanje pokretnih slika

Editovanje pokretnih slika (eng. video editing) predstavlja osnovnu aktivnost u procesu postprodukcije, kada se od video materijala snimljenog i pripremljenog u procesu produkcije kreira kona na verzija video proizvoda. Kod video editovanja osnovna manipulacija je video montaža, što zna i ure ivanje niza slika u cilju dobijanja kona ne verzije pokretnih slika.

Prethodnica video editing-a je montaža filma. Montaža filma (eng. film editing) je proces kreiranja kona ne verzije filma u završnoj

fazi filmske postprodukcije što predstavlja umetni ki in koji se svodi na se enje i lepljenje filmskih traka snimljenih u procesu produkcije. Kona na verzija filma od lepljenih traka presnimavala se na kompaktne filmske trake koje su se distribuirale bioskopima. Proizvodnja filma razvila se u jaku i profitabilnu industriju zbog ega su uloge ne samo glumaca ve i režisera, montažera i producenta postale izuzetno zna ajne. U razvoju filmske umetnosti i filmske industrije preplitali su se interesi i uticaji režisera, montažera i producenata, zbog ega su se formirale razli ite filmske škole i filozofije kako za proces produkcije, tako i postprodukcije. Okosnice filmskog stvaralaštva su rediteljski rez (eng. director's cut) i završni rez (eng. final cut), što o igledno ukazuje na zna aj montaže. Zna aj procesa montaže, odnosno rediteljskog i završnog reza, prenosi se i kroz smenu tehnologija, što se vidi kroz nazive savremenih softverskih alata za kreiranje videa.

Sa pojavom magnetoskopa za zapisivanje televizijske slike, po inje elektronska linearna video montaža.

Linearna video montaža (eng. linear video editing) je proces selekcije, ure ivanja i modifikacije slika i zvuka zabeleženih na video trakama, u cilju kreiranja kona ne verzije video zapisa pomo u sistema koji sadrži dva ili više ure aja sa magnetnim trakama, video monitorima i elektronskim video meša em – mikserom. Princip montaže sa magnetoskopskim trakama ima odre ene sli nosti sa filmskom montažom, ali pruža daleko ve e mogu nosti. Zapisi se sa traka prevode u video signale koji se prikazuju na kontrolnim monitorima i vode na video mikser, iji je izlaz priklju en na glavni monitor. Video mikser ima mogu nost izbora kadrova sa više razli itih ulaza, kao i njihovo mešanje i pretapanje.

176

Page 185: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Digitalizacijom video i audio signala stvorena je mogu nost montaže pomo u ra unara koja je ozna ena kao nelinearna montaža ili digitalni video editing.

Nelinearna montaža (eng. non-linear editing) predstavlja ure ivanje i obradu slika pomo u ra unara u cilju kreiranja digitalnog videa. Nelinearna montaža pruža daleko ve e mogu nosti za kreiranje raznovrsnih multimedijalnih proizvoda od filmske i linearne video montaže.

Za nelinearnu montažu, odnosno digitalno video editovanje, razvijeno je više softverskih alata za razli ite operativne sisteme. Najzna ajnije programe za video editovanje razvile su firme Avid Technology, Adobe i Apple Macintosh.

Detaljniji opis i pregled softverskih alata za video montažu bio bi obiman i zato su nabrojani samo najzna ajniji programi, a u slede im odeljcima dat je kratak opis samo softverskih alata Premiere i Final Cut.

Media Composer, naj eš e se po firmi koja ga je 1989 godine razvila, zove Avid, prvi je hardversko – softverski sistem na Macintosh II za nelinearnu montažu koji je dominirao u filmskoj i televizijskoj produkciji u prošloj deceniji i dalje ostao zna ajan sa novim verzijama za visoke rezolucije slike i niskobudžetne primene.

Premiere jedan je od prvih programa za digitalnu video montažu razvijen pre dve decenije i danas u najnovijim CS verzijama jedan je od najpopularinijih programa za video editing. Instalira se na operativne sisteme Apple Macintosh kao i za Microsoft Windows. Final Cut Studio je softverski komplet (eng. software suite) za profesionalnu video i audio produkciju koji je u filmskoj i televizijskoj produkciji postao konkurencija Avidovom Media Composer-u. To je mo an i šire dostupan komplet koji sadrži šest osnovnih i više manjih aplikacija za video editing. To su: Final Cut Pro 7 za video editing, Motion 4 za grafi ke animacije, Soundtrack Pro 3 za napredno editovanje i dizajniranje zvuka, DVD Studio Pro 4 za kodiranje, autorizaciju i disk izdavaštvo, Color 1.5 za nijansiranje boja i Compressor 3.5 za kodovanje finalnog video proizvoda u razli ite formate. iMovie veoma je popularan sistem za montažu ulaznog nivoa i sadrži filtriranje slike, konverziju ka sepia tonalitetu ili belom i crnom, mogu nost titlovanja i montažu zvuka. Nije skup i dobija se ve instaliran na mnogim Macintosh ra unarima.

Video Wave i Studio Deluxe, sli no iMovie-u, jednostavni su i jeftini, namenjeni studentima i nastavnicima koji mogu raditi DVD, VHS, CD-ROM formate i veb filmove.

EDIUS NEO je softver namenjen za nelinearnu video montažu za operativni sistem Microsoft Windows. Poseduje dobre karakteristike nelinearne montaže kao što su realno vreme, miksovani format HD/SD editovanja, titlovanje, i stvaranje DVD.

EDIUS Neo 2 je program koji pruža mogu nost editovanja raznih formata uklju uju i AVCHD, HDV, DV, Windows Media i QuickTime, podržava rad u realnom vremenu, ima mogu nost miksovanja razli itih formata unutar iste vremenske ose. EDIUS Neo 2 je namenjen za nastavnu okolinu, ima veoma dobre karakteristike nelinearne montaže. Ima mogu nost stvaranja Blu-ray Disc i DVD (DVD authoring).

EDIUS 5 je softverski alat dizajniran za profesionalni nivo montaže, za postprodukciju. Avid Liquid Pro7 je SD i HD video editor koji ima mogu nost obrade okružavaju eg

zvuka sa preko 1000 efekata u realnom vremenu. Edituje DV, MPEG I, MPEG IBP (eng. I-frame, B-frame, P-frame – IBP), nekompresovani, Windows Media, ekspres digitalni video (eng. digital video express – DIVX) i MPEG-4 u SD kao i HDV. Ima mogu nost stvaranja DVD (DVD authoring): definisanjem interaktivnosti, kreiranjem menija, audio izlaza Dolby Digital 5.1 surround mix.

177

Page 186: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Sony Vegas Movie Studio 9 Platinum je program za video editovanje i kreiranje DVD. Namenjen je za ku ne ra unare. Softver ima mogu nost prihvatanja i organizacije DV videa, editovanje klipova u vremenskoj osi i eksportovanje videa u DVD ili video CD (eng. video CD – VCD). Tako e omogu ava eksporovanje videa za koriš enje sa pokretnom konzolom za igranje (eng. PlayStation Portable – PSP), iPod i YouTube. Pruža mogu nost HDV i AVCHD editovanja. Podržava snimanje, editovanje i kodovanje videa. Ima podršku za 5.1 surround sound miksovanje i kodovanje.

SONY Vegas Pro 9 je profesionalni softver za video i audio postprodukciju za difuziju – broadcast i digitalne video diskove (eng. digital video disc – DVD) i plave – blu-rej diskove – opti ke diskove za memorisanje podataka (eng. blu-ray disc – BD).

Adobe Encore DVD je softverski alat namenjen profesionalnoj izradi DVD-a. Format videa uvedenog u programsko okruženje se automatski prebacuje u MPEG-2 format. Izlazni oblik audio formata je Dolby Digital sistem. Kompatibilan je sa Photoshop-om. Interaktivan meni se može kreirati u Photoshop-u i koristiti u programu Adobe Encore DVD.

Pinnacle Studio HD je program za video editovanje u mnogim Windows ra unarima. Podržava HD video i pruža mogu nosti tranzicija, animacije i efekata. CINEFORM NeoScene je program za nelinearnu montažu u filmskom stvaralaštvu, daje izuzetno visok kvalitet CineForm fajlova. PROGRAM ADOBE PREMIERE

Adobe Premiere, naj eš e ozna en samo Premiere, jedan je od prvih programa za digitalno editovanje, raspoloživ za operativne sisteme Apple Macintosh kao i za Microsof Windows. Ima mnogostruku primenu, od kratkih filmova za veb sajtove do visokoprofesionalnih produkcija. Poseduje velik izbor postprodukcijskih efekata od prelaza do dizajna i montaže zvuka.

Prva verzija Adobe Premiere 1.0 razvijena je 1993 da bi potom sledile nove serije do 2002 godine sa oznakom Adobe Premiere 6.5. Zatim sledi razvoj sa oznakama Adobe Premiere Pro i to 2003 godine Adobe Premiere Pro 1.0, što bi odgovaralo Adobe Premiere 7.0, a zatim 2004 godine Adobe Premiere Pro 1.5 i 2005 godine Adobe Premiere Pro 1.5.1. Naredne 2006 godine razvijen je Adobe Premiere Pro 2.0 a slede e 2007 godine pušten je pod novim nazivom Adobe Premiere Pro CS3. Naredne 2008 i 2009 godine su Adobe Premiere Pro CS4 a 2010 godine Adobe Premiere Pro CS5 da bi najnovija verzija u 2011 godine bila ozna ena sa Adobe Premiere Pro CS5.5.

Adobe Premiere koristi tri glavna radna ekrana – prozora: projekat, vremenska osa i monitor kao što je prikazano na Slici 9.2.3.1.

Radni ekran projekat (eng. project) koristi SE za prikupljanje sirovog ili osnovnog materijala (eng. raw materijal) za projekat: video i audio klipove, nepokretne slike. Video klipovi mogu biti uneti (eng. captured) u Premiere direktno sa kamere ili sa trake, ili mogu biti importovani sa diska. Unutar prozora projekat svaki klip se prikazuje sa njegovom slikom, imenom, dužinom trajanja i drugim informacijama.

Radni ekran vremenske ose (eng. timeline) vizuelno prikazuje linearni opseg kompletiranog filma (eng. movie), prikazuju i redosled komponentnih klipova. Vreme se pove ava sa leva na desno. Vremenski prozori mogu imati nekoliko video i audio tragova. Ve i broj tragova se koristi za tranzicije i preklapanje (eng. transitions and overlays).

178

Page 187: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Monitor je radni ekran u kome se prikazuje stvarna slika. Obi no je podeljen na dva okvira, od kojih svaki ima posebnu kontrolu – playback, jog, shuttle. Leva polovina prikazuje izvorni klip. Može se izabrati odre eni frejm u klipu u prozoru i mogu se postaviti ulazne – in i izlazne – out ta ke. Desna polovina prozora monitora koristi se za prikazivanje filma (eng. movie) u procesu sastavljanja (eng. asemblovanja) na vremenskoj osi.

Slika 9.2.3.1—Radni ekrani Adobe Premiere

Vredost vremenskog koda (eng. timecode) prikazuje se sa etiri para brojeva 01:04:32:15, koji predstavljaju sate, minute, sekunde i frejmove. Za PAL sistem zadnja dva broja koja identifikuju broj frejma su u rasponu od 0 do 24, dok je za NTSC sistem raspon od 0 do 29. PROGRAM FINAL CUT PRO

Final Cut Pro – FCP je razvijen 1999 godine kao modul Final Cut Studio koji omogu ava korisniku da priklju uje video sa spoljnih ure aja ili iz ra unarskih memorija i na hard disku ga edituje, obra uje i isporu uje u raznim verzijama formata. Prve verzije razvila je firma Macromedia Inc. a kasnije Apple Inc.

Final Cut Pro 7 je verzija za Mac ra unare sa Mac OS X verzijom operativnog sistema, ili kasnijom, koriste i Intel procesore. Sadrži jednostavne kao i napredne editing alate za neprimetne tranzicije i precizne video manipulacije. Ima izuzetne profesionalne mogu nosti za kreiranje tokom procesa nelinearne montaže kao što su: editovanje sa formatima HDV, XDCAM HD , DVCPRO HD, preko 150 filtera u realnom vremenu, veliki broj efekta, prikazivanje u

179

Page 188: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

realnom vremenu za vreme editovanja, 2D/3D prostor, audio postprodukcija, 5.1 surround sound mixing, finalizacija profesionalnog DVD sa interaktivnim karakteristikama, autorizaciju SD i dvoslojnog HD – DVD-9.

Radni ekran Final Cut Pro 7 sadrži etiri osnovna dela: okvir pretraživa (eng. Browser), ulazni prozor za pregled programskog matrijala (eng. Viewer window), izlazni prozor (eng. Canvas) i vremensku liniju (eng. Timeline) kao što je prikazano na Slici 9.2.3.2.

Slika 9.2.3.2—Radni ekran Final Cut Pro

Browser je prozor u kome se organizuje i pristupa svim izvorima materijala za dati projekt, sve sekvence, klipovi, audio zapisi, efekti i ostale datoteke medija smeštenih u Project Final Cut Pro file.

Viewer je prozor u kome se mogu medija fajlovi pregledati i skra ivati, pregledati i ure ivati pojedina ni klipovi, postavljati ulazne i izlazne ta ke, locirati i markirati specifi ni kadrovi, praviti izmene kao što je primena filtara i podešavanje parametara kretanja, menjati zvuk. U osnovu mogu e su izmene u klipu koriste u Viewer i zatim postaviti klip u sekvencu na Timeline.

Viewer ima svoj interfejs – shuttle interface za skeniranje sa promenljivom brzinom, napred i nazad kroz klip kao i jog interface za napredovanje kadar po kadar. Na vrhu sadrži tabulatore za kontrolu klipova: Video Tab, Audio Tab, Filters Tab, Tabs pomo u kojih se pregledaju, markiraju i podešavaju frejmovi, tonski kanali i podešavaju klju ni kadrovi.

Canvas prozor je radni prostor za editovanje klipova u sekvenci i posmatranje rezultata. To je replika programskog monitora gde se posmatra editovani materijal. Canvas ima kao i Viewer svoj shuttle interface. Timeline je traka koja objedinjuje medije i na kojoj se prikazuju slojevi (eng. layers) video i audio traka u nizu (eng. sequence) duž vremenske ose. Koristi se za pregledanje podloga (eng. layout) i komponenti u vremenskom nizu, navigaciju izme u klipova, selekciju specifi nih ta aka u sekvenci. Timeline se ogleda na Canvas koji prikazuje kretanje glave za reprodukciju na

180

Page 189: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

vremenskoj osi. Na njoj se video i audio klipovi mogu pomerati, menjati, raspore ivati i brisati u cilju kreiranja sekvence kakva bi na kraju trebala da se pojavi u željenom filmu. Na vremenskoj osi se postavljaju i sadržaji sekvence kao što su natpisi (eng. titles) i prelazi (eng. transitions). 9.2.4 Softverski alati za kreiranje animacija

Za kreiranje animacija razli itog nivoa složenosti razvijeno je više softverskih alata i platformi. Najjednostavnije animacije kreiraju se pomo u GIF formata, dok se za kreiranje složenijih animacija koriste softvrske kolekcije Fleš (eng. Flash) i Maja (eng. Maya).

GIF format jedan je od dva naj eš e koriš ena ra unarska grafi ka formata za razmenu slika koji se može koristiti za kreiranje malih animacija sa nižom rezolucijom i paletom od 256 boja.

Fleš softverski komplet predstavlja platformu za kreiranje animacija. Maya softverski komplet predstavlja platformu za kreiranje 3D digitalnih sadržaja za

igrani film (eng. feature film), digitalnu video radiodifuziju i video produkciju, razvoj interaktivnih video igara, animaciju, arhitekturu, obrazovanje, nau na istraživanja. PROGRAM ADOBE FLASH

Adobe Flash, skra eno Flash se deklariše kao multimedijalna platforma za kreiranje animacija, video sadržaja i interaktivnosti a pomo u njega mogu se praviti i ra unarske igre. Fleš je izvanredan alat za veb aplikacije.

Razvoj Fleša po inje 1996 godine sa prvom verzijom Macromedia Flash 1, zatim se svake slede e godine re aju nove savršenije verzije sve do 2005 kada se pojavljuje Macromedia Flash 8, da bi 2007 prešao u Adobe kada se lansira Adobe Flash CS3(9) Professional.

CS3 podržava ActionScript 3.0, omogu ava da sve aplikacije mogu da se prevedu u ActionScript, bolje se integriše u druge Adobe programe.

Slede e 2008 godine pojavljuje se Adobe Flash CS4(10) Professional koji sadrži inverznu kinematiku, osnovne manipulacije sa 3D objektima, tekstualno ure ivanje (eng. text engine) i dalja ekspanzija ka ActionScript 3.0. CS4 omogu ava kreiranje animacija sa više mogu nosti od prethodnih verzija.

Poslednja verzija od 2010 Adobe Flash Professional CS5(10.1) poja ala je tekstualno ure ivanje i poboljšala rad sa kinematikom.

Fleš omogu ava upotrebu vektorske i rasterske grafike za sastavljanje teksta, crteža i slika a podržava obostrani audio i video striming i prihvatanje signala sa tastature, mikrofona i kamere.

Fleš sadrži jedan objektno orijentisani jezik ActionScript sa otvorenim kodom, koji omogu ava kreiranje programabilnih multimedijalnih proizvoda sa animacijom i visokim stepenom interaktivnosti.

Sadržaji Fleša mogu se prikazati na raznim kompjuterskim sistemima i ure ajima pomo u Adobe Flash Player-a, mrežnih pretraživa a i savršenijih mobilnih telefona.

ActionScript je programski jezik za algoritamsko kreiranje animacija i programiranje interakcija na osnovu definisanih položaja, trajektorija i simbola. Pogodan je za kreiranje veb- aplikacija i njihovo povezivanje sa korisni kim interfejsom.

181

Page 190: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

SWF (eng. shockwave flash ili small web file – SWF) je format vektorske grafike koji se može generisati sa flešom. Pogodan je za veb animacije. Grafi ki objekti su predstavljeni u vektorskom obliku. SWF fajl je sli an programu, uklju uje definicije objekata i instrukcije kako sa njima manipulisati. SWF podaci su kodovani u binarnoj formi i komprimovani, rezultuju i u vrlo malu veli inu fajla.

Fleš dozvoljava da se importuje bitmapirana slika u animaciju, ali time se pove ava veli ina fajla.

U flešu s koriste tri razli ite vrste simbola:

Grafi ki simboli su vektorski objekti kreirani za motion tweening. Simoli dugmadi (eng. button symbols) su specijalna vrsta simbola koja se koristi za

dodavanje interaktivnosti. Simboli pokretanja (eng. movie clip symbols) su animacije sa sopstvenim vremenskom

linijom koje se ugra uju unutar glavnog movie. Vremenska linija (eng. timeline) predstavlja grafi ki prikaz niza slika, odnosno sekvence

kadrova koja se koristi za kreiranje animacije u flešu. Animacija se može graditi jedan frejm u jednom trenutku, insertuju i klju ne frejmove u timeline sekvencijalno. Drugi na in je ubacivanje glavnih frejmova u vremensku liniju.

Flash pozornica (eng. stage) je pozornica, prozor u kojoj se kreira frejm crtanjem objekata. Objekti se mogu kreirati koriste i drawing tools, ili mogu biti importovani. Bitmapirane slike, uklju uju i formate JPEG i PNG, mogu se importovati i transformisati u auto-traced vektorski objekat. Bitmapirane slike se mogu koristiti unutar Flash frame, ali se kasnije ne može vršiti skaliranje ili rotacija bez potencijalnog degradiranja slike.

Koriste se lejeri da bi se organizovali elementi u frejmu, interpolirano kretanje (eng. interpolating motion).

Grafi ki objekti mogu biti sa uvani u biblioteci u specijalnom obliku zvanom simbol (eng. symbol), koji omogu ava da objekat bude ponovo koriš en. Potreban broj instances mogu se postaviti na stage. Instances ostaju linkovani za simbol. Ako se simbol menja, automatski se menjaju i instances. Instances su identi ni, i na njih se primenjuju transformacije, da bi se promenila veli ina ili orijentacija od svake instances. PROGRAM AUTODESK MAYA

Autodesk Maya, skra eno Maya, je mo an komercijalni softver za 3D animaciju koji omogu ava previzualizaciju, vizuelne efekte, modelovanje, animaciju karaktera i rendering za razvoj projekata filmske i video produkcije, ra unarskih igara, arhitekture, obrazovanja i nau nih istraživanja.

Program Maya razvila je 1998 godine firma Alias Systems Corporation koju je 2005 godine otkupila firma Autodesk.

Verzija Maya 2012 može se instalirati na ra unarima sa operativnim sistemima Linux, Mac OS X i Microsoft Windows. Previzualizacija (eng. previsualization) predstavlja proces, razvijen u filmskoj industriji, za kreiranje prototipa kroz vizuelno istraživanje i scensko planiranje što omogu ava bolje razumevanje projekta i generisanje preliminarne verzije video proizvoda. Kod kreiranja 3D

182

Page 191: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

animacija u softveru Maya, uz nižu rezoluciju slike, prikazuju se karakteristike, funkcionalnost i tok procesa željene aplikacije što omogu ava brz i lak na in ostvarivanja promena do postizanja željenog rezultata.

Vizuelni efekati iz realnog sveta kao što su dim, vatra, eksplozija, tok fluida, efekat kose u filmskoj i televizijskoj produkciji mogu se simulirati u softveru Maya. Na primer simulator za realisti ki izgled ljudske kose je ostvaren koriš enjem krivih i efekata crtanja. Simulacija životinjskog krzna – dlake sli na je sa efektom kose. Može se koristiti i za simulaciju drugih sli nih objekata kao što je trava, fizika sudarenih objekata, simulacija tkanine i materijala, simulacija spreja, prskalica, simulacija prašine, praha.

Modelovanje u ra unarskim tehnologijama je proces predstavljanja realnih objekata pomo u tehnika kompjuterske grafike. Maja je mo no sredstvo za kreiranje ra unarski generisanih slika (eng. computer-generated imagery – CGI).

Ra unarski generisane slike predstavljaju oblast primene kompjuterske 3D grafike za specijalne efekte u filmovima, televizijekim programima i ra unarskim igrama.

Modelovanje pomo u programa Maja zavisi od tipa objekta. Definisana su tri tipa objekata: poligoni, NURBS i izdeljene manje površine.

Poligoni su geometrijski oblici sa tri ili više pravih stranica. Poligoni omogu avaju modelovanje površina gra enjem i promenom oblika manjih delova površine.

Neuniformne racionalne osnovne krive (eng. non-uniform rational B-splines – NURBS) geometrijski su tipovi koji se mogu koristiti za stvaranje 3D krivih i površina. NURBS omogu avaju, sa visokim nivoom kontrole, kreiranje blagih, krivih površina.

Izdeljenim manjim površinama (eng. subdivision surfaces) se omogu ava editovanje površina. Oblik nekog objekta se prikazuje geometrijom, materijal objekta opisuje izgled površine nakon renderovanja. Materijali i teksture se postavljaju tako da simuliraju realnu reakciju površina na svetlost.

3D animacija predstavlja važan deo televizijskih, filmskih i multimedijalnih projekata za animaciju karaktera.

Animacija karaktera predstavlja proces “oživljavanja” virtualnih objekata koji mogu biti osobe, životinje, roboti ili neki predmeti koji se animiraju izrazima lica, u cilju komunikacije sa publikom kroz akciju. Karakteri kao što su ljudi i životinje mogu se proizvesti sa visokim stepenom realizma. Pre animacije karaktera u sceni, crta se skelet karaktera, a zatim se skelet oblaže kožom. Aplikacija Maja omogu ava definisanje unutrašnjeg skeleta za karaktere i dodeljivljnje kože za stvaranje realisti kih pokreta sa deformacijama. Proces pripreme kontrole karaktera je nazvan rigging i omogu ava fokusiranje na proces animacije. U procesu dizajna i animacije karaktera kombinuju se transformacije digitalnog skeleta sa deformacijama površine kože – spoljašnjeg omota a skeleta. Specifi ni zahtevi za kretanje karaktera odre uju kompleksnost kontrole karaktera. Mehanika karaktera treba da bude ubedljiva publici, koža i ode a treba, tako e, da se kre u i na odgovaraju i na in savijaju. Maja omogu ava da se upravlja delovima koji konstituišu tipi an karakter.

Rendering je ra unarski proces koji omogu ava da se komponente kao što su površine, materijali, teksture, efekti, osvetljenja, modeli, kamere i kretanja postavljaju u sekvencu bitmapiranih slika. Maja softver sadrži ugra en programski skript jezik (eng. Maya embedded language – MEL).

Maja programski jezik MEL omogu ava prilago avanje korisni kog interfejsa i pisanje skripta i makroa za kreiranje objekta, osvetljenja, kamere i tekstura. Na taj na in se pomo u

183

Page 192: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Maja softvera mogu po zamisli autora kreirati raznovrsni efekti i animacije. MEL omogu ava da se promenom vrednosti parametara u vremenu animiraju objekati, svetlo ili samo bilo koji entitet.

Maja korisni ki interfejs (eng. Maya user interface) predstavlja, sa funkcionalnog aspekta, skup alata dostupnih korisniku na radnom ekranu monitora, koji osim funkcija zajedni kih za sve razli ite aspekte 3D grafike softverskih aplikacija, sadrži skup alata namenjenih specifi nim zadacima kao što su modeliranje, teksturisanje, animacija, renderovanje i sl.

Podrazumevani (eng. default) Maja korisni ki interfejs, prikazan na Slici 9.2.4.1 i na Slici 9.2.4.2, sadrži slede e osnovne sekcije:

Glavni meni – Main Menu Bar Statusna linija – Status Line Školjka – Shelf Alatna kutija – Tool Box Radni prostor – Workspace Meni za radni prostor – Panel Menus Vremenska traka – Time Slider Traka opsega – Range Slider Upravlja ka linija – Command Line Pomo na linija – Help Line Kanalska kutija – Channel Box Editor lejera – Layer editor

Slika 9.2.4.1—Radni ekran sa Maja interfejsom (eng. Maya Interface) i radnim prostorom

184

Page 193: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Korisnik na radnom ekranu monitora definiše virtuelni radni prostor, scenu, za realizaciju projekta. Scena može da bude sa uvana u raznim formatima. Standardni format je .mb – Maya binary.

U aplikaciji Maya 2010 dodat je MatchMover kojim se omogu ava kombinovanje elemenata ra unarskog grafi kog interfejsa (eng. computer graphics interface – CGI).

Kamera sekventor (eng. camera sequencer) jedna je od najoriginalnijih karakteristika u softveru Maya 2011. Dodat je u aplikaciji Maya 2010. Koristi se za raspodelu planova više kamera i njihovo rukovanje u sekvenci animacije. Omogu ava koriš enje razli itih kamera analogno realizaciji u filmskim i televizijskim studijima. Kamera sekventor povezuje planove iz više kamera smeštenih u 3D sceni, aranžiraju i planove i svi uju i izme u uglova i planova kamera, koriš enjem više kamera, uglova i pogleda, za stvaranje kompletne sekvence animacije.

Aplikacija Maya je organizovana u tri sloja, lejera: GUI, MEL Engine i Dependency Graph.

GUI lejer predstavlja grafi ki korisni ki interfejs dostupan animatorima, dizajnerima i programerima.

MEL Engine je Maya lejer u kome se izvršavaju komande korisnika sa GUI lejera. Dependency Graph je lejer gde su smešteni svi podaci o sceni i gde se izvršava

neophodna modifikacija podataka na osnovu skripta MEL komandi.

Slika 9.2.4.2—Radni prostor za modelovanje ili kreiranje animacije u programu Maja

Arhitektura aplikacije Maja je razli ita od arhitekture drugih programa. U mnogim postoje im aplikacijama su modelovanje, animacija, rasveta i rendering date kao odvojene

185

Page 194: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

procedure. Aplikacija Maja ima arhitekturu dijagrama – grafa vora (eng. node graph architecture). Svaki elemenat scene, na primer, svaka kriva, link, slika, tekstura, klju ni frejm se definiše kao vor. Svaki vor ima svoje osobine (eng. attributes) i prilago enost. Svaki vor može primiti, modifikovati i transmitovati podatke slede em voru. Da bi se ostvarila željena funkcionalnost formira se mreža vorova ili preko grafi kog korisni kog interfejsa ili programiranjem (MEL ili C++). Svaki 3D zadatak se realizuje protokom i modifikacijom podataka kroz mrežu me usobno povezanih vorova. Informacija koja se koristi za konstrukciju scene je u obliku osobina i prenosi se me usobno zavisnim vorovima. Jedan vor može imati veliki broj osobina koje može proslediti dalje ili zahtevati kao ulaz. Primeri vorova su vor transformacije koji sadrži informacije o lokaciji, vor oblika sadrži geometrijske informacije i vor materijala koji sadrži informacije o boji. vor predstavlja jedan blok – building block scene.

Blokovi se linkuju da bi kreirali kompleksnije blokove. Blokovi formiraju model protoka podataka koji se zove Maya's pipeline.

Maya's pipeline omogu ava digitalni produkcioni pipeline:

Pri a – Story Preslikavanje pri e u vizuelni domen – Visual Development Kreiranje karaktera - Character Design Storibord – Storyboards Postavka scene – Scene Layout Modelovanje – Modeling Animacija – Animation Sen enje i tekstura – Shading and Texturing Osvetljenje – Lighting Rendering

Maja softver je predvi en i za proces postprodukcije (eng. post production) u kome se

vrši titlovanje, dodavanje raznih efekata, prelaza i sli no.

9.3 Programi za snimanje, obradu i editovanje zvuka

Programi za snimanje, obradu i editovanje zvuka omogu avaju vremensku i frekvencijsku analizu, obradu spektra, uklanjanje šuma, dinami ku kompresiju i promenu u estanosti kod editovanog audio signala.

Elektronski ure aji sa programima za snimanje, editovanje i reprodukciju zvuka u obliku digitalnog audio signala i/ili MIDI podataka zovu se sekvenseri i realizuju se kao digitalne audio radne stanice.

Digitalne audio radne stanice (eng. digital audio workstation – DAW) predstavljaju specijalni elektronski sistem namenjen za snimanje, obradu, editovanje i reprodukciju (eng. playing back) digitalnog audio signala i mogu biti integrisani ili kompjuterski. Integrisani sistem se sastoji iz audio konzole, konvertora i ure aja za memorisanje podataka. Kompjuterski zasnovan sistem za snimanje digitalnog audio signala DAW sastoji se od: kompjutera, analogno-digitalnog i digitalno-analognog konvertora, audio softvera i najmanje jednog ulaznog ure aja za dodatni audio signal. Softverom se obezbe uje korisni ki interfejs i kontrolišu komponente hardvera da bi se omogu ilo snimanje, editovanje i prikazivanje audio signala. Softver može biti

186

Page 195: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

realizovan za snimanje jednog traga, gde se u jednom trenutku prikazuje samo jedan audio signal mono ili stereo, ili više tragova, koji omogu ava da se signal snima sa nekoliko mikrofona ili razli itih ulaza na disk u istom trenutku na posebne tragove. Za svaki trag posebno može se podešavati ja ina ili stereo balans audio signala. Svaki trag se snima u posebnom fajlu u memoriji kompjutera i može se posebno editovati. U finalizaciji se vrši miksovanje tragova u dva stereo traga ili više saraund tragova.

Razvoj softvera za digitalni audio po inje po etkom devedesetih godina prošlog veka. Kompanije koje su razvile najmo nije softvere koji i danas dominiraju u profesionalnim primenama su AVID, Adobe, Apple, Steinberg i Sony. Na tržištu se nude softverski alati i kolekcije razli itog nivoa složenosti i cene koštanja.

Najpoznatije digitalne radne stanice i softverski kompleti su:

Pro Tools, Media Composer, M-Audio, VENUE, Sibvelius i Euphonic kompanije AVID

Audition i Logic Studio kompanije Adobe LogicStudio kompanije Apple Nuendo, Cubase kompanije Steinberg Sound Forge, ACID Pro i Vegas Pro kompanije Sony

Kao primer i ilustracija za mogu nosti koje imaju softverski alati za editovanje zvuka

dataljnije e biti opisan softverski alat Sound Forge. 9.3.1 Obrada zvuka pomo u Sound Forge-a

Sound Forge je Sony-jev softverski komplet za editovanje zvuka za profesionalne i poluprofesionalne namene. Na Slici 9.3.1.1 prikazan je radni ekran Sound Forge-a.

Slika 9.3.1.1—Radni ekran Sound Forge-a

187

Page 196: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Funkcije i instrukcije editovanja Sound Forge-a:

Spektralna analiza – Spectrum Analysis: nadzor u realnom vremenu (eng. real time). Monitoring i prikaz trenutnih vrednosti zvu nog signala – Sonogram;

Uklanjanje šuma: Noise Gate, Noise Reduction, EQ, Click and Crackle Removal, Audio Restoration;

Dinami ka kompresija – Compressor: Threshold, Ration, Attack and Release time; Promena u estanosti – Time Stretch, Pitch, Vibrato .

SPEKTRALNA ANALIZA U SOUND FORGE

Na Slici 9.3.1.2-a je prikazano predstavljanje zvuka u vremenskom domenu, odnosno prikazivanje amplitude signala u zavisnosti od vremena.

Spektralna analiza omogu ava predstavljanje zvuka u frekvencijskom domenu, odnosno prikazivanje amplituda signala u zavisnosti od u estanosti što je prikazano na Slici 9.3.1.2-b. Spektar zvu nog signala se posmatra aktiviranjem Real Time Monitoring-a.

Slika 9.3.1.2—Analiza zvu nog signala uSoundForge-u: a) Vremenska analiza – Waveform display, b) Spektralna analiza – Spectrum graph

Sonogramom se na x osi predstavlja vreme, na y osi frekvencija, a boja predstavlja nivo

signala što je prikazano na Slici 9.3.1.3. UKLANJANJE ŠUMA U SOUND FORGE-U

Instrukcije menija za uklanjanje šuma pomo u Sound Forge-a su:

Noise Gate– selekcija šuma, Noise Reduction – smanjenje šuma, EQ – izjedna avanje, Click and Crackle Removal – uklanjanje pucketanja, Audio Restoration – restauracija audio snimaka.

188

Page 197: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Slika 9.3.1.3—Prikaz sonograma u Sound Forge-u

Noise Gate služi za uklanjanje šuma ispod izabranog nivoa praga (eng.treshold) kao što je prikazano na Slici 9.3.1.4.

Slika 9.3.1.4—Ilustracija za instrukciju Noise Gate – selekcija šuma

Instrukcija smanjenje šuma - Noise Reduction obavlja se u dva koraka. Izabere se i ozna i deo snimka koji sadrži samo šum – noiseprint, što je prikazano na Slici 9.3.1.5. Uklanja se šum iz celog snimka na osnovu ovog uzorka. Za izabrani noiseprint gleda se frekvencijski spektar, zajedno sa ta kama anvelope koje ograni avaju model šuma. Signal ispod anvelope se smatra šumom i bi e smanjen, dok e signal iznad anvelope ostati nepromenjen. Podizanjem ta aka anvelope bi e uklonjeno više signala i obrnuto, spuštanjem anvelope manje originalnog signala bi e smanjeno.

Menjanjem vrednosti “podižemo” ili “spuštamo” anvelopu noiseprint-a. Uobi ajene vrednosti su izme u –6 dB i +6 dB. Poželjno je isprobavanje vrednosti u ovom intervalu sa ciljem pronalaženja najboljeg rešenja za dati slu aj. Vrednosti iznad 0 dB uklanjaju više šuma,

189

Page 198: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

ali pove avaju mogu nost da se ukloni i koristan signal niskog nivoa. Vrednosti ispod 0 dB uklanjaju manje korisnog signala, ali ako je vrednost preniska bi e uklonjeno veoma malo šuma.

Slika 9.3.1.5—Radna površina za instrukciju Noise Reduction Izjedna avanje (izjedna ava (eng. equalizer – EQ)): Podešavanjem centralne frekvencije, širine i poja anja filtara ekvalizatora poja avaju se frekvencije korisnog signala koje su mogle biti oslabljene, na primer zbog koriš enja opcija za redukciju šuma. Postoji ekvilajzer sa tri opsega frekvencija 3Band EQ: niske, srednje i visoke, i Graphic EQ – sa više od 3 filtra, što je prikazano na Slici 9.3.1.6.

Uklanjanje pucketanja – Click and Crackle Removal obavlja se podešavanjem amplitude, trajanja i u estanosti gli eva koji se uklanjaju.

Audio Restoration je instrukcija koja omogu ava uklanjanje gli eva, kao i smanjenje

šuma iz starih snimaka. Sadrži vremenske parametre koji odre uju uklju ivanje i isklju ivanje algoritma. Vremenski parametri pomažu u spre avanju uklanjanja korisnog signala.

190

Page 199: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Slika 9.3.1.6—Radna površina za Izjedna avanje – EQ

DINAMI KA KOMPRESIJA U SOUND FORGE-U Dinami ki kompresija predstavlja obradu audio signala kojom se smanjuje dinami ki opseg ja ine zvuka, odnosno smanjuje se razlika izme u najvišeg i najnižeg nivoa zvuka tokom snimanja ili reprodukcije. Parametri dinami ke kompresije (Slika 9.3.1.7) su:

THRESHOLD – prag predstavlja nivo signala pri kome se kompresor uklju uje; RATIO – odnos, pokazatelj stepena kompresije posle dostizanja praga; ATTACK TIME – vreme koje je potrebno da se dostigne odnos kompresije definisan sa

RATIO. Duže vreme zna i da e se kompresija primeniti sporije; RELEASE TIME – vreme koje je potrebno da se kompresija zaustavi, pošto je signal

prethodno pao ispod nivoa praga. Duže vreme zna i da e se zvuk vratiti u nekomprimovano stanje sporije.

Radna površina za dinami ku kompresiju u Sound Forge-u predstavljena je na Slici 9.3.1.8.

191

Page 200: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Slika 9.3.1.7—Parametri dinami ke kompresije: prag - THRESHOLD, prelazne faze: vreme uspostave –

ATTACK TIME i vreme osloba anja – RELEASE TIME, stepen kompresije – RATIO

Slika 9.3.1.8—Radna površina za dinami ku kompresiju

192

Page 201: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

PROMENA U ESTANOSTI U SOUND FORGE-U

Instrukcije menija Sound Forge-a za promenu u estanosti su:

Time Stretch – promena trajanja snimka, Pitch – promena visine tona, Vibrato – promena visine tona pomo u frekvencijske modulacije.

Time Stretch menja dužinu snimka, bez promene osnovne frekvencije.Pri ubrzanoj

reprodukciji i skra ivanju trajanja snimka – komprimovanja u vremenu, širi se spektar, javljaju se više frekvencije. Ako se usporava originalni snimak, dolazi do komprimovanja spektra. Najbolji rezultati postižu se za Time Stretch izme u 75% i 115%, kao što je prikazano na Slici 9.3.1.9. Van ovog opsega, mogu a je pojava izobli enja. Obradom snimka više puta sa malim priraštajem, na primer 10 %, dobija se bolji rezultat nego jednom jednokratnom obradom sa ve om promenom dužine snimka.

Slika 9.3.1.9—Radna površina za promenu dužine snimka Pitch funkcija omogu ava da se promeni osnovna frekvencija snimka.

Vibrato – efekat vibriranja koristi frekvencijsku modulaciju za promenu osnovne frekvencije signala u toku vremena.

Reverb omogu ava rekonstruisanje uticaja prostora u kome je sniman zvuk na sam snimak, što zna i da omogu ava kreiranje efekta koji smešta zvuk u prostoriju u kojoj nije sniman. To se radi kada nije snimano u adekvatnoj prostoriji ili kada je uticaj snimane prostorije izgubljen usled neadekvatne tehnike snimanja.

Na Slici 9.3.1.10 prikazana je radna površina Sound Forge-a za reverberaciju.

193

Page 202: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Slika 9.3.1.10—Radna površina za reverberaciju

Parametri koji se podešavaju za efekat reverberacije su:

Nivo procesuiranog signala koji e se miksovati sa originalnim signalom. Nivo prvih refleksija koje e biti miksovane i dovedene na izlaz. Prve refleksije su one

refleksije koje su se naj eš e odbile samo jednom pre nego što su stigle do slušaoca. Na osnovu ovih refleksija slušalac može da oceni veli inu prostora.

Trajanje reverberacije: Tipi no, sve preko tri sekunde je veoma dugo vreme reverberacije. Ve ina manjih prostorija ima vreme opadanja signala manje od jedne sekunde.

Vreme izme u startnog zvuka i po etka reverberacije: Ovo je parametar koji daje informaciju o veli ini prostora u kome zvuk nastaje. Ve e vreme je karakteristika ve ih prostorija.

Prostorije sa jednoli nim zvukom po inju slabljenje sugnala ve na 4000 Hz, dok za “svetlije” prostorije slabljenje po inje za više frekvencije.

9.4 Rezime

Aplikativni softver za multimedije su ra unarski programi koji se koriste kao sredstvo, odnosno alat za izradu multimedijalnih proizvoda.

Intenzivan razvoj softvera za obradu slike i zvuka datira po etkom devedesetih godina prošlog veka. U tom razvoju prednja e ameri ke kompanije AVID, Adobe i Apple koje i danas vode sa najmo nijim softverima za snimanje, obradu i editovanje zvuka, slike i videa. Postoji zna ajan broj programa razvijenih za obradu slike i zvuka, pojedina no, ili objedinjenih u video.

194

Page 203: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

Softverski alati za obradu bitmapiranih slika omogu avaju poboljšanje kvaliteta slika i njihovo prilago avanje krajnjoj nameni. Razvijeno je više softverskih alata od kojih su najpoznatiji Photoshop, Corel Painter i CorelDRAW.

Za obradu vektorske slike postoji više softverskih alata od kojih su najpoznatiji Adobe Illustrator, CorelDRAW i Macromedia Freehand. Za nelinearnu video montažu Media Composer, Premiere i Final Cut Studio.

Za snimanje, obradu, editing i reprodukciju zvuka koriste se digitalne radne stanice sa odgovaraju im softverskim kompletima. Najpoznatije kolekcije programa za audio su:

Pro Tools, Media Composer, M-Audio, VENUE, Sibvelius i Euphonic kompanije AVID,

Audition i Logic Studio kompanije Adobe, LogicStudio kompanije Apple, Nuendo, Cubasekompanije Steinberg, Sound Forge, ACID Pro i Vegas Pro kompanije Sony.

Tehnološki razvoj i masovna popularizacija i prodaja audio i video ure aja doprinela je

da i sistemi za razvoj postanu finansijski dostupni ve em broju dizajnera i kreatora multimedijalnih sadržaja. Raznovrsni programi za obradu zvuka i slike mogu se instalirati na personalnim i prenosnim ra unarima što daje tehni ko-tehnološke mogu nosti širokom krugu korisnika da se posvete multimedijalnom stvaralaštvu koje pruža zadovoljstvo ulnoj percepciji.

Pitanja

Šta je aplikativni softver za multimedije? 1. 2. Šta je vlasni ki softver – Proprietary software? 3. Šta je softver u javnom vlasništvu – Public domain software? 4. Šta je slobodan softver i softver otvorenog koda – free and open source

software? 5. Šta je Power Point? 6. Šta je Flash? 7. Šta je Dreamweaver? 8. Šta je AfterEffects? 9. Šta je Ulide GIF Animator?

10. Šta je Photoshop? 11. Šta je CorelDRAW? 12. Šta je Adobe Illustrator? 13. Šta je Adobe Premier? 14. Šta je EDIUS? 15. Šta je Final Cut? 16. Šta je Maya?

195

Page 204: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

17. Šta je Sound Forge? 18. Koja editovanja podržava Sound Forge? 19. Šta je spektralna analiza? 20. Koje su instrukcije za spektralnu analizu u Sound Forge-u? 21. Šta je šum? 22. Koje su instrukcije za uklanjanje šuma u Sound Forge-u? 23. Šta je to dinami ka kompresija? 24. Koje su instrukcije za dinami ku kompresiju u Sound Forge-u? 25. Koje su instrukcije za promenu u estanosti u Sound Forge-u?

Literatura [9.1] http://en.wikipedia.org/wiki/Video_editing [9.2] http://en.wikipedia.org/wiki/Linear_video_editing [9.3] http://en.wikipedia.org/wiki/Non-linear_editing_system [9.4] http://en.wikipedia.org/wiki/List_of_video_editing_software [9.5] http://www.expertrating.com/courseware/MayaCourse/MAYA-Animation-Basics 1.asp

N. Chapman and J. Chapman, Digital media tools. New York: John Wiley & Sons, 2002.

[9.6]

N. Chapman and J. Chapman, Digital Multimedia. John Wiley & Sons, 2007. [9.7] [9.8] Vaughan, Multimedia: Making It Work. 8th ed. McGraw-Hill, 2011.

196

Page 205: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

SPISAK SKRA ENICA

AAC advanced audio coding napredno audio kodovanje

ACELP algebraic code excited linear prediction algebarski kod pobu ene linerane predikcije

A/D analog to digital analogno digitalni

AFX animation framework eXtension proširenje okvira animacije

AL adaption layer adaptacioni sloj

API application programming interface interfejs za programske aplikacije

ASCII American standard code for information interchange Ameri ki standardni kod za razmenu informacija

ATDM

asynchronous time-division multiplexing asinhrono multipleksiranje sa vremenskom raspodelom kanala

ATM

asynchronous transfer mode asinhroni transfer mod

AVC advanced video coding napredno video kodovanje

AVCHD advanced video coding high definition napredno video kodovanje visoke definicije

AVI audio video interleave, audio video interleaved isprepletani zvuk i slika

BB

band by band opseg po opseg

b bit bit

B byte bajt

B bidirectionally-predictive dvosmerno prediktivni, biprediktivni

B-frame bidirectional-frame, backwards-predicted frame, B-picture, inter-frame dvosmerni-frejm, unazad-predvidiv frejm, B-slika, me u-frejm

BD blu-ray disc opti ki disk za memorisanje podataka

BIFS

binary format for scenes binarni oblik scena

BiM

binary format for metadata binarni format za metapodatke

197

Page 206: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

BISDN broadband ISDN širokopojasni ISDN

BMP bitmap bitska mapa

BQ

bi-level quantization dvostruka kvantizacija

CABAC

context adaptive binary arithmetic coding binarno aritmeti ko adaptivno kodovanje konteksta

CAVLC context arithmetic variable-length coding adaptivno kodovanje sa promenljivom kodnom re i

CCD charge-coupled device ure aji sa spregnutim naelektrisanjem

CD

compact disc kompakt disk

CD

committee draft dodeljeni draft

CGI computer-generated imagery ra unarski generisane slike

CGI computer graphics interface ra unarski grafi ki interfejs, ra unarska grafika

CID charge injection device ure aj za detektovanje punjenja

CIF common intermediate format zajedni ki srednji format

CMOS complemantary metal-oxide-semiconductor komplementarne logike tranzistorski metal-oksid-poluprovodnik

CODEC coder-decoder koder-dekoder

CRC cyclic redundancy check cikli na provera suvišnosti

CS conjugate structure konjugovana struktura

CS-ACELP conjugate structure ACELP konjugovana struktura ACELP

CSMA/CD

carrier sense multiple access with collision detection postupak višestrukog pristupa uz detekciju kolizije

CSS cascading style sheets kaskadni stil listova

1D

one-dimensional jednodimenzionalni

2D two-dimensional dvodimenzionalni

198

Page 207: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

3D

three-dimesional trodimenzionalni

D

descriptor deskriptor

DAW digital audio workstation digitalna audio radna stanica

dB decibel decibel

DBC dictionary-based coding kodiranje na bazi re nika

DCT

discrete cosine transform diskretna kosinusna transformacija

DDL

description definition language opis definicije jezika

DI digital item digitalni deo

DID

digital item declaration deklaracija o digitalnim delovima

DIVX digital video express ekspres digitalni video

DMIF

delivery multimedia integration framework okvir za isporuku multimedijalnih komunikacija

DPCM/DCT differential pulse code modulation /discrete cosine transform diferencijalna impulsno kodovana modulacija/diskretna kosinusna transformacija

dpi dots per inch broj ta aka po jedinici dužine

DRM

digital rights managment upravljanje digitalnim pravima

DS descriptor scheme šema za deskripciju

DSM-CC dgital storage media-command and control digitalna memorija-komanda i kontrola

DSP digital signal processing digitalna obrada signala

DSVD digital simultaneous voice and data digitalni simultani glas i podaci

DV digital video digitalni video

DVB

digital video broadcasting digitalna video difuzija

199

Page 208: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

DWT discrete wavelet transform diskretna wavelet transformacija

EM

electromagnetic elektromagnetni

EQ equalizer izjedna ava

ES

elementary stream osnovni strim

FEC

forward error correction korekcija grešaka unapred

FOE first order entropy entropija prvog reda

3G

third generation tre a generacija

GA

general audio generalni audio

GDF grade distortion function funkcija stepena ošte enja informacije

GFX

graphics framework eXtensions proširenja okvira grafike

GIF graphics interchange format grafi ki format za razmenu

GII

global information infrastructure globalna informaciona infrastruktura

GK

gate keeper nadzor prolaza

GNU Gnu’s Not Unix GNUs dizajn sli an Unix-u, ali se razlikuje od Unix-a jer je slobodan softver i ne sadrži Unix kod

GOB

group of blocks grupa blokova

GPL General Public License opšta javna licenca

GSTN general switched telephone network opšta komutaciona telefonska mreža

GW gate way mrežni prolaz

HD high-definition visoka definicija

HDV high-definition video video visoke definicije, video visoke rezolucije

200

Page 209: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

HDTV high-definition television televizija visoke definicije, televizija visoke rezolucije

HMM

hidden Markov model skriveni model Markova

HTML

hyper text markup language hipertekst sa ozna enim jezikom

HVS human visual system ove iji vizuelni system

I intra unutar

I-frame intra-frame unutrašnji-frejm

IBP I-frame, B-frame, P-frame I-frejm, B-frejm, P-frejm

IDCT

inverse DCT inverzna DCT

IEC

International Electrotechnical Committee Me unarodni elektrotehni ki komitet

IETF Internet Engineering Task Force Grupa za IP standarde

IP

internet protocol internet protocol

IPMP

intellectual property management and protection upravljanje intelektualnoim svojinom i zaštita

IPRS intelectual property rights prava intelektualne svojine

ISDN

integrated services digital network digitalna mreža integrisanih servisa

ISM

interactive storage media interaktivna memorija

ISO Internatonal Standard Organization Me unarodna organizacija za standardizaciju

ITU International Telecommunication Union Me unarodna unija za telekomunikacije

ITU-R

International Telecommunication Union–Radio Standardization Sector Me unarodna unija za telekomunikacije–Radio sektor za standardizaciju

ITU–T

International Telecommunication Union–Telecommunication Sector Me unarodna unija za telekomunikacije–Telekomunikacioni sektor

JPEG Joint Photographic Experts Group Grupa eksperata za fotografiju

JPEG-LS JPEG standard for image lossless coding JPEG standard za kodovanje mirnih slika bez gubitaka

201

Page 210: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

JP2 optional file format for JPEG 2000 opcioni fajl format za JPEG 2000

JTC

Joint Technical Committee Pridružni tehni ki komitet

JVC joint video coding združeno video kodovanje

JVT

Joint Video Team Združeni video tim

LAN

local area network lokalna ra unarska mreža

MAE mean absolute error srednja apsolutna greška

MB

macroblock makroblok

MCU

multipoint control unit kontrolna jedinica za više ta aka

MDS

multimedia description schemes multimedijalne šeme za deskripciju

MEL Maya embedded language ugra en programski skript jezik u Maya softver

MIDI musical instrumment digital interface digitalni interfejs za muzi ki instrument

MIPS

millions of instructions per second milioni instrukcija u sekundi

MOS

mean opinion score srednja vrednost mišljenja

MOS metal oxide sensors senzori gasa

MPEG

Motion Picture Experts Group Grupa eksperata za obradu pokretne slike, Ekspertna grupa za pokretne slike

MPEG-J Motion Picture Experts Group-Java Grupa eksperata za obradu pokretne slike-Java

MP3

Motion Picture Experts Group-1 Audio Layer 3 Grupa eksperata za obradu pokretne slike-1 audio sloj 3

MP4 Motion Picture Experts Group-4 File Format Grupa eksperata za obradu pokretne slike-4 fajl format

MQ

multiple quantization multipl kvantizacija

MSE

mean square error srednja kvadratna greška

NAL network apstraction layer mrežni apstrakcioni sloj

202

Page 211: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

NISDN

narrow-band ISDN uskopojasni ISDN

NTSC National Television System Committee Nacionalni komitet za televizijski sistem

NURBS non-uniform rational B-spline neuniformna racionalna osnovna kriva

OCR optical character recognition opti ko prepoznavanje znakova

OS operating system operativni sistem

OSI

open system interconnection povezivanje otvorenih sistema

P predictive prediktivni

P-frame predicted-frame, forward-predicted frame, inter-frame predvidiv-frejm, unapred-predvidiv frejm, me u-frejm

PAL phase alternating line linijska promena faze

PC

personal computer personalni ra unar

PCM

pulse code modulation impulsna kodna modulacija

PDF probability density function funkcija gustine verovatno e

PNG

portable network graphic pokretna mrežna grafika

PSNR peak-signal-to-noise ratio vršni odnos signal–šum

PSP PlayStation portable pokretna konzola za igranje

PSTN public switched telephone network javna telefonska mreža sa komutacijom, javna komutirana telefonska mreža

QCIF quarter common intermediate format etvrtni zajedni ki srednji format

QoS quality of service kvalitet servisa

RAM

random access memory memorija sa slu ajnim pristupom

RDF rate distortion function funkcije stepena ošte enja

REC

request for comment zahtev za komentar

203

Page 212: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

RLE run-length encoding kodovanje dužine niza

ROI

region of interest region od interesa

ROM

read-only memory memorija sa o itavanjem

RTCP real time control protocol kontrolni protokol u realnom vremenu

RTP

real time transport protocol transportni protokol u realnom vremenu

SA

structured audio strukturni audio

SAOL

structured audio orchestra language strukturni jezik audio orkestra

SC

sub-committee podkomitet

SCN switched circuit network mreža za komutaciju kanala

SDTV

standard definision television televizija standardne rezolucije

SECAM fran. sequentiel couleur a memoire, eng. sequential color with memory Francuski televizijski standard

SG

Study Group Studijska grupa

SGML

standard generalized markup language standardni generalizovani jezik za markiranje

SH sample and hold uzorak i zadržavanje

SNHC

synthetic natural hybrid coding sinteti ko prirodno hibridno kodovanje

SNR

signal-to-noise ratio odnos signal–šum

SQ

single quantization jednostruka kvantizacija

SWF shockwave Flash ili small web file format vektorske grafike koji se može generisati sa flešom

SVGA super video graphics array super video grafi ka kartica – niz

TC technical committee tehni ki komitet

TCP/IP

transmission control protocol/internet protocol protokol kontrole prenosa/internet protocol

204

Page 213: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

TDNN

time-delayed neural network neuralne mreže sa vremenskim kašnjenjem

TIF tagged image format format ozna ene slike

TIFF tagged image file format format dat. ozna ene slike

ToR

terms of reference izrazi za reference

TR

Technical report Tehniški izveštaj

TSR two-level secure re-routing dvoslojno bezbedno rutiranje

TTSI

text-to-speech interface interfejs tekst-govor

VBR

variable bit rate promenljiva bitska brzina

VCD video CD, view CD, compact disc digital video video CD

VCEG

Video Coding Expert Group Ekspertska grupa za video kodovanje

VCL

video coding layer video kodni sloj

VGA video graphics array video grafi ka kartica – niz

VHDL

very high speed integrated circuit hardware description language hardverski opisni jezik za vrlo brzo integrisano kolo

VLC

variable-length code kod promenljive dužine

VM verification model verifikaconi model

VO

video object video objekat

VOC volatile organic compound isparljivo organsko jedinjenje

VOP

video object plane ravan video objekta

VQ vector quantization vektorska kvantizacija

VRML virtual reality modeling language jezik modelovanja virtualne realnosti

VTC

visual texture coding kodovanje vizuelne teksture

205

Page 214: OSNOVE MULTIMEDIJALNIH TEHNOLOGIJA MPEG-2 standard .. 82 7.5 MPEG-4 standard .. 84 7.5.1 Delovi MPEG-4 standarda ... 86 7.5.2 MPEG-4 standard: vizuelni deo ...

W3C

World Wide Web Consortium WWW Konzorcijum

WD working draft radni draft

WG

Working Group Radna grupa

XGA eXtended graphics array proširena grafi ka kartica

XML eXtensible markup language ozna eni jezik za proširenje

XMT

eXtensible MPEG-4 textual prošireni MPEG-4 tekstualni

wavelength talasna dužina

206