Zvukové kompresory

38
Zvukové kompresory Zvukové kompresory Jaroslav Miškovský Jaroslav Miškovský

description

Zvukové kompresory. Jaroslav Miškovský. Přehled. Vnímání zvuku Maskování Komprese dat Ztrátová komprese Formáty: MPEG MP3 OGG WMA AAC. Lidské vnímání zvuku. Frekvenční rozsah Frekvenční rozsah zvuku, který většina lidí vnímá, začíná kolem 20 Hz a dosahuje ke 20 kHz. - PowerPoint PPT Presentation

Transcript of Zvukové kompresory

Page 1: Zvukové kompresory

Zvukové kompresoryZvukové kompresory

Jaroslav MiškovskýJaroslav Miškovský

Page 2: Zvukové kompresory

PřehledPřehled

► Vnímání zvukuVnímání zvuku►MaskováníMaskování► Komprese datKomprese dat► Ztrátová kompreseZtrátová komprese► Formáty:Formáty:

MPEGMPEG MP3MP3 OGGOGG WMAWMA AACAAC

Page 3: Zvukové kompresory

Lidské vnímání zvukuLidské vnímání zvuku

► Frekvenční rozsahFrekvenční rozsah Frekvenční rozsah zvuku, který většina lidí vnímá, začíná Frekvenční rozsah zvuku, který většina lidí vnímá, začíná

kolem kolem 20 Hz a dosahuje ke 20 kHz. 20 Hz a dosahuje ke 20 kHz.

Nejvýznamnější rozsah je 2–4 kHz, který je nejdůležitější Nejvýznamnější rozsah je 2–4 kHz, který je nejdůležitější pro srozumitelnost řeči a na nějž je lidské ucho nejcitlivější. pro srozumitelnost řeči a na nějž je lidské ucho nejcitlivější.

Nejvyšší informační hodnota řeči je přenášena v pásmu Nejvyšší informační hodnota řeči je přenášena v pásmu 0,5–2 kHz.0,5–2 kHz.

► Dynamický rozsahDynamický rozsah Dynamický rozsah lidského ucha (rozdíl mezi nejhlasitějším Dynamický rozsah lidského ucha (rozdíl mezi nejhlasitějším

a nejtišším vnímatelným zvukem) je uprostřed slyšitelného a nejtišším vnímatelným zvukem) je uprostřed slyšitelného frekvenčního pásma asi 120 dB. Na okrajích pásma je frekvenčního pásma asi 120 dB. Na okrajích pásma je mnohem menší.mnohem menší.

Page 4: Zvukové kompresory

Lidské vnímání zvukuLidské vnímání zvuku

► Rozlišování frekvenceRozlišování frekvence Schopnost rozlišit frekvence tónů se u každého člověka liší Schopnost rozlišit frekvence tónů se u každého člověka liší

a je frekvenčně závislá. a je frekvenčně závislá. Uprostřed slyšitelného frekvenčního pásma za ideálních Uprostřed slyšitelného frekvenčního pásma za ideálních

podmínek lze rozlišit změnu frekvence o několik centů. Na podmínek lze rozlišit změnu frekvence o několik centů. Na okrajích pásma je rozlišovací schopnost výrazně nižší.okrajích pásma je rozlišovací schopnost výrazně nižší.

Page 5: Zvukové kompresory

Citlivost lidského sluchu na Citlivost lidského sluchu na frekvencefrekvence

Page 6: Zvukové kompresory

MaskováníMaskování

Máme dva druhy maskování:Máme dva druhy maskování: Frekvenční maskováníFrekvenční maskování Tempolární maskováníTempolární maskování

Page 7: Zvukové kompresory

Frekvenční maskováníFrekvenční maskování Schopnost odlišit dva frekvenčně blízké tóny je ovlivněna Schopnost odlišit dva frekvenčně blízké tóny je ovlivněna

frekvenčním maskováním. frekvenčním maskováním.

Pokud znějí dva tóny současně, může jeden z nich potlačit Pokud znějí dva tóny současně, může jeden z nich potlačit slyšitelnost toho druhého. Tato neschopnost slyšet oba slyšitelnost toho druhého. Tato neschopnost slyšet oba současné tóny se nazývá frekvenční maskování. současné tóny se nazývá frekvenční maskování.

Maskovací schopnost je závislá na frekvenci maskujícího Maskovací schopnost je závislá na frekvenci maskujícího tónu, frekvenční vzdálenosti a úrovni maskujícího signálu. tónu, frekvenční vzdálenosti a úrovni maskujícího signálu.

Vnímání tónů s blízkými frekvencemi je ovlivněno šířkou Vnímání tónů s blízkými frekvencemi je ovlivněno šířkou kritického pásma. To má na nejnižších kmitočtech velikost kritického pásma. To má na nejnižších kmitočtech velikost kolem 100 Hz, zatímco na nejvyšších kmitočtech dosahuje kolem 100 Hz, zatímco na nejvyšších kmitočtech dosahuje až 4 kHz. až 4 kHz.

Využití: např. MP3, Ogg Vorbis nebo ATRAC.Využití: např. MP3, Ogg Vorbis nebo ATRAC.

Page 8: Zvukové kompresory

Frekvenční maskováníFrekvenční maskování

Page 9: Zvukové kompresory

Tempolární (časové) Tempolární (časové) maskovánímaskování

Pokud po hlasitém tónu následuje stejný tón s Pokud po hlasitém tónu následuje stejný tón s menší hlasitostí, je jeho vnímání potlačeno. menší hlasitostí, je jeho vnímání potlačeno. Potlačen může být i tichý tón předcházející Potlačen může být i tichý tón předcházející maskovacímu tónu.maskovacímu tónu.

Page 10: Zvukové kompresory

Datový tok (Bitrate)Datový tok (Bitrate)

– – počet kilobitů za sekundu v multimediálním počet kilobitů za sekundu v multimediálním souboru.souboru.

► CBR (Constant bitrate)CBR (Constant bitrate) Konstantní datový tok – používá se nejvíce pro audio a Konstantní datový tok – používá se nejvíce pro audio a

video soubory. Znamená, že bitstream obsahující data má video soubory. Znamená, že bitstream obsahující data má stále stejnou velikost. stále stejnou velikost.

Soubor je většinou větší než při VBR a u pasáží s velkým Soubor je většinou větší než při VBR a u pasáží s velkým počtem hudebních informací nezní tak dobře.počtem hudebních informací nezní tak dobře.

► VBR (Variable bitrate)VBR (Variable bitrate) Proměnný datový tok – hodnota datového toku závisí na Proměnný datový tok – hodnota datového toku závisí na

podmínkách. U klidných míst kodér bitrate šetří, přidává ho podmínkách. U klidných míst kodér bitrate šetří, přidává ho u intenzivnějších partií. u intenzivnějších partií.

Kvalita je většinou vyšší než u CBR. Kvalita je většinou vyšší než u CBR.

Page 11: Zvukové kompresory

Datový tok (Bitrate)Datový tok (Bitrate)

► ABR (Average bitrate)ABR (Average bitrate) Průměrný datový tok – hodnota datového toku se vypočítá Průměrný datový tok – hodnota datového toku se vypočítá

jako suma přenosové rychlosti každého vzorku vydělena jako suma přenosové rychlosti každého vzorku vydělena počtem vzorků. Skladba má v průměru nastavený jeden počtem vzorků. Skladba má v průměru nastavený jeden bitrate, výkyvy jsou možné.bitrate, výkyvy jsou možné.

Page 12: Zvukové kompresory

Komprese datKomprese dat

►Bezeztrátová komprese Bezeztrátová komprese ►Ztrátová kompreseZtrátová komprese

Page 13: Zvukové kompresory

Bezeztrátová kompreseBezeztrátová komprese

► Jedná se o algoritmy, které dovolují přesnou Jedná se o algoritmy, které dovolují přesnou zpětnou rekonstrukci komprimovaných dat.zpětnou rekonstrukci komprimovaných dat.

► Používá se všude tam, kde je důležité, aby Používá se všude tam, kde je důležité, aby originální data a data po dekompresi originální data a data po dekompresi komprimovaného souboru byla totožná.komprimovaného souboru byla totožná. např. při přenášení počítačových dat, výsledků měření, např. při přenášení počítačových dat, výsledků měření,

textu apod.textu apod.

Page 14: Zvukové kompresory

Bezeztrátové kompresní Bezeztrátové kompresní metodymetody

► WAV, Monkey's Audio, RealPlayerWAV, Monkey's Audio, RealPlayer► Zip, RARZip, RAR► GIF, PNGGIF, PNG► Huffyuv, H.264/MPEG-4 AVCHuffyuv, H.264/MPEG-4 AVC

Page 15: Zvukové kompresory

WAVWAV(Waveform audio format)(Waveform audio format)

► Tento zvukový formát vytvořily firmy IBM a Tento zvukový formát vytvořily firmy IBM a Microsoft. Je to speciální varianta obecnějšího Microsoft. Je to speciální varianta obecnějšího formátu RIFF.formátu RIFF.

► Většinou se používá nekomprimovaný zvuk v Většinou se používá nekomprimovaný zvuk v pulzně kódové modulaci (PCM). pulzně kódové modulaci (PCM). stejně jako na Audio CDstejně jako na Audio CD

► Velikost WAV souboru je omezena na 4 GB, což Velikost WAV souboru je omezena na 4 GB, což odpovídá asi 6.6 hodinám záznamu v CD kvalitě.odpovídá asi 6.6 hodinám záznamu v CD kvalitě. Datový tok odpovídá 1411Kb/s při vzorkování 44100 Hz.Datový tok odpovídá 1411Kb/s při vzorkování 44100 Hz.

Page 16: Zvukové kompresory

Ztrátová kompreseZtrátová komprese

► Při kompresi jsou některé informace nenávratně Při kompresi jsou některé informace nenávratně ztraceny a nelze je zpět rekonstruovat. ztraceny a nelze je zpět rekonstruovat.

► Používá se tam, kde je možné ztrátu některých Používá se tam, kde je možné ztrátu některých informací tolerovat a kde nevýhoda určitého informací tolerovat a kde nevýhoda určitého zkreslení je bohatě vyvážena velmi významným zkreslení je bohatě vyvážena velmi významným zmenšením souboru. zmenšením souboru. např. při kompresi zvuku nebo obrazu.např. při kompresi zvuku nebo obrazu.

Page 17: Zvukové kompresory

Ztrátová komprese - principZtrátová komprese - princip

► Po úvodním předzpracování se přeskupí a/nebo Po úvodním předzpracování se přeskupí a/nebo transformují data tak, aby bylo možno lehce oddělit transformují data tak, aby bylo možno lehce oddělit důležité informace od nedůležitých. důležité informace od nedůležitých.

► Nedůležité informace se pak potlačí mnohem více Nedůležité informace se pak potlačí mnohem více než důležité a nakonec se výsledek zkomprimuje než důležité a nakonec se výsledek zkomprimuje některým z bezeztrátových kompresních algoritmů.některým z bezeztrátových kompresních algoritmů.

► Algoritmus ztrátové komprese má tedy dvě Algoritmus ztrátové komprese má tedy dvě podstatné částipodstatné části transformace původních dat transformace původních dat potlačení různě důležitých dat.potlačení různě důležitých dat.

Page 18: Zvukové kompresory

Transformace původních datTransformace původních dat

► K transformaci původních nebo předzpracovaných K transformaci původních nebo předzpracovaných dat se obvykle používá některá z ortonormálních dat se obvykle používá některá z ortonormálních nebo téměř ortonormálních transformací.nebo téměř ortonormálních transformací. DCT (diskrétní kosinová transformace) DCT (diskrétní kosinová transformace) FFT (rychlá Fourierova transformace) FFT (rychlá Fourierova transformace) DWT (diskrétní vlnková transformace) DWT (diskrétní vlnková transformace)

Page 19: Zvukové kompresory

Potlačení některých datPotlačení některých dat

► V této části kompresního algoritmu je rozhodující V této části kompresního algoritmu je rozhodující kvalitní psychoakustický model, který určuje, jaká kvalitní psychoakustický model, který určuje, jaká data mohou být potlačena nebo dokonce úplně data mohou být potlačena nebo dokonce úplně odstraněna. odstraněna.

► Při kompresi zvuku se hledají frekvence, které Při kompresi zvuku se hledají frekvence, které člověk stejně nemůže vnímat.člověk stejně nemůže vnímat.

► Problém při kompresi zvuku je o to složitější, že Problém při kompresi zvuku je o to složitější, že lidský sluch je velmi citlivý i na časové umístění lidský sluch je velmi citlivý i na časové umístění zvuku. I s tím musí dobrý psychoakustický model zvuku. I s tím musí dobrý psychoakustický model počítat.počítat.

Page 20: Zvukové kompresory

Formáty využívající ztrátovou Formáty využívající ztrátovou kompresikompresi

► MPEGMPEG► MP3MP3► Ogg VorbisOgg Vorbis► WMAWMA► AACAAC

► Dále JPEG, JPEG 2000Dále JPEG, JPEG 2000

Page 21: Zvukové kompresory

MPEGMPEG (Motion Picture Experts Group ) (Motion Picture Experts Group )► MPEG-1: Kódování pohyblivého obrazu a MPEG-1: Kódování pohyblivého obrazu a

přidruženého zvuku pro digitální datové nosiče s přidruženého zvuku pro digitální datové nosiče s rychlostí přenosu 0,9 až 1,5 Mbitu/s. Standard pro rychlostí přenosu 0,9 až 1,5 Mbitu/s. Standard pro kódování zvuku zahrnuje také oblíbený zvukový kódování zvuku zahrnuje také oblíbený zvukový kompresní formát Layer 3 (MP3).kompresní formát Layer 3 (MP3).

► MPEG-2: Všeobecné kódování pohyblivého obrazu a MPEG-2: Všeobecné kódování pohyblivého obrazu a přidruženého zvuku. Zahrnuje přenosové, obrazové přidruženého zvuku. Zahrnuje přenosové, obrazové a zvukové kódovací standardy pro vzduchem šířené a zvukové kódovací standardy pro vzduchem šířené televizní vysílaní ATSC a DVB, digitální satelitní TV televizní vysílaní ATSC a DVB, digitální satelitní TV přenos, digitální kabelový TV signál a (s určitými přenos, digitální kabelový TV signál a (s určitými změnami) disky DVD Video. Přenosová rychlost se změnami) disky DVD Video. Přenosová rychlost se pohybuje od 1,5 Mbitu/s až do 15 Mbitů/s (pro TV pohybuje od 1,5 Mbitu/s až do 15 Mbitů/s (pro TV signál se používá rychlost 6 Mbitů/s).signál se používá rychlost 6 Mbitů/s).

Page 22: Zvukové kompresory

MPEGMPEG (Motion Picture Experts Group ) (Motion Picture Experts Group )► MPEG-3: Původně určený pro kódování standardu MPEG-3: Původně určený pro kódování standardu

HDTV, později byl jeho vývoj pozastaven a standard HDTV, později byl jeho vývoj pozastaven a standard MPEG-3 byl sloučen se standardem MPEG-2.MPEG-3 byl sloučen se standardem MPEG-2.

► MPEG-4: Kódování audiovizuálního obsahu s velmi MPEG-4: Kódování audiovizuálního obsahu s velmi nízkým bitratem. Rozšiřuje formát MPEG-1 o nízkým bitratem. Rozšiřuje formát MPEG-1 o podporu audio/video „objektů“, 3D obsahu, podporu audio/video „objektů“, 3D obsahu, kódování s nízkou rychlostí přenosu a Digitální kódování s nízkou rychlostí přenosu a Digitální správu práv (angl. Digital Rights Management správu práv (angl. Digital Rights Management (DRM)).(DRM)).

Page 23: Zvukové kompresory

Komprese MPEGKomprese MPEG

► Kodeky MPEG využívají tzv. ztrátovou kompresi Kodeky MPEG využívají tzv. ztrátovou kompresi pomocí transformačních kodeků. pomocí transformačních kodeků.

► U ztrátových transformačních kodeků se vzorky U ztrátových transformačních kodeků se vzorky obrazu nebo zvuku rozdělí na drobné segmenty, obrazu nebo zvuku rozdělí na drobné segmenty, transformují se na frekvenční prostor a poté transformují se na frekvenční prostor a poté kvantizují (quantized) a dále kódují.kvantizují (quantized) a dále kódují.

V rámci standardu MPEG je popsán jen formát bitového V rámci standardu MPEG je popsán jen formát bitového proudu a dekodér. proudu a dekodér.

Page 24: Zvukové kompresory

MP3MP3(MPEG-1 Layer 3)(MPEG-1 Layer 3)

► O vývoj formátu MP3 se zasloužil německý vědec O vývoj formátu MP3 se zasloužil německý vědec Karlheinz Brandenburg, ředitel pobočky Karlheinz Brandenburg, ředitel pobočky Frauenhoferova ústavu pro mediální komunikaci v Frauenhoferova ústavu pro mediální komunikaci v Ilmenau, a jeho vědecký tým.Ilmenau, a jeho vědecký tým.

► je to formát ztrátové komprese zvukových souborů, je to formát ztrátové komprese zvukových souborů, založený na kompresním algoritmu MPEG. založený na kompresním algoritmu MPEG. Při zachování vysoké kvality umožňuje zmenšit velikost Při zachování vysoké kvality umožňuje zmenšit velikost

hudebních souborů v CD kvalitě přibližně na desetinu.hudebních souborů v CD kvalitě přibližně na desetinu.

Page 25: Zvukové kompresory

Komprese zvuku MP3Komprese zvuku MP3

► MP3 se snaží odstranit redundanci zvukového MP3 se snaží odstranit redundanci zvukového signálu na základě psychoakustického modelu.signálu na základě psychoakustického modelu.

► Komprese je založena na Komprese je založena na vvyužiyužittí následujících í následujících nedokonalostí lidského sluchu:nedokonalostí lidského sluchu: Různá citlivost závislá na frekvenciRůzná citlivost závislá na frekvenci Frekvenční maskováníFrekvenční maskování Tempolární (časové) maskování Tempolární (časové) maskování

► Míru komprimace udává takzvaný bitrate.Míru komprimace udává takzvaný bitrate.► Nejčastěji se setkáte s bitrate 128 Kb/s, občas 192 Nejčastěji se setkáte s bitrate 128 Kb/s, občas 192

Kb/s což odpovídá téměř CD kvalitě. Kb/s což odpovídá téměř CD kvalitě.

Page 26: Zvukové kompresory

MP3 – slabinyMP3 – slabiny

► Při komprimaci mluveného slova jsou výsledky Při komprimaci mluveného slova jsou výsledky výrazně horší. výrazně horší.

► Popsané maskování a potlačování tónů způsobuje, Popsané maskování a potlačování tónů způsobuje,

že uže u mluveného slova může být ve slově potlačena mluveného slova může být ve slově potlačena počáteční nebo koncová slabika. Mohou být také počáteční nebo koncová slabika. Mohou být také zkracovány pauzy mezi jednotlivými slovy. zkracovány pauzy mezi jednotlivými slovy.

► Výsledná kvalita ovšem závisí na zvoleném Výsledná kvalita ovšem závisí na zvoleném datovém toku.datovém toku.

Page 27: Zvukové kompresory

Ogg VorbisOgg Vorbis

► Datový formát Ogg propagovaný nadací Xiph.org Datový formát Ogg propagovaný nadací Xiph.org ► Dnes je základem ztrátový zvukový kodek Ogg Vorbis Dnes je základem ztrátový zvukový kodek Ogg Vorbis

(16 - 256 Kb/s na kanál). (16 - 256 Kb/s na kanál). ► Kodek je koncipován tak, aby byl maximálně flexibilní. Kodek je koncipován tak, aby byl maximálně flexibilní. ► Umožňuje použití velkého rozsahu vzorkovacích Umožňuje použití velkého rozsahu vzorkovacích

frekvencí 8kHz – 192kHz.frekvencí 8kHz – 192kHz.► Použití až 255 kanálůPoužití až 255 kanálů► Používá standardně VBR, lze i CBR, ABRPoužívá standardně VBR, lze i CBR, ABR► „„bitrate peeling„bitrate peeling„

umožňuje snížit velikost přenosové rychlosti bez nutnosti umožňuje snížit velikost přenosové rychlosti bez nutnosti znovu kódovat soubor =znovu kódovat soubor =>> nedochází ke zhoršení kvality nedochází ke zhoršení kvality

vlivem kódovánívlivem kódování

Page 28: Zvukové kompresory

Ogg Vorbis - kvalitaOgg Vorbis - kvalita

► U Ogg Vorbis kvalitu určuje, jak moc se U Ogg Vorbis kvalitu určuje, jak moc se komprimovaný soubor liší od originálu. komprimovaný soubor liší od originálu.

► Rozsah nastavení kvality je v rozmezí -1 až 10, kde Rozsah nastavení kvality je v rozmezí -1 až 10, kde deset je nejlepší kvalita.deset je nejlepší kvalita. Standardní nastavení kvality je 3, které většinou odpovídá Standardní nastavení kvality je 3, které většinou odpovídá

průměrnému bitrate 112kbps. Srovnáním s MP3 na průměrnému bitrate 112kbps. Srovnáním s MP3 na 128kbps je zvuková kvalita Ogg lepší a velikost souboru je 128kbps je zvuková kvalita Ogg lepší a velikost souboru je zhruba o 10% menší. zhruba o 10% menší.

Nastavením kvality 2 se zvuková kvalita vyrovnává, ale Nastavením kvality 2 se zvuková kvalita vyrovnává, ale soubor je už o 25% menší.soubor je už o 25% menší.

Page 29: Zvukové kompresory

Ogg Vorbis - použitíOgg Vorbis - použití

► Výrobci her pro kompresi zvukových (někdy i Výrobci her pro kompresi zvukových (někdy i obrazových) dat obsažených ve hrách.obrazových) dat obsažených ve hrách.

► Použití na InternetuPoužití na Internetu Např. ČRoNapř. ČRo

► Jeho předností je i otevřená licence. Jeho předností je i otevřená licence.

Page 30: Zvukové kompresory

WMAWMA (Window Media Audio) (Window Media Audio)

► Formát vyvinutý Microsoftem jako součást Windows Formát vyvinutý Microsoftem jako součást Windows Media byl původně určen jako náhrada za MP3.Media byl původně určen jako náhrada za MP3.

► Aktuální verze je 9.2, která kromě původního Aktuální verze je 9.2, která kromě původního ztrátového kodeku přidává i zvláštní kodeky pro ztrátového kodeku přidává i zvláštní kodeky pro bezztrátovou a multikanálovou kompresi.bezztrátovou a multikanálovou kompresi.

► WMA 9 ProWMA 9 Pro Zachytává zvuk v plném rozlišení (vzorkování v kvalitě 24 Zachytává zvuk v plném rozlišení (vzorkování v kvalitě 24

bitů/96 kHz) ve formátu stereo nebo 5.1 (či dokonce 7.1) bitů/96 kHz) ve formátu stereo nebo 5.1 (či dokonce 7.1) SurroundSurround

Přenosové rychlosti 128 až 768 kb/s. Přenosové rychlosti 128 až 768 kb/s. Místo souborů MP3 ve formátu stereo při přenosové rychlosti Místo souborů MP3 ve formátu stereo při přenosové rychlosti

128 kb/s mohou uživatelé pracovat se soubory WMA 5.1 s 128 kb/s mohou uživatelé pracovat se soubory WMA 5.1 s vyšší věrností při stejné přenosové rychlosti.vyšší věrností při stejné přenosové rychlosti.

Page 31: Zvukové kompresory

WMA - kvalitaWMA - kvalita

► Od verze 9 je kvalita zvuku WMA velmi slušná, Od verze 9 je kvalita zvuku WMA velmi slušná, dosahuje téměř ke špičce (Vorbis, Musepack). dosahuje téměř ke špičce (Vorbis, Musepack). Známým problémem je příliš časné ořezávání Známým problémem je příliš časné ořezávání vyšších frekvencí při nižších bitrate. vyšších frekvencí při nižších bitrate.

► Zato WMA neobsahuje ani při nižších bitrate tolik Zato WMA neobsahuje ani při nižších bitrate tolik artefaktů jako konkurence.artefaktů jako konkurence.

► Zvukově mírně překonává MP3, zvláště při nižších Zvukově mírně překonává MP3, zvláště při nižších datových tocích. datových tocích.

Page 32: Zvukové kompresory

WMA – hardwarová a softwarová WMA – hardwarová a softwarová podporapodpora

► Oficiálně existuje pouze jeden enkóder a ten je Oficiálně existuje pouze jeden enkóder a ten je integrovaný ve Windows Media Player. Je velmi integrovaný ve Windows Media Player. Je velmi rychlý (dokonce několikrát rychlejší než třeba rychlý (dokonce několikrát rychlejší než třeba enkodér Vorbisu), ale obsahuje minimum nastavení. enkodér Vorbisu), ale obsahuje minimum nastavení. Není možné nastavit CBR ani ABR, pouze VBR a to pouze v Není možné nastavit CBR ani ABR, pouze VBR a to pouze v

několika pevných profilech.několika pevných profilech.

► K fomátu WMA neexistuje otevřená specifikace, K fomátu WMA neexistuje otevřená specifikace, existuje tedy pouze jediný použitelný enkodér, který existuje tedy pouze jediný použitelný enkodér, který je navíc těsně spjat s platformou Windows. je navíc těsně spjat s platformou Windows.

► Ohledně hardware je na tom WMA velmi dobře. Ohledně hardware je na tom WMA velmi dobře. Nejspíš díky obchodním „tlakům“ je WMA velmi Nejspíš díky obchodním „tlakům“ je WMA velmi rozšířený formát především u přehrávačů hudby a rozšířený formát především u přehrávačů hudby a DVD přehrávačů.DVD přehrávačů.

Page 33: Zvukové kompresory

AACAAC(Advanced Audio Coding)(Advanced Audio Coding)

► AAC je součástí audio standardu MPEG-2 a MPEG-4. AAC je součástí audio standardu MPEG-2 a MPEG-4. Hlavním nositelem licence je firma Dolby Labs.Hlavním nositelem licence je firma Dolby Labs.

► Formát AAC není úplně jednotný a obsahuje v sobě Formát AAC není úplně jednotný a obsahuje v sobě několik profilů, vylepšení apod. několik profilů, vylepšení apod. technologie jako LTP (Long Term Prediction) nebo technologie jako LTP (Long Term Prediction) nebo

Postprocessing Postprocessing

► Existuje mnoho enkoderů, které se razantně liší Existuje mnoho enkoderů, které se razantně liší kvalitou. kvalitou. AAC je jeden z nejpokročilejších kodeků a má velmi dobré AAC je jeden z nejpokročilejších kodeků a má velmi dobré

vyhlídky do budoucna.vyhlídky do budoucna.

Page 34: Zvukové kompresory

AAC - vlastnostiAAC - vlastnosti

► Vzorkovací frekvence od 8 kHz do 96 kHz Vzorkovací frekvence od 8 kHz do 96 kHz

► 48 audio kanálů 48 audio kanálů

► Signál je zpracovaný upravenou diskrétní kosinovou Signál je zpracovaný upravenou diskrétní kosinovou transformací (MDCT)transformací (MDCT)

► Komprimované audio v 96 Kb/s obecně překoná Komprimované audio v 96 Kb/s obecně překoná kvalitu MP3 komprimovaného v 128 Kb/s.kvalitu MP3 komprimovaného v 128 Kb/s.

Page 35: Zvukové kompresory

AAC - podporaAAC - podpora

► Softwarová podpora není zrovna nejlepší, většina Softwarová podpora není zrovna nejlepší, většina přehrávačů potřebuje externí plugin (pokud nějaký přehrávačů potřebuje externí plugin (pokud nějaký existuje). existuje).

► V oblasti hardware se ujal především v V oblasti hardware se ujal především v přehrávačích firmy Apple iPod. Jeho podpora se přehrávačích firmy Apple iPod. Jeho podpora se také nachází v novém firmware (2.0) PSP (Play také nachází v novém firmware (2.0) PSP (Play Station Portable).Station Portable).

Page 36: Zvukové kompresory

UkázkaUkázka

►MP3 s různými datovými tokyMP3 s různými datovými toky 48Kb/s; 64Kb/s; 128Kb/s; 192Kb/s a 48Kb/s; 64Kb/s; 128Kb/s; 192Kb/s a

nakonec nekomprimovaný soubornakonec nekomprimovaný soubor

►MP3 s různou vzorkovací frekvencíMP3 s různou vzorkovací frekvencí 16kHz; 24kHz; 44,1kHz; 48kHz16kHz; 24kHz; 44,1kHz; 48kHz

Page 37: Zvukové kompresory

ZdrojeZdroje

► www.wikipedia.orgwww.wikipedia.org► http://www.sweb.cz/nullsoftwinamp/winamp/test.hthttp://www.sweb.cz/nullsoftwinamp/winamp/test.ht

mm► http://home.zcu.cz/~mtoman/zvuk.htmhttp://home.zcu.cz/~mtoman/zvuk.htm► Základy experimentální psychoakustiky: Alois MelkaZáklady experimentální psychoakustiky: Alois Melka

Page 38: Zvukové kompresory

Konec prezentaceKonec prezentace

Děkuji za pozornostDěkuji za pozornost