Multimedia dan Computer Vision

80
H. SUMIJAN STAF PENGAJAR Universitas Putra Indonesia “YPTK” MULTIMEDIA DAN COMPUTER VISION

Transcript of Multimedia dan Computer Vision

Page 1: Multimedia dan Computer Vision

H. SUMIJANSTAF PENGAJAR

Universitas Putra Indonesia “YPTK”

MULTIMEDIA DAN COMPUTER VISION

Page 2: Multimedia dan Computer Vision

Multimedia: merupakan integrasi dari media

kontinu (misalnya audio, video) dan media

diskrit (teks, audio, grafik, gambar, video)

menjadi informasi digital yang dapat

disampaikan kepada pengguna secara tepat.

Teknologi Multimedia : teknologi berbasis

komputer yang dapat mengintegrasikan

informasi teks, suara, gambar, animasi dan

video digital serta mengkomunikasikannya

kepada pengguna.

Page 3: Multimedia dan Computer Vision

Tantangan Teknis :

Butuh pengelolaan ragam data dan

volume data besar

Waktu proses data dan komunikasi antara

komponen-komponen teknologi bersifat real-

time.

Butuh sinkronisasi kerja antar komponen

teknologi

Page 4: Multimedia dan Computer Vision

Volume Data : Speech 8000 samples/s 8Kbytes/s

CD Audio44,100 samples/s, 2 bytes/sample

176Kbytes/s

Satellite 180X180 km^2 600MB/image

Imagery 30m^2 resolution (60MB compressed)

NTSC Video30fps, 640X480 pixels, 3bytes/pixel

30Mbytes/s (2-8 Mbits/s compressed)

Page 5: Multimedia dan Computer Vision

Dokumen multimedia :

Teks

Citra Audio

Video

Animasi (komputer grafik)

Page 6: Multimedia dan Computer Vision

Suatu dokumen yang berisikan dua atau lebih

elemen-elemen multimedia (media) dari sumber

yang berbeda ( teks, citra, video, audio, …)

Dokumen multimedia disimpan dalam satu atau

beberapa file secara tersinkronisasi terhadap

dasar waktu yang sama.

Dokumen multimedia :

Contoh :

Suatu reportase pada siaran televisi akan susah difahami jika

komentar seorang jurnalis memiliki delay waktu terhadap

video dan/atau juga terhadap ilustrasi grafik yang ditayangkan.

Page 7: Multimedia dan Computer Vision

Sinkronisasi dokumen multimedia :

• Sinkronisasi intra-objets

• Sinkronisasi inter-objets

Page 8: Multimedia dan Computer Vision

Layanan Residential Video-on-demand

Video phone/Conference

Multimedia home shopping (MM catalogs,

product demos and presentation)

Layanan Business Services

Corporate training

Desktop MM conferencing, MM e-mail

Page 9: Multimedia dan Computer Vision

9

Vidéo conférence

1. Volume data multimedia sangat besar

2. Bandwidth jaringan terbatas dan mahal

3. Delay waktu transmisi besar

Page 10: Multimedia dan Computer Vision

1. Realtime Object Recognition in video games Ari Morgan (1)

2. Multiple Camera Tracking with Wide Baseline Homography

Zhaowen Wang, Ning Xu, David Ho (3)

3. Multiview 3D object reconstruction Vinay Muttineni, Mahesh

Akella, Allan Law (3)

4. Wild Cat Identification Mohammad Amanzadeh, Amit Das,

Heman Gala (3)

5. Background subtraction: compare three methods Kevin

Shih, Philbert Lin, and Pooya Khorrami (3) Compare

three methods for background subtraction.

6. Taxi Detection and Tracking AJ von Alt, Phil Lee (2)

Develop a method for detecting and tracking specific

cars through a video sequence with applications to New

York style Taxi cabs in an urban environment

CONTOH APLIKASI COMPUTER VISION

Page 11: Multimedia dan Computer Vision

7. Classroom webcam control Sahil Handa, Sujay Bhobe,

Suchithra Gopal (3)

8. K-mer Based DNA Sequence Alignment using Inverse

Document File Approach Izzat El Hajj (1) One of the

bottleneck problems in DNA sequence assembly and

alignment is being able to find contigs in a database

that overlap with a sequence of base pairs. The idea

this project wishes to borrow from computer vision is

the inverse document file approach used to query

image databases.

9. Analyze material composition Johannes Traa (1) I would

like to explore a computer vision application of

techniques from compositional data analysis (CODA).

CONTOH APLIKASI COMPUTER VISION

Page 12: Multimedia dan Computer Vision

10. Bimanual Symmetric Gesture Recognition using Computer

Vision Aadeel Akhtar, Manoj Kumar, Tom Paine (3)

11. Similar category classification Abdel Vargas Silva (1)

12. Real-time Segmentation of Human Data from Kinect

Pengye Xia, Nan Chen, and Tony Lau (3)

13. Street Sign Recognition John Parkeer, Brian Wright (2)

14. Control law and parameter recovery from video footage

Sophie Puydupin and Pritam Sukumar (2)

15. Aircraft localization and classification Jason Oates (1)

16. Detect Star Patterns for Space Navigation Eric Babcock (1)

17. Create 3D Mesh using Kinect Jorge Carmona (1)

18. Automatic Face Tagging Thapanapong Rukkanchanunt,

Manne Henriksson, Seylom Ayivi-Guedehoussou (3)

CONTOH APLIKASI COMPUTER VISION

Page 13: Multimedia dan Computer Vision

19. Object Removal by Retrieving Background Regions

Mariyam Khalid, Daphne Tsatsoulis, Zhicheng Yan (3)

20. 20. Segment out person using Kinect RJ Marsan, Felix

Wang, John Wieting (3)

21. Playing Card Recognition Cem Onyuksel, Adam

Zimmerman (2)

22. Depth Upsampling using Sparse Dictionaries Keunhong

Park (1)

23. Monitoring and Diagnostics of Gas Turbines Duy (Dewey)

Tran (1)

24. Restoring Motion-Blurred Image Chao Xia (1)

25. Power Watershed Segmentation Pratik Mallya (1)

26. Carcassonne Gameboard Scorer Zigang Xiao, Ting Yu (2)

27. Image Analysis of Maize Ear Ou Yang Fu (1)

CONTOH APLIKASI COMPUTER VISION

Page 14: Multimedia dan Computer Vision

Pendidikan

Pembelajaran jarak jauh

Repository video pembelajaran

Akses ke MM digital libraries

Kedokteran

Diagnosis, pengobatan dan pengarsipan

Basis data multimedia

Page 15: Multimedia dan Computer Vision

Bidang medis (kedokteran) :

Page 16: Multimedia dan Computer Vision

Simulasi kedokteran :

Page 17: Multimedia dan Computer Vision

Bidang medis (Diagnosis) :

Algoritma segmentasi warna citra

Page 18: Multimedia dan Computer Vision

Simulasi penerbangan :

Page 19: Multimedia dan Computer Vision

APA KEUNTUNGAN BERBUAT BAIKAllah tidak membebani seseorang melainkan sesuai dengan kesanggupannya. Ia

mendapat pahala (dari kebajikan) yang diusahakannya dan ia mendapat siksa

(dari kejahatan) yang dikerjakannya. (Mereka berdoa): "Ya Tuhan kami, janganlah

Engkau hukum kami jika kami lupa atau kami tersalah. Ya Tuhan kami, janganlah

Engkau bebankan kepada kami beban yang berat sebagaimana Engkau bebankan

kepada orang-orang sebelum kami. Ya Tuhan kami, janganlah Engkau pikulkan

kepada kami apa yang tak sanggup kami memikulnya. Beri ma'aflah kami;

ampunilah kami; dan rahmatilah kami. Engkaulah Penolong kami, maka tolonglah

kami terhadap kaum yang kafir."( QS: 2. Al Baqarah:286)

Barangsiapa yang mengerjakan kebaikan seberat dzarrahpun, niscaya dia akan

melihat (balasan)nya. Asbabun nuzul. Dan barangsiapa yang mengerjakan

kejahatan sebesar dzarrahpun, niscaya dia akan melihat (balasan)nya pula.

Asbabun nuzul (QS: 99. Al Zalzalah:7-8)

Dan sampaikanlah berita gembira kepada mereka yang beriman dan berbuat

baik, bahwa bagi mereka disediakan surga-surga yang mengalir sungai-sungai

di dalamnya. Setiap mereka diberi rezki buah-buahan dalam surga-surga itu,

mereka mengatakan : "Inilah yang pernah diberikan kepada kami dahulu."

Mereka diberi buah-buahan yang serupa dan untuk mereka di dalamnya ada

isteri-isteri yang suci dan mereka kekal di dalamnya. (QS :2. Al Baqarah:25)

Page 20: Multimedia dan Computer Vision

• Kompresi data teks (Huffman coding,

RLE coding, LZW coding, arithmetic coding

• Representasi dan kompresi data suara

dan audio

• Representasi dan kompresi citra

• Representasi dan kompresi video

Page 21: Multimedia dan Computer Vision

• Metode representasi data/informasi kedalam

ukuran yang lebih kecil sehingga dapat

mempercepat waktu transmisinya dan memperkecil

penggunaan memori penyimpanan

• Kompresi dapat dilakukan tanpa kehilangan

atau perubahan data (Lossless compression)

• Kompresi dapat dilakukan dengan kehilangan atau

perubahan data (lossy compression)

Page 22: Multimedia dan Computer Vision

• Pengkodean (coding) data atau informasi

yang memiliki redundancy (kerangkapan)

kedalam jumlah bit yang lebih kecil.

• Digunakan untuk kompresi teks atau

citra/video tanpa kehilangan/perubahan data

(citra/video medis)

• Beberap contoh coding : Huffman, arithmetic,

statistik, RLE (run-length encoding), Lempel-

Ziv, Lempel-Ziv-Welch,

Page 23: Multimedia dan Computer Vision

A 12"" 9S 7P 5R 5T 5E 4I 4N 4U 4M 3K 2O 2Y 2C 1J 1L 1V 1

Page 24: Multimedia dan Computer Vision

• Huffman Coding (David Albert Huffman 1952)

- Berbasis pada perhitungan statistik

- Mengunakan bantuan pohon biner

- Data yang frekuensi munculnya paling

banyak dikode dengan jumlah bit terkecil

- Data yang frekuensi munculnya paling

sedikit dikode dengan jumlah bit terbesar

Page 25: Multimedia dan Computer Vision

• Huffman Coding

Contoh : "this is an example of a huffman tree"

- statistik munculnya karakter : “ “= 7, a=4,

e=4, f=3, t=2, h=2, i=2, s=2, n=2, m=2, x=1,

p=1, l=1, u=1, 0=1, r=1.

- Probabilitas munculnya karakter : “ “= 0.1944…,

a=e=0.1111…, f=0.0833…, t=h=i=s=n=m=0.0556,

x=p=l=u=o=r=0.0278.

Page 26: Multimedia dan Computer Vision

• Huffman Coding Pohon biner :

““= 7a=4 e=4 f=3 t=2 h=2 i=2 s=2 n=2 m=2 x=1 p=1 l=1 u=1 0=1 r=1

2

2

2 4

4

4

4

5

8

8

8

12

16

20 36“ “= 000a = 010 e = 011 f = 0010 t = 0011 h = 1000 i = 1001 s = 1010 n = 1011 m = 1100 x = 11010 p = 11011 l = 11100 u = 11101 o = 11110 r = 11111288 bit 195 bit

0 0 0

0 1

1

0 1

1

0 0 0 1

1

0 1

1

0 0 1

0 1

1

0 0 1

1

0 1

1

Page 27: Multimedia dan Computer Vision

• Huffman Coding

1. digunakan untuk pengkodean teks, citradan video

2. Ada 3 jenis algorithme Huffman coding,Masing masing berhubungan denganmetode pembuatan pohon biner :

Page 28: Multimedia dan Computer Vision

• Huffman Coding

statik : code setiap karakter ditentukan

langsung oleh algoritma (contoh : teks

berbahasa Prancis, dimana frekuensi

kemunculan huruf e sangat banyak sehingga

code bitnya kecil.

semi-adaptatif : teks harus dibaca terlebih dulu

untuk menghitung frekuensi munculnya setiap

karakter, kemudian membentuk pohon

binernya.

Page 29: Multimedia dan Computer Vision

• Huffman Coding

adaptatif : Metode ini memberikan rasio kompresi

yang tinggi karena pohon biner Dibentuk secara

dinamik mengikuti tahapan compresi. Namun dari

sisi kecepatan eksekusi membutuhkan waktu yang

lebih lama karena satiap saat pohon binernya akan

beruabah mengikuti perubahan frekuensi munculnya

setiap karakter.

Page 30: Multimedia dan Computer Vision

• Kelemahan Huffman Coding

- Bila frekuensi munculnya setiap karakter dalam

suatu dokumen adalah sama semua.

- File kompresinya bisa sama atau lebih besar dari

file aslinya

- Solusi yang mungkin adalah kompresi per blok

karekter dari dokumen tersebut

Entropi H :

Entropi H :

Page 31: Multimedia dan Computer Vision

• Run-length encoding

- RLE coding telah diaplikasikan khususnya pada scanner

hitam putih (biner)

- Prinsip dasarnya adalah menghitung jumlah/panjang data

yang sama dalam serangkain data yang akan dikompres

- Contoh pada dokumen hitam H (tulisan) dan putih P (latar

belakang dokumen), berikut misalnya data pada satu baris

dokumen yang direpresntasikan dalam pixel :

PPPPPPPPPPPPHPPPPPPPPPPPPPPHHHPPPPPPPPPPPPPPPPPPPPPPPHPPPPPPPPPPP

- Bentuk kompresinya adalah : 12P1H14P3H23P1H11P

Page 32: Multimedia dan Computer Vision

• Aplikasi Run-length encoding

- Kompresi citra format bmp pada Windows dan OS/2 untuk

citra 1, 4 dan 8 bit/pixel

- Citra format PCX 8 dan 24 bit/pixel

- Fax dan scanner hitam putih

Page 33: Multimedia dan Computer Vision

Format file citra:

• File citra umumnya memiliki :

- header yang menyatakan informasi citra seperti ukuran

citra, format file, dll.

- data citra itu sendiri

• Struktur file berbeda antara satu format dengan format

citra lainnya

• Bisa jadi struktur file untuk format citra yang sama

berbeda dari satu versi ke versi yang lain (contoh : file

TIFF)

Page 34: Multimedia dan Computer Vision

• Format JPEG mengikuti norm ISO

• Bersifat pengunaan bebas

• Jumlah warna citra 224 = 16777216 warna

• Type kompresi lossy menggunakan DCT

• Kualitas kompresi tergantung pada rasio

kompresi

• Tidak memiliki sifat warna transparan

• Bukan format animasi

Page 35: Multimedia dan Computer Vision

• JPEG 2000 masih dibawah proteksi hak paten

• Type kompresi lossy dan lossless menggunakan

Wavelet Transform

• Jumlah warna citra 224 = 16777216 warna

• Kualitas kompresi dapat diatur secara lokal atau

global

• Dapat ditampilkan dengan ukuran yang berbeda

• Bukan format animasi

• Tidak memiliki sifat warna transparan

Page 36: Multimedia dan Computer Vision

• Bersifat pengunaan bebas

• Type kompresi lossless baik untuk citra

berwarna maupun citra gray-level

• Memiliki sifat warna transparan

• Bukan format animasi

• Versi format animasinya adalah MNG

Page 37: Multimedia dan Computer Vision

• Bersifat dilindungi oleh hak paten

• Jumlah warna citra 256 (sistem pallet)

• Dapat memiliki sifat warna transparan

• Dapat merupakan format animasi

• Penggunaa umum adalah untuk logo dan

citra yang memiliki jumlah warna sedikit

Page 38: Multimedia dan Computer Vision

Pembagian citra

dalam blok

8x8 pixel

Transformasi

warnaDCT Kuantisasi

Coding RLE

&

Huffman

Tabel

Kuantisasi

Tabel

coding

Rekonstruksi

Blok citra

Transformasi

Warna

invers

IDCTKuantisasi

Inverse

Decoding RLE

&

Huffman

Citra terkompresi

JPEGCitra asli

Kompresi JPEG

Rekonstruksi JPEG

Bagan standar kompresi citra JPEG

Matrice d’origine.

Page 39: Multimedia dan Computer Vision

Matrice d’origine. Matrice transformée DCT

DCT

Matrice de quantification

Matrice quantifiée.

÷

1260 rata2 dari

seluruh matrik asli

-1, 1, -3, 2 deviasi

Page 40: Multimedia dan Computer Vision

1

0

2

2

).12(cos).,()(.),(

N

x

NXN

ixyxPixeliCyiDCT

1

0

1

0 2

).12(cos.

2

).12(cos).,()().(.

2),(

N

x

N

y N

jy

N

ixyxPixeliCjC

NjiDCT

1

0

2

2

).12(cos.),()(.),(

N

y

XNN

jyyiDCTjCjiDCT

Transformasi DCT

1

0

1

0 2

).12(cos.

2

).12(cos).,()().(.

2),(

N

i

N

j N

jy

N

ixjiDCTiCjC

NyxPixel

1

0

2

2

).12(cos).,()(.),(

N

j

NXN

jyjiDCTjCyiIDCT

1

0

2

2

).12(cos.),()(.),(

N

i

XNN

ixyiIDCTiCyxPixel

Transformasi DCT invers.

Implementasi 1D :

Implementasi 1D :

Page 41: Multimedia dan Computer Vision

Matriks hasil IDCT

IDCT

x

Matriks kuantisasi

Matriks terkuantisasi. Matriks terkuantisasi invers.

00000000

00000000

00000000

00000000

00000000

0000001314

0000001224

000001001264

F

Page 42: Multimedia dan Computer Vision

Quantization Table for:

Photoshop CS2 (Save As 11)Quantization Table: Luminance

1 1 1 2 3 3 4 5

1 1 1 2 3 4 4 6

1 1 2 3 4 4 5 7

2 2 3 4 4 5 7 8

3 3 4 4 5 7 8 8

3 4 4 5 7 8 8 8

4 4 5 7 8 8 8 8

5 6 7 8 8 8 8 8

Quantization Table: Chrominance

1 2 4 7 8 8 8 8

2 2 4 7 8 8 8 8

4 4 7 8 8 8 8 8

7 7 8 8 8 8 8 8

8 8 8 8 8 8 8 8

8 8 8 8 8 8 8 8

8 8 8 8 8 8 8 8

8 8 8 8 8 8 8 8

Quantization Table for:

IrfanView (95%)Quantization Table: Luminance

2 1 1 2 2 4 5 6

1 1 1 2 3 6 6 6

1 1 2 2 4 6 7 6

1 2 2 3 5 9 8 6

2 2 4 6 7 11 10 8

2 4 6 6 8 10 11 9

5 6 8 9 10 12 12 10

7 9 10 10 11 10 10 10

Quantization Table: Chrominance

2 2 2 5 10 10 10 10

2 2 3 7 10 10 10 10

2 3 6 10 10 10 10 10

5 7 10 10 10 10 10 10

10 10 10 10 10 10 10 10

10 10 10 10 10 10 10 10

10 10 10 10 10 10 10 10

10 10 10 10 10 10 10 10

Page 43: Multimedia dan Computer Vision

Zigzag coding : urutan pengkode

menurut norm JPEG.

20 -10 11 1 -9 2 -2 -4 -8 -1 0 1 2 3 -1 0 0 0 0 -1 EOB

• DC adalah nilai rata-rata matriks dan merepresentasikan

informasi global matriks (frekuensi rendah)

• AC merepresentasikan informasi detail matriks (frek. tinggi)

• Penkodean dilakukan dalam bentuk zigzag :

Page 44: Multimedia dan Computer Vision

Table 1 - Huffman - Luminance (Y) - DC

Length Bits Code

3 bits

000001010011100101110

04050302060100 (End of Block)

4 bits 1110 07

5 bits 1111 0 08

6 bits 1111 10 09

7 bits 1111 110 0A

Table 2 - Huffman - Luminance (Y) - AC

Length Bits Code

2 bits 0001

0102

3 bits 100 03

4 bits 101010111100

110400 (End of Block)

5 bits 1101 01101 11110 0

052112

6 bits 1110 101110 11

3141

... ... ...

12 bits...1111 1111 0011...

...F0 (ZRL)...

... ... ...

16 bits ...1111 1111 1111 1110

...FA

20 -10 11 1 -9 2 -2 -4 -8 -1 0 1 2 3 -1 0 0 0 0 -1 EOB

Code bit-stream :

Code 01, 21, 41, dst 2 mendahului 2 angka 0

Contoh : 32 adalah 000-2 bit

Page 45: Multimedia dan Computer Vision

20 -10 11 1 -9 2 -2 -4 -8 -1 0 1 2 3 -1 0 0 0 0 -1 EOB

AC Code Size Additional Bits DC/AC Value

01 1 0 1 -1 1

02 2 00,01 10,11 -3,-2 2,3

03 3 000,001,010,011 100,101,110,111 -7,-6,-5,-4 4,5,6,7

04 4 0000,...,0111 1000,...,1111 -15,...,-8 8,...,15

05 5 0 0000,... ...,1 1111 -31,...,-16 16,...,31

06 6 00 0000,... ...,11 1111 -63,...,-32 32,...,63

07 7 000 0000,... ...,111 1111 -127,...,-64 64,...,127

08 8 0000 0000,... ...,1111 1111 -255,...,-128 128,...,255

09 9 0 0000 0000,... ...,1 1111 1111 -511,...,-256 256,...,511

0A 10 00 0000 0000,... ...,11 1111 1111 -1023,...,-512 512,...,1023

0B 11 000 0000 0000,... ...,111 1111 1111 -2047,...,-1024 1024,...,2047

1011 0101 1011 1011 00 1 . . . . . 1010 1 . . . . . . 111011 0 1100

(04)- 10 (04)- 11 ( 11)- ( 41)

Page 46: Multimedia dan Computer Vision

• Informasi dalam signal 1-D et 2-D tersebar dalam

frekuensi yang berbeda (dari frekuensi rendah ke

frekuensi tinggi)

• Analisis informasi dalam signal tersebut membutuhkan

teknik analisis multi-frekuensi multi-resolusi

multi-scale

• Wavelet transform (WT) sangat sesuai dengan

kebutuhan analisis multi-frekuensi.

Page 47: Multimedia dan Computer Vision

Bagaimana DWT berfungsi ?

Dua pendekatan analisis :

- pendekatan melalui dilatasi filter resolusi signal tetap.

- pendekatan melalui dilatasi signal resolusi signal

berubah

Contoh : misalkan suatu signal memiliki informasi yang

tersebar hingga pada frekuensi 1000 Hz.

Prinsipe : memisahkan signal dalam dua komponen yaitu

informasi general (frekuensi rendah) dan informasi

detil (frekuensi tinggi)

Page 48: Multimedia dan Computer Vision

Pendekatan melalui dilatasi filtre ?

- Pada tahap awal, kita bagi informasi signal dalam dua bagian dengan

melewatkannya dalam high-pass filter (500-1000 Hz) dan low-pass

filter (0-500 Hz).

- Menghasilkan satu signal yang berhubungan dengan informasi pada

interval 0-500 Hz (frekuensi rendah) dan satu signal lainnya dengan

informasi pada interval 500-1000 Hz (frekuensi tinggi).

- Selanjutnya, kita lakukan proses berulang pada salah satu atau kedua

komponen tadi.

- Andaikan kita lakukan untuk bagian low-pass dengan menggunakan

high-pass filter (250-500 Hz) dan low-pass filter (0-250 Hz). Maka kita

akan punya 3 komponen informasi, masing-masing berhubungan

dengan informasi dari satu signal yang sama pada frekuens 0-250 Hz,

250-500 Hz et 500-1000 Hz.

- dst.

Page 49: Multimedia dan Computer Vision

Pendekatan dilatasi signal ?

• Tahap pertama, kita lewatkan signal kedalam low-pass filter dan high-

pass filter (kita gunakan filter dengan resolusi yang sama,).

• Tahap kedua, resolusi signal hasil low-pass dan high-pass kita bagi dua.

• Selanjutnya, kita lakukan proses yang sama hingga pada resolusi yang

diinginkan.

Keuntungan untuk kompresi citra :

- Lebih mudah untuk implementasi real-time

- sangat baik untuk kompresi citra dan video

Page 50: Multimedia dan Computer Vision
Page 51: Multimedia dan Computer Vision
Page 52: Multimedia dan Computer Vision

• Ada beberapa jenis WT yang telah dikembangkan, diantaranya yang

digunakan untuk format JPEG2000 :

- ''CDF 9/7'' Cohen-Daubechies-Fauvaue (irreversible).

- ''spline 5/3'' pour Le Gall (lebih sederhana dan reversible).

• Bilangan 9 dan 5 merupakan jumlah elemen filter low-pass. Bilangan 7

dan 3 merupakan jumlah elemen filter high-pass.

Pour la CDF 9/7 :

+0.602949018236

+0.266864118443 (Z1 +Z-1)

-0.0782223266529 (Z2 +Z-2)

-0.016864118448 (Z3 +Z-3)

+0.026748757411 (Z4 +Z-4)

+0.557543526229 (Z1)

-0.295635881557 (Z2 +Z0)

-0.028771763114 (Z3 +Z-1)

+0.045635881557 (Z4 +Z-2)

Filter low-pass L :

Filter high-pass H :

Page 53: Multimedia dan Computer Vision

• Wavelet Transform (WT)

- Ide : membagi citra kedalam tingkat resolusi yang berbeda

- Pembagiannya berdasarkan pita frekuensi yang bebeda

- Menjaga/mempertahankan kualitas data

• Principes :

– Melakukan proses WT terhadap citra asli

– Kuantisasi skalar (sesuai tingkat resolusi)

– Pengkodean (RLE, entropy, Huffman, …)

Page 54: Multimedia dan Computer Vision

KuantisasiWavelet

Transform

Coding

per blok

Citra

asli

Citra

terkompresi

Encoder Optimisasi

rasio-distorsi

Pembentukan

bitstream

Citra

rekonstruksi

Kantisasi

invers

Decoder

Decoding

Per blok

Wavelet

transform

inverse

Citra

terkompresi

Page 55: Multimedia dan Computer Vision

Standar Kompresi JPEG2000LL1

LH1

HL1

HH1baris

kolom

Citra

asli

Detil

horisontal

Detil

vertikal

Detil

diagonal

Page 56: Multimedia dan Computer Vision

Standar kompresi JPEG2000

Transmisi secara progresif per resolusi

Page 57: Multimedia dan Computer Vision

Standard compression JPEG2000

Transmisi secara progresif per resolusi

Page 58: Multimedia dan Computer Vision

Standar kompresi JPEG2000Transmisi secara progresif per resolusi

Page 59: Multimedia dan Computer Vision

Standar kompresi JPEG2000Transmisi secara progresif per resolusi

Page 60: Multimedia dan Computer Vision

Standard compression JPEG2000

Perbandingan rasio kompresi

Page 61: Multimedia dan Computer Vision

Contoh citra hasil kompresi :

Standar kompresi JPEG2000

JPEG JPEG 2000

Page 62: Multimedia dan Computer Vision

Standard compression JPEG2000

• Keuntungan

– Kualitas lebih baik dari JPEG

– Lossless dan lossy compression sangat baik

– Regions of Interests ROI coding

– Transmisi dan pengkodean progressif

– Sesuai untuk data aplikasi multimedia

• Untuk nilai PSNR (pick signal to noise ratio) yang sama,

ratio kompresi JPEG2000 dapat mencapai 2 kali dari

JPEG

• Efek blok tidak tampak

Page 63: Multimedia dan Computer Vision

Kompresi VideoProblem :

1. Satu citra dari suatu video dapat menempati kapasitas

memori sekitar 0,916 MB (640x480 pixel).

2. Untuk menampilkan video yang secara visual tampak kontinu,

maka kecepatan pengambilan gambar adalah 25 atau 30 citra

per detik, atau sekitar 23 MB/detik atau sekitar 1,38 GB/menit

atau sekitar 82,94 GB/jam.

3. Kapasitas penyimpanan (CD dan DVD) yang ada saat ini

sekitar 7GB,

4. Kapasitas band-width jaringan komunikasi yang terbatas.

5. 25 citra/detik butuh band-with sekitar 184 Mbps.

Page 64: Multimedia dan Computer Vision

Kompresi Video

Solusi :

- Meningkatkan kapasitas memori penyimpanan,

implikasinya penambahan biaya yang besar

- Memperbesar band-width komunikasi

implikasinya penambahan biaya yang besar

- Kompresi data video pengembangan algoritma

CoDec (COmpression/DECompression) untuk

memperkecil semaksimal mungkin data video tanpa

banyak mengurangi kualitas visualnya

Page 65: Multimedia dan Computer Vision

Kompresi Video

• Ide pertama adalah mengurangi jumlah data rate

(dari 25 fps ke 12 fps atau dari 30 fps ke 15 fps),

dengan konsekuensi menghilangkan sejumlah

pergerakan objek video (video motions)

• Intraframe (spatial) compression:

mengurangi redundant informasi/data yang

berada dalam satu citra atau frame.

Page 66: Multimedia dan Computer Vision

Kompresi Video

Interframe (temporal) compression

• Landasan pemikiran adalah bahwa banyak terdapat

perulangan informasi/data video dari satu frame (citra)

ke frame lainnya.

• Sehingga perlu pengembangan metode atau algoritma

yang mampu menghilangkan redundancy informasi/dat

antar frame.

• Butuh identifikasi key frame (master frame)

• Key frame: dasar untuk menentukan berapa banyaknya

frame secara berurutan yang memiliki pergerakan objek

yang sama (hampir sama)

Page 67: Multimedia dan Computer Vision

Kompresi Video

Interframe (temporal) compression

• Andaikan bahwa informasi/data background adalah tetap (langit,

jalan dan rumput) dan hanya mobil yang bergerak.

• Frame pertama disimpan sebagai key frame dan frame-frame

lainnya diambil hanyalah objek yang bergerak (mobil).

t

Page 68: Multimedia dan Computer Vision

Standar video MPEG

MPEG-1, adalah suatu standar untuk kompresi data video

dan audio (2 kanal audio). Memungkinkan untuk

menyimpan video dengan kapasitas 1.5 Mbps pada media

VCD (Video CD).

MPEG-2, suatu standard dikembangkan untuk televisi

numerik (HDTV) yang memberikan kualitas tinggi dengan

kapasitas 40 Mbps dan 5 canal audio. MPEG-2 juga

dikembangkan untuk dapat mengidentifikasi dan

memproteksi terhadap pembajakan. Format ini digunakan

untuk video DVD.

Page 69: Multimedia dan Computer Vision

Standards et normes vidéos : MPEG

MPEG-4, standard yang ditujukan untuk compresidata multimédia dalam bentuk objek numériques,sehingga lebih memudahkan interactivity, danpengunaanya lebih adaptif terhadap kebutuhan webdan interface mobile.

MPEG-7, standard ditujukan untuk memberikanrepresentasi standar data audio dan visual agar dapatlebih memungkinkan pencarian informasi dalamvideo berdasarkan content. Standar ini disebut jugaMultimedia Content Description Interface.

Page 70: Multimedia dan Computer Vision

MPEG : Prinsip dasar

Prediksi Transformasi Kuantisasi Entropy Coding

P T Q Ce

Decoding

R G B Y U V

Luminance

Format ruang warna : 4:1:1 (4:2:0)

Page 71: Multimedia dan Computer Vision

MPEG : Prinsip dasar

Konversi RGB Yuv :

Konversi Yuv RGB :

Page 72: Multimedia dan Computer Vision

Konversi dari camera-bmp-avi-mpeg

Kirim ke : [email protected]

Cari salah satu :1. Video Compression dari camera-bmp-avi-wmv

2. Video Compression dari camera-bmp-avi-flv

Source :http://www.mathworks.com/search/ice.cgi?query=wmv

http://www.mathworks.com/search/ice.cgi?query=flashvideo

TUGAS MEMBEDAH 5 JURNAL

Page 73: Multimedia dan Computer Vision

Buat suatu karya ilmiah dengan topik, pilih salah satu topik dibawah ini :

“Video Compression Dari Citra bmp-AVI-MPEG Dengan MatLab ”

“Video Compression Dari Citra jpg-MPEG-WMV Dengan MatLab”

“Video Compression Dari Citra gif-AVI-FLV Dengan MatLab”

Atau cari yang sesuai dengan Video Compression

Ada pun ketentuannya adalah: yang dikirim ke email : [email protected]

Minimal 5 referensi/daftar pustaka tahun terbit paling akhir 2009.

Paling sedikit 2 Halaman selain daftar pustaka. Disimpulkan dari 5 jurnal

thesis, skripsi, atau proceding sbb : abstrak, pendahuluan, isi, dan

kesimpulan.

TUGAS MEMBEDAH 5 JURNAL

Page 74: Multimedia dan Computer Vision

MPEG : Prinsip dasar

Komponen Y mengandung lebih banyak informasi dari komponen U dan V

Page 75: Multimedia dan Computer Vision

MPEG : Prinsip dasar

Modul Prediksi :

Page 76: Multimedia dan Computer Vision

MPEG : Prinsip dasar

Modul Prediksi :

• Frames I : citra dikompresi secara terpisah tanpa citra

referensi dari citra sebelumnya.

• Frames P: citra yang diprediksi berdasarkan pada citra

referensi I atau P sebelumnya.

• Frames B (Citra interpolsi bidireksional) : citra ini dihitung

berdasarkan citra referensi I dan P,

Urutan penyimpanan dalam file : I P B B B P B B B I B B B

I B B B P B B B P B B B I

Page 77: Multimedia dan Computer Vision

MPEG : Prinsip dasar

Page 78: Multimedia dan Computer Vision

MPEG : Prinsip dasarr

Citra ini dikompresi dengan hanya menggunkan

metode

kompresi JPEG.

Citra ini sangat penting dalam video MPEG karena

dialah yang menjamin kesinambungan data citra

lainnya

Ada 2 atau 3 citra I per detiknya dalam video MPEG.

Frames I :

Page 79: Multimedia dan Computer Vision

MPEG : Principe

Frames P :

Citra ini dihitung melalui perbedaan antra citra actual terhadap

citra I atau citra P sebelumnya.

Algoritma yang dikembangkan untuk menghitung citra P adalah

melalui perbandingan blok per blok, disebut macroblocs (16x16

pixels), dan berdasarkan pada nilai ambang tertentu dapat

dinyatakan apakah blok tesebut berbeda dengan blok citra

sebelumnya. Jika ya maka dilakukan compresi JPEG dan jika tidak,

blok tersebut dinyatakan sama dengan blok citra sebelumnya dan

tidak perlu dikompresi.

Perhitungan macroblocs sangat mempengaruhi kecepatan

kompresi.

Page 80: Multimedia dan Computer Vision

MPEG : Principe

Frames B :

Sama halnya dengan frames P, frames B dihitung

berdasarkan perbedaan antara citra actual terhadap citra

referensi I sebelumnya dan citra referensi P berikutnya, hal

ini dapat memberikan kualitas kompresi yang baik, namun

memberikan delay waktu karena harus mengetahui dulu

citra berikutnya dan harus disimpan di memori 3 citra

secara berturutan (citra I/P sebelumnya, citra actual dan

citra P/I berikutnya).