Multimedia dan Computer Vision

H. SUMIJANSTAF PENGAJAR

Universitas Putra Indonesia “YPTK”

MULTIMEDIA DAN COMPUTER VISION

Multimedia: merupakan integrasi dari media

kontinu (misalnya audio, video) dan media

diskrit (teks, audio, grafik, gambar, video)

menjadi informasi digital yang dapat

disampaikan kepada pengguna secara tepat.

Teknologi Multimedia : teknologi berbasis

komputer yang dapat mengintegrasikan

informasi teks, suara, gambar, animasi dan

video digital serta mengkomunikasikannya

kepada pengguna.

Tantangan Teknis :

Butuh pengelolaan ragam data dan

volume data besar

Waktu proses data dan komunikasi antara

komponen-komponen teknologi bersifat real-

time.

Butuh sinkronisasi kerja antar komponen

teknologi

Volume Data : Speech 8000 samples/s 8Kbytes/s

CD Audio44,100 samples/s, 2 bytes/sample

176Kbytes/s

Satellite 180X180 km^2 600MB/image

Imagery 30m^2 resolution (60MB compressed)

NTSC Video30fps, 640X480 pixels, 3bytes/pixel

30Mbytes/s (2-8 Mbits/s compressed)

Dokumen multimedia :

Teks

Citra Audio

Video

Animasi (komputer grafik)

Suatu dokumen yang berisikan dua atau lebih

elemen-elemen multimedia (media) dari sumber

yang berbeda ( teks, citra, video, audio, …)

Dokumen multimedia disimpan dalam satu atau

beberapa file secara tersinkronisasi terhadap

dasar waktu yang sama.

Dokumen multimedia :

Contoh :

Suatu reportase pada siaran televisi akan susah difahami jika

komentar seorang jurnalis memiliki delay waktu terhadap

video dan/atau juga terhadap ilustrasi grafik yang ditayangkan.

Sinkronisasi dokumen multimedia :

• Sinkronisasi intra-objets

• Sinkronisasi inter-objets

Layanan Residential Video-on-demand

Video phone/Conference

Multimedia home shopping (MM catalogs,

product demos and presentation)

Layanan Business Services

Corporate training

Desktop MM conferencing, MM e-mail

9

Vidéo conférence

1. Volume data multimedia sangat besar

2. Bandwidth jaringan terbatas dan mahal

3. Delay waktu transmisi besar

1. Realtime Object Recognition in video games Ari Morgan (1)

2. Multiple Camera Tracking with Wide Baseline Homography

Zhaowen Wang, Ning Xu, David Ho (3)

3. Multiview 3D object reconstruction Vinay Muttineni, Mahesh

Akella, Allan Law (3)

4. Wild Cat Identification Mohammad Amanzadeh, Amit Das,

Heman Gala (3)

5. Background subtraction: compare three methods Kevin

Shih, Philbert Lin, and Pooya Khorrami (3) Compare

three methods for background subtraction.

6. Taxi Detection and Tracking AJ von Alt, Phil Lee (2)

Develop a method for detecting and tracking specific

cars through a video sequence with applications to New

York style Taxi cabs in an urban environment

CONTOH APLIKASI COMPUTER VISION

7. Classroom webcam control Sahil Handa, Sujay Bhobe,

Suchithra Gopal (3)

8. K-mer Based DNA Sequence Alignment using Inverse

Document File Approach Izzat El Hajj (1) One of the

bottleneck problems in DNA sequence assembly and

alignment is being able to find contigs in a database

that overlap with a sequence of base pairs. The idea

this project wishes to borrow from computer vision is

the inverse document file approach used to query

image databases.

9. Analyze material composition Johannes Traa (1) I would

like to explore a computer vision application of

techniques from compositional data analysis (CODA).


10. Bimanual Symmetric Gesture Recognition using Computer

Vision Aadeel Akhtar, Manoj Kumar, Tom Paine (3)

11. Similar category classification Abdel Vargas Silva (1)

12. Real-time Segmentation of Human Data from Kinect

Pengye Xia, Nan Chen, and Tony Lau (3)

13. Street Sign Recognition John Parkeer, Brian Wright (2)

14. Control law and parameter recovery from video footage

Sophie Puydupin and Pritam Sukumar (2)

15. Aircraft localization and classification Jason Oates (1)

16. Detect Star Patterns for Space Navigation Eric Babcock (1)

17. Create 3D Mesh using Kinect Jorge Carmona (1)

18. Automatic Face Tagging Thapanapong Rukkanchanunt,

Manne Henriksson, Seylom Ayivi-Guedehoussou (3)


19. Object Removal by Retrieving Background Regions

Mariyam Khalid, Daphne Tsatsoulis, Zhicheng Yan (3)

20. 20. Segment out person using Kinect RJ Marsan, Felix

Wang, John Wieting (3)

21. Playing Card Recognition Cem Onyuksel, Adam

Zimmerman (2)

22. Depth Upsampling using Sparse Dictionaries Keunhong

Park (1)

23. Monitoring and Diagnostics of Gas Turbines Duy (Dewey)

Tran (1)

24. Restoring Motion-Blurred Image Chao Xia (1)

25. Power Watershed Segmentation Pratik Mallya (1)

26. Carcassonne Gameboard Scorer Zigang Xiao, Ting Yu (2)

27. Image Analysis of Maize Ear Ou Yang Fu (1)


Pendidikan

Pembelajaran jarak jauh

Repository video pembelajaran

Akses ke MM digital libraries

Kedokteran

Diagnosis, pengobatan dan pengarsipan

Basis data multimedia

Bidang medis (kedokteran) :

Simulasi kedokteran :

Bidang medis (Diagnosis) :

Algoritma segmentasi warna citra

Simulasi penerbangan :

APA KEUNTUNGAN BERBUAT BAIKAllah tidak membebani seseorang melainkan sesuai dengan kesanggupannya. Ia

mendapat pahala (dari kebajikan) yang diusahakannya dan ia mendapat siksa

(dari kejahatan) yang dikerjakannya. (Mereka berdoa): "Ya Tuhan kami, janganlah

Engkau hukum kami jika kami lupa atau kami tersalah. Ya Tuhan kami, janganlah

Engkau bebankan kepada kami beban yang berat sebagaimana Engkau bebankan

kepada orang-orang sebelum kami. Ya Tuhan kami, janganlah Engkau pikulkan

kepada kami apa yang tak sanggup kami memikulnya. Beri ma'aflah kami;

ampunilah kami; dan rahmatilah kami. Engkaulah Penolong kami, maka tolonglah

kami terhadap kaum yang kafir."( QS: 2. Al Baqarah:286)

Barangsiapa yang mengerjakan kebaikan seberat dzarrahpun, niscaya dia akan

melihat (balasan)nya. Asbabun nuzul. Dan barangsiapa yang mengerjakan

kejahatan sebesar dzarrahpun, niscaya dia akan melihat (balasan)nya pula.

Asbabun nuzul (QS: 99. Al Zalzalah:7-8)

Dan sampaikanlah berita gembira kepada mereka yang beriman dan berbuat

baik, bahwa bagi mereka disediakan surga-surga yang mengalir sungai-sungai

di dalamnya. Setiap mereka diberi rezki buah-buahan dalam surga-surga itu,

mereka mengatakan : "Inilah yang pernah diberikan kepada kami dahulu."

Mereka diberi buah-buahan yang serupa dan untuk mereka di dalamnya ada

isteri-isteri yang suci dan mereka kekal di dalamnya. (QS :2. Al Baqarah:25)

• Kompresi data teks (Huffman coding,

RLE coding, LZW coding, arithmetic coding

• Representasi dan kompresi data suara

dan audio

• Representasi dan kompresi citra

• Representasi dan kompresi video

• Metode representasi data/informasi kedalam

ukuran yang lebih kecil sehingga dapat

mempercepat waktu transmisinya dan memperkecil

penggunaan memori penyimpanan

• Kompresi dapat dilakukan tanpa kehilangan

atau perubahan data (Lossless compression)

• Kompresi dapat dilakukan dengan kehilangan atau

perubahan data (lossy compression)

• Pengkodean (coding) data atau informasi

yang memiliki redundancy (kerangkapan)

kedalam jumlah bit yang lebih kecil.

• Digunakan untuk kompresi teks atau

citra/video tanpa kehilangan/perubahan data

(citra/video medis)

• Beberap contoh coding : Huffman, arithmetic,

statistik, RLE (run-length encoding), Lempel-

Ziv, Lempel-Ziv-Welch,

A 12"" 9S 7P 5R 5T 5E 4I 4N 4U 4M 3K 2O 2Y 2C 1J 1L 1V 1

• Huffman Coding (David Albert Huffman 1952)

- Berbasis pada perhitungan statistik

- Mengunakan bantuan pohon biner

- Data yang frekuensi munculnya paling

banyak dikode dengan jumlah bit terkecil

- Data yang frekuensi munculnya paling

sedikit dikode dengan jumlah bit terbesar

http://fr.wikipedia.org/wiki/David_Albert_Huffman

• Huffman Coding

Contoh : "this is an example of a huffman tree"

- statistik munculnya karakter : “ “= 7, a=4,

e=4, f=3, t=2, h=2, i=2, s=2, n=2, m=2, x=1,

p=1, l=1, u=1, 0=1, r=1.

- Probabilitas munculnya karakter : “ “= 0.1944…,

a=e=0.1111…, f=0.0833…, t=h=i=s=n=m=0.0556,

x=p=l=u=o=r=0.0278.

• Huffman Coding Pohon biner :

““= 7a=4 e=4 f=3 t=2 h=2 i=2 s=2 n=2 m=2 x=1 p=1 l=1 u=1 0=1 r=1

2

2

2 4

4

4

4

5

8

8

8

12

16

20 36“ “= 000a = 010 e = 011 f = 0010 t = 0011 h = 1000 i = 1001 s = 1010 n = 1011 m = 1100 x = 11010 p = 11011 l = 11100 u = 11101 o = 11110 r = 11111288 bit 195 bit

0 0 0

0 1

1

0 1

1

0 0 0 1

1

0 1

1

0 0 1

0 1

1

0 0 1

1

0 1

1

• Huffman Coding

1. digunakan untuk pengkodean teks, citradan video

2. Ada 3 jenis algorithme Huffman coding,Masing masing berhubungan denganmetode pembuatan pohon biner :

• Huffman Coding

statik : code setiap karakter ditentukan

langsung oleh algoritma (contoh : teks

berbahasa Prancis, dimana frekuensi

kemunculan huruf e sangat banyak sehingga

code bitnya kecil.

semi-adaptatif : teks harus dibaca terlebih dulu

untuk menghitung frekuensi munculnya setiap

karakter, kemudian membentuk pohon

binernya.

• Huffman Coding

adaptatif : Metode ini memberikan rasio kompresi

yang tinggi karena pohon biner Dibentuk secara

dinamik mengikuti tahapan compresi. Namun dari

sisi kecepatan eksekusi membutuhkan waktu yang

lebih lama karena satiap saat pohon binernya akan

beruabah mengikuti perubahan frekuensi munculnya

setiap karakter.

• Kelemahan Huffman Coding

- Bila frekuensi munculnya setiap karakter dalam

suatu dokumen adalah sama semua.

- File kompresinya bisa sama atau lebih besar dari

file aslinya

- Solusi yang mungkin adalah kompresi per blok

karekter dari dokumen tersebut

Entropi H :

Entropi H :

• Run-length encoding

- RLE coding telah diaplikasikan khususnya pada scanner

hitam putih (biner)

- Prinsip dasarnya adalah menghitung jumlah/panjang data

yang sama dalam serangkain data yang akan dikompres

- Contoh pada dokumen hitam H (tulisan) dan putih P (latar

belakang dokumen), berikut misalnya data pada satu baris

dokumen yang direpresntasikan dalam pixel :

PPPPPPPPPPPPHPPPPPPPPPPPPPPHHHPPPPPPPPPPPPPPPPPPPPPPPHPPPPPPPPPPP

- Bentuk kompresinya adalah : 12P1H14P3H23P1H11P

• Aplikasi Run-length encoding

- Kompresi citra format bmp pada Windows dan OS/2 untuk

citra 1, 4 dan 8 bit/pixel

- Citra format PCX 8 dan 24 bit/pixel

- Fax dan scanner hitam putih

Format file citra:

• File citra umumnya memiliki :

- header yang menyatakan informasi citra seperti ukuran

citra, format file, dll.

- data citra itu sendiri

• Struktur file berbeda antara satu format dengan format

citra lainnya

• Bisa jadi struktur file untuk format citra yang sama

berbeda dari satu versi ke versi yang lain (contoh : file

TIFF)

• Format JPEG mengikuti norm ISO

• Bersifat pengunaan bebas

• Jumlah warna citra 224 = 16777216 warna

• Type kompresi lossy menggunakan DCT

• Kualitas kompresi tergantung pada rasio

kompresi

• Tidak memiliki sifat warna transparan

• Bukan format animasi

• JPEG 2000 masih dibawah proteksi hak paten

• Type kompresi lossy dan lossless menggunakan

Wavelet Transform

• Jumlah warna citra 224 = 16777216 warna

• Kualitas kompresi dapat diatur secara lokal atau

global

• Dapat ditampilkan dengan ukuran yang berbeda


• Tidak memiliki sifat warna transparan

• Bersifat pengunaan bebas

• Type kompresi lossless baik untuk citra

berwarna maupun citra gray-level

• Memiliki sifat warna transparan


• Versi format animasinya adalah MNG

• Bersifat dilindungi oleh hak paten

• Jumlah warna citra 256 (sistem pallet)

• Dapat memiliki sifat warna transparan

• Dapat merupakan format animasi

• Penggunaa umum adalah untuk logo dan

citra yang memiliki jumlah warna sedikit

Pembagian citra

dalam blok

8x8 pixel

Transformasi

warnaDCT Kuantisasi

Coding RLE

&

Huffman

Tabel

Kuantisasi

Tabel

coding

Rekonstruksi

Blok citra

Transformasi

Warna

invers

IDCTKuantisasi

Inverse

Decoding RLE

&

Huffman

Citra terkompresi

JPEGCitra asli

Kompresi JPEG

Rekonstruksi JPEG

Bagan standar kompresi citra JPEG

Matrice d’origine.

Matrice d’origine. Matrice transformée DCT

DCT

Matrice de quantification

Matrice quantifiée.

÷

1260 rata2 dari

seluruh matrik asli

-1, 1, -3, 2 deviasi

1

0

2

2

).12(cos).,()(.),(

N

x

NXN

ixyxPixeliCyiDCT

1

0

1

0 2

).12(cos.

2

).12(cos).,()().(.

2),(

N

x

N

y N

jy

N

ixyxPixeliCjC

NjiDCT

1

0

2

2

).12(cos.),()(.),(

N

y

XNN

jyyiDCTjCjiDCT

Transformasi DCT

1

0

1

0 2

).12(cos.

2

).12(cos).,()().(.

2),(

N

i

N

j N

jy

N

ixjiDCTiCjC

NyxPixel

1

0

2

2

).12(cos).,()(.),(

N

j

NXN

jyjiDCTjCyiIDCT

1

0

2

2

).12(cos.),()(.),(

N

i

XNN

ixyiIDCTiCyxPixel

Transformasi DCT invers.

Implementasi 1D :

Implementasi 1D :

Matriks hasil IDCT

IDCT

x

Matriks kuantisasi

Matriks terkuantisasi. Matriks terkuantisasi invers.

00000000

00000000

00000000

00000000

00000000

0000001314

0000001224

000001001264

F

Quantization Table for:

Photoshop CS2 (Save As 11)Quantization Table: Luminance

1 1 1 2 3 3 4 5

1 1 1 2 3 4 4 6

1 1 2 3 4 4 5 7

2 2 3 4 4 5 7 8

3 3 4 4 5 7 8 8

3 4 4 5 7 8 8 8

4 4 5 7 8 8 8 8

5 6 7 8 8 8 8 8

Quantization Table: Chrominance

1 2 4 7 8 8 8 8

2 2 4 7 8 8 8 8

4 4 7 8 8 8 8 8

7 7 8 8 8 8 8 8

8 8 8 8 8 8 8 8

8 8 8 8 8 8 8 8

8 8 8 8 8 8 8 8

8 8 8 8 8 8 8 8

Quantization Table for:

IrfanView (95%)Quantization Table: Luminance

2 1 1 2 2 4 5 6

1 1 1 2 3 6 6 6

1 1 2 2 4 6 7 6

1 2 2 3 5 9 8 6

2 2 4 6 7 11 10 8

2 4 6 6 8 10 11 9

5 6 8 9 10 12 12 10

7 9 10 10 11 10 10 10

Quantization Table: Chrominance

2 2 2 5 10 10 10 10

2 2 3 7 10 10 10 10

2 3 6 10 10 10 10 10

5 7 10 10 10 10 10 10

10 10 10 10 10 10 10 10

10 10 10 10 10 10 10 10

10 10 10 10 10 10 10 10

10 10 10 10 10 10 10 10

Zigzag coding : urutan pengkode

menurut norm JPEG.

20 -10 11 1 -9 2 -2 -4 -8 -1 0 1 2 3 -1 0 0 0 0 -1 EOB

• DC adalah nilai rata-rata matriks dan merepresentasikan

informasi global matriks (frekuensi rendah)

• AC merepresentasikan informasi detail matriks (frek. tinggi)

• Penkodean dilakukan dalam bentuk zigzag :

http://fr.wikipedia.org/wiki/Image:CompressionJPEGImage13.gif

http://fr.wikipedia.org/wiki/Image:CompressionJPEGImage13.gif

Table 1 - Huffman - Luminance (Y) - DC

Length Bits Code

3 bits

000001010011100101110

04050302060100 (End of Block)

4 bits 1110 07

5 bits 1111 0 08

6 bits 1111 10 09

7 bits 1111 110 0A

Table 2 - Huffman - Luminance (Y) - AC

Length Bits Code

2 bits 0001

0102

3 bits 100 03

4 bits 101010111100

110400 (End of Block)

5 bits 1101 01101 11110 0

052112

6 bits 1110 101110 11

3141

... ... ...

12 bits...1111 1111 0011...

...F0 (ZRL)...

... ... ...

16 bits ...1111 1111 1111 1110

...FA

20 -10 11 1 -9 2 -2 -4 -8 -1 0 1 2 3 -1 0 0 0 0 -1 EOB

Code bit-stream :

Code 01, 21, 41, dst 2 mendahului 2 angka 0

Contoh : 32 adalah 000-2 bit

20 -10 11 1 -9 2 -2 -4 -8 -1 0 1 2 3 -1 0 0 0 0 -1 EOB

AC Code Size Additional Bits DC/AC Value

01 1 0 1 -1 1

02 2 00,01 10,11 -3,-2 2,3

03 3 000,001,010,011 100,101,110,111 -7,-6,-5,-4 4,5,6,7

04 4 0000,...,0111 1000,...,1111 -15,...,-8 8,...,15

05 5 0 0000,... ...,1 1111 -31,...,-16 16,...,31

06 6 00 0000,... ...,11 1111 -63,...,-32 32,...,63

07 7 000 0000,... ...,111 1111 -127,...,-64 64,...,127

08 8 0000 0000,... ...,1111 1111 -255,...,-128 128,...,255

09 9 0 0000 0000,... ...,1 1111 1111 -511,...,-256 256,...,511

0A 10 00 0000 0000,... ...,11 1111 1111 -1023,...,-512 512,...,1023

0B 11 000 0000 0000,... ...,111 1111 1111 -2047,...,-1024 1024,...,2047

1011 0101 1011 1011 00 1 . . . . . 1010 1 . . . . . . 111011 0 1100

(04)- 10 (04)- 11 ( 11)- ( 41)

• Informasi dalam signal 1-D et 2-D tersebar dalam

frekuensi yang berbeda (dari frekuensi rendah ke

frekuensi tinggi)

• Analisis informasi dalam signal tersebut membutuhkan

teknik analisis multi-frekuensi multi-resolusi

multi-scale

• Wavelet transform (WT) sangat sesuai dengan

kebutuhan analisis multi-frekuensi.

Bagaimana DWT berfungsi ?

Dua pendekatan analisis :

- pendekatan melalui dilatasi filter resolusi signal tetap.

- pendekatan melalui dilatasi signal resolusi signal

berubah

Contoh : misalkan suatu signal memiliki informasi yang

tersebar hingga pada frekuensi 1000 Hz.

Prinsipe : memisahkan signal dalam dua komponen yaitu

informasi general (frekuensi rendah) dan informasi

detil (frekuensi tinggi)

Pendekatan melalui dilatasi filtre ?

- Pada tahap awal, kita bagi informasi signal dalam dua bagian dengan

melewatkannya dalam high-pass filter (500-1000 Hz) dan low-pass

filter (0-500 Hz).

- Menghasilkan satu signal yang berhubungan dengan informasi pada

interval 0-500 Hz (frekuensi rendah) dan satu signal lainnya dengan

informasi pada interval 500-1000 Hz (frekuensi tinggi).

- Selanjutnya, kita lakukan proses berulang pada salah satu atau kedua

komponen tadi.

- Andaikan kita lakukan untuk bagian low-pass dengan menggunakan

high-pass filter (250-500 Hz) dan low-pass filter (0-250 Hz). Maka kita

akan punya 3 komponen informasi, masing-masing berhubungan

dengan informasi dari satu signal yang sama pada frekuens 0-250 Hz,

250-500 Hz et 500-1000 Hz.

- dst.

Pendekatan dilatasi signal ?

• Tahap pertama, kita lewatkan signal kedalam low-pass filter dan high-

pass filter (kita gunakan filter dengan resolusi yang sama,).

• Tahap kedua, resolusi signal hasil low-pass dan high-pass kita bagi dua.

• Selanjutnya, kita lakukan proses yang sama hingga pada resolusi yang

diinginkan.

Keuntungan untuk kompresi citra :

- Lebih mudah untuk implementasi real-time

- sangat baik untuk kompresi citra dan video

• Ada beberapa jenis WT yang telah dikembangkan, diantaranya yang

digunakan untuk format JPEG2000 :

- ''CDF 9/7'' Cohen-Daubechies-Fauvaue (irreversible).

- ''spline 5/3'' pour Le Gall (lebih sederhana dan reversible).

• Bilangan 9 dan 5 merupakan jumlah elemen filter low-pass. Bilangan 7

dan 3 merupakan jumlah elemen filter high-pass.

Pour la CDF 9/7 :

+0.602949018236

+0.266864118443 (Z1 +Z-1)

-0.0782223266529 (Z2 +Z-2)

-0.016864118448 (Z3 +Z-3)

+0.026748757411 (Z4 +Z-4)

+0.557543526229 (Z1)

-0.295635881557 (Z2 +Z0)

-0.028771763114 (Z3 +Z-1)

+0.045635881557 (Z4 +Z-2)

Filter low-pass L :

Filter high-pass H :

• Wavelet Transform (WT)

- Ide : membagi citra kedalam tingkat resolusi yang berbeda

- Pembagiannya berdasarkan pita frekuensi yang bebeda

- Menjaga/mempertahankan kualitas data

• Principes :

– Melakukan proses WT terhadap citra asli

– Kuantisasi skalar (sesuai tingkat resolusi)

– Pengkodean (RLE, entropy, Huffman, …)

KuantisasiWavelet

Transform

Coding

per blok

Citra

asli

Citra

terkompresi

Encoder Optimisasi

rasio-distorsi

Pembentukan

bitstream

Citra

rekonstruksi

Kantisasi

invers

Decoder

Decoding

Per blok

Wavelet

transform

inverse

Citra

terkompresi

Standar Kompresi JPEG2000LL1

LH1

HL1

HH1baris

kolom

Citra

asli

Detil

horisontal

Detil

vertikal

Detil

diagonal

Standar kompresi JPEG2000

Transmisi secara progresif per resolusi

Standard compression JPEG2000

Transmisi secara progresif per resolusi

Standar kompresi JPEG2000Transmisi secara progresif per resolusi


Perbandingan rasio kompresi

Contoh citra hasil kompresi :

Standar kompresi JPEG2000

JPEG JPEG 2000


• Keuntungan

– Kualitas lebih baik dari JPEG

– Lossless dan lossy compression sangat baik

– Regions of Interests ROI coding

– Transmisi dan pengkodean progressif

– Sesuai untuk data aplikasi multimedia

• Untuk nilai PSNR (pick signal to noise ratio) yang sama,

ratio kompresi JPEG2000 dapat mencapai 2 kali dari

JPEG

• Efek blok tidak tampak

Kompresi VideoProblem :

1. Satu citra dari suatu video dapat menempati kapasitas

memori sekitar 0,916 MB (640x480 pixel).

2. Untuk menampilkan video yang secara visual tampak kontinu,

maka kecepatan pengambilan gambar adalah 25 atau 30 citra

per detik, atau sekitar 23 MB/detik atau sekitar 1,38 GB/menit

atau sekitar 82,94 GB/jam.

3. Kapasitas penyimpanan (CD dan DVD) yang ada saat ini

sekitar 7GB,

4. Kapasitas band-width jaringan komunikasi yang terbatas.

5. 25 citra/detik butuh band-with sekitar 184 Mbps.

Kompresi Video

Solusi :

- Meningkatkan kapasitas memori penyimpanan,

implikasinya penambahan biaya yang besar

- Memperbesar band-width komunikasi

implikasinya penambahan biaya yang besar

- Kompresi data video pengembangan algoritma

CoDec (COmpression/DECompression) untuk

memperkecil semaksimal mungkin data video tanpa

banyak mengurangi kualitas visualnya

Kompresi Video

• Ide pertama adalah mengurangi jumlah data rate

(dari 25 fps ke 12 fps atau dari 30 fps ke 15 fps),

dengan konsekuensi menghilangkan sejumlah

pergerakan objek video (video motions)

• Intraframe (spatial) compression:

mengurangi redundant informasi/data yang

berada dalam satu citra atau frame.

Kompresi Video

Interframe (temporal) compression

• Landasan pemikiran adalah bahwa banyak terdapat

perulangan informasi/data video dari satu frame (citra)

ke frame lainnya.

• Sehingga perlu pengembangan metode atau algoritma

yang mampu menghilangkan redundancy informasi/dat

antar frame.

• Butuh identifikasi key frame (master frame)

• Key frame: dasar untuk menentukan berapa banyaknya

frame secara berurutan yang memiliki pergerakan objek

yang sama (hampir sama)

Kompresi Video

Interframe (temporal) compression

• Andaikan bahwa informasi/data background adalah tetap (langit,

jalan dan rumput) dan hanya mobil yang bergerak.

• Frame pertama disimpan sebagai key frame dan frame-frame

lainnya diambil hanyalah objek yang bergerak (mobil).

t

Standar video MPEG

MPEG-1, adalah suatu standar untuk kompresi data video

dan audio (2 kanal audio). Memungkinkan untuk

menyimpan video dengan kapasitas 1.5 Mbps pada media

VCD (Video CD).

MPEG-2, suatu standard dikembangkan untuk televisi

numerik (HDTV) yang memberikan kualitas tinggi dengan

kapasitas 40 Mbps dan 5 canal audio. MPEG-2 juga

dikembangkan untuk dapat mengidentifikasi dan

memproteksi terhadap pembajakan. Format ini digunakan

untuk video DVD.

Standards et normes vidéos : MPEG

MPEG-4, standard yang ditujukan untuk compresidata multimédia dalam bentuk objek numériques,sehingga lebih memudahkan interactivity, danpengunaanya lebih adaptif terhadap kebutuhan webdan interface mobile.

MPEG-7, standard ditujukan untuk memberikanrepresentasi standar data audio dan visual agar dapatlebih memungkinkan pencarian informasi dalamvideo berdasarkan content. Standar ini disebut jugaMultimedia Content Description Interface.

MPEG : Prinsip dasar

Prediksi Transformasi Kuantisasi Entropy Coding

P T Q Ce

Decoding

R G B Y U V

Luminance

Format ruang warna : 4:1:1 (4:2:0)


Konversi RGB Yuv :

Konversi Yuv RGB :

Konversi dari camera-bmp-avi-mpeg

Kirim ke : [email protected]

Cari salah satu :1. Video Compression dari camera-bmp-avi-wmv

2. Video Compression dari camera-bmp-avi-flv

Source :http://www.mathworks.com/search/ice.cgi?query=wmv

http://www.mathworks.com/search/ice.cgi?query=flashvideo

TUGAS MEMBEDAH 5 JURNAL

mailto:[email protected]

http://www.mathworks.com/search/ice.cgi?query=wmv

http://www.mathworks.com/search/ice.cgi?query=flashvideo

Buat suatu karya ilmiah dengan topik, pilih salah satu topik dibawah ini :

“Video Compression Dari Citra bmp-AVI-MPEG Dengan MatLab ”

“Video Compression Dari Citra jpg-MPEG-WMV Dengan MatLab”

“Video Compression Dari Citra gif-AVI-FLV Dengan MatLab”

Atau cari yang sesuai dengan Video Compression

Ada pun ketentuannya adalah: yang dikirim ke email : [email protected]

Minimal 5 referensi/daftar pustaka tahun terbit paling akhir 2009.

Paling sedikit 2 Halaman selain daftar pustaka. Disimpulkan dari 5 jurnal

thesis, skripsi, atau proceding sbb : abstrak, pendahuluan, isi, dan

kesimpulan.

TUGAS MEMBEDAH 5 JURNAL

mailto:[email protected]


Komponen Y mengandung lebih banyak informasi dari komponen U dan V


Modul Prediksi :


Modul Prediksi :

• Frames I : citra dikompresi secara terpisah tanpa citra

referensi dari citra sebelumnya.

• Frames P: citra yang diprediksi berdasarkan pada citra

referensi I atau P sebelumnya.

• Frames B (Citra interpolsi bidireksional) : citra ini dihitung

berdasarkan citra referensi I dan P,

Urutan penyimpanan dalam file : I P B B B P B B B I B B B

I B B B P B B B P B B B I

MPEG : Prinsip dasarr

Citra ini dikompresi dengan hanya menggunkan

metode

kompresi JPEG.

Citra ini sangat penting dalam video MPEG karena

dialah yang menjamin kesinambungan data citra

lainnya

Ada 2 atau 3 citra I per detiknya dalam video MPEG.

Frames I :

MPEG : Principe

Frames P :

Citra ini dihitung melalui perbedaan antra citra actual terhadap

citra I atau citra P sebelumnya.

Algoritma yang dikembangkan untuk menghitung citra P adalah

melalui perbandingan blok per blok, disebut macroblocs (16x16

pixels), dan berdasarkan pada nilai ambang tertentu dapat

dinyatakan apakah blok tesebut berbeda dengan blok citra

sebelumnya. Jika ya maka dilakukan compresi JPEG dan jika tidak,

blok tersebut dinyatakan sama dengan blok citra sebelumnya dan

tidak perlu dikompresi.

Perhitungan macroblocs sangat mempengaruhi kecepatan

kompresi.

MPEG : Principe

Frames B :

Sama halnya dengan frames P, frames B dihitung

berdasarkan perbedaan antara citra actual terhadap citra

referensi I sebelumnya dan citra referensi P berikutnya, hal

ini dapat memberikan kualitas kompresi yang baik, namun

memberikan delay waktu karena harus mengetahui dulu

citra berikutnya dan harus disimpan di memori 3 citra

secara berturutan (citra I/P sebelumnya, citra actual dan

citra P/I berikutnya).

Multimedia dan Computer Vision

Design

Transcript of Multimedia dan Computer Vision