22767797 MULTIVARIAT Analisis Korelasi Kanonik

BAB I

PENDAHULUAN

1. 1 Latar Belakang

Analisis korelasi kanonik ditemukan untuk mengidentifikasi dan mengukur

kumpulan antara dua himpunan dari variabel. Analisis korelasi kanonik fokus pada

korelasi antara sebuah kombinasi linear dari variabel dalam satu himpunan dan

kombinasi linear dari variabel dalam himpunan lainnya. Ide pertama adalah untuk

menentukan bagian dari kombinasi linear yang memiliki korelasi terbesar. Berikutnya,

kita menentukan bagian dari kombinasi linear yang memiliki korelasi terbesar diantara

semua bagian yang tidak berkorelasi dengan bagian yang dipilih di awal. Proses

berlanjut. Bagian dari kombinasi linear dinamakan variabel kanonik, dan korelasi yang

lainnya dinamakan korelasi kanonik.

Ada beberapa masalah penelitian yang melibatkan hubungan antara dua

kelompok variabel, misalnya hubungan antara sekelompok variabel kepribadian dan

sekelompok variabel kemampuan, hubungan antara indeks harga dan indeks produksi.

Disamping hubungan fungsional yang dinyatakan dengan persamaan regresi, ada juga

yang perlu dipersoalkan yaitu ukuran kuat lemahnya antara dua kelompok variabel.

Kajian tentang ukuran kuat lemahnya hubungan antara sekelompok variabel

peramal dan sekelompok variabel tanggapan dikenal sebagai Analisis Korelasi Kanonik.

Korelasi kanonik mengukur kekuatan kumpulan antara dua himpunan dari variabel.

Aspek terbesar dari suatu teknik merepresentasikan sebuah percobaan ke sebuah intisari

yang berdimensi tinggi dengan hubungan antara dua himpunan dari variabel ke dalam

sebuah bagian kecil dari variabel kanonik.

Analisis Korelasi Kanonik 1

Pada Analisis Regresi Linear, dicari kombinasi linear dari sekelompok variabel

peramal yang dipandang dapat paling baik menjelaskan variasi dan variabel-variabel

tanggapan. Sedangkan pada Analisis Korelasi Kanonik dicari kombinasi linear dari

variabel-variabel peramal dan kombinasi linear dari variabel-variabel tanggapan yang

bersifat bahwa koefisien korelasi momen hasil kali antara kedua kombinasi linear itu

mencapai nilai maksimum. Koefisien korelasi yang maksimum itu disebut koefisien

korelasi kanonik antara kedua kelompok variabel tersebut dan koefisien-koefisien dari

masing-masing variabel yang menghasilkan koefisien korelasi maksimum disebut

bobot-bobot kanonis.

Dalam makalah ini penulis mencoba untuk mengambil satu kasus sehingga judul

makalah yang diambil adalah ” PENENTUAN PASANGAN VARIASI KANONIK

SAMPEL DENGAN TEKNIK ANALISIS KORELASI KANONIK”.

1.2 Rumusan Masalah

Berdasarkan uraian dari latar belakang diatas, maka penulis merumuskan

petanyaan tentang bagaimana penentuan pasangan variasi kanonik sampel dengan

teknik analisis multivariat.

1.3 Tujuan Penulisan

Setiap kegiatan yang dilakukan oleh individu dan kelompok tidak terlepas dari

tujuan yang hendak dicapai. Demikian pula dengan penulisan makalah ini, dimana

penulisan makalah ini bertujuan untuk lebih memahami cara penentuan pasangan variasi

kanonik sampel dengan teknik analisis multivariat.


1.4 Sistematika Penulisan

Penulisan makalah ini akan dikemas dalam sistematika penulisan sebagai

berikut:

BAB I : PENDAHULUAN

Bab ini membahas tentang latar belakang permasalahan yang akan

dibahas, rumusan masalah, tujuan penulisan, dan sistematika penulisan.

BAB II : ANALISIS KORELASI KANONIK

Bab ini membahas uraian tentang analisis korelasi kanonik beserta

formula-formula yang akan digunakan dalam pengolahan data dan

analisis pada bab selanjutnya.

BAB III : PENGOLAHAN DATA

Bab ini membahas perhitungan untuk menentukan pasangan variasi

kanonik sampel.

BAB IV : KESIMPULAN

Bab ini menjelaskan tentang kesimpulan dari keseluruhan perhitungan

dalam penulisan makalah ini.


BAB II

ANALISIS KORELASI KANONIK

2.1 Variabel Kanonik dan Korelasi Kanonik

Kita akan tertarik dalam mengukur dari kumpulan antara dua kelompok variabel.

Kelompok pertama dari p variabel diwakili oleh (p x 1) vektor acak X (1). Kelompok

kedua dari q variabel diwakili oleh (q x 1) vektor acak X(2). Kita asumsi, dalam

pengembangan teoritis, bahwa X(1) mewakili himpunan yang lebih kecil, sehingga p

q.

Misalkan untuk vektor acak X(1) dan X(2) :

(2-1)

Vektor acaknya :

(2-2)

Vektor rata-ratanya :

(2-3)


Dan matriks kovariannya :

(2-4)

Kovarian antara pasangan variabel-variabel dari himpunan berbeda yaitu satu

variabel dari X(1), satu variabel dari X(2) yang termuat di atau ekuivalen di . pq

elemen dari mengukur kumpulan antara dua himpunan. Ketika p dan q relatif besar,

menginterpretasikan elemen dari secara bersamaan biasanya adalah percuma. Selain

itu, sering bahwa kombinasi linear dari variabel itu menarik dan berguna untuk

memprediksi atau membandingkan tujuan. Tugas pokok dari analisis korelasi kanonik

adalah meringkaskan kumpulan antara himpunan X(1) dan X(2) dalam syarat-syarat yang

sedikit berhati-hati memilih kovarian (atau korelasi) daripada kovarian pq di .

Kombinasi linear menyediakan ringkasan sederhana mengukur suatu himpunan dari

variabel. Himpunan

(2-5)

Untuk beberapa bagian dari koefisien vektor a dan b. Dengan menggunakan (2-5) dan

kombinasi linear Z = CX dimana,

Sehingga,


(2-6)

Kemudian dapat dicari koefisien vektor a dan b sedemikian sehingga,

(2-7)

sebisa mungkin bernilai besar.

Definisi:

Bagian pertama pasangan dari variabel kanonik adalah bagian dari kombinasi

linear U1, V1 yang mempunyai unit variansi, yang memaksimalkan korelasi (2-7);

Bagian kedua dari variabel kanonik adalah bagian dari kombinasi linear U2, V2 yang

mempunyai unit variansi, yang memaksimalkan korelasi (2-7) diantara semua

pilihan yang tidak berkorelasi dengan bagian pertama dari variabel kanonik.

Pada langkah ke-k:

Bagian ke-k pasangan dari variabel kanonik adalah bagian dari kombinasi linear Uk,

Vk yang mempunyai unit variansi, yang memaksimalkan korelasi (2-7) diantara

semua pilihan yang tidak berkorelasi dengan bagian k-1 sebelumnya dari pasangan

variabel kanonik.

Korelasi antara bagian ke-k dari variabel kanonik dinamakan korelasi kanonik ke-k.

Akibat 2.1. Misalkan p q dan vektor acak X(1) dan X(2) mempunyai,

dimana ∑ mempunyai

rank lengkap. Untuk koefisien vector , bentuk kombinasi linear U = a’X(1)


dan V = b’X(2). Maka diperoleh dengan kombinasi linear (variabel

kanonik bagian pertama).

,

Bagian ke-k dari variabel kanonik, k = 2, 3, ..., p, dan

memaksimumkan diantara kombinasi linear yang

tidak berkorelasi dengan variabel kanonik 1, 2, ..., k-1 sebelumnya.

adalah nilai eigen dari dan adalah vektor

eigen (p x 1). (Jumlah juga nilai eigen p paling besar dari matriks

yang bersesuaian dengan vektor eigen (q x 1), f1,f2, ..., fp.

Tiap fi adalah proporsi untuk ). Variasi kanonik

mempunyai sifat sebagai berikut:

untuk k, l = 1, 2, ..., p.

Jika variabel awal distandardisasikan dengan dan

maka variabel kanonik berbentuk:

(2-8)


Disini dan dan fk adalah

vektor-vektor eigen dari dan 2/12212

11121

2/122

secara berurut.

Korelasi kanonik k memenuhi,

(2-9)

dan adalah vektor eigen tak nol dari matriks

atau matriks 2/12212

11121

2/122

.

2. 2 Menginterpretasikan Populasi Variabel Kanonik

Variabel kanonik secara umumnya artifisal. Jika variabel awal X(1) dan X(2)

digunakan, koefisien kanonik a dan b mempunyai unit proporsi dari himpunan X (1) dan

X(2). Jika variabel awal yang distandardisasikan mempunyai rata-rata nol dan unit

varians, maka koefisien kanonik tidak mempunyai unit dari pengukuran, dan pasti

diinterpretasikan ke dalam bentuk variabel yang distandarkan.

2.2.1 Mengidentifikasi Varibel Kanonik

Walaupun variabel kanonik artifisal, variabel kanonik dapat diidentifikasi dalam

bentuk variabel pokok. Identifikasi sering dibantu dengan menghitung korelasi antara

variabel kanonik dan variabel awal.

Misalkan A = [a1, a2, ..., ap]’ dan B = [b1, b2, ..., bp]’, sehingga vektor dari

variabel kanonik adalah (2-10)

dimana kita awalnya tertarik di variabel kanonik pertama p di V. Maka,

(2-11)


Karena diperoleh dengan membagi

. Secara ekuivalen,

.

Pendahuluan (p x p) diagonal matriks elemen diagonal ke-k dalam bentuk

matriks,

Perhitungan yang sama untuk bagian menghasilkan

(2-12)

dimana adalah matriks diagonal (q x q) dengan elemen ke-i Variabel

kanonik diturunkan dari variabel standard terkadang diinterpretasikan dengan

menghitung korelasi.

(2-13)

dimana adalah matriks yang barisnya memuat koefisien kanonik untuk

himpunan Z(1) dan Z(2) secara berurut. Korelasi pada matriks yang ditunjukkan (2-13)

mempunyai nilai numerik sama dengan yang dimunculkan (2-12), yakni

dan seterusnya. Mengikuti ini,

korelasi tidak dipengaruhi

oleh standaridisasi.


2.2.2 Korelasi Kanonik Sebagai Generalisasi Dari Koefisien Korelasi Lainnya

Pertama-tama, koefisien korelasi menyamaratakan korelasi antara dua variabel.

Ketika X(1) dan X(2) masing-masing terdiri dari variabel tunggal, sehingga p = q = 1,

untuk semua a, b. Oleh karena itu variasi kanonik

dan memiliki korelasi ketika X(1) dan X(2) memiliki

komponen lebih, kondisi dengan 1 pada posisi ke-i dan

dengan 1 pada posisi ke-i menghasilkan,

(2-14)

yaitu bahwa korelasi kanonik yang pertama lebih besar dari harga mutlak semua elemen

dalam .

Kedua, perkalian koefisien korelasi adalah persoalan khusus dari korelasi

kanonik ketika X(1) memiliki elemen tunggal (p=1), menimbulkan

, untuk p=1 (2-15)

Ketika p > 1, lebih besar dari setiap korelasi perkalian dengan X(2) atau korelasi

perkalian dengan X(1). Akibatnya,

(2-16)

yaitu bahwa korelasi kanonik juga merupakan perkalian koefisien korelasi dari Uk

dengan X(2) atau perkalian koefisien korelasi Vk dengan X(1).

Karena interpretasi dari perkalian koefisien korelasi, korelasi kanonik ke-k

kuadrat, , adalah sebanding dengan varians dari variasi kanonik Uk yang dijelaskan


oleh himpunan X(2) dan juga sebanding dengan varians dari variasi kanonik Vk yang

dijelaskan oleh himpunan X(1). Oleh karena itu, seringkali dinamakan varians

bersama antara dua himpunan X(1) dan X(2). Untuk nilai yang semakin besar, , kadang-

kadang dianggap sebagai ukuran dari himpunan yang overlap (tumpang tindih).

2.2.3 Variabel Kanonik r yang Pertama Sebagai Variabel Kesimpulan

Perubahan koordinat dari

dilakukan untuk memaksimalkan dan berturut-turut dimana

(Ui, Vi) memiliki korelasi nol dengan pasangan (Ui, Vi), (U2, V2), ..., (Ui-1, Vi-1). Korelasi

antara himpunan X(1) dan X(2) telah dimasukkan kedalam pasangan variabel kanonik.

Dengan model, vektor koefisien ai, bi dipilih untuk memaksimumkan korelasi,

tidak perlu menampilkan variabel penaksir himpunan bagian dari kovarian dan

. Ketika beberapa pasangan dari variabel kanonik yang pertama memberikan

kesimpulan yang kecil dari variabilitas dalam dan , maka tidaklah jelas

bagaimana korelasi kanonik dapat diinterpretasikan.

2.2.4 Interpretasi Geometrik dari Analisis Korelasi Kanonik Populasi

Interpretasi geometrik dari prosedur pemilihan variabel kanonik memberrikan

pengetahuan yang berharga kedalam sifat analisis korelasi kanonik. Transformasi

dari memberikan .


Dari 2.1 dan dimana adalah matriks orrthogonal

dengan baris dan . Sekarang adalah himpunan dari komponen

utama yang berasal dari X(1) saja. Matriks memiliki ke-i baris ,

yang komponen utama ke-i nya ditetapkan memiliki varians I. Yaitu

.

Akibatnya, U = AX(1) = dapat diinterpretasikan sebagai:

1. Transformasi dari X(1) ke komponen utama standar yang tidak berkorelasi,

2. Rotasi orrthogonal P1 yang ditentukan oleh , dan

3. Rotasi E’ yang ditentukan dari matriks kovarian penuh ∑.

Interpretasi serupa berlaku untuk .

2.3 Variasi Kanonik Sampel Dan Korelasi Kanonik Sampel

Sampel acak dari n observasi pada masing-masing variabel dari (p + q) variabel

X(1), X(2) dapat digabungkan kedalam ((p + q) x n) data matriks

dimana (2-17)


Adapun vektor rata-rata sampelnya adalah

dimana dan (2-18)

Dan matriks kovarian sampel dapat ditulis dimana

, k,l = 1, 2 (2-19)

Kombinasi linear , (2-20)

memiliki korelasi sampel (2-21)

Pasangan pertama dari variasi kanonik sampel dalam kombinasi linear dan

memiliki unit varian sampel yang memaksimumkan rasio (2-21). Pada umumnya,

ke-k pasangan variasi kanonik sampel adalah pasangan dari kombinasi linear dan

yang memiliki unit varian sampel yang memaksimumkan (2-21) diantara kombinasi

linear yang tidak berkorelasi dengan k-1 variasi kanonik sampel yang sebelumnya.

Korelasi sampel antara dan dinamakan korelasi kanonik sampel. Variasi

sampel kanonik dan korelasi kanonik sampel dapat diperoleh dari matriks kovarian

sampel S11, S12 = S21’, dan S22 dengan cara yang bersesuaian dengan persoalan yang

dibahas dalam 2.1.


Akibat 2.2. Misalkan adalah p order nilai eigen dari

vektor eigen yang berkoresponden dengan dimana

didefinisikan pada (2-19) dan Misalkan menjadi vektor eigen

dari dimana p yang pertama diperoleh dari

Pasangan variasi kanonik sampel ke-k adalah

dimana x(1) dan x(2) adalah nilai variabel dari X(1)

dan X(2) untuk unit ekperimen khusus. Variasi kanonik sampel pertama mempunyai

korelasi sampel maksimum . Untuk pasangan ke-k dan korelasi ini

merupakan kemungkinan terbesar diantara kombinasi linear yang tidak berkorelasi

dengan k-1 variasi kanonik sampel sebelumnya. Jumlah adalah korelasi

kanonik sampel. Jika , maka korelasi kanonik sampel tak nol adalah

.

Jika observasi distandardisasikan, maka data matriks menjadi

dan variasi kanonik sampel menjadi :

(2-22)

dimana Korelasi kanonik sampel tidak efektif dengan

standardisasi. Sebagai catatan bahwa untuk observasi standard.


2.4 Ukuran Deskripsi Penambahan Sampel

Jika variasi kanonik memberikan kesimpulan yang bagus dari masing-masing

himpunan variabel, maka persekutuan antara variabel-variabel dapat digambarkan

dalam bagian variasi kanonik dan korelasinya. Ini berguna untuk mendapatkan ukuran

kesimpulan dari tingkat dimana variasi kanonik menginformasikan untuk masing-

masing himpunan. Dan juga berguna ketika menghitung proporsi varian dalam suatu

himpunan variabel yang dijelaskan oleh variasi kanonik dari himpunan lain.

2.4.1 Penaksiran dari Matriks Kesalahan

Diberikan matriks . Misalkan

dan menotasikan ke-i kolom dari dan berturut-turut. Karena dan

maka,

(2-23)

Karena sampel , sampel dan sampel

(2-24)


Karena dan memiliki kovarians sampel I , r kolom petama dari

memuat kovarian sampel dari r variasi kanonik pertama dengan

variabel komponennya . Demikian pula r kolom pertama dari

memuat kovarian sampel dengan variabel komponennya. Jika pasangan r

kanonik pertama digunakan maka dimisalkan,

(2-25)

sehingga S12 diperkirakan Cov .

Selanjutnya, penaksiran untuk matriks kesalahannya adalah

(2-26)

Penaksir matriks kesalahan (2-26) dapat diinterpretasikan sebagai kesimpulan

dari gambaran seberapa baik r variasi kanonik sampel yang pertama menghasilkan

matriks kovarian sampel. Pola entry yang terbesar dalam baris atau kolom dari

penaksiran matriks kesalahan menandakan hal yang kurang baik terhadap variabel

koresponding.


Biasanya r variasi yang pertama melakukan kerja yang baik untuk menghasilkan

elemen dari S12 = S’12 daripada elemen dari S11 atau S22. Secara matematis, ini terjadi

karena matriks sisa pada persoalan yang lalu secara langsung berhubungan dengan p – r

korelasi sampel kanonik terkecil. Korelasi ini biasanya tertutup terhadap nol. Disisi lain,

matriks sisa bersesuaian dengan penaksiran matriks S11 dan S22 hanya bergantung pada p

– r yang sebelumnya dan q – r vektor koefisien. Elemen-elemen dalam vektor ini relatif

besar, dan karena itu matriks sisa memiliki entry yang besar.

2.4.2 Proporsi dari Varian Sampel yang Diketahui

Ketika observasi distandardisasi, matriks kovarian Skl merupakan matriks

korelasi Rkl. Vektor koefisien kanonik merupakan baris dari matriks dan serta

kolom dan yang merupakan korelasi sampel antara variasi kanonik dan

variabel komponennya. Khususnya,

dan


(2-27)

dimana adalah koefisien korelasi sampel antara elemen yang ditulis.

Dengan menggunakan (2-24) dan observasi standar, maka

Total varian sampel standar dalam himpunan pertama

Total varian sampel standar dalam himpunan kedua

(2-28)

Karena korelasi dalam r < p kolom pertama dari dan hanya melibatkan variasi

kanonik sampel dan berturut-turur, kita definisikan

kontribusi dari r variasi kanonik yang pertama terhadap total varians sampel standar

sebagai dan

.

Proporsi dari total varian sampel standar dijelaskan dengan r variasi kanonik yang

pertama menjadi:


dan

(2-29)

Ukuran deskripsi diatas memberikan petunjuk seberapa baik variasi kanonik

menggambarkan masing-masing himpunannya yang memberikan deskripsi nilai tunggal

dari matriks kesalahannya, terutama

berdasarkan (2-28) dan (2-29).

2.5 Kesimpulan Sampel Besar

Ketika ∑12 = 0 maka a’X(1) dan b’X(2) memiliki kovarians a’∑12b = 0 untuk

semua vektor a dan b. Akibatnya semua korelasi kanonik haruslah nol sehingga analisis

kanonik tidak diteruskan lagi. Hasil selanjutnya memberikan cara untuk menguji ∑12 = 0

untuk sampel besar.

Misalkan: merupakan sampel acak dari populasi N(p+q)(μ, ∑)

dengan


Tes rasio likelihood dari H0 : ∑12 = melawan H1 : ∑12 ≠ menolak H0 untuk nilai

yang besar dari (2-30) dimana

adalah estimator tak bias dari . Untuk n yang besar, tes

statistik (2-30) mendekati variabel acak yang berdistribusi Chi-kuadrat .

BAB III

PENGOLAHAN DATA DAN ANALISIS

3.1 Contoh Kasus

Dalam sebuah sekolah dasar terdapat beberapa siswa yang diukur kemampuan

membaca dan berhitungnya. Dengan

, sehingga bentuk

matriks korelasi sampelnya seperti dibawah ini:


3.2 Pengolahan Data

Korelasi kanonik sample dan variasi kanonik sampel dijabarkan dalam

perhitungan berikut ini:

i)

ii)

iii) Untuk

Jadi,

Untuk


Jadi,

iv)

Nilai eigen dan diperoleh dari:


Jadi,

Pasangan variasi kanonik dan adalah sebagai berikut:

Diketahui dan vektor eigen nya yaitu :

Jadi,

dan , maka

Dengan menggunakan 52,027,0 , maka . Jadi,

pasangan variasi kanonik sampel pertama yaitu sebagai berikut:


,

Diketahui dan vektor eigen nya yaitu :

Jadi,

dan , maka

Dengan menggunakan , maka . Jadi,

pasangan variasi kanonik kedua yaitu sebagai berikut:

,


dan

Proporsi dari total varian sampel standar yang pertama adalah :

dan proporsi dari total

varian sampel standar yang kedua adalah :

. Sehingga terlihat

bahwa proporsi dari total varian sampel standar yang kedua lebih baik dari

proporsi dari total varian sampel standar yang pertama.

Test signifikansi dari relasi kanonik kemampuan membaca dan berhitung siswa.

H0 : Tidak ada hubungan antara kemampuan membaca siswa dengan

berhitung siswa.

H1 : Ada hubungan antara kemampuan membaca siswa dengan berhitung

siswa.

H0 ditolak jika , karena dan , dua korelasi kanonik

dan terlihat nonzero, atau dengan kata lain , jadi H0

diterima.


BAB IV

KESIMPULAN

4.1 Kesimpulan

Dari pengolahan data pada bab sebelumnya, diketahui matriks korelasi

sampelnya adalah , sehingga dapat

diambil kesimpulan bahwa :

Analisis korelasi kanonik dari himpunan kemampuan membaca dan berhitung

siswa menggunakan variabel R menghasilkan dua korelasi kanonik dan dua

pasangan variasi kanonik yaitu korelasi kanonik dengan pasangan

variasi kanonik serta korelasi kanonik

dengan pasangan variasi kanonik .


Proporsi dari total varian sampel standar dan

, sehingga Sehingga terlihat bahwa proporsi dari total

varian sampel standar yang kedua lebih baik dari proporsi dari total varian

sampel standar yang pertama.

H0 diterima karena dan , dua korelasi kanonik dan

terlihat nonzero yang artinya tidak ada hubungan antara kemampuan membaca

siswa dengan berhitung siswa.


22767797 MULTIVARIAT Analisis Korelasi Kanonik

Documents

Transcript of 22767797 MULTIVARIAT Analisis Korelasi Kanonik