22767797 MULTIVARIAT Analisis Korelasi Kanonik
-
Upload
lutfi-al-achmad -
Category
Documents
-
view
122 -
download
3
Transcript of 22767797 MULTIVARIAT Analisis Korelasi Kanonik
BAB I
PENDAHULUAN
1. 1 Latar Belakang
Analisis korelasi kanonik ditemukan untuk mengidentifikasi dan mengukur
kumpulan antara dua himpunan dari variabel. Analisis korelasi kanonik fokus pada
korelasi antara sebuah kombinasi linear dari variabel dalam satu himpunan dan
kombinasi linear dari variabel dalam himpunan lainnya. Ide pertama adalah untuk
menentukan bagian dari kombinasi linear yang memiliki korelasi terbesar. Berikutnya,
kita menentukan bagian dari kombinasi linear yang memiliki korelasi terbesar diantara
semua bagian yang tidak berkorelasi dengan bagian yang dipilih di awal. Proses
berlanjut. Bagian dari kombinasi linear dinamakan variabel kanonik, dan korelasi yang
lainnya dinamakan korelasi kanonik.
Ada beberapa masalah penelitian yang melibatkan hubungan antara dua
kelompok variabel, misalnya hubungan antara sekelompok variabel kepribadian dan
sekelompok variabel kemampuan, hubungan antara indeks harga dan indeks produksi.
Disamping hubungan fungsional yang dinyatakan dengan persamaan regresi, ada juga
yang perlu dipersoalkan yaitu ukuran kuat lemahnya antara dua kelompok variabel.
Kajian tentang ukuran kuat lemahnya hubungan antara sekelompok variabel
peramal dan sekelompok variabel tanggapan dikenal sebagai Analisis Korelasi Kanonik.
Korelasi kanonik mengukur kekuatan kumpulan antara dua himpunan dari variabel.
Aspek terbesar dari suatu teknik merepresentasikan sebuah percobaan ke sebuah intisari
yang berdimensi tinggi dengan hubungan antara dua himpunan dari variabel ke dalam
sebuah bagian kecil dari variabel kanonik.
Analisis Korelasi Kanonik 1
Pada Analisis Regresi Linear, dicari kombinasi linear dari sekelompok variabel
peramal yang dipandang dapat paling baik menjelaskan variasi dan variabel-variabel
tanggapan. Sedangkan pada Analisis Korelasi Kanonik dicari kombinasi linear dari
variabel-variabel peramal dan kombinasi linear dari variabel-variabel tanggapan yang
bersifat bahwa koefisien korelasi momen hasil kali antara kedua kombinasi linear itu
mencapai nilai maksimum. Koefisien korelasi yang maksimum itu disebut koefisien
korelasi kanonik antara kedua kelompok variabel tersebut dan koefisien-koefisien dari
masing-masing variabel yang menghasilkan koefisien korelasi maksimum disebut
bobot-bobot kanonis.
Dalam makalah ini penulis mencoba untuk mengambil satu kasus sehingga judul
makalah yang diambil adalah ” PENENTUAN PASANGAN VARIASI KANONIK
SAMPEL DENGAN TEKNIK ANALISIS KORELASI KANONIK”.
1.2 Rumusan Masalah
Berdasarkan uraian dari latar belakang diatas, maka penulis merumuskan
petanyaan tentang bagaimana penentuan pasangan variasi kanonik sampel dengan
teknik analisis multivariat.
1.3 Tujuan Penulisan
Setiap kegiatan yang dilakukan oleh individu dan kelompok tidak terlepas dari
tujuan yang hendak dicapai. Demikian pula dengan penulisan makalah ini, dimana
penulisan makalah ini bertujuan untuk lebih memahami cara penentuan pasangan variasi
kanonik sampel dengan teknik analisis multivariat.
Analisis Korelasi Kanonik 2
1.4 Sistematika Penulisan
Penulisan makalah ini akan dikemas dalam sistematika penulisan sebagai
berikut:
BAB I : PENDAHULUAN
Bab ini membahas tentang latar belakang permasalahan yang akan
dibahas, rumusan masalah, tujuan penulisan, dan sistematika penulisan.
BAB II : ANALISIS KORELASI KANONIK
Bab ini membahas uraian tentang analisis korelasi kanonik beserta
formula-formula yang akan digunakan dalam pengolahan data dan
analisis pada bab selanjutnya.
BAB III : PENGOLAHAN DATA
Bab ini membahas perhitungan untuk menentukan pasangan variasi
kanonik sampel.
BAB IV : KESIMPULAN
Bab ini menjelaskan tentang kesimpulan dari keseluruhan perhitungan
dalam penulisan makalah ini.
Analisis Korelasi Kanonik 3
BAB II
ANALISIS KORELASI KANONIK
2.1 Variabel Kanonik dan Korelasi Kanonik
Kita akan tertarik dalam mengukur dari kumpulan antara dua kelompok variabel.
Kelompok pertama dari p variabel diwakili oleh (p x 1) vektor acak X (1). Kelompok
kedua dari q variabel diwakili oleh (q x 1) vektor acak X(2). Kita asumsi, dalam
pengembangan teoritis, bahwa X(1) mewakili himpunan yang lebih kecil, sehingga p
q.
Misalkan untuk vektor acak X(1) dan X(2) :
(2-1)
Vektor acaknya :
(2-2)
Vektor rata-ratanya :
(2-3)
Analisis Korelasi Kanonik 4
Dan matriks kovariannya :
(2-4)
Kovarian antara pasangan variabel-variabel dari himpunan berbeda yaitu satu
variabel dari X(1), satu variabel dari X(2) yang termuat di atau ekuivalen di . pq
elemen dari mengukur kumpulan antara dua himpunan. Ketika p dan q relatif besar,
menginterpretasikan elemen dari secara bersamaan biasanya adalah percuma. Selain
itu, sering bahwa kombinasi linear dari variabel itu menarik dan berguna untuk
memprediksi atau membandingkan tujuan. Tugas pokok dari analisis korelasi kanonik
adalah meringkaskan kumpulan antara himpunan X(1) dan X(2) dalam syarat-syarat yang
sedikit berhati-hati memilih kovarian (atau korelasi) daripada kovarian pq di .
Kombinasi linear menyediakan ringkasan sederhana mengukur suatu himpunan dari
variabel. Himpunan
(2-5)
Untuk beberapa bagian dari koefisien vektor a dan b. Dengan menggunakan (2-5) dan
kombinasi linear Z = CX dimana,
Sehingga,
Analisis Korelasi Kanonik 5
(2-6)
Kemudian dapat dicari koefisien vektor a dan b sedemikian sehingga,
(2-7)
sebisa mungkin bernilai besar.
Definisi:
Bagian pertama pasangan dari variabel kanonik adalah bagian dari kombinasi
linear U1, V1 yang mempunyai unit variansi, yang memaksimalkan korelasi (2-7);
Bagian kedua dari variabel kanonik adalah bagian dari kombinasi linear U2, V2 yang
mempunyai unit variansi, yang memaksimalkan korelasi (2-7) diantara semua
pilihan yang tidak berkorelasi dengan bagian pertama dari variabel kanonik.
Pada langkah ke-k:
Bagian ke-k pasangan dari variabel kanonik adalah bagian dari kombinasi linear Uk,
Vk yang mempunyai unit variansi, yang memaksimalkan korelasi (2-7) diantara
semua pilihan yang tidak berkorelasi dengan bagian k-1 sebelumnya dari pasangan
variabel kanonik.
Korelasi antara bagian ke-k dari variabel kanonik dinamakan korelasi kanonik ke-k.
Akibat 2.1. Misalkan p q dan vektor acak X(1) dan X(2) mempunyai,
dimana ∑ mempunyai
rank lengkap. Untuk koefisien vector , bentuk kombinasi linear U = a’X(1)
Analisis Korelasi Kanonik 6
dan V = b’X(2). Maka diperoleh dengan kombinasi linear (variabel
kanonik bagian pertama).
,
Bagian ke-k dari variabel kanonik, k = 2, 3, ..., p, dan
memaksimumkan diantara kombinasi linear yang
tidak berkorelasi dengan variabel kanonik 1, 2, ..., k-1 sebelumnya.
adalah nilai eigen dari dan adalah vektor
eigen (p x 1). (Jumlah juga nilai eigen p paling besar dari matriks
yang bersesuaian dengan vektor eigen (q x 1), f1,f2, ..., fp.
Tiap fi adalah proporsi untuk ). Variasi kanonik
mempunyai sifat sebagai berikut:
untuk k, l = 1, 2, ..., p.
Jika variabel awal distandardisasikan dengan dan
maka variabel kanonik berbentuk:
(2-8)
Analisis Korelasi Kanonik 7
Disini dan dan fk adalah
vektor-vektor eigen dari dan 2/12212
11121
2/122
secara berurut.
Korelasi kanonik k memenuhi,
(2-9)
dan adalah vektor eigen tak nol dari matriks
atau matriks 2/12212
11121
2/122
.
2. 2 Menginterpretasikan Populasi Variabel Kanonik
Variabel kanonik secara umumnya artifisal. Jika variabel awal X(1) dan X(2)
digunakan, koefisien kanonik a dan b mempunyai unit proporsi dari himpunan X (1) dan
X(2). Jika variabel awal yang distandardisasikan mempunyai rata-rata nol dan unit
varians, maka koefisien kanonik tidak mempunyai unit dari pengukuran, dan pasti
diinterpretasikan ke dalam bentuk variabel yang distandarkan.
2.2.1 Mengidentifikasi Varibel Kanonik
Walaupun variabel kanonik artifisal, variabel kanonik dapat diidentifikasi dalam
bentuk variabel pokok. Identifikasi sering dibantu dengan menghitung korelasi antara
variabel kanonik dan variabel awal.
Misalkan A = [a1, a2, ..., ap]’ dan B = [b1, b2, ..., bp]’, sehingga vektor dari
variabel kanonik adalah (2-10)
dimana kita awalnya tertarik di variabel kanonik pertama p di V. Maka,
(2-11)
Analisis Korelasi Kanonik 8
Karena diperoleh dengan membagi
. Secara ekuivalen,
.
Pendahuluan (p x p) diagonal matriks elemen diagonal ke-k dalam bentuk
matriks,
Perhitungan yang sama untuk bagian menghasilkan
(2-12)
dimana adalah matriks diagonal (q x q) dengan elemen ke-i Variabel
kanonik diturunkan dari variabel standard terkadang diinterpretasikan dengan
menghitung korelasi.
(2-13)
dimana adalah matriks yang barisnya memuat koefisien kanonik untuk
himpunan Z(1) dan Z(2) secara berurut. Korelasi pada matriks yang ditunjukkan (2-13)
mempunyai nilai numerik sama dengan yang dimunculkan (2-12), yakni
dan seterusnya. Mengikuti ini,
korelasi tidak dipengaruhi
oleh standaridisasi.
Analisis Korelasi Kanonik 9
2.2.2 Korelasi Kanonik Sebagai Generalisasi Dari Koefisien Korelasi Lainnya
Pertama-tama, koefisien korelasi menyamaratakan korelasi antara dua variabel.
Ketika X(1) dan X(2) masing-masing terdiri dari variabel tunggal, sehingga p = q = 1,
untuk semua a, b. Oleh karena itu variasi kanonik
dan memiliki korelasi ketika X(1) dan X(2) memiliki
komponen lebih, kondisi dengan 1 pada posisi ke-i dan
dengan 1 pada posisi ke-i menghasilkan,
(2-14)
yaitu bahwa korelasi kanonik yang pertama lebih besar dari harga mutlak semua elemen
dalam .
Kedua, perkalian koefisien korelasi adalah persoalan khusus dari korelasi
kanonik ketika X(1) memiliki elemen tunggal (p=1), menimbulkan
, untuk p=1 (2-15)
Ketika p > 1, lebih besar dari setiap korelasi perkalian dengan X(2) atau korelasi
perkalian dengan X(1). Akibatnya,
(2-16)
yaitu bahwa korelasi kanonik juga merupakan perkalian koefisien korelasi dari Uk
dengan X(2) atau perkalian koefisien korelasi Vk dengan X(1).
Karena interpretasi dari perkalian koefisien korelasi, korelasi kanonik ke-k
kuadrat, , adalah sebanding dengan varians dari variasi kanonik Uk yang dijelaskan
Analisis Korelasi Kanonik 10
oleh himpunan X(2) dan juga sebanding dengan varians dari variasi kanonik Vk yang
dijelaskan oleh himpunan X(1). Oleh karena itu, seringkali dinamakan varians
bersama antara dua himpunan X(1) dan X(2). Untuk nilai yang semakin besar, , kadang-
kadang dianggap sebagai ukuran dari himpunan yang overlap (tumpang tindih).
2.2.3 Variabel Kanonik r yang Pertama Sebagai Variabel Kesimpulan
Perubahan koordinat dari
dilakukan untuk memaksimalkan dan berturut-turut dimana
(Ui, Vi) memiliki korelasi nol dengan pasangan (Ui, Vi), (U2, V2), ..., (Ui-1, Vi-1). Korelasi
antara himpunan X(1) dan X(2) telah dimasukkan kedalam pasangan variabel kanonik.
Dengan model, vektor koefisien ai, bi dipilih untuk memaksimumkan korelasi,
tidak perlu menampilkan variabel penaksir himpunan bagian dari kovarian dan
. Ketika beberapa pasangan dari variabel kanonik yang pertama memberikan
kesimpulan yang kecil dari variabilitas dalam dan , maka tidaklah jelas
bagaimana korelasi kanonik dapat diinterpretasikan.
2.2.4 Interpretasi Geometrik dari Analisis Korelasi Kanonik Populasi
Interpretasi geometrik dari prosedur pemilihan variabel kanonik memberrikan
pengetahuan yang berharga kedalam sifat analisis korelasi kanonik. Transformasi
dari memberikan .
Analisis Korelasi Kanonik 11
Dari 2.1 dan dimana adalah matriks orrthogonal
dengan baris dan . Sekarang adalah himpunan dari komponen
utama yang berasal dari X(1) saja. Matriks memiliki ke-i baris ,
yang komponen utama ke-i nya ditetapkan memiliki varians I. Yaitu
.
Akibatnya, U = AX(1) = dapat diinterpretasikan sebagai:
1. Transformasi dari X(1) ke komponen utama standar yang tidak berkorelasi,
2. Rotasi orrthogonal P1 yang ditentukan oleh , dan
3. Rotasi E’ yang ditentukan dari matriks kovarian penuh ∑.
Interpretasi serupa berlaku untuk .
2.3 Variasi Kanonik Sampel Dan Korelasi Kanonik Sampel
Sampel acak dari n observasi pada masing-masing variabel dari (p + q) variabel
X(1), X(2) dapat digabungkan kedalam ((p + q) x n) data matriks
dimana (2-17)
Analisis Korelasi Kanonik 12
Adapun vektor rata-rata sampelnya adalah
dimana dan (2-18)
Dan matriks kovarian sampel dapat ditulis dimana
, k,l = 1, 2 (2-19)
Kombinasi linear , (2-20)
memiliki korelasi sampel (2-21)
Pasangan pertama dari variasi kanonik sampel dalam kombinasi linear dan
memiliki unit varian sampel yang memaksimumkan rasio (2-21). Pada umumnya,
ke-k pasangan variasi kanonik sampel adalah pasangan dari kombinasi linear dan
yang memiliki unit varian sampel yang memaksimumkan (2-21) diantara kombinasi
linear yang tidak berkorelasi dengan k-1 variasi kanonik sampel yang sebelumnya.
Korelasi sampel antara dan dinamakan korelasi kanonik sampel. Variasi
sampel kanonik dan korelasi kanonik sampel dapat diperoleh dari matriks kovarian
sampel S11, S12 = S21’, dan S22 dengan cara yang bersesuaian dengan persoalan yang
dibahas dalam 2.1.
Analisis Korelasi Kanonik 13
Akibat 2.2. Misalkan adalah p order nilai eigen dari
vektor eigen yang berkoresponden dengan dimana
didefinisikan pada (2-19) dan Misalkan menjadi vektor eigen
dari dimana p yang pertama diperoleh dari
Pasangan variasi kanonik sampel ke-k adalah
dimana x(1) dan x(2) adalah nilai variabel dari X(1)
dan X(2) untuk unit ekperimen khusus. Variasi kanonik sampel pertama mempunyai
korelasi sampel maksimum . Untuk pasangan ke-k dan korelasi ini
merupakan kemungkinan terbesar diantara kombinasi linear yang tidak berkorelasi
dengan k-1 variasi kanonik sampel sebelumnya. Jumlah adalah korelasi
kanonik sampel. Jika , maka korelasi kanonik sampel tak nol adalah
.
Jika observasi distandardisasikan, maka data matriks menjadi
dan variasi kanonik sampel menjadi :
(2-22)
dimana Korelasi kanonik sampel tidak efektif dengan
standardisasi. Sebagai catatan bahwa untuk observasi standard.
Analisis Korelasi Kanonik 14
2.4 Ukuran Deskripsi Penambahan Sampel
Jika variasi kanonik memberikan kesimpulan yang bagus dari masing-masing
himpunan variabel, maka persekutuan antara variabel-variabel dapat digambarkan
dalam bagian variasi kanonik dan korelasinya. Ini berguna untuk mendapatkan ukuran
kesimpulan dari tingkat dimana variasi kanonik menginformasikan untuk masing-
masing himpunan. Dan juga berguna ketika menghitung proporsi varian dalam suatu
himpunan variabel yang dijelaskan oleh variasi kanonik dari himpunan lain.
2.4.1 Penaksiran dari Matriks Kesalahan
Diberikan matriks . Misalkan
dan menotasikan ke-i kolom dari dan berturut-turut. Karena dan
maka,
(2-23)
Karena sampel , sampel dan sampel
(2-24)
Analisis Korelasi Kanonik 15
Karena dan memiliki kovarians sampel I , r kolom petama dari
memuat kovarian sampel dari r variasi kanonik pertama dengan
variabel komponennya . Demikian pula r kolom pertama dari
memuat kovarian sampel dengan variabel komponennya. Jika pasangan r
kanonik pertama digunakan maka dimisalkan,
(2-25)
sehingga S12 diperkirakan Cov .
Selanjutnya, penaksiran untuk matriks kesalahannya adalah
(2-26)
Penaksir matriks kesalahan (2-26) dapat diinterpretasikan sebagai kesimpulan
dari gambaran seberapa baik r variasi kanonik sampel yang pertama menghasilkan
matriks kovarian sampel. Pola entry yang terbesar dalam baris atau kolom dari
penaksiran matriks kesalahan menandakan hal yang kurang baik terhadap variabel
koresponding.
Analisis Korelasi Kanonik 16
Biasanya r variasi yang pertama melakukan kerja yang baik untuk menghasilkan
elemen dari S12 = S’12 daripada elemen dari S11 atau S22. Secara matematis, ini terjadi
karena matriks sisa pada persoalan yang lalu secara langsung berhubungan dengan p – r
korelasi sampel kanonik terkecil. Korelasi ini biasanya tertutup terhadap nol. Disisi lain,
matriks sisa bersesuaian dengan penaksiran matriks S11 dan S22 hanya bergantung pada p
– r yang sebelumnya dan q – r vektor koefisien. Elemen-elemen dalam vektor ini relatif
besar, dan karena itu matriks sisa memiliki entry yang besar.
2.4.2 Proporsi dari Varian Sampel yang Diketahui
Ketika observasi distandardisasi, matriks kovarian Skl merupakan matriks
korelasi Rkl. Vektor koefisien kanonik merupakan baris dari matriks dan serta
kolom dan yang merupakan korelasi sampel antara variasi kanonik dan
variabel komponennya. Khususnya,
dan
Analisis Korelasi Kanonik 17
(2-27)
dimana adalah koefisien korelasi sampel antara elemen yang ditulis.
Dengan menggunakan (2-24) dan observasi standar, maka
Total varian sampel standar dalam himpunan pertama
Total varian sampel standar dalam himpunan kedua
(2-28)
Karena korelasi dalam r < p kolom pertama dari dan hanya melibatkan variasi
kanonik sampel dan berturut-turur, kita definisikan
kontribusi dari r variasi kanonik yang pertama terhadap total varians sampel standar
sebagai dan
.
Proporsi dari total varian sampel standar dijelaskan dengan r variasi kanonik yang
pertama menjadi:
Analisis Korelasi Kanonik 18
dan
(2-29)
Ukuran deskripsi diatas memberikan petunjuk seberapa baik variasi kanonik
menggambarkan masing-masing himpunannya yang memberikan deskripsi nilai tunggal
dari matriks kesalahannya, terutama
berdasarkan (2-28) dan (2-29).
2.5 Kesimpulan Sampel Besar
Ketika ∑12 = 0 maka a’X(1) dan b’X(2) memiliki kovarians a’∑12b = 0 untuk
semua vektor a dan b. Akibatnya semua korelasi kanonik haruslah nol sehingga analisis
kanonik tidak diteruskan lagi. Hasil selanjutnya memberikan cara untuk menguji ∑12 = 0
untuk sampel besar.
Misalkan: merupakan sampel acak dari populasi N(p+q)(μ, ∑)
dengan
Analisis Korelasi Kanonik 19
Tes rasio likelihood dari H0 : ∑12 = melawan H1 : ∑12 ≠ menolak H0 untuk nilai
yang besar dari (2-30) dimana
adalah estimator tak bias dari . Untuk n yang besar, tes
statistik (2-30) mendekati variabel acak yang berdistribusi Chi-kuadrat .
BAB III
PENGOLAHAN DATA DAN ANALISIS
3.1 Contoh Kasus
Dalam sebuah sekolah dasar terdapat beberapa siswa yang diukur kemampuan
membaca dan berhitungnya. Dengan
, sehingga bentuk
matriks korelasi sampelnya seperti dibawah ini:
Analisis Korelasi Kanonik 20
3.2 Pengolahan Data
Korelasi kanonik sample dan variasi kanonik sampel dijabarkan dalam
perhitungan berikut ini:
i)
ii)
iii) Untuk
Jadi,
Untuk
Analisis Korelasi Kanonik 21
Jadi,
iv)
Nilai eigen dan diperoleh dari:
Analisis Korelasi Kanonik 22
Jadi,
Pasangan variasi kanonik dan adalah sebagai berikut:
Diketahui dan vektor eigen nya yaitu :
Jadi,
dan , maka
Dengan menggunakan 52,027,0 , maka . Jadi,
pasangan variasi kanonik sampel pertama yaitu sebagai berikut:
Analisis Korelasi Kanonik 23
,
Diketahui dan vektor eigen nya yaitu :
Jadi,
dan , maka
Dengan menggunakan , maka . Jadi,
pasangan variasi kanonik kedua yaitu sebagai berikut:
,
Analisis Korelasi Kanonik 24
dan
Proporsi dari total varian sampel standar yang pertama adalah :
dan proporsi dari total
varian sampel standar yang kedua adalah :
. Sehingga terlihat
bahwa proporsi dari total varian sampel standar yang kedua lebih baik dari
proporsi dari total varian sampel standar yang pertama.
Test signifikansi dari relasi kanonik kemampuan membaca dan berhitung siswa.
H0 : Tidak ada hubungan antara kemampuan membaca siswa dengan
berhitung siswa.
H1 : Ada hubungan antara kemampuan membaca siswa dengan berhitung
siswa.
H0 ditolak jika , karena dan , dua korelasi kanonik
dan terlihat nonzero, atau dengan kata lain , jadi H0
diterima.
Analisis Korelasi Kanonik 25
BAB IV
KESIMPULAN
4.1 Kesimpulan
Dari pengolahan data pada bab sebelumnya, diketahui matriks korelasi
sampelnya adalah , sehingga dapat
diambil kesimpulan bahwa :
Analisis korelasi kanonik dari himpunan kemampuan membaca dan berhitung
siswa menggunakan variabel R menghasilkan dua korelasi kanonik dan dua
pasangan variasi kanonik yaitu korelasi kanonik dengan pasangan
variasi kanonik serta korelasi kanonik
dengan pasangan variasi kanonik .
Analisis Korelasi Kanonik 26
Proporsi dari total varian sampel standar dan
, sehingga Sehingga terlihat bahwa proporsi dari total
varian sampel standar yang kedua lebih baik dari proporsi dari total varian
sampel standar yang pertama.
H0 diterima karena dan , dua korelasi kanonik dan
terlihat nonzero yang artinya tidak ada hubungan antara kemampuan membaca
siswa dengan berhitung siswa.
Analisis Korelasi Kanonik 27