Uji Data Multivariat

10
UJI DATA By: Nelvia Iryani, SE, MSi

Transcript of Uji Data Multivariat

Page 1: Uji Data Multivariat

UJI DATA

By: Nelvia Iryani, SE, MSi

Page 2: Uji Data Multivariat

UJI DATA

• Uji data adalah untuk memastika bahwa berbagai metode multivariat (Cluster, faktor, dll) bisa digunakan pada data tertentu sehingga hasil proses multivariat bisa di interprestasikan dengan tepat.

• Pengabaian uji data:– Bisa membuat kesimpulan menjadi bias– Output multivariat tidak bisa di proses– Output yang dihasilkan dapat sangat berbeda di

bandingkan jika data lengkap– Banyak waktu dan tenaga terbuang untuk proses statitstik

multivariat.

Page 3: Uji Data Multivariat

Jenis-Jenis Uji Data

1. Uji Mising Data (Uji mising value) Menguji apakah ada data

yang tidak lengkap/ hilang yang akan mempengaruhi pengolahan data.

2. Uji outlier (data yang sangat exstrim)

3. Uji Normalitas, uji linieritas, uji homoskedastisitas

CARA PENGUJIAN1. Menggunakan grafik2. Menggunakan alat uji

Statistik

Page 4: Uji Data Multivariat

MISING DATA

• Informasi yang tidak tersedia untuk sebuah subjek (Kasus).

• Dalam SPSS: adanya sel-sel kosong pada satu atau lebih variabel.

• Dapat terjadi karena informasi tidak diberikan subjek, sulit dicari, informasi tidak tersedia.

TAHAPAN1. Analyse mising value Analysis.2. Isi Quatitative variables, Categorical

variables3. Masukan variabel nama ke Case labels.4. Pada Estimation aktifkan kotak: listwise,

Pairwise, EM.5. Klik Patterns6. Pada Display, aktifkan Tabulated

case……,case with missing value7. Continue, klik descriptives. 8. Pada bagian Indicator variable statistic

aktifkan percent mismatch dan Crosstabulation Of…

9. OK

Page 5: Uji Data Multivariat

PEMBAHASAN OUTPUT

1. Univariate Statistic1. Jika dlihat kolom N, terlihat angka

bervariasi pada setiap variabel, tergantung data yang hilang.

2. Pada variabel USIA dari 75 konsumen yang didata, ada 66 data konsumen yg terisi, sehingga terdapat 9 data yang missing. Dan seterusnya untuk semua variabel.

3. Semua data variabel MINUM lengkap terisi.

4. Untuk USIA, rata-rata usia 66 konsumen adalah 30,13 th dengan standar deviasi 6,36 .. Dan seterusnya.

2. Summary of Estimated Means1. Jika digunakan metode LISTWISE,

maka rata2 usia menjadi 29,9 th, berat badan menjadi 55,5 kg dan seterusnya…

2. Jika digunakan metode ALLVALUES, nilainya menjadi 30,13 th untuk usia, dan 54,91 kg untuk berat. nilai ini sama dengan nilai mean pada tabel UNIVARIAT STATISTIC.

3. Jika digunakan metode EM, rata2 usia dan berat menjadi 30,23 th dan 54,92 kg.

Note:Listwise: hanya kasus yang semua datanya ada yang ditampilkanPairwise: Data yang lengkap dan berpasangan yang ditampilkanEMM: metode untuk menghasilkan angka MCAR

Page 6: Uji Data Multivariat

NEXT

3. Crosstabulation Minum1. Untuk variabel usia, dari 66 data yang

valid, 33 data ada pada kategori minum sedikit, dan sisanya 33 data pada kategori minum banyak. 13,2% data yang missing ada pada usia konsumen yang termasuk kategori minum sedikit dan 10,8% minum banyak, 12% merupakan rata2 dari 13,2% dan 10,8%.. Dan seterusnya…

2. Hanya ada 3 variabel yang tampil (Usia, Berat, Tinggi) dari enam variabel yang di Uji, karena 4 variabel Iainnya mempunyai sedikit data missing (kurang dari 5%).

3. Dari ketiga variabel yang ditampilkan, terlihat penyebaran data yang missing pada kedua tipe konsumen, dalam arti ada persentase data hilang pada setiap kategori dan variabel. Hal ini sudah menggabrkan keacakan data yang hilang.

4. Missing Pattern

1. Tabel mising Pattern menggambarkan penyebaran data yang hilang untuk konsumen yang memang datanya tidak lengkap dan bukannya keseluruhan konsumen.

2. Rusdi mempunyai 1 missing data pada variabel berat dan persentasenya 1/7x100% = 14,3%.

3. Eli punya 2 missing data berat dan usia. Karena 2 dari 7 variabel, maka persentasenya: 2/7x100% = 28,6%.

Page 7: Uji Data Multivariat

Next

5. Tabulated Patterns

1. Merupakan sisi lain penyebaran l missing value. Missing value dinyatakan per variabel

2. Angka 53 menyatakan ada 53 data (konsumen) yang valid, dalam arti tidak terdapat missing value pada semua variabelnya.

3. Angka 5 berarti ada 5 data missing hanya pada variabel berat Rusdi, Lusi, erni, kristanto, Ninik.

4. Angka 1 baris 3 berarti adanya satu data yang missing pada variabel berat dan usia Eli.

6. Listwise Correlations

1. Angka 0,168 menyatakan besarnya korelasi antara berat dengan Usia. “Jika angka korelasi < 0,5 hanya sedikit pengaruh missing data suatu variabel terhadap terjadinya missing data pada vaiabel lainay”. Ex: “0,829 terjadinya MV pada variabel INCOME berpengaruh kuat pada terjadinya MV pada variabel Usia, tidak bagus karena menandakan rendahnya keacakan Mssing value”.

2. Hanya ada 2 korelasi yang cukup kuat yakni INCOME-USIA dan INCOME-OLAH RAGA, sedangkan OLAH RAGA – USIA tidak menunjukkan korelasi yang kuat.

Page 8: Uji Data Multivariat

Next7. Parwise Frequencies

1. Memasangkan variabel yang mempunyai data lengkap.

2. Jika dipasngkan USIA dengan BERAT, maka akan ada 61 data yang valid, sedangkan 14 data (75-61) tidak valid. Namun jika yang dipasngkan USIA dengan TINGGI, maka akan ada 63 data yang valid, 12 data (75-63) tidak valid.

8. Pairwise Corelations1. Korelasi > 0,5 pola missing

value adalah random

9. Em Correlation 1. Korelasi > 0,5 pol missing value

adalah random.2. Alat Uji MCAR

Sig MCAR > 0,05 MV adalah randomSig MCAR < 0,05 MV adalah tidak random.

3. MCAR = 32,33 dengan Sig 0,859 > 0,05 MV random.

KESIMPULAN:“ Missing Value terjadi adalah bersifat acak (random) dan tidak memiliki pola terntentu, maka bisa dilakukan bebagai perlakuan lanjutan”.

Page 9: Uji Data Multivariat

PERLAKUAN TERHADAP MISSING VALUE

• Membuang baris (kasus) yang mengandung MV, menghapus variabel (kolam) yang mengandung MV.

• Mengisi sel (data) yang MV dengan nilai tertentu yang dianggap bisa mendekati kenyataan sebenarnya jika data terisi, cara pengisian data mengisi dengan “rata-rata keseluruhan data”.

TAHAPAN

• Transform Replace MV masukan Usia, Berat, Tinggi, Income, Jakerja, Olah raga ke bagian New Variables.

• Ok

Page 10: Uji Data Multivariat

PEMBAHASAN OUTPUTKESIMPULAN

• Result Variables9 data untuk variabel USIA diganti, 6 variabel Berat , dan seterusnya..

• Metode penggantian berdasarkan rata-rata. Karena rata-rata 30,14 maka setiap data yang hilang (kosong) diganti dengan 30,14.

SEKIAN TERIMAKASIH