Uji Data Multivariat
-
Upload
luke-robinson -
Category
Documents
-
view
22 -
download
9
Transcript of Uji Data Multivariat
UJI DATA
By: Nelvia Iryani, SE, MSi
UJI DATA
• Uji data adalah untuk memastika bahwa berbagai metode multivariat (Cluster, faktor, dll) bisa digunakan pada data tertentu sehingga hasil proses multivariat bisa di interprestasikan dengan tepat.
• Pengabaian uji data:– Bisa membuat kesimpulan menjadi bias– Output multivariat tidak bisa di proses– Output yang dihasilkan dapat sangat berbeda di
bandingkan jika data lengkap– Banyak waktu dan tenaga terbuang untuk proses statitstik
multivariat.
Jenis-Jenis Uji Data
1. Uji Mising Data (Uji mising value) Menguji apakah ada data
yang tidak lengkap/ hilang yang akan mempengaruhi pengolahan data.
2. Uji outlier (data yang sangat exstrim)
3. Uji Normalitas, uji linieritas, uji homoskedastisitas
CARA PENGUJIAN1. Menggunakan grafik2. Menggunakan alat uji
Statistik
MISING DATA
• Informasi yang tidak tersedia untuk sebuah subjek (Kasus).
• Dalam SPSS: adanya sel-sel kosong pada satu atau lebih variabel.
• Dapat terjadi karena informasi tidak diberikan subjek, sulit dicari, informasi tidak tersedia.
TAHAPAN1. Analyse mising value Analysis.2. Isi Quatitative variables, Categorical
variables3. Masukan variabel nama ke Case labels.4. Pada Estimation aktifkan kotak: listwise,
Pairwise, EM.5. Klik Patterns6. Pada Display, aktifkan Tabulated
case……,case with missing value7. Continue, klik descriptives. 8. Pada bagian Indicator variable statistic
aktifkan percent mismatch dan Crosstabulation Of…
9. OK
PEMBAHASAN OUTPUT
1. Univariate Statistic1. Jika dlihat kolom N, terlihat angka
bervariasi pada setiap variabel, tergantung data yang hilang.
2. Pada variabel USIA dari 75 konsumen yang didata, ada 66 data konsumen yg terisi, sehingga terdapat 9 data yang missing. Dan seterusnya untuk semua variabel.
3. Semua data variabel MINUM lengkap terisi.
4. Untuk USIA, rata-rata usia 66 konsumen adalah 30,13 th dengan standar deviasi 6,36 .. Dan seterusnya.
2. Summary of Estimated Means1. Jika digunakan metode LISTWISE,
maka rata2 usia menjadi 29,9 th, berat badan menjadi 55,5 kg dan seterusnya…
2. Jika digunakan metode ALLVALUES, nilainya menjadi 30,13 th untuk usia, dan 54,91 kg untuk berat. nilai ini sama dengan nilai mean pada tabel UNIVARIAT STATISTIC.
3. Jika digunakan metode EM, rata2 usia dan berat menjadi 30,23 th dan 54,92 kg.
Note:Listwise: hanya kasus yang semua datanya ada yang ditampilkanPairwise: Data yang lengkap dan berpasangan yang ditampilkanEMM: metode untuk menghasilkan angka MCAR
NEXT
3. Crosstabulation Minum1. Untuk variabel usia, dari 66 data yang
valid, 33 data ada pada kategori minum sedikit, dan sisanya 33 data pada kategori minum banyak. 13,2% data yang missing ada pada usia konsumen yang termasuk kategori minum sedikit dan 10,8% minum banyak, 12% merupakan rata2 dari 13,2% dan 10,8%.. Dan seterusnya…
2. Hanya ada 3 variabel yang tampil (Usia, Berat, Tinggi) dari enam variabel yang di Uji, karena 4 variabel Iainnya mempunyai sedikit data missing (kurang dari 5%).
3. Dari ketiga variabel yang ditampilkan, terlihat penyebaran data yang missing pada kedua tipe konsumen, dalam arti ada persentase data hilang pada setiap kategori dan variabel. Hal ini sudah menggabrkan keacakan data yang hilang.
4. Missing Pattern
1. Tabel mising Pattern menggambarkan penyebaran data yang hilang untuk konsumen yang memang datanya tidak lengkap dan bukannya keseluruhan konsumen.
2. Rusdi mempunyai 1 missing data pada variabel berat dan persentasenya 1/7x100% = 14,3%.
3. Eli punya 2 missing data berat dan usia. Karena 2 dari 7 variabel, maka persentasenya: 2/7x100% = 28,6%.
Next
5. Tabulated Patterns
1. Merupakan sisi lain penyebaran l missing value. Missing value dinyatakan per variabel
2. Angka 53 menyatakan ada 53 data (konsumen) yang valid, dalam arti tidak terdapat missing value pada semua variabelnya.
3. Angka 5 berarti ada 5 data missing hanya pada variabel berat Rusdi, Lusi, erni, kristanto, Ninik.
4. Angka 1 baris 3 berarti adanya satu data yang missing pada variabel berat dan usia Eli.
6. Listwise Correlations
1. Angka 0,168 menyatakan besarnya korelasi antara berat dengan Usia. “Jika angka korelasi < 0,5 hanya sedikit pengaruh missing data suatu variabel terhadap terjadinya missing data pada vaiabel lainay”. Ex: “0,829 terjadinya MV pada variabel INCOME berpengaruh kuat pada terjadinya MV pada variabel Usia, tidak bagus karena menandakan rendahnya keacakan Mssing value”.
2. Hanya ada 2 korelasi yang cukup kuat yakni INCOME-USIA dan INCOME-OLAH RAGA, sedangkan OLAH RAGA – USIA tidak menunjukkan korelasi yang kuat.
Next7. Parwise Frequencies
1. Memasangkan variabel yang mempunyai data lengkap.
2. Jika dipasngkan USIA dengan BERAT, maka akan ada 61 data yang valid, sedangkan 14 data (75-61) tidak valid. Namun jika yang dipasngkan USIA dengan TINGGI, maka akan ada 63 data yang valid, 12 data (75-63) tidak valid.
8. Pairwise Corelations1. Korelasi > 0,5 pola missing
value adalah random
9. Em Correlation 1. Korelasi > 0,5 pol missing value
adalah random.2. Alat Uji MCAR
Sig MCAR > 0,05 MV adalah randomSig MCAR < 0,05 MV adalah tidak random.
3. MCAR = 32,33 dengan Sig 0,859 > 0,05 MV random.
KESIMPULAN:“ Missing Value terjadi adalah bersifat acak (random) dan tidak memiliki pola terntentu, maka bisa dilakukan bebagai perlakuan lanjutan”.
PERLAKUAN TERHADAP MISSING VALUE
• Membuang baris (kasus) yang mengandung MV, menghapus variabel (kolam) yang mengandung MV.
• Mengisi sel (data) yang MV dengan nilai tertentu yang dianggap bisa mendekati kenyataan sebenarnya jika data terisi, cara pengisian data mengisi dengan “rata-rata keseluruhan data”.
TAHAPAN
• Transform Replace MV masukan Usia, Berat, Tinggi, Income, Jakerja, Olah raga ke bagian New Variables.
• Ok
PEMBAHASAN OUTPUTKESIMPULAN
• Result Variables9 data untuk variabel USIA diganti, 6 variabel Berat , dan seterusnya..
• Metode penggantian berdasarkan rata-rata. Karena rata-rata 30,14 maka setiap data yang hilang (kosong) diganti dengan 30,14.
SEKIAN TERIMAKASIH