Materi & Struktur Multivar 1 PDF

28
Selamat Datang .. Dalam zona ANALISIS PEUBAH GANDA 334H1203 (oleh M. Saleh AF) DEPARTEMEN MATEMATIKA PRODI STATISTIKA FMIPA UNHAS 2014

description

analisis peubah ganda

Transcript of Materi & Struktur Multivar 1 PDF

  • Selamat Datang .. Dalam zonaANALISIS PEUBAH GANDA

    334H1203(oleh M. Saleh AF)

    DEPARTEMEN MATEMATIKAPRODI STATISTIKAFMIPA UNHAS

    2014

  • POKOK-POKOK BAHASAN APG1. Aspek-aspek & konsep Dasar pada Analisis Multivariat2. Aljabar Matriks & Vektor random3. Geometri sampel, Sampling random & Generalisasi varians4. Distribusi Normal Multivariat5. Inverensi tentang vektor mean6. Perbandingan mean multivariat dan Analisis Profil7. Model regresi linier multivariat8. Analisis faktor dan inferensi untuk struktur matriks Covarians9. Analisis Korelasi Kanonik10. Analisis Diskriminan dan Klasifikasi11. Analisis Kluster dan Metode Jarak Statistik

    Referensi1. Morison DF, 1976, Multivariat Statistical Method, McGraw-Hall Inc, Tokyo2. Richard and Johnson, 2002, Applied Multivariat Statistical Analysis, Prentice Hall, Inc. USA

    Deskripsi Matakuliah APG :Konsep dasar analisis multivariate, vektor, matriks, Partisi matriks dekomposisi, Jarak statistic, distribusimultinormal, pendugaan vektor mean dan matriks varian-kovarians, probabilitas Kontur, Intervalkepercayaan, uji hipotesis vektor mean satu dan beberapa populasi, Manova, Manacova,Regresi gandamultivariat , Analisis Komponen Utama, Analisis Faktor, Analisis Profil, Analisis Diskriinan ,Analisis Kluster dan interpretasi geometrik.

    1. Aspek-aspek & konsep Dasar pada Analisis Multivariat2. Aljabar Matriks & Vektor random3. Geometri sampel, Sampling random & Generalisasi varians4. Distribusi Normal Multivariat5. Inverensi tentang vektor mean6. Perbandingan mean multivariat dan Analisis Profil7. Model regresi linier multivariat8. Analisis faktor dan inferensi untuk struktur matriks Covarians9. Analisis Korelasi Kanonik10. Analisis Diskriminan dan Klasifikasi11. Analisis Kluster dan Metode Jarak Statistik

    Referensi1. Morison DF, 1976, Multivariat Statistical Method, McGraw-Hall Inc, Tokyo2. Richard and Johnson, 2002, Applied Multivariat Statistical Analysis, Prentice Hall, Inc. USA

  • No POKOK BAHASAN SUB POKO BAHASAN1

    Aspek & Konsep Dasarpada AnalisisMultivariat

    1.11.21.31.4

    Pendahuluan : Aplikasi dari teknik-teknik multivariatPengorganisasian data (array, deskripsi statistik & teknik2 grafik/plotJarak Euklit dan Jarak StatistikContoh soal dan soal latihan

    2 Aljabar matriks danvektor random

    2.12.22.32.42.5

    Vektor & matriks, nilai eigen, vektor eigen, vektor uniter, ortogonalitasVektor random, Matriks random, matriks definit positif dan matriks akar kuadratDekomposisi spektral dan dekomposisi nilai singularPartisi matriks varians-covarians dan vektor meanVektor mean & matriks covarians untuk kombinasi linier var.randomContoh soal dan soal-soal latihan

    3 Geometri Sampel,Sampling random danGeneralisasi varians

    3.13.23.33.43.5

    Geometri dari sampel & Generalisasi VariansSampel random dan Nilai Ekspektasi pada mean sampel dan CovariansMean Sampel, Covarians dan KorelasiNilai sampel pada kombinasi linier dari variabel-variabel randomContoh dan Soal-soal latihan

    POKOK DAN SUB POKOK BAHASAN APG

    Geometri Sampel,Sampling random danGeneralisasi varians

    3.13.23.33.43.5

    Geometri dari sampel & Generalisasi VariansSampel random dan Nilai Ekspektasi pada mean sampel dan CovariansMean Sampel, Covarians dan KorelasiNilai sampel pada kombinasi linier dari variabel-variabel randomContoh dan Soal-soal latihan

    4 Distribusi normalmultivariat

    4.14.24.34.44.54.64.74.8

    Distribusi Normal Multivariat dan sifat-sifatnyaDensitas Normal Multivariat dan sifat-sifatnyaFungsi Pembangkit Momen & Probabilitas KonturLikelihood Normal Multivariat dan Penaksiran Maksimum LikelihoodDistribusi sampling untuk dan S dan sifat2 DistribusiWishartMendeteksi Data Pencilan dan Pembersihan DataTransformasi untuk mendekati NormalitasContoh dan Soal-soal Latihan

    5 Inferensi tentangvektor random

    5.15.25.35.4

    Penentuan Nilai awal vektor Mean pada populasi normalStatistik Hostellings dan Uji Perbandingan LikelihoodDiagram Kontrol Kualitas pada multivariate (Diagram monitoring Statbilitas,Control Region, Control Ellips, )Contoh dan Soal-soal latihan

  • No POKOK BAHASAN SUB POKO BAHASAN6 Perbandingan mean

    multivariat danAnalisis Profil

    6.16.26.36.46.5

    Uji Hipotesis vektor-vektor mean dua populasi (kecil dan kasus )Uji Hipotesis vektor-vektor mean pada beberapa populasi multivariate (One-way Manova; and Two-way Manova)Analisis Profil (Uji kesejajaran, keberhimpitan dan kesamaan)Model-model MultivariatContoh soal dan Soal-soal latihan

    7 Model regresi liniermultivariat

    7.17.27.37.47.57.6

    Model Regresi Klasik dan Pendugaan Least squaresInferensi tentangModel Regresi dan penaksiran fungsi regresiRegresi Ganda Multivariat (Multivariat multiple Regression)Uji Perbandingan Likelihood untuk parameter regresiPenaksiran dengan regresi ganda multivariateContoh soal dan Soal-soal latihan

    8 Analisis faktor daninferensi untukstruktur matriksCovarians

    8.18.28.38.48.5

    Model Faktor OrtogonalMetode Estimasi (Metode Komponen Utama , Faktor Utama, dan MaksimumLikelihood)Rotasi Faktor dan Factor Scores (Metode WLS dan metode Regresi)SEM (Structural Equation Models)Contoh soal dan soal-soal Latihan

    Analisis faktor daninferensi untukstruktur matriksCovarians

    8.18.28.38.48.5

    Model Faktor OrtogonalMetode Estimasi (Metode Komponen Utama , Faktor Utama, dan MaksimumLikelihood)Rotasi Faktor dan Factor Scores (Metode WLS dan metode Regresi)SEM (Structural Equation Models)Contoh soal dan soal-soal Latihan

    9 Analisis KorelasiKanonik

    9.19.29.39.4

    Variat Kanonik dan Korelasi KanonikInterpretasi variabel kanonik populasi, dan korelasi kanonikVariat kanonik dan corelasi kanonik pada sampelContoh soal dan Soal-soal latihan

    10 Analisis Diskriminandan Klasifikasi

    10.110.210.310.410.5

    Pemisahan dan Klasifikasi untuk dua populasiKlasifikasi untuk dua populasi normal multivariate (kasus )Fungsi Diskriminan FishersMetode Fishers untuk diskriminasi /Pemisahan objek-objekContoh soal dan soal-soal Latihan

    11 Analisi Kluster &Metode Jarak

    11.111.211.3

    Keseragaman ukuranMetode Kluster berhirarki dan Non-hirarkiPenskalaan Multidimensi dan Analisis Korespondensi

  • Keterampilankerja khusus

    Penguasaanpengetahuan

    Sikap

    Keterampilankerja umum

    Deskripsi Capaian Pembelajarandalam SNPT 2014

  • KEMAMPUAN KERJA khusus PRODI STATISTIKA (level 6)Mampu melakukan perancangan percobaan, pengumpulan dan pembangkitan data(dalam bentuk survei, percobaan, atau simulasi), pengorganisasian data, analisisdata menggunakan teknik-teknik statistika, dan penarikan kesimpulan secara sahih,dengan memanfaatkan minimal satu perangkat lunak statistika.Mampu menyelesaikan masalah penaksiran (estimation), pengujian hipotesis,prediksi dan prakiraan (forecasting) pada beberapa bidang, dengan menggunakandata dan beberapa metodologi statistika (metode dan model) dan menyajikannyadalam bentuk deskripsi yang mudah dipahami oleh pengguna.Mampu melakukan analisis terhadap beberapa alternatif solusi yang tersedia dibidang statistika untuk menyelesaikan masalah dan mampu menyajikan kesimpulananalisis untuk pengambilan keputusan yang tepat, (Draf SNPT 2014)

    KEMAMPUAN KERJA khusus PRODI STATISTIKA (level 6)Mampu melakukan perancangan percobaan, pengumpulan dan pembangkitan data(dalam bentuk survei, percobaan, atau simulasi), pengorganisasian data, analisisdata menggunakan teknik-teknik statistika, dan penarikan kesimpulan secara sahih,dengan memanfaatkan minimal satu perangkat lunak statistika.Mampu menyelesaikan masalah penaksiran (estimation), pengujian hipotesis,prediksi dan prakiraan (forecasting) pada beberapa bidang, dengan menggunakandata dan beberapa metodologi statistika (metode dan model) dan menyajikannyadalam bentuk deskripsi yang mudah dipahami oleh pengguna.Mampu melakukan analisis terhadap beberapa alternatif solusi yang tersedia dibidang statistika untuk menyelesaikan masalah dan mampu menyajikan kesimpulananalisis untuk pengambilan keputusan yang tepat, (Draf SNPT 2014)

  • PENGUASAAN PENGETAHUAN PRODI STATISTIKA (level 6)Menguasai konsep teori peluang dan statistika, matematika, kalkulus, aljabarlinear elementer, metode-metode analisis statistika, dan pemogramankomputer elementer.Menguasai beberapa metodologi (metode dan model) statistika untukdigunakan dalam menyelesaikan masalah di beberapa bidang.Menguasai minimal dua perangkat lunak statistika, termasuk perangkat lunakyang berbasis open source ,(SNPT 2014)

  • Ketrampilan kerja Umum Lulusan SARJANA SNPT (LEVEL 6)1.Mampu menerapkan pemikiran logis, kritis, sistematis, dan inovatif dalam konteks pengembangan

    atau implementasi ilmu pengetahuan dan teknologi yang memperhatikan danmenerapkan nilai humaniora yang sesuai dengan bidang keahliannya;

    2.Mampu menunjukkan kinerja mandiri, bermutu, dan terukur;3.Mampu mengkaji implikasi pengembangan atau implementasi ilmu pengetahuan dan teknologi

    yang memperhatikan dan menerapkan nilai humaniora sesuai dengan keahliannyaberdasarkan kaidah, tata cara dan etika ilmiah dalam rangka menghasilkan solusi,gagasan, desain atau kritik seni;

    4.Mampu menyusun deskripsi saintifik hasil kajian tersebut di atas dalam bentuk skripsi atau laporantugas akhir, dan mengunggahnya dalam laman perguruan tinggi;

    5.Mampu mengambil keputusan secara tepat dalam konteks penyelesaian masalah di bidangkeahliannya, berdasarkan hasil analisis informasi dan data;

    6.Mampu memelihara dan mengembangkan jaringan kerja dengan pembimbing, kolega, sejawatbaik di dalam maupun di luar lembaganya.

    7.Mampu bertanggung jawab atas pencapaian hasil kerja kelompok dan melakukan supervisi sertaevaluasi terhadap penyelesaian pekerjaan yang ditugaskan kepada pekerja yang berada dibawah tanggung jawabnya;

    8.Mampu melakukan proses evaluasi diri terhadap kelompok kerja yang berada di bawah tanggungjawabnya, dan mampu mengelola pembelajaran secara mandiri;

    9.Mampu mendokumentasikan, menyimpan, mengamankan, dan menemukan kembali data untukmenjamin kesahihan dan mencegah plagiasi; (Tim Belmawa DIKTI 2014)

    Ketrampilan kerja Umum Lulusan SARJANA SNPT (LEVEL 6)1.Mampu menerapkan pemikiran logis, kritis, sistematis, dan inovatif dalam konteks pengembangan

    atau implementasi ilmu pengetahuan dan teknologi yang memperhatikan danmenerapkan nilai humaniora yang sesuai dengan bidang keahliannya;

    2.Mampu menunjukkan kinerja mandiri, bermutu, dan terukur;3.Mampu mengkaji implikasi pengembangan atau implementasi ilmu pengetahuan dan teknologi

    yang memperhatikan dan menerapkan nilai humaniora sesuai dengan keahliannyaberdasarkan kaidah, tata cara dan etika ilmiah dalam rangka menghasilkan solusi,gagasan, desain atau kritik seni;

    4.Mampu menyusun deskripsi saintifik hasil kajian tersebut di atas dalam bentuk skripsi atau laporantugas akhir, dan mengunggahnya dalam laman perguruan tinggi;

    5.Mampu mengambil keputusan secara tepat dalam konteks penyelesaian masalah di bidangkeahliannya, berdasarkan hasil analisis informasi dan data;

    6.Mampu memelihara dan mengembangkan jaringan kerja dengan pembimbing, kolega, sejawatbaik di dalam maupun di luar lembaganya.

    7.Mampu bertanggung jawab atas pencapaian hasil kerja kelompok dan melakukan supervisi sertaevaluasi terhadap penyelesaian pekerjaan yang ditugaskan kepada pekerja yang berada dibawah tanggung jawabnya;

    8.Mampu melakukan proses evaluasi diri terhadap kelompok kerja yang berada di bawah tanggungjawabnya, dan mampu mengelola pembelajaran secara mandiri;

    9.Mampu mendokumentasikan, menyimpan, mengamankan, dan menemukan kembali data untukmenjamin kesahihan dan mencegah plagiasi; (Tim Belmawa DIKTI 2014)

  • Parameter Deskripsi Capaian Pembelajaran

    Kemampuan kerja

    Khusus

    (Kemampuan bidang

    Kerja)

    KK1 Mampu menyusun dan atau memilih rancangan pengumpulan/

    pembangkitan data yang efisien dan menerapkannya dalam bentuk survei,

    percobaan, atau simulasi.

    KK2 Mampu melakukan manajemen dan analisis data menggunakan teknik-

    teknik statistika dengan bantuan perangkat lunak. (+ interpretasi)

    KK3 Mampu menyelesaikan permasalahan nyata secara statistika dan mampu

    menyajikan serta mengkomunikasikan dalam bentuk yang mudah

    dipahami baik secara tertulis maupun lisan. (analisys & reporting data)

    RUMUSAN CAPAIAN PEMBELAJARAN PRODI STATISTIKA (Learning Outcome)

    Penguasaan

    Pengetahuan

    PP1 Menguasai konsep dasar keilmuan statistika dan metode-metode analisis

    statistika yang dapat diaplikasikan pada berbagai bidang terapan.

    PP2 Menguasai minimal dua perangkat lunak statistika, termasuk perangkat

    lunak yang berbasis open source

    Kemampuan

    Managerial

    (Sikap dan

    Kemampuan Kerja

    Umum)

    KM1 Mampu bekerjasama dan berkomunikasi dalam tim serta

    bertanggungjawab terhadap pekerjaan.

    KM2 Memiliki etika profesi dalam penerapan statistika.

    KM3 Bertakwa Kepada Tuhan Yang Maha Esa

    Sumber : FORSTAT , YOGYA, DESEMBER 2013

  • 1. Aspek & Struktur Data Multivariat Aspek dan Konsep Dasar pada Analisis Multivariat Struktur Data Multivariat Array pada basik Deskriptif Statistik Teknik grafik dan plot data Multivariat

    PERTEMUAN 1Kontrak Pembelajaran

    Aspek dan Konsep Dasar pada Analisis Multivariat Struktur Data Multivariat Array pada basik Deskriptif Statistik Teknik grafik dan plot data Multivariat

  • Struktur data multivariateSebuah observasi multivariat adalah koleksi pengukuran pada p variabelyang berbeda dalam suatu trial/item yang samaJika pada tiap-tiap variabel (1,2...p ), dilakukan masing-masing sebanyak n kalipengukuran maka entri data dapat dinyatakan dalam bentuk sebuah matriks berukurann x p , sebagai berikut

    varb 1 varb 2 varb k varb pitem 1item 2item 2

    item n

    item j

    atau dapat dinyatakan dalam benrtuk data array persegi panjang,katakanlah X yang terdiri dari n baris dan p kolom, yaitu

  • : nilai pengukuran/trial ke j pada variabel ke k

    ...... (1)

    Setiap baris dari X merupakan sebuah observasi/pengukuran multivariat,sehingga diperoleh sebuah sampel berukuran n dari populasi p variat. Dengankata lain, sampel merupakan n pengukuran pada tiap-tiap komponen variabel.

  • Deskripsi StatistikUntuk suatu data diperlukan ringkasan angka yang disebut statistik deskriptip

    Mean (rata-rata) adalah statistik deskriptip yang merupakan salah satuukuran pusat dari suatu himpunan data Variansi adalah statistik deskriptip yang merupakan salah satu ukuranpenyebaran data

    Koefisien korelasi adalah statistik deskriptip yang merupakan ukurankeeratan hubungan linier antara dua (atau lebih) variabel . Keofisien korelasitidak tergantung pada satuan (unit) pengukuran

  • Array of basic Descriptive StatisticsVektor mean sampel

    Matriks varians-covarianssampel

    dengan

    dengan

    Matriks korelasi sampel

    dengan

    dengan

  • Ilustrasi 1Dari empat mahasiswa pembeli pada sebuah toko buku dicatat total pembelian masing-masing mahasiswa (dalam puluhan ribu rupiah) beserta jumlah buku yang di beli.Tentukan a. Deskripsi statistik data ( ) untuk data bivariat

    b. Plot data X atas 4 buah titik dalam ruang dua dimensi dan tentukan pusatdata

    Variabel 1 : (total penjualan dlm puluhan ribu Rp ) : 42 52 48 58

    SolusiMisalkan variabel 1 adalah total pembelian dan varibel 2 adalah jumlah buku yangdibeli. Jadi terdapat empat pengukuran pada dua variabel. Dalam bentuk tabel data(data array) dapat disajikan dalam bentuk matriks data sebagai berikut

    Variabel 1 : (total penjualan dlm puluhan ribu Rp ) : 42 52 48 58Variabel 2 : (jumlah buku yang terjual ) : 4 5 4 3Dalam hal ini

    Atau data di tuliskan dalam bentuk matriks sebagai (data bivariat)

  • Jadi vektor mean sampel adalaha.

    Jadi matriks varian-covarians sampel adalah (untuk pembagi n-1) adalah

  • ,,

    , Jadi matriks korelasi sampel adalah

    Varians dan covarians sampel (dengan pembagi n)

    dengan

  • b.

    Untuk matriks

    5

    X2

    10 30 50 604020

    4321

    (50,4)

    X1O

  • Plot DataPlot dari observasi sebenarnya penting dan dapat membantu analisis data.Plot untuk semua pengukuran pada semua variabel tidak mungkin dilakukan,(khususnya jika dimensnya lebih besar tiga) walaupun demikian plot pantulindividual variabel dan pasangan variabel masih banyak memberi informasi.

    Variabel 1 : x1 3 4 2 6 8 2 5

    Variabel 2 : x2 5 5.5 4 7 10 5 7.5

    Misalkan diberikan 7 pasang pengukurn pada dua variabel sebagai berikut :Ilustrasi 2

    1010

    x2Koordinat titik-titik adalah :

    (3,5) ; (4,5.5); (2,4) ; (6,7) ; (8,10) ; (2,5) ; (5,7.5)

    Gbr-3: Diagram pencardan diagram titik

    Diagram pencar

    4

    6

    2

    8

    2 4 6 8 10

    4

    6

    2

    8

    2 4 6 8 10Diagram titik

    Dia gr

    am tit

    ik

    x1

    (3,5) ; (4,5.5); (2,4) ; (6,7) ; (8,10) ; (2,5) ; (5,7.5)Plot data dalam dua dimensi ini disebutscatter plot (diagram pencar)

  • JARAK STATISTIKJARAK STATISTIK

  • Jarak euclid secara umum untuk dua titik dan

    Jarak euclid (jarak garis lurus) antara titik ke titik asal

    Jarak euclid

    Jarak statistikJarak statistik antara titik

    dan

    Jarak statistikJarak statistik antara titik

    dimana

    Perbandingan jarak euclid dan jarak statistik terletak pada pembobotdan pada dan

  • Jarak yang digunakan dalam statistik diberi nama jarak statistik.

    Jarak euclidien ini umumnya tidak cocok digunakan untuk statistik. Hal inidisebabkan oleh pada jarak euclid, setiap koordinat mempunyai konstribusisama untuk perhitungan jarak.Bila koordinat merupakan pengukuran yang mempunyai fluktuasi randomdari magnitude berbeda, dibutuhkan memberikan bobot pada tiap-tiapkoordinat dengan bobot besar untuk variabilitas kecil dan sebaliknyaHal ini akan memberikan ukuran jarak yang berbeda dengan jarak euclidian.

    danSebagai ilustrasi, diambil n titik pada dua variabel

    x1

    x2

    danyang saling bebas (independen) seperti pada gambar berikutSebagai ilustrasi, diambil n titik pada dua variabel

    Dari diagram pencar tersebut , tampak bahwa variansilebih besar dari variansiSalah satu cara untuk memberikan bobot adalah denganmenggunakan standar deviasi sampel. Membagikoordinat dengan standar deviasinya, didapatstandarisasi koordinat, dan

  • Perluasan jarak statistik untuk p variabel antara titikdan adalah

    1. Jarak P ke O ,

    2. BilaJarak Euclidian = Jarak statistik

    maka

  • Catatan

    (rotasi) sebesar sudut , dengan matriks transformasi rotasi :

    Untuk dua variabel yang tidak independen (misalnya korelasinya positif) sepertitampak pada diagram pencar berikut, maka jarak statistik harus di modifikasi

    Sehingga didapat sumbu-sumbu koordinat baru(lihat gambar)dimana

    x1

    x2

  • Dengan sumbu baru ini, jarak statistik dari ke titik asal O(0,0) adalah

    Dengan perhitungan secara aljabar diperoleh

    dimanadimana

  • Secara umum jarak terhadap titik tetapbila kedua variabel berkorelasi adalah

    x2

    x1

  • Terima kasih..Merci