Praktikum Komputasi Statistik 1 KOmet

28
Laporan Praktikum 1 Komputasi Statistika Statistika deskriptif, korelasi dan regresi dengan software R Disusun oleh : Nama : Komet Rachmawansah NIM : 105090502111001 Tanggal Praktikum : 17 Oktober 2012 Asisten 1 : 1. Teguh Prasetyo 2. Eka Putri Yuli T LABORATORIUM KOMPUTER PROGRAM STUDI STATISTIKA JURUSAN MATEMATIKA – FAKULTAS MIPA

Transcript of Praktikum Komputasi Statistik 1 KOmet

Page 1: Praktikum Komputasi Statistik 1 KOmet

Laporan Praktikum 1

Komputasi Statistika

Statistika deskriptif, korelasi dan regresi dengan software R

Disusun oleh :

Nama : Komet RachmawansahNIM : 105090502111001Tanggal Praktikum : 17 Oktober 2012Asisten 1 : 1. Teguh Prasetyo

2. Eka Putri Yuli T

LABORATORIUM KOMPUTERPROGRAM STUDI STATISTIKA

JURUSAN MATEMATIKA – FAKULTAS MIPAUNIVERSITAS BRAWIJAYA

MALANG2012

Page 2: Praktikum Komputasi Statistik 1 KOmet

BAB IPENDAHULUAN

1.1 Latar BelakangKomputasi sangat berguna sekali untuk memecahkan masalah

mengenai data inputan yang menggunakan suatu algoritma tertentu. Untuk penyelesaian komputasi sangat sulit jika tidak dengan bantuan software computer. Di program studi statistika terdapat beberapa software yang mendukung untuk analisisnya, contohnya software R, minitab, spss, genstat, amos, eviews, dan lain sebagainya. Di dalam software R terdapat beberapa fasilitas untuk manipulasi, perhitungan dan penampilan grafik. Oleh karena itu, software R dapat digunakan untuk analisis statistika. Namun, di dalam software R ini diperlukan syntax untuk dapat mengetahui hasil dari analisis statistika tersebut, misalnya untuk mencari nilai rata-rata dari suatu sampel digunakan syntax >mean().

Untuk itu dalam praktikum ini akan membahas mengenai pengenalan software R dan operasi-operasi matriks yang ada di dalam software R.

1.2 Tujuan

1.2.1 Tujuan Umum- Mahasiswa mampu memahami dan melakukan input data di

software R

1.2.1 Tujuan Khusus- Mahasiswa mampu menganalisis data ringkasan 5 angka - Mahasiswa mampu menganalisis korelasi- Mahasiswa mampu menganalisis regresi

1

Page 3: Praktikum Komputasi Statistik 1 KOmet

BAB IITINJAUAN PUSTAKA

2.1 Statistika DeskriptifStatistika deskriptif adalah bagian dari ilmu statistika yang hanya

mengolah, menyajikan data tanpa mengambil keputusan untuk populasi. Dengan kata lain hanya melihat gambaran secara umum dari data yang didapatkan. Statistika Deskriptif diantaranya:

Ukuran Lokasi: Modus, Mean, Median, dll. Ukuran Variabilitas: Varians, Standar Deviasi, Range, dll. Ukuran bentuk: Kurtosis, Skewness, dll.Statistika deskriptif bisa didefinisikan sebagai metode yang berkaitan

dengan pengumpulan, peringkasan, penyajian data sehingga memberikan informasi organization, summarization and presentation of data.

Iqbal Hasan (2004:185) menjelaskan : Analisis deskriptif adalah merupakan bentuk analisis data penelitian untuk menguji generalisasi hasil penelitian berdasarkan satu sample. Analisa deskriptif ini dilakukan dengan pengujian hipotesis deskriptif. Hasil analisisnya adalah apakah hipotesis penelitian dapat digeneralisasikan atau tidak. Jika hipotesis nol (H0) diterima, berarti hasil penelitian dapat digeneralisasikan. Analisis deskriptif ini menggunakan satu variable atau lebih tapi bersifat mandiri, oleh karena itu analisis ini tidak berbentuk perbandingan atau hubungan.

Iqbal Hasan (2001:7) menjelaskan : Statistik deskriptif atau statistik deduktif adalah bagian dari statistik yang mempelajari cara pengumpulan data dan penyajian data sehingga mudah dipahami. Statistik deskriptif hanya berhubungan dengan hal menguraikan atau memberikan keterangan-keterangan mengenai suatu data atau keadaan atau fenomena. Dengan kata lain statistik deskriptif berfungsi menerangkan keadaan, gejala, atau persoalan. Penarikan kesimpulan pada statistik deskriptif (jika ada) hanya ditujukan pada kumpulan data yang ada. Didasarkan pada ruang lingkup bahasannya statistik deskriptif mencakup : 1. Distribusi frekuensi beserta bagian-bagiannya seperti :

a. Grafik distibusi (histogram, poligon frekuensi, dan ogif); b. Ukuran nilai pusat (rata-rata, median, modus, kuartil dan sebagainya); c. Ukuran dispersi (jangkauan, simpangan rata-rata, variasi, simpangan baku, dan sebagianya); d. Kemencengan dan keruncingan kurva 2. Angka indeks 3. Times series/deret waktu atau berkala 4. Korelasi dan regresi sederhana

2

Page 4: Praktikum Komputasi Statistik 1 KOmet

Bambang Suryoatmono (2004:18) menyatakan Statistika Deskriptif adalah statistika yang menggunakan data pada suatu kelompok untuk menjelaskan atau menarik kesimpulan mengenai kelompok itu saja

Ukuran Lokasi: mode, mean, median, dll Ukuran Variabilitas: varians, deviasi standar, range, dll Ukuran Bentuk: skewness, kurtosis, plot boks Pangestu Subagyo (2003:1) menyatakan : Yang dimaksud sebagai

statistika deskriptif adalah bagian statistika mengenai pengumpulan data, penyajian, penentuan nilai-nilai statistika, pembuatan diagram atau gambar mengenai sesuatu hal, disini data yang disajikan dalam bentuk yang lebih mudah dipahami atau dibaca.

Sudjana (1996:7) menjelaskan : Fase statistika dimana hanya berusaha melukiskan atau menganalisa kelompok yang diberikan tanpa membuat atau menarik kesimpulan tentang populasi atau kelompok yang lebih besar dinamakan statistika deskriptif.

Contoh lain Statistika Deskriptif: Peringkasan data dalam bentuk:1. Tabulasi Data (Tabel)2. Diagram Balok (Histogram)3. Diagram Kue (Pie Chart)

2.2 Korelasi Nilai korelasi adalah nilai yang menggambarkan tingkat keeratan hubungan linier antara dua variabel atau lebih. Nilai korelasi tidak menggambarkan hubungan sebab akibat antara dua variabel atau lebih tetapi semata-mata menggambarkan keterkaitan linier antar variabel. Nilai korelasi sering dinotasikan dengan r dan nilainya dari –1 sampai 1 (-1 r 1), nilai r yang mendekati 1 atau –1 menunjukkan semakin erat hubungan linier antara kedua variabel tersebut. Sedangkan nilai r yang mendekati nol menggambarkan hubungan kedua variabel tersebut tidak linier. Tanda dari nilai r dapat dilihat dari diagram pencar pengamatan dari dua variabel tersebut. Bila titik-titik pengamatan menggerombol mengikuti garis lurus dengan kemiringan positif, maka korelasi antar kedua variabel tersebut positif. Sebaliknya bila titik-titik pengamatan tersebut menggerombol mengikuti garis lurus dengan kemiringan negatif, maka korelasi antar variabel tersebut bertanda negatif.

:

Salah satu ukuran keeratan hubungan linier antara dua variabel adalah Koefisien Korelasi Pearson, rumus untuk menghitung korelasi tersebut dari data sampel adalah sebagai berikut:

3

Page 5: Praktikum Komputasi Statistik 1 KOmet

r=∑i=1

n

( x i− x )( y i− y )

√∑i=1

n

(x i− x )2∑i=1

n

( y i− y )2

=∑i=1

n

x i y i−n x y

√[∑i=1

n

x i2−n x2 ][∑i=1

n

y i2−n y2 ]

r=Sxy

√ Sxx S yy

dengan –1 r 1

Inferensi terhadap ρ

Nilai r merupakan suatu nilai penduga bagi nilai korelasi populasi

yang dilambangkan dengan ρ maka apabila ingin mendapatkan suatu uji

yang menyatakan kapan r berada cukup jauh dari suatu nilai tertentu ρ0 .Hipotesis untuk menguji apakah dua varibel mempunyai hubungan linier atau tidak adalah sebagai berikut :

Ho : ρ = 0Statistik uji :

t= r √n−2

√1−r2, dengan v = n - 2

Wilayah kritis :

t < -t untuk Ho : ρ < 0

t > t untuk Ho : ρ > 0

t < -t/2 dan t > t/2 untuk Ho : ρ 0

2.3 Regresi Analisis regresi mempelajari bentuk hubungan antara satu atau

lebih peubah bebas (X) dengan satu peubah tak bebas (Y). dalam penelitian peubah bebas ( X) biasanya peubah yang ditentukan oelh peneliti secara bebas misalnya dosis obat, lama penyimpanan, kadar zat pengawet, umur ternak dan sebagainya. Disamping itu peubah bebas bisa juga berupa peubah tak bebasnya, misalnya dalam pengukuran panjang badan dan berat badan sapi, karena panjang badan lebih mudah diukur maka panjang badan dimasukkan kedalam peubah bebas (X), sedangkan berat badan

4

Page 6: Praktikum Komputasi Statistik 1 KOmet

dimasukkan peubah tak bebas (Y). sedangkan peubah tak bebas (Y) dalam penelitian berupa respon yang diukur akibat perlakuan/peubah bebas (X). misalnya jumlah sel darah merah akibat pengobatan dengan dosis tertentu, jumlah mikroba daging setelah disimpan beberapa hari, berat ayam pada umu tertent dan sebagainya.

Dalam kehidupan sehari-hari seringkali kita ingin melihat hubungan antara dua variabel, seperti hubungan antara panjang bayi dan bobot bayi, protein dan kadar hemoglobin, tinggi badan dan berat badan, IQ anak dan nilai matematikanya. Umumnya suatu variabel bersifat mempengaruhi variabel yang lainnya, variabel pertama disebut variabel bebas (independent variable) sedangkan variabel yang kedua disebut variabel tak bebas (dependent variable). Secara kuantitatif hubungan antara variabel bebas dan variabel tak bebas dapat dimodelkan dalam suatu model matematik. Metode yang digunakan untuk mencari pola hubungan fungsional antara satu variabel bebas (independen / prediktor / X) dengan satu variabel tak bebas (dependen / respons / y) adalah analisis regresi sederhana. Model analisis regresi sederhana Y terhadap X adalah :

y i=α+β x i+εidengan yi = variabel respon ke-i

xi = variabel prediktor ke-i = parameter intersep = parameter slope (kemiringan)i = error ke-i

Dengan menggunakan metode kuadrat terkecil (least square) persamaan regresi diatas dapat diduga dengan :

y i=a+bx idengan

b=∑i=1

n

( x i− x )( y i− y )

∑i=1

n

( x i− x )2

=∑i=1

n

xi y i−n x y

∑i=1

n

xi2−n x2

=S xy

S xx

a= y−b x

5

Page 7: Praktikum Komputasi Statistik 1 KOmet

Koefisien determinasi

Untuk mengetahui kesesuaian model dan besarnya variasi nilai Y yang dapat dijelaskan oleh model regresi digunakan nilai koefisien determinasi dengan rumus sbb:

R2=∑i=1

n

( y i− y )2

∑i=1

n

( y i− y )2

dengan 0 R2 1Untuk analisis regresi linier sederhana :

R2 = r2

6

Page 8: Praktikum Komputasi Statistik 1 KOmet

BAB IIIMETODOLOGI

1.1 Statistika Deskriptif Membuka software R 2.11.1, pilih menu packages> load

packages>Rcmdr

Lalu klik OK Untuk menginputkan data pilih data>data set baru Kemudian muncul kotak dialog seperti dibawah ini kemudian

masukkan nama untuk data set : DataHasilPanenPadi. klik OK.

Klik kotak var 1 , kemudian muncul kotak dialog di bawah ini, isikan variable name : Hasil Panen Padi/kwintal dan pilih type character.

Isikan data sebanyak 25 pada kolom data hasil UTS Komstat

7

Page 9: Praktikum Komputasi Statistik 1 KOmet

Untuk mencari ringkasan 5 angka (statistika deskriptif) maka tutup terlebih dahulu Data Editor agar proses tetap berjalan, kemudian pilih statistika pada toolbar > ringkasan> data set active> lalu OK.

Setelah perintah OK maka output akan keluar ,

Untuk memplotkan data ke dalam grafik pilih grafik pada menu toolbar > histogram ,

8

Page 10: Praktikum Komputasi Statistik 1 KOmet

klik OK. Maka didapatkan grfik histogram sebagai berikut ,

Untuk mengetahui macam grafik yang lain maka pilih grafik > QQ plot ,klik OK.

Maka dihasilkan plot indeks ,

1.2 Korelasi

9

Page 11: Praktikum Komputasi Statistik 1 KOmet

Seperti langkah-langkah untuk mencari ringkasan 5 angka, pertama membuka software R 2.1.11 > load packages > Rcmdr > OK. Kedua dengan cara yang sama , input data dengan 2 variabel.

Kasus :Ingin diketui ada korelasi antara Pengeluaran/ bulan (Y) dan Pendapatan/ bulan yang diperoleh (X). Dengan responden sebanyak 30 penduduk di suatu daerah. Masukkan nama untuk data set : korelasi lalu klik OK Kotak variabel 1 diganti nama dengan : Pengeluaran/ Bulan dan pilih type character. Kotak variabel 2 diganti nama dengan : Pendapatan/ Bulan dan pilih type character.

Input data sebanyak 30 . Karena akan diketahui ada korelasi antara lama belajar dan IP dari 30 mahasiswa statistika kelas A 2010 UB. Maka hasil input data sebagai berikut :

10

Page 12: Praktikum Komputasi Statistik 1 KOmet

Untuk mengetahui korelasi antara lama belajar dan IP maka pilih statistika pada menu toolbar > ringkasan > uji korelasi > pilih dua peubah IP dan lama belajar, tipe korelasi produk-momen pearson, hipotesis alternatif : dua arah , klik OK

Output akan keluar di jendela keluaran ,

11

Page 13: Praktikum Komputasi Statistik 1 KOmet

1.3 Regresi Seperti langkah-langkah untuk mencari ringkasan 5 angka, pertama

membuka software R 2.1.11 > load packages > Rcmdr > OK. Kedua dengan cara yang sama , input data dengan 3 peubah eksplanatori (X1,X2,X3).

Kasus :Suatu Penelitian ingin diketahui pengaruh tingkat pendapatan, IQ, dan pengeluaran seseorang terhadap jumlah tabungan. Dalam analisis regresi kita ingin memprediksi hal tersebut. Dengan responden sebanyak 35 orang. Y = Jumlah Tabungan X1 = Jumlah Pendapatan/ bulanX2 = IQ X3 = Jumlah Pengeluaran/ bulan Input data data > data set baru Masukkan nama untuk data set : regresi lalu klik OK Kotak variabel 1 diganti nama dengan : Tabungan dan pilih type

character ,variabel 2 diganti nama dengan : Pendapatan pilih type character, variabel 3 diganti nama dengan : IQ pilih type character, variabel 4 diganti nama dengan : Pengeluaran pilih type character,

Input data sebanyak 41 pada kolom participation,citizenship,democracy, dan implement democracy. Maka akan muncul tabel sebagai berikut :

12

Page 14: Praktikum Komputasi Statistik 1 KOmet

Untuk mencari regresi pada data maka klik statistika pada menu toolbar > pencocokan model > regresi linier ,

Nama untuk model : RegModel.1 Peubah respon : Participation Peubah eksplanatori : citizen, democracy, implement democracy , lalu

klik OK Maka akan muncul output :

BAB IV

13

Page 15: Praktikum Komputasi Statistik 1 KOmet

HASIL DAN PEMBAHASAN4.1 Output Software4.1.1 Ringkasan 5 angka

Data dibuat grafik :

1. Grafik histogram

2. Grafik plot indeks 14

Page 16: Praktikum Komputasi Statistik 1 KOmet

4.1.2 Korelasi

4.1.3 Regresi

4.2 Interprestasi15

Page 17: Praktikum Komputasi Statistik 1 KOmet

4.2.1 Ringkasan 5 angka

Dari output , dapat diketahui nilai minimal , nilai quartil, median, nilai mean (rata-rata), dan nilai maksimum. Maka nilai UTS komputasi statistik mahasiswa statistika kelas A 2010 Universitas Brawijaya mempunyai ringkasan 5 angka sebagai berikut :

1. Nilai minimal komputasi statistik : 65.002. Quartil : - Quartil pertama = 70.00

- Quartil ketiga = 85.003. Nilai median : 79.004. Nilai mean : 78.645. Nilai maksimum : 95

Dari grafik histogram , sumbu y merupakan frekuensi data dan sumbu x merupakan nilai komputasi statistik.

Dari grafilk plot indeks , banyaknya lingkaran kecil menunjukkan banyaknya data sebanyak 25 yang menyebar acak. Sumbu x merupakan banyaknya data sedangkan sumbu y merupakan nilai komputasi statistik. 4.2.2.Korelasi

Korelasi antara pengeluaran/bulan (Y) dan pendapata (X) adalah 0.982676, maka terdapat hubungan erat antara tingkat pengeluaran dan tingkat pendapatan.

Dilihat dari nilai p-value = 2.2e – 16 dibandingkan dengan nilai α = 0.05 dengan Ho : Tidak ada hubungan antara lama belajar dan Ip , H1 : ada hubungan antara tingkat pengeluaran dan tingkat pendapatan, maka p-value < α jadi kesimpulan tolak Ho dengan interpretasi ada hubungan antara lama tingkat pengeluaran dan tingkat pendapatan atau belum cukup bukti untuk mengatakan bahwa tidak terdapat hubungan antara tingkat pengeluaran dan tingkat pendapatan.

Dilihat dari nilai selang kepercayaan 95% maka korelasi antara tingkat pengeluaran dan tingkat pendapatan mempunyai selang kepercayaan 95% = 0.9635195 – 0.9918150.

4.2.3 Regresi

16

Page 18: Praktikum Komputasi Statistik 1 KOmet

Min 1Q Median 3Q Max -6.2944 -2.1788 0.1548 2.4812 5.6104

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 5.36349 7.29553 0.735 0.467759 IQ -0.01689 0.06203 -0.272 0.787224 Pendapatan 1.93325 0.45098 4.287 0.000164 ***Pengeluaran -1.80888 0.57128 -3.166 0.003453 ** ---Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.662 on 31 degrees of freedomMultiple R-squared: 0.4026, Adjusted R-squared: 0.3448 F-statistic: 6.963 on 3 and 31 DF, p-value: 0.001026

Interpretasi: Dari output , didapatkan nilai estimasi parameter untuk Intercept (b0) sebesar 5.36349, untuk IQ (b1) sebesar 1.93325, democracy (b2) sebesar -0.01689, implement.democracy (b3) sebesar -1.80888. Sehingga model persamaan regresi liniernya adalah :

Y = 5.36349 + 1.93325 X - 0.01689 X 2 -1.80888 X3 Dimana :

o Y = Jumlah Tabungan

o X1 = Jumlah Pendapatan/ bulan

o X2 = IQ

o X3 = Jumlah Pengeluaran/ bulan

Interpretasi untuk b1 = 1,93325 → pertambah 1 tingkat Jumlah Pendapatan/ bulan maka akan menaikkan Jumlah Tabungan seseorang sebesar 1.93325 dengan asumsi IQ dan Jumlah Pengeluaran/ bulan adalah konstan.

Interpretasi untuk b2 = -0.01689 → pertambah 1 IQ maka akan menurunkan Jumlah Tabungan seseorang sebesar 0.01689 seseorang dengan asumsi tingkat Jumlah Pendapatan/ bulan dan Jumlah Pengeluaran/ bulan adalah konstan.

Interpretasi untuk b3 = -1.80888 → pertambah 1 tingkat Jumlah Pengeluaran/ bulan maka akan menurunkan Jumlah Tabungan sebesar 1.80888 dengan asumsi tingkat dan IQ adalah konstan.

17

Page 19: Praktikum Komputasi Statistik 1 KOmet

Dilihat dari uji simultan maka di dapat nilai F stat = 6.93 dengan db 3 dan 31 dan p-value : 0.001026 dibandingkan dengan α = 0.05 jadi p-value < α , maka F stat signifikan.

Dilihat dari nilai R-squared = 0.4026 maka model regresi tersebut mampu menjelaskan 40.26 % keragaman dari data (model dapat dikatakan kurang layak).

Dilihat dari uji Parsial maka, Pr(>|t|) α = 0.05

(Intercept) 0.467759 → p-value > α (tidak nyata)IQ 0.787224 → p-value > α (tidak nyata)Pendapatan 0.000164 *** → p-value > α (nyata)Pengeluaran 0.003453 ** --- → p-value > α (nyata)

Y= 1,93325 X1 - 1.80888 X3

BAB VPENUTUP

5.1 Kesimpulan

18

Page 20: Praktikum Komputasi Statistik 1 KOmet

Dengan meggunakan software R maka dapat menganalisis data dengan ringkasan 5 angka yaitu : nilai minimal , nilai quartil, median, nilai mean (rata-rata), dan nilai maksimum.

Selain itu juga bisa menganalisis korelasi. Seperti data diatas setelah di uji korelasi ternyata terdapat hubungan antara lama tingkat pengeluaran dan tingkat pendapatan

Software R juga bisa menganalisis regresi dengan beberapa pengujian diantaranya uji simultan, uji parsial, R-squared, dan mengetahui model yang layak digunakan.5.2 Saran

Mestinya laboratorium dilengkapi dengan software R sehingga praktikum tidak terganggu karena setiap praktikan harus menginstal software R di komputer masing- masing.

19

Page 21: Praktikum Komputasi Statistik 1 KOmet

20