Post on 31-Dec-2015
description
Dasar-dasar Statistika
Kuliah Statistika Program Studi Sistem Informasi Fakultas Sains dan Teknologi Universitas Islam
Negeri “Syarif Hidayatullah” Jakarta
Kaitan Teknik Sampling dengan Metode Statistika
Populasi
SamplePenarikan Sample
Proses generalisasi
Pengolahan Data
Pengumpulan Data
Diperoleh Statistik
Uji Hipotesis(bagaimana kondisi
parameter di populasi?)
LaporanPenggunaan Statistika DeskriptifPenggunaan Statistika Induktif
Laporan
Random
Non-Random
Statistik Parameter Penjelasan
n N Banyaknya satuan dasar yang diteliti (sample), yang ada di populasi.
X x (baca myu X) Rata-rata X.
Sx x(baca sigma X) Simpangan baku (standard deviation) X.
Sx2 x
2 (baca sigma kuadrat X)
Ragam (variance) X.
p P Proporsi.
r (baca rho) Koefisien korelasi.
b (baca beta) Koefisien regresi.
Nama Parameter Statistik
Rata-rata (Means) X
Simpangan baku (standard deviation) X
Ragam (variance) X
N
X in
XX i
N
X i2
2
N
X i2
1
2
2
n
XXS i
1
2
n
XXS i
Penggunaan Statistika dalam Penelitian
• Metode Statistika adalah metode yang digunakan dalam pengumpulan, penyajian, analisis dan penafsiran data.
• Statistika deskriptif adalah metode yang berkaitan dengan pengumpulan dan penyajian segugus (set) data sehingga memberikan informasi yang berguna.
• Statistika induktif (inferensia) mencakup semua metode yang berhubungan dengan analisis sebagian data (sample) untuk kemudian sampai pada peramalan atau penarikan kesimpulan mengenai keseluruhan gugus data induknya (populasi).
Kuesioner Buku Kode
Pemasukan data
Pre-codingCoding
Pengolahan Data
Data CleaningData Editing
DeskriptifTabel Frekuensi
Tabulasi Silang
Tabel Perbandingan antar kategori:
Rata-rata (means)
Proporsi
Histogram, grafik, dll
Rata-rata peringkat (means Ranking)
Induktif
Random sampling
Generalisasi ke populasi
Uji beda:Rata-rata (means)Rata-rata peringkat (means Ranking)
Proporsi
Uji asosiasi & korelasiUji ‘pengaruh’
Asosiasi & KorelasiAnalisis Ragam (Anova)Analisis regresi
Beberapa pengertian dasar
• Populasi terdiri atas seluruh satuan (unit) dasar penelitian.
• Bila satuan dasar penelitian diteliti semua (sensus) maka akan diketahui nilai dari sifat-sifat di populasi.
• Nilai dari sifat-sifat populasi disebut Parameter.• Sample: bagian dari populasi yang diteliti.• Bila sebagian satuan dasar penelitian diteliti (sample),
maka akan diperoleh nilai dari sifat-sifat di sample.• Nilai dari sifat-sifat sample disebut Statistik.• Statistik digunakan sebagai penduga (estimator) dari
Parameter.• Kerangka Sample (Sampling Frame) adalah daftar yang
digunakan sebagai dasar penarikan sample.
Penarikan sample (Sampling)
Penarikan sample secara acak (Random Sampling)oSemua unsur dalam populasi mempunyai kesempatan terpilih menjadi sample.
oTidak ada faktor sengaja (dipilih atau tidak dipilih), hanya berdasarkan peluang (probability) dalam menentukan sample.
oStatistika induktif atau inferensia dapat digunakan untuk melakukan generalisasi dari sample ke populasi.
Penarikan sample tak acak (Non-Random Sampling)o Unsur dalam populasi yang terpilih sebagai
sample didasarkan pada kriteria tertentu (informasi yang ingin dikumpulkan dapat diperoleh).
o Ada faktor sengaja memilih unsur tertentu dalam menentukan sample.
o Statistika induktif atau inferensia tidak dapat digunakan untuk melakukan generalisasi dari sample ke populasi.
Beberapa kegiatan dalam Statistik Deskriptif• Perhitungan Ukuran Pemusatan, Ukuran Penyebaran.• Pengelompokan atau klasifikasi data.• Pemaparan data dalam tabulasi tunggal (Tabel
Frekuensi, Tabel Rata-rata, dll).• Pemaparan data dalam tabulasi silang (cross tabulation).• Pemaparan data dalam bentuk gambar seperti:
diagram batang, balok, (histogram, barchart); diagram kue, atau bagan melingkar (pie-chart); poligon, diagram garis, atau grafik; diagram tebar (scatter-plot) dan lain sebagainya.
• Perhitungan ukuran keeratan hubungan.• Membandingkan, menganalisis, dan menginterpretasi
hasil pengolahan data.
Skala Pengukuran
Nominal (dapat dikelompokkan, tidak punya urutan)
Ordinal (dapat dikelompokkan, dapat diurutkan, jarak antar nilai tidak tetap sehingga tidak dapat dijumlahkan)
Interval (dapat dikelompokkan, diurutkan, dijumlahkan karena memiliki satuan tetap, tidak dapat dibagi karena bukan nol murni tetapi nol perjanjian)
Rasio (dapat dikelompokkan, diurutkan, dijumlahkan, dan dibagi karena memiliki nol murni –mutlak--)
Skala pengukuran dan Ukuran Pemusatan
Skala pengukuran
Ukuran Pemusatan
Nominal Modus (nilai yang sering muncul, yang frekuensinya paling tinggi)
Ordinal Median (nilai tengah, setelah data diurutkan)
dan modus.
Interval/rasio Mean (rata-rata)
median, dan modus.
Skala pengukuran dan Ukuran Penyebaran
Skala pengukuran
Ukuran Penyebaran
Nominal Rasio keragaman.
Ordinal Simpangan, simpangan kuartil.
Interval/rasio Simpangan baku (standard deviation), ragam (variance)
Data sebelum diurutkan
Data setelah diurutkan
Q1
Q3
i Xi1 142 153 144 145 136 107 168 139 20
10 2111 1512 913 1114 1415 12
Total 211
Xi2
196225196196169100256169400441225
81121196144
Data
X[i]9
1011121313141414141515162021
3115
Nilai fre % Cum %9 1 6.7 6.7
10 1 6.7 13.311 1 6.7 20.012 1 6.7 26.713 2 13.3 40.014 4 26.7 66.715 2 13.3 80.016 1 6.7 86.720 1 6.7 93.321 1 6.7 100.0
Total 15 100.0
Tabel Frekuensi
Pemusatan
modus = 14
median = 14
means = 211/15
means = 14.067
2iX
9 10 11 12 13 14 16 20 21
Histogram
Simpangan Baku
S = 3.2396
Jadi simpangan baku sama dengan 3.2396
1
/2
12
n
nXXS i
14
15/)211(3115 2S
Rasio Keragaman:fmodus = 4
RK = 1-(fmodus/n)0.73333
Simpangan KuartilQ1 = nilai yang memisahkan sekumpulan data menjadi dua,
25% di sebelah kiri dan 75% di sebelah kanan.
Dari tabel Frekuensi (perhatikan Cum %)Q1 = (11+12)/2 = 11.5Q3 = 15
SQ = (Q3-Q1)/2 = (15-11.5)/21.75
Ukuran Penyebaran
Hubungan dua variableSkala Pengukuran Jenis hubungan
Nominal (punya sifat
dapat dikelompokkan)Asosiasi, koefisien kontingensi, koefisien Phi, Chi-kuadrat (2)
Ordinal (punya sifat
dapat diurutkan)Korelasi peringkat (rank correlation) Spearman.
Interval/rasio (punya sifat dapat dijumlahkan atau dibagi)
Korelasi hasil kali (product moment correlation) Pearson.
Kasus Anak Jalanan DKI (n=500)
• Umur anak jalanan:
Descriptive Statistics
500 6 17 13.44 2.79Umur anak (tahun)N Minimum Maximum Mean
Std.Deviation
Lanjutan Umur Anak Jalanan DKiUmur anak (tahun)
6 1.2 1.2 1.2
9 1.8 1.8 3.0
15 3.0 3.0 6.0
25 5.0 5.0 11.0
34 6.8 6.8 17.8
39 7.8 7.8 25.6
41 8.2 8.2 33.8
45 9.0 9.0 42.8
61 12.2 12.2 55.0
84 16.8 16.8 71.8
81 16.2 16.2 88.0
60 12.0 12.0 100.0
500 100.0 100.0
6
7
8
9
10
11
12
13
14
15
16
17
Total
ValidFrequency Percent
ValidPercent
CumulativePercent
Histogram umur anjal DKI
Umur anak (tahun)
18.016.014.012.010.08.06.0
Umur anak (tahun)F
req
ue
ncy
200
100
0
Std. Dev = 2.79
Mean = 13.4
N = 500.00
Tabel Frekuensi Umur Anjal DKI (setelah dikategorisasi)
Kategori umur
169 33.8 33.8 33.8
190 38.0 38.0 71.8
141 28.2 28.2 100.0
500 100.0 100.0
6-12 tahun
13-15 tahun
16-17 tahun
Total
ValidFrequency Percent
ValidPercent
CumulativePercent
Umur anjal DKI berdasarkan Jenis Kelamin
Report
Umur anak (tahun)
13.71 402 2.68
12.34 98 2.96
13.44 500 2.79
Jenis kelaminLaki-laki
Perempuan
Total
Mean NStd.
Deviation
Rata-rata Umur Anjal berdasarkan Jenis Kelamin
Report
Umur anak (tahun)
13.71 402 2.68
12.34 98 2.96
13.44 500 2.79
Jenis kelaminLaki-laki
Perempuan
Total
Mean NStd.
Deviation
Lama di Jalan (tahun)
Descriptive Statistics
499 1 16 3.06 2.14Lama di jalanan (tahun)N Minimum Maximum Mean
Std.Deviation
Tabel Frekuensi tanpa dikategorisasi
Lama di jalanan (tahun)
82 16.4 16.4 16.4
165 33.0 33.1 49.5
128 25.6 25.7 75.2
50 10.0 10.0 85.2
25 5.0 5.0 90.2
14 2.8 2.8 93.0
8 1.6 1.6 94.6
9 1.8 1.8 96.4
5 1.0 1.0 97.4
4 .8 .8 98.2
6 1.2 1.2 99.4
1 .2 .2 99.6
1 .2 .2 99.8
1 .2 .2 100.0
499 99.8 100.0
1 .2
500 100.0
1
2
3
4
5
6
7
8
9
10
11
12
15
16
Total
Valid
SystemMissing
Total
Frequency PercentValid
PercentCumulative
Percent
Histogram lama di jalanan (tahun)
Lama di jalanan (tahun)
16.014.012.010.08.06.04.02.0
Lama di jalanan (tahun)F
req
ue
ncy
300
200
100
0
Std. Dev = 2.14
Mean = 3.1
N = 499.00
Tabel Frekuensi lama di jalanan (setelah dikategorisasi)
kategori lama di jalanan
82 16.4 16.4 16.4
368 73.6 73.7 90.2
49 9.8 9.8 100.0
499 99.8 100.0
1 .2
500 100.0
1 tahun
2-5 tahun
> 5 tahun
Total
Valid
SystemMissing
Total
Frequency PercentValid
PercentCumulative
Percent
Rata-rata Lama di jalan berdasarkan Jenis Kelamin
Report
Lama di jalanan (tahun)
2.96 401 1.93
3.46 98 2.82
3.06 499 2.14
Jenis kelaminLaki-laki
Perempuan
Total
Mean NStd.
Deviation
Tabulasi Silang Umur dan Lama di jalan
Kategori umur * kategori lama di jalanan Crosstabulation
48 107 13 168
28.6% 63.7% 7.7% 100.0%
22 145 23 190
11.6% 76.3% 12.1% 100.0%
12 116 13 141
8.5% 82.3% 9.2% 100.0%
82 368 49 499
16.4% 73.7% 9.8% 100.0%
Count
% within Kategori umur
Count
% within Kategori umur
Count
% within Kategori umur
Count
% within Kategori umur
6-12 tahun
13-15 tahun
16-17 tahun
Kategoriumur
Total
1 tahun 2-5 tahun > 5 tahun
kategori lama di jalanan
Total
Tabulasi Silang (Kolom %)
Kategori umur * kategori lama di jalanan Crosstabulation
48 107 13 168
58.5% 29.1% 26.5% 33.7%
22 145 23 190
26.8% 39.4% 46.9% 38.1%
12 116 13 141
14.6% 31.5% 26.5% 28.3%
82 368 49 499
100.0% 100.0% 100.0% 100.0%
Count
% within kategorilama di jalanan
Count
% within kategorilama di jalanan
Count
% within kategorilama di jalanan
Count
% within kategorilama di jalanan
6-12 tahun
13-15 tahun
16-17 tahun
Kategoriumur
Total
1 tahun 2-5 tahun > 5 tahun
kategori lama di jalanan
Total
Pengantar Statistika Induktif (Inferensia)
• Berdasarkan pada peluang (probability).
• Data diperoleh dari sample yang dipilih secara acak (random).
• Hipotesis:Hipotesis Nol (H0)Hipotesis alternatif (H1)
• Menerima H0 sama dengan menolak H1.
• Menolak H0 sama dengan menerima H1.
Hipotesis
Hipotesis nol: o Bersifat tunggal (mengarah pada satu nilai tertentu).o Meng-nol-kan sesuatu:
Tidak ada perbedaan perbedaan sama dengan NOL.Tidak ada hubungan antara variable X dengan Y hubungan dua variable sama dengan NOL.
Tidak ada ‘pengaruh’ variable X thd Y ‘pengaruh’ variable X terhadap Y sama dengan NOL.
Hipotesis Alternatif: o Bersifat majemuk
Dua arah (two tails)Satu arah (one tail)
Kaidah Pengambilan Keputusan
• ManualTerima Hojika |Stat Hitung| <= |Stat Tabel| Tolak Ho jika |Stat Hitung| > |Stat Tabel|
• KomputerTerima Hojika Peluang Sig >= Taraf UjiTolak Ho jika Peluang Sig < Taraf Uji
Statistika Parametrik vs Non-Parametrik
• Statistika Parametrik didasarkan pada asumsi distribusi normal, untuk menganalisis data yang terukur dalam skala interval atau rasio.
• Statistika Non-Parametrik tidak didasarkan pada asumsi distribusi normal, untuk menganalisis data yang terukur dalam skala ordinal atau nominal.
Beberapa Statistika Parametrik
Uji beda rata-rata (t-test means, oneway, anova). Analisis Korelasi:
• Menentukan apakah ada hubungan bermakna antar dua variable di populasi.
Analisis Regresi:• Menentukan apakah ada pengaruh variable-variable
bebas (independent variables) terhadap variable terpengaruh (dependent variable).
• Memperkirakan nilai variable terpengaruh bila diketahui nilai variable-variable bebas.
Analisis data multivariate: analisis diskriminan, analisis faktor dll.
Beberapa Statistika Non-Parametrik
• Uji beda proporsi: dua kelompok bebas, dua kelompok berpasangan, lebih dari dua kelompok.
• Uji hubungan melalui Tabulasi Silang.
• Uji beda median (rata-rata peringkat): dua kelompok bebas, dua kelompok berpasangan, lebih dari dua kelompok.